• Какой подход для поиска лучше?

    qonand
    @qonand
    Software Engineer
    Лучше не изобретать велосипед и воспользоваться ElasticSearch или Sphinx
    Ответ написан
    8 комментариев
  • Как лучше запускать задачу из cron каждые 10 секунд?

    saboteur_kiev
    @saboteur_kiev Куратор тега Linux
    software engineer
    запускать каждые 10 секунд - не слишком выгодно.

    Напишите себе демона и пусть он все время работает с банальной паузой или сверкой timestamp.
    А в кроне просто периодически проверяйте запущен он или нет.
    Ответ написан
    Комментировать
  • Как загрузить прайс лист по частям?

    @Kravalg
    Раз уж 504 ошибка, это значит, что сервер не успевает за отведенное ему время отдать ответ. Это и немудренно, так как ты при получении данных сразу же их обрабатываешь. Для малого количества данных этот подход уместен, но для больших - нет в чем ты уже убедился.

    Решение, которые позволит тебе обрабатывать данные практически любых размеров:

    1) Скрипт, который принимает данные и обрабатывает их сейчас должен сохранять их(к примеру, в файл) и ставить в очередь на обработку. Теперь твой скрипт не будет улетать в 504, так как ответ будет за считанные миллисекунды.
    2) Следующим этапом будет написание скрипта, который будет получать сообщения из очереди на обработку этих данных. Если размер данных, которые ты получаешь исчисляется в сотнях мегабайтов и больше, тогда перед обработкой этих данных тебе необходимо будет их поделить на части (в случае, если хранилищем ты выберешь файлы).
    3) После того, как ты получишь данные по частям ты можешь их обрабатывать в фоновом режиме

    Я описал общий алгоритм, если не можешь выбрать конкретные технологии - пиши в комментарии, подскажу

    UPD.
    Для обработки больших файлов можно использовать генераторы - статья

    Для запуска фоновых обработчиков можно использовать cron или workers - статья
    Ответ написан
    2 комментария
  • Можете подсказать программу для бекапа (WIN)?

    skobkin
    @skobkin
    Гентушник, разработчик на PHP и Symfony.
    Из свободных - Duplicati, например. Бекапит только файлы. Умеет WebDav и тысячу других бэкендов.
    Из платных - Acronis TI, но он, вроде, только FTP умеет и больше нацелены на продажу своего облака, чем использование пользовательских внешних хранилищ. Но по SMB тоже нормально выгружает на NAS, например. Бекапит как файлы так и разделы (при желании посекторно).
    Ответ написан
    Комментировать
  • Как как получить html-код страницы для парсинга?

    oh_shi
    @oh_shi
    Если это заказ с фриланса за пачку доширака, то лучше просто откажитесь. Владельцы сильно не хотят, чтобы их парсили.
    spoiler
    Pardon Our Interruption...
    As you were browsing www.controller.com something about your browser made us think you were a bot. There are a few reasons this might happen:
    You're a power user moving through this website with super-human speed.
    You've disabled JavaScript in your web browser.
    A third-party browser plugin, such as Ghostery or NoScript, is preventing JavaScript from running. Additional information is available in this support article.
    To request an unblock, please fill out the form below and we will review it as soon as possible.
    First Name:
    Last Name:
    E-mail:
    You reached this page when attempting to access https://www.controller.com/info/site-map from 127.0.0.1 on 2018-11-30 12:58:16 UTC.
    Trace: ead57087-e556-473f-880f-707c3bfa87c1 via 449bb29d-9aa5-44ea-a964-418570a62186

    Уже при первом взгляде видно, что у них есть сверка ip c популярными vpn сервисами, несколько видов капчи, слежение за курсором, десяток кук для валидации. Откуда вы пришли, они тоже следят UserReferrer=https://toster.ru/q/583813.
    Если таки хотите попробовать это все победить, точно могу сказать, что получить 1 раз валидную куку и добавить к запросам не прокатит. Нужен headless browser, например Capybara + Poltergeist.
    Ответ написан
    2 комментария
  • Как выяснить причину 100% нагрузки на сервер VDS?

    Radjah
    @Radjah
    В любой непонятной ситуации первым делом смотри логи.

    У тебя дохрена потоков апача в состоянии running, четверь из них в D-state. К ним у тебя база данных. Всё это на двух ядрах и двух гигах оперативы. При этом своп уже забит под завязку, а оперативы свободного 300 метров под страничный кэш.
    Если ssh отвечает, то стопорни апач и посмотри логи запросов, кто-то наверняка или брутит или DDoS-ит, или владелец сайта проворонил очередную дыру в движке сайта и вовремя не обновил его. Сайт так и так висит в вечном "Ожидание ответа от сервера", так что много не потеряешь, а ресурсы на разбор проблем освободятся.
    Ответ написан
    Комментировать
  • Как выяснить причину 100% нагрузки на сервер VDS?

    VELIK505
    @VELIK505
    Руководитель департамента profitcentr.com
    apache2 грузит больше всего.
    Ответ написан
    6 комментариев
  • Какой НОРМАЛЬНЫЙ дистрибутив поставить с самыми свежими программами?

    jamakasi666
    @jamakasi666 Куратор тега Linux
    Просто IT'шник.
    Вот больше похоже что проблем не в дистре или железе, а в том кто перед ним. Выбирать то что нужно лично вам по критериям. До свежести довести можно любой дистр. Жаловаться что что то не работает\работает не так\ глючит последнее дело и наступать оно должно после внимательно чтения тонкостей дистрибутива и конкретно вашего железа.
    Ну раз захотели свежести то самый относительно простой это арч\манжара. Для всех ситуаций есть арч вики где расписано все крайне удобно и довольно досконально. Не хочется заморачиваться тогда ставьте абсолютно любой дистрибутив хоть дебиан но ветку берите тестовую\дев или что то типа Tumbleweed как в opensuse.

    Конкретно у вас сейчас желание получить "кнопку которая делает хорошо", так не бывает. Тут все достаточно просто, если ноутбук да еще и с дискреткой то автоматом получаете геморой разной степени с дровами для видео, особенно если встройка+дискретка. Опять же если ноутбук то с огромной долей вероятности получить еще один прикол связанный с профилями питания ЦП. Хоткеи вообще отдельная тема. Темы\цвета, вы серьезно?)

    Ну и кроме того, если вы считаете себя "начинающим программистом" то ну уж точно должны уметь читать документацию а значит и понимать хотябы минимально "причина-следствие".
    Ответ написан
    2 комментария
  • Как распознать частоту звука (ноты) в C#?

    Griboks
    @Griboks Куратор тега C#
    Использовать преобразование Фурье для получения спектра записи. Затем проанализировать спектр на наличие гармоник нот.
    Ответ написан
    2 комментария
  • Как заблокировать IP-адрес, который пингуется?

    ky0
    @ky0
    Миллиардер, филантроп, патологический лгун
    Это плохой критерий для блокировки. Адреса добропорядочных пользователей ровно так же могут пинговаться - это зависит от настройки оборудования на той стороне.
    Ответ написан
    Комментировать
  • Время от времени не ресолвятся домены. Как траблшутить?

    @pfg21
    ex-турист
    посмотреть как службы днс работают.
    на домашней убунте как то были плавающие проблемы с днс, службы ложили на записи в резолв.конф и стучались в 127.0.0.1:53 где висел бинд который тоже чего неправильно работал.
    вырезал все лишнее нафиг, оставил только перенаправление запросов на вншение днс (точнее на роутер локалки).
    как конкретно, не вспомню :) гуглил и ковырял.
    Ответ написан
    Комментировать
  • Big прайсы, обновлять или удалять и заново записывать?

    Melkij
    @Melkij
    PostgreSQL DBA
    Суть такова, что есть прайс(ы) ~5млн и его нужно быстро обновлять (раз в 2 часа).

    Это НЕ много и совсем НЕ часто.

    обновлять или удалять и заново записывать

    Ложный выбор, это одна и та же операция. MVCC update = delete + insert
    Но что важно - не делать update который вам действительно не нужен. Postgresql не анализирует данные в поиске пустых обновлений, update table set id = id; вам честно удвоит таблицу, хотя ничего на логическом уровне не изменится.

    Профилируйте, на что реально тратите время - pg_stat_statements ответит хорошо на этот вопрос со стороны базы. Пальцем в небо - вы работаете в автокоммите и естественно 5млн пишущих операций для любой честной ACID базы - это порядком медленного IO (даже для SSD)
    Ответ написан
    4 комментария
  • Переводят ли легаси .net на .net core?

    mindtester
    @mindtester
    http://iczin.su/hexagram_48
    каждый отдельно взятый
    Интерпрайс
    сам принимает решение, исходя из каких то собственных внутренних причин
    Ответ написан
    Комментировать
  • Windows рядом с Linux?

    CityCat4
    @CityCat4
    //COPY01 EXEC PGM=IEBGENER
    Нет. Винда не умеет использовать ext4, так что она его будет просто игнорировать. Линух спокойно смонтирует виндовые разделы.
    НО:
    Как совершенно верно заметил xtress - винда непременно завалит бут и скорее всего придется грузиться с livecd и бут восстанавливать :)
    Ответ написан
    2 комментария
  • Не запускается apache ubuntu?

    @LemonFox
    stateless mind
    Если внимательно прочитать, то можно увидеть что вам говорят - в файле /etc/apache2/mods-enabled/dir.conf в сроке 3 ошибка.
    Ответ написан
    Комментировать
  • В чём приемущество SQLite перед Excel?

    saboteur_kiev
    @saboteur_kiev
    software engineer
    1. Excel - платный продукт, который есть не везде. SQLite - бесплатный движок, доступен под любой язык программирования, есть огромное количество бесплатных программ, которые могут с ним работать. Также можно на любой языке написать простенькую визуализацию данных из sqlite

    2. Excel - электронная таблица. SQLite - база данных. Это разные продукты. По сути надо сравнивать SQLite и Access. Просто Excel достаточно мощная программа, в которой средства, чтобы справляться с рядом не слишком сложных задач, которые пора бы уже ложить в базу данных.

    3. Для работы с SQLite нужно писать запросы, Excel более распространен и популярен - почти любой может в экселе посмотреть данные и что-то с ними сделать при помощи мышки.

    А насчет конкретно вас - никто не скажет, ибо структура данных, требования к быстродействию и вообще - знаете только вы. Просто подучите SQL и освойте SQLite, чтобы решить надо оно вам или нет.
    Ответ написан
    8 комментариев
  • В чём приемущество SQLite перед Excel?

    DevMan
    @DevMan
    преимущество sqlite в бесплатности, возможности встраивания, и, собственно, sql.
    если excel вы используете только для себя и вас он устраивает, то преимущества sqlite вам ни к чему.
    Ответ написан
    Комментировать
  • Что может заменить c++?

    BasmanovDaniil
    @BasmanovDaniil
    Геймдизайнер-телепат
    Теоретически Rust, но он ещё свеженький, инфраструктура по части игр не развита. Может быть через пару лет что-нибудь для него и появится.
    Ответ написан
    3 комментария
  • С чего начать разрабатывать приложение на NativeScript и Vue.js?

    ulkoart
    @ulkoart
    Начать стоит с изучения документации, что бы потом не получилось так, что вы хотите одно, а NativeScript это не умеет.
    Ответ написан
    Комментировать
  • Как построить инфраструктуру большого проекта?

    DexterHD
    @DexterHD
    Software Engineer, Teamlead, CTO
    Для начала изучите принципы приложения 12 факторов: https://12factor.net/ru/ Эти рекомендации позволяют создавать приложения которые легко и просто масштабируются, как горизонтально, так и вертикально.
    После можете посетить хороший ресурс со статьями на тему высоких нагрузок: https://ruhighload.com/
    Ответ написан
    2 комментария