• Как разбить текст на предложения?

    mindtester
    @mindtester
    http://iczin.su/hexagram_48
    прогресс ИТ в этой области растет, и довольно быстро, особенно последнее время

    но запрошенная вами планка, все еще достаточно высока.. по крайней мере для домашнего пользователя

    с другой стороны - на сколько я помню - все хорошие системы распознавания (очень-очень крупных вендоров), вообще то и так сносно справляются задачей...

    если конечно не наговаривать монотонно большие объемы текстов.. вы ни в каком месте не лукавите?

    попробуйте api от MS тут человек делится опытом
    Ответ написан
    Комментировать
  • Как сделать свою систему документооборота?

    sergey-gornostaev
    @sergey-gornostaev Куратор тега Django
    Седой и строгий
    Вопрос слишком общий, класса "Как заработать миллион". Есть множество способов, но нет конкретного рецепта. Да, на Django это сделать можно. Разнообразных библиотек понадобиться множество, но это будут не библиотеки типа django-documentooborot, а узкоспециализированные библиотеки для облегчения разработки отдельных элементов системы, типа формирования печатных форм, версионирования документов, выполнения фоновых заданий и т.п. Одно точно - прежде, чем разрабатывать свою систему документооборота, стоит плотно поработать с парой-тройкой существующих.
    Ответ написан
    Комментировать
  • Как оптимально работать с данными в JSON?

    @res2001
    Developer, ex-admin
    Вставлять большой массив данных в SQL лучше с помощью bulk insert, но, на сколько я помню, эта операция не понимает json (нужно уточнить). Можно из json конвертнуть в csv (или во что-либо другое, с чем bulk insert работает), а потом уже вставлять в sql. JSON преобразовать в csv можно достаточно простым скриптом на javascript.
    Чтоб быстро работал поиск, нужно сделать соответствующие индексы.
    Предложенный альтернативный вариант можно считать рабочим, только если нет сильно удаленных клиентов с не слишком быстрыми каналами связи (и вообще их не очень много), кроме того, чтоб не таскать на каждый запрос этот огромный BLOB можно вытянуть его один раз при старте клиента, а потом уже искать только локально.
    Но, как по мне, вариант с загрузкой в SQL вполне рабочий.
    Ответ написан
    Комментировать
  • Сервер раза 4 в сутки полностью забивается на 100% по CPU и 100% по RAM. Причина?

    @BorisKorobkov
    Web developer
    Изучайте серверное администрирование (top, iostat, ps, show processlist, логи и пр.) или обратитесь к хорошему админу.

    Если проблема регулярно в одно и то же время, то первым делом проверьте cron.
    Ответ написан
    3 комментария
  • Сервер раза 4 в сутки полностью забивается на 100% по CPU и 100% по RAM. Причина?

    @lega
    забивается на 100% по CPU и 100% по RAM

    Если RAM не хватает, то начинает прокачиваться своп, из-за этого все тормозит. Ищите задачи которые съедают весь RAM.
    Ответ написан
    Комментировать
  • Какие файловые системы используются в очень больших хранилищах?

    @Wexter
    для локального хранилища zfs(вместо хард/софт рейда)/xfs/ext4, для распределённого ceph/glusterfs/gfs2
    Ответ написан
    Комментировать
  • Как найти и заменить слова в текстовом файле?

    @pfg21
    ex-турист
    В любом потоковом текстовом редакторе умеющим регекспы, от sed до однострочника на "perl -pe"
    Ответ написан
    Комментировать
  • PHP - Правильно ли при загрузке изображения менять расширение на .jpg? Чем такой вариант лучше?

    kotomyava
    @kotomyava
    Системный администратор
    Если просто добавляется расширение .jpg, и есть возможность загружать картинки в других форматах, то это, конечно, не правильно.
    Если все файлы действительно конвертируются в jpeg, или загрузка файлов в других форматах фильтруется где-то, то всё ок.

    Ну и да, расширение, не имеет отношения к _формату файла_, на самом деле. Это не более чем подсказка.
    Ответ написан
    Комментировать
  • Стоит ли использовать Docker?

    Xuxicheta
    @Xuxicheta
    инженер
    1. Контейнер это не виртуальная машина, это способ изоляции приложения.
    Производительность почти не меняется. Оверхэд едва заметен.
    Да, запускается несколько копий. Конечно не стоит множить ресурсоемкие процессы. Но СУБД и веб-серверы не входят в их число. У меня, например, работают 5 постгресов на одном микросервере без проблем. Опять таки, это до тех пор, пока нагрузки несерьезны.
    Образы ОС запущены не будут. Они нужны только чтобы обеспечить приложению среду исполнения. В памяти висят только процессы приложений (ну то что вы в докере запустили)

    2. В продакшене основной смысл это упрощение запуска микросервисов на разнообразном парке оборудования. Для классических приложений профит только в развертывании.

    3. Есть разница в потраченном времени на настройку как раз redmine, gitlab и еще нескольких сервисов, установленных на хосте, и процесс запуска того же добра в контейнерах. Как раз в случае нескольких сервисов на одной машине докер всё серьезно упрощает.
    Все эти rvm, nvm, этого пакета не хватает, того, а тут разные версии. Добавить сюда еще организацию бекапа.
    С контейнерами другая проблема - это их корректное обновление.
    Ответ написан
    Комментировать
  • Переезд на https - как вернуть скорость ответа сервера?

    @lega
    Если идет редирект для каждого реквеста, то это неправильно. все ссылки должны быть изначально с https, что-б работало напрямую без редиректов.
    Ответ написан
    1 комментарий
  • Как легко перейти с jQuery на VUE?

    zooks
    @zooks
    Frontend
    Для лендосов рекомендую этот фреймворк:
    vanilla-js.com
    Ответ написан
    1 комментарий
  • Как легко перейти с jQuery на VUE?

    Мне кажется, что фреймворки подойдут для более сложных приложений, нежели лендинги. В большом приложении есть много компонентов, которе часто используются в нескольких местах, есть роутинг и много других плюшек. Если это одностраничный лендинг, я бы не пихал туда никакой фреймворк. Просто не вижу смысла
    Ответ написан
    Комментировать
  • Что за вирус на моем сайте?

    dkrylov
    @dkrylov
    смотри иньекции js в файлах которые отвечают за отображение видов текущей страницы

    Либо другие какие то включения инородного кода
    Ответ написан
    Комментировать
  • Какие есть способы снизить нагрузку на базу данных mysql?

    ddv88
    @ddv88
    Binance Futures
    простой сервис вопрос-ответ

    бд заходит за 100

    Как то эти две вещи не состыковываются.
    Профилирование делали? Смотрели какие запросы создают нагрузку?
    Ответ написан
    2 комментария
  • Какие есть способы снизить нагрузку на базу данных mysql?

    gbg
    @gbg
    Любые ответы на любые вопросы
    Хранить данные в XML - отличный способ поднять нагрузку на сервер до 300%. Этот формат не предназначен для обработки (уж тем более, для многопоточной) данных, он годится для передачи информации между системами.

    Буфер для базы есть, кэши там, вот это вот все. А у вас индексы в таблицах есть?
    Ответ написан
    Комментировать
  • Построение графика функции на языке C?

    zagayevskiy
    @zagayevskiy
    Android developer at Yandex
    Я думаю, надо юзать gnuplot.

    ndevilla.free.fr/gnuplot
    Ответ написан
    Комментировать
  • Как отследить почему падает MySQL too many connections?

    Melkij
    @Melkij
    PostgreSQL DBA
    Не падает, а отказывается принимать новые соединения из-за исчерпания указанного в конфиге лимита max_connections.
    Есть отдельная страничка в мануале

    Для mysql коннекты не такие тяжёлые относительно того же postgresql и max_connections вполне можно увеличивать.
    Какие коннекты открыты и откуда можно посмотреть в show processlist
    Ответ написан
    2 комментария
  • Парсинг - это open data?

    sergey-gornostaev
    @sergey-gornostaev
    Седой и строгий
    Нет, не является. Является ли поедание хлеба выпеканием?

    Открытые данные (англ. open data) — концепция, отражающая идею о том, что определённые данные должны быть свободно доступны для машиночитаемого использования и дальнейшей републикации без ограничений авторского права, патентов и других механизмов контроля. Освободить данные от ограничений авторского права можно с помощью свободных лицензий, таких как лицензий Creative Commons. Если какой-либо набор данных не является общественным достоянием, либо не связан лицензией, дающей права на свободное повторное использование, то такой набор данных не считается открытым, даже если он выложен в машиночитаемом виде в Интернет.

    Источник

    Проще говоря, если вы выкладываете на сайт ваши данные (тексты, изображения, документы, цены и пр.) без лицензионных ограничений и в таком виде, чтобы их легко было парсить - это open data. А если вы парсите чьи-то данные, то это парсинг.
    Ответ написан
    Комментировать
  • Почему лежит MSDN?

    AlexanderYudakov
    @AlexanderYudakov
    C#, 1С, Android, TypeScript
    Жмем F12, потом "Network", потом F5.
    Там где появится красная строка — ответ на ваш вопрос.
    Ответ написан
    1 комментарий
  • Перенос сервера на виртуальную машину, как лучше?

    Ого! Лучше не пытайтесь делать vhd из запущенной Windows XP! Если бы что-то и получилось, вы бы получили битый образ. Обязательно делайте нахолодную.
    К тому же, перенести будет проблемно - высока вероятность что не запустится и придётся производить "восстановление с диска", чтобы добиться нормальной работы внутри виртуалки.
    Ответ написан
    4 комментария