• Обязательно ли заполнять матрицу с примерами всем словарем возможных слов?

    @AlexSku
    не буду отвечать из-за модератора
    Есть такое понятие, как разреженная матрица. Запоминаются только ненулевые элементы (с координатами). Можно использовать обычный словарь (ассоциативный список).
    Ответ написан
    3 комментария
  • Обязательно ли заполнять матрицу с примерами всем словарем возможных слов?

    DanilBaibak
    @DanilBaibak
    Machine Learning engineer
    Размер словоря можно ограничить, взяв топ, например, 5 тыс слов (предварительно отсортировав по "весу").

    Существует ряд эвристик, которы так же можно применить:
    1. Исключить стоп-слова
    2. Не включать слова, которые встречаются "реже чем..."
    3. Не включать слова, которые встречаются "чаще чем..."


    Рекомендую посмотреть на реализацию TfidfVectorizer от scikit-learn.
    Ответ написан
    4 комментария
  • PHP7. Двухуровневое кеширование + форк?

    @rPman
    Меняйте парадигму разработки, в подавляющем большинстве случаев переделать свое приложение можно с минимумом затрат.

    Устаревший классический принцип - на каждый запрос к веб серверу приложение заново собирает данные из базы данных, шаблонов, формирует ответ и прочее, содержит в идеологии проблему вот этого повтора сбора данных, из-за которой приходится городить кеши.

    Поднимите на базе php вебсервер (или даже вебсокет сервер или оба, react вполне себе технология, с плюшками от nodejs, асинхронщины и прочее) в том случае ваши данные будут всегда в оперативной памяти и контролируемы вами (т.е. вы можете управлять кешированием (управление блокировками) на уровне логики приложения, вплоть до полного хранения в оперативной памяти в переменных, а не базы данных как прослойки), само собой нет необходимости выставлять этот сервер в сеть, пусть проксирующим будет ваш основной вебсервер, контролирующий пользователей на уровне запросов и даже авторизации, а ваше react приложение - отвечать за логику.

    Из недостатков подхода, полученный бонус к скорости заметно отдалит необходимость перехода к многопроцессорной реализации, так как по умолчанию это single thread приложение (но само собой никто не мешает вам запускать несколько бакенд но блокировками управлять так же придется с оглядкой на это), т.е. разрабатывая приложение об этом почему то многие стараются не задумываться сразу, типа зачем и так все круто, но потом будет больно.

    В некоторых случаях скорость может подняться тысячекратно.

    Классический же подход позволяет 'из коробки' использовать многопоточность и даже кластерную реализацию чуть ли не на администраторском уровне.

    upd. исправил в ответе redis на react (глупо попутал термины)
    Ответ написан
    Комментировать
  • Какие есть онлайн-редакторы схемы БД?

    а как же phpMyAdmin? =)
    Так же есть для php фрэймворка Laravel laravelsd.com
    Ответ написан
    1 комментарий
  • Какую выбрать версию Symfony2 для разработки?

    Fesor
    @Fesor
    Full-stack developer (Symfony, Angular)
    я обычно беру стабильную версию на данный момент, и просто периодически обновляю. Там не такая уж и болезненная миграция с версии на версию.
    Ответ написан
    Комментировать