Ответы пользователя по тегу Кластеризация
  • Можно ли сделать быстрый поиск по карте с 1 млн маркеров (MongoDb) и кластеризацией?

    Попробуйте PostGIS для хранения данных. В ней эти алгоритмы уже реализованы и данные получаются при помощи обычных SQL запросов.
    Для скорости пробуйте построить таблицу соответствий между входными параметрами и искомой областью. Скажем, определить longitude, latitude и тогда можно быстро доставать нужную область. С кэшированием координат часто запрашиваемых областей еще более ускорится.
    Ответ написан
    Комментировать
  • Алгоритм для кластеризации документов из нескольких частей?

    fastText
    ... Facebook объявила об открытии исходных текстов библиотеки fastText, предоставляющей средства для классификации текста с использованием методов машинного обучения
    (заметим: классификации, а не кластеризации)
    Классификация - это кода классы заранее известны и к ним нужно отнести все классифицируемые элементы.
    Каждый документ содержит взаимосвязанные по смыслу данные.

    Под понятием "вектора" в машинном обучении прежде всего нужно понимать набор каких признаков представляют те или иные данные.

    Сперва нужно произвести нормализацию и фильтрацию данных. А текст - это сырые данные, негодные для машинного обучения, ибо машина - не человек, которые понимает значения слов (опять же, обычно не более 2-х разных языков).
    Ответ написан