Ответы пользователя по тегу Алгоритмы
  • Что и где почитать про алгоритмы определения интереса(ов) пользователей?

    akalend
    @akalend
    программирую
    я занимаюсь похожей задачей, с тем отличием, что анализ предпочтений идет для службы знакомств. Прикладная сторона — вычислять спамера, предложения разных услуг… т.е. чьи цели НЕ познакомиться.

    У каждого пользователя есть некоторые показатели (у нас их более 50). Собирается информация на каждом шаге пользоввателя нахождения на сайте. Далее мы данные прокручиваем через статистику, и выявляем кластеры пользователей. Аномальные пользователи «неадексаты», те, чье расстояние на n-мерном пространстве более, чем две медианы кластера.

    Кластеры
    ru.wikipedia.org/wiki/%D0%9A%D0%BB%D0%B0%D1%81%D1%82%D0%B5%D1%80%D0%BD%D1%8B%D0%B9_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7
    www.statsoft.ru/home/textbook/modules/stcluan.html
    www.nickart.spb.ru/analysis/cluster.php
    Ответ написан
  • Подход (алгоритмы и тд) чтобы сделать поиск по параметрам как на Яндекс-маркете?

    akalend
    @akalend
    программирую
    Также подскажите — может я замахнулся на слишком сложную идею, которую не под силу реализовать одному человеку за разумное кол-во времени?

    начни с минимума, потом поймешь чего не хватает!
    главное запуститься, доработаешь в процессе. Я тоже упростил поиск до (разумного) минимума.
    Ответ написан
    Комментировать
  • Подход (алгоритмы и тд) чтобы сделать поиск по параметрам как на Яндекс-маркете?

    akalend
    @akalend
    программирую
    я разрабатывал похожую систему, второй похожий проект в разработке.
    пока для поиска использую Сфинкс — статья про поиск в процессе написания (через недельку другую будет готова).

    Основные идеи по структуре хранения:
    — есть товары (спецификациии)
    — есть предложения (данные от магазинов)
    — есть модели
    -есть каталог

    Все предложения от магазинов привязаны к спецификациям и/или к моделям.

    Запускается робот, который анализирует названия товаров и принадлежность их к категориям и привязывает их к моделям. В зависимости от того, как поработают эти роботы — будет построен хороший индекс, и соответственно качественный поиск.

    И еще не забываем, что в ЯМ — есть куча контент-менеджеров, которые редактируют «спецификации товаров» и сильно облегчают «жизнь роботов».

    Основные идеи поиска:
    — строим индекс по каталогу, названиям, моделям,
    -на каждый индекс делаем по запросу.
    — в зависимости от полученных результатов делаем соответствующие вывод
    — делаем анализ взаиморасположения поисковых слов
    — параметры проходят полнотекстный поиск.

    Честно говря я хотел пож этот проект сделать свой поисковик, но сил не хватит. Сперва надо запустить со Сфинксом.

    Поддерживаю идею MongoDb как средство хранения информации и быстрого ее извлечение. C использованием MongoDb может быть маленькая проблема (кроме ограничения на размер данных в 2 Гб для 32 бит Ось ), которая выльится в большой геморой: пока индексатор Сфинкса на нее не написан. Я тоже собирался ее использовать, но пока остановился на мускуле.

    На последней PHPConf был хороший доклад про использование Сфинкса по поиску миллиона товаров dostavka.ru ( у меня сайт агрегатор — было 2 миллиона) Видео есть на сайте PHPConf
    Ответ написан
  • как лучше организовать контейнер для хранения IP адресов (1-3Mb)

    akalend
    @akalend Автор вопроса
    программирую
    заинтересованным, решил делать так:

    поиск по IP структура в виде b-Tree
    далее проверка на время
    времена хранятся в ввиде обратного списка
    вытесняется самый последний в очереди.

    При обновлении IP — переносим значение эл-та в конец списка.
    Ответ написан
    Комментировать