• Plsa обучающая выборка?

    @maewyn Автор вопроса
    То есть, если на мой случай перевести, то x1...xn - это термины в документе, xi - то с какой вероятностью они относятся к темам (которых от 1 до m). А Yi - это уже известные вероятности для соотношений тем и терминов? Грубо говоря, мы должны параметры модели установить так, чтобы xi максимально приблизилось к yi, тогда уже на большой коллекции документов, где yi неизвестно результат будет более или менее нормальным?
    Ответ написан
  • Где найти экспертов для ранжирования сайтов?

    @maewyn Автор вопроса
    Спасибо. Так мне и нужно сравнить эффективность того же pagerank и моего алгоритма, какой из них будет ближе к человеческому рейтингу. Читал, что ранжирование поисковика mahalo.com происходило вручную.
    Ответ написан
    Комментировать