• Что такое вектор слова (как его вычислить), word embedding и как работает word2vec?

    angrySCV
    @angrySCV
    machine learning, programming, startuping
    вектор - это отрезок в пространстве (определенная величина которой мы что-то измеряем в пространстве).
    Если это 3х мерное пространство то это соответственно набор параметров длина, ширина, высота объекта которого мы измеряем.
    Многообразие слов может быть представлено очень большим "пространством" (условно можно назвать "смысл"), и вордТуВек - работает измеряя параметры определенного слова в этом пространстве.
    Для примера можно рассмотреть например - если мы ограничим пространство всех слов (смыслов), только словами с цветом - тогда у каждого нашего слова зеленый, красный, черный, синий и тд, будет размер в пространстве который бы соответствовал цветовой характеристике (например RGB, типа там [0, 0, 0] - для черного), однако пространство у нас куда более большое, чем только характеристики цвета, такое пространство может иметь тысячимерную размерность "смыслов".
    самое главное что мы в итоге переводя слова в такие вектора, можем их сравнивать. находить близкие по смыслу слова и сравнивать составленные из этих слов "фигуры" в пространстве
    Ответ написан
    6 комментариев