Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Данил
Machine Learning engineer
29
вклад
0
вопросов
55
ответов
29%
решений
Ответы пользователя по тегу
Обработка естественного языка
Как можно искать похожие предложения по смыслу?
Данил
@DanilBaibak
Machine Learning engineer
Используя word2vec, получаем вектора для каждого слова
Для каждого ответа считаем вектор, как среднее векторов слов из которых он состоит
Считаем вектор вопроса, как среднее векторов слов из которых он состоит
Для определенного вопроса ищем ответ используя, например, косинусное расстояние
Ответ написан
более трёх лет назад
Комментировать
Нравится
1
Комментировать
Классификатор текста по заданным ключевым словам?
Данил
@DanilBaibak
Machine Learning engineer
Берете векторное представление для русского языка (например
тут
)
Считаете суммарный вектор для каждого эмоционального состояния
Для определенного текста, считаете суммарный вектор этого текста и считает
косинусное расстояние
с каждым
вектором моционального состояния
Если брать текст небольшого размера, должно неплохо работать.
Ответ написан
более трёх лет назад
Комментировать
Нравится
Комментировать
Обработка естественного языка на коленке, как научится выдергивать из текста город, улицу, район?
Данил
@DanilBaibak
Machine Learning engineer
Ваша задача называется
Named-entity recognition
. Существует ряд библиотек, которые решают эту задачу (spacy, NLTK). Большинство решений приведены для английского языка. Но, я думаю, есть примеры и для русского.
Ответ написан
более трёх лет назад
Комментировать
Нравится
2
Комментировать
Алгоритм разделения слов, которые, при опечатке, случайно "склеились" (написаны без пробела)?
Данил
@DanilBaibak
Machine Learning engineer
Как вариант, попробуйте поискать библиотеку, которая проверяет правописание.
Ответ написан
более трёх лет назад
5
комментариев
Нравится
2
5
комментариев
Оценили как «Нравится»
Закрыть
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама