Задать вопрос
Taras_Serevann
@Taras_Serevann
веб-разработчик, автор

Что такое токенизация текста?

Здравствуйте!

Может кто-то наглядно и простым языком объяснить, что такое токенизация текста в машинном обучение и как она применяется на практике
  • Вопрос задан
  • 5163 просмотра
Подписаться 2 Оценить Комментировать
Помогут разобраться в теме Все курсы
  • Яндекс Практикум
    Специалист по Data Science плюс
    17 месяцев
    Далее
  • Нетология
    Бизнес-аналитик
    7 месяцев
    Далее
  • Skillbox
    Профессия Machine Learning Engineer
    12 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 1
longclaps
@longclaps
токенизация - разбиение текста на слова ( и не-слова, те знаки препинания, границы абзацев и т.п). Полезность её в машинном обучении - прямое донесение до сетки факта, что человек (чьим действиям её надо научить подражать) воспринимает текст как поток слов, а не поток букв.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы