@ermak148

Как преобразовать текст (эмбеддинги) в вектор фиксированной длинны?

Учу уже месяц pytorch и пришел к NLP, трансформерам и т.д. Хочу сделать генератор картинок на GAN, но эмбеддинги gpt динамической длины (всмысле seq_len), а gan'у нужны данные фиксированной длинны. Спрашивал на стаковерфлоу, но там сказали бери среднее или сумму, но этот подход я решил использовать в последнюю очередь, ведь одно и то же среднее или сумму можно сделать из разных токенов (вроде как), вот я и ищу другие способы
  • Вопрос задан
  • 116 просмотров
Пригласить эксперта
Ответы на вопрос 1
mayton2019
@mayton2019
Bigdata Engineer
Посмотри как в Spark/Databricks работает HashingTF https://spark.apache.org/docs/3.5.0/ml-features.ht...

И еще посмотри ссылки от Feature Hashing https://en.wikipedia.org/wiki/Feature_hashing
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы