Задать вопрос
@ermak148

Как преобразовать текст (эмбеддинги) в вектор фиксированной длинны?

Учу уже месяц pytorch и пришел к NLP, трансформерам и т.д. Хочу сделать генератор картинок на GAN, но эмбеддинги gpt динамической длины (всмысле seq_len), а gan'у нужны данные фиксированной длинны. Спрашивал на стаковерфлоу, но там сказали бери среднее или сумму, но этот подход я решил использовать в последнюю очередь, ведь одно и то же среднее или сумму можно сделать из разных токенов (вроде как), вот я и ищу другие способы
  • Вопрос задан
  • 160 просмотров
Подписаться 1 Средний Комментировать
Пригласить эксперта
Ответы на вопрос 1
mayton2019
@mayton2019
Bigdata Engineer
Посмотри как в Spark/Databricks работает HashingTF https://spark.apache.org/docs/3.5.0/ml-features.ht...

И еще посмотри ссылки от Feature Hashing https://en.wikipedia.org/wiki/Feature_hashing
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
от 200 000 до 300 000 ₽
Greenway Global Новосибирск
от 150 000 ₽
Akronix Санкт-Петербург
от 150 000 до 200 000 ₽
02 февр. 2025, в 00:55
2500 руб./за проект
02 февр. 2025, в 00:25
5000 руб./за проект
02 февр. 2025, в 00:18
1000 руб./за проект