Как высчитать макимальную длину строки слов в токенах для обучения модели OpenAI?

Question

Kakagawa @Kakagawa

Машинное обучение

Как высчитать макимальную длину строки слов в токенах для обучения модели OpenAI?

При обучении модели на основе своего файла с диалогами на модели text-davinci-002 возникает ошибка:

openai.error.InvalidRequestError: This model's maximum context length is 4097 tokens, however you requested 26087 tokens (21991 in your prompt; 4096 for the completion). Please reduce your prompt; or completion length.

Файл с диалогом оформлен в формате:
User: привет, как дела?
Ai: привет, хорошо

Длина каждой строки не превышает 1500 символов. Если верить гайду openai, то подсчет такой:

Если 100 токенов равны 75 словам, то 1 токен равен 0,75 словам (75 слов / 100 токенов). Тогда, чтобы посчитать количество лимитированных слов в 4096 токенах, нужно умножить количество токенов на соотношение слов к токенам:

4096 токенов * 0,75 слова/токен = 3072 слова

Таким образом, в 4096 токенах может быть использовано до 3072 слов.

Верно ли я считаю? Почему он пишет что я запрашиваю ему 26087 токенов?

Вопрос задан более двух лет назад
1030 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Яндекс Практикум

Инженер машинного обучения

4 месяца

Далее
Skillfactory

Machine Learning и Deep Learning

5 месяцев

Далее
Нетология

Машинное обучение

10 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Машинное обучение

+1 ещё

Средний
Есть ли готовая архитектура модели, которая принимает на вход подобный формат данных?
- 3 подписчика
- 27 сент.
- 154 просмотра
0

ответов
Машинное обучение

+1 ещё

Простой
Поиск по образцу. Как сделать быстрый поиск вхождения картинок-символов на большом чертеже?
- 2 подписчика
- 19 сент.
- 185 просмотров
1

ответ
Нейронные сети

+1 ещё

Простой
С помощью чего проанализировать данные и построить свою нейронную сеть для бана пользователей?
- 1 подписчик
- 09 сент.
- 178 просмотров
2

ответа
Нейронные сети

+1 ещё

Средний
Как повысить macro f1 в задаче классификации изображения?
- 1 подписчик
- 03 сент.
- 56 просмотров
0

ответов
Веб-разработка

+1 ещё

Простой
Какие есть ML-инструменты, которые по структуре или изображению лендинга предсказывают зоны внимания пользователей?
- 1 подписчик
- 28 авг.
- 394 просмотра
3

ответа
Видеокарты

+1 ещё

Средний
Целесообразно ли использование двух RTX 5080 для обучения нейросетей?
- 1 подписчик
- 24 авг.
- 346 просмотров
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 440 просмотров
3

ответа
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 64 просмотра
0

ответов
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 146 просмотров
3

ответа
Python

+3 ещё

Простой
Как повысить точность классификации по табличным документам?
- 2 подписчика
- 19 мая
- 304 просмотра
1

ответ
Показать ещё Загружается…

Разработчик плагина для Wordpress

TripShock Adventures

от 1 200 до 2 500 $

SRE в команду трафика Core Infrastructure

Яндекс • Москва

от 400 000 ₽

Старший дизайнер специальных проектов

Хабр • Москва

от 180 000 до 200 000 ₽

А уверен, что ты строчку послал, а не весь свой текст.

Answer 1 · 2023-04-04 12:55:07

Тебя пишет что в запросе 21991 токенов, ты перед отправкой запроса выведи, что именно ты там в prompt вставил. Ну про 0,75 я не видел в гайдах, видел только пример "For example, the string "ChatGPT is great!" is encoded into six tokens: ["Chat", "G", "PT", " is", " great", "!"]."

Как высчитать макимальную длину строки слов в токенах для обучения модели OpenAI?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт