Volgarastraport, я сам у себя регулирую. В противном случае ошибка. Параметров подобных не видел. Хотя обертку лично делал. И совсем недавно. И реализовал все актуальные параметры и методы
Volgarastraport, предел токенов у этой модели - 4096. Это количество включает и твой текст, который ты передал. Т.е. ты должен передать максимум столько текста, чтоб результирующий текст не превысил 4096.
Например, если ты передал макстокенс 1024, то длина твоего текста запроса не должна превышать 4096 - 1024. Т.е. максимальная длина промпт должна быть не больше 3072.
Volgarastraport, возьми вопрос из моего скрина. Сделай запрос и покажи текст всего запроса и ответа в json. Я хочу увидеть что ответит. Ну и токены увелич до 1024
Volgarastraport, по ссылке видно, что я там обычные параметры передаю.
Prompt (текст, с историей, чтоб контекст учитывался)
MaxTokens - 1024
Temperature - 0.5
User (для разделения чатов)
Т.е. ничего специфического.
Приведи пример запроса и ответа. Желательно и то и другое сырыми джсонами