Задать вопрос
Пользователь пока ничего не рассказал о себе

Наибольший вклад в теги

Все теги (2)

Лучшие ответы пользователя

Все ответы (3)
  • Как устроены Нейрохам и подобные ему боты с точки зрения ML?

    @morginalium8
    1. расцензуренные модельки
    ни одна облачная модель не будет полностью открытой. у нее есть фильтры безопасности, запретные темы и тд.
    с локальными моделями так-же - по умолчанию базовая версия весов не будет отвечать на незаконные вопросы. однако умные люди нашли способ обйти это ограничения. поэтому обычно после выхода серьзной модели выходит и версия без цензуры.
    2. актуальные шутки
    во-первых - старый добрый few-shot на лучших примерах.
    во-вторых - постоянная обновляема база шуток, анекдотов и контекста. формат такой базвы может быть разный (rag, skills, общий сиспромт или динамический сиспромт). обновляется это или вручную, или сами агенты периодически смотрят популярные видосы в тиктоке и вычленяют шутки.

    еще, наверное, есть такая штука: ищем видос в тт с текстом, пасрим текст через OCR, берем самый залайканный комм и используем его в качестве шутки. так можно приличный датасет собрать, и на небольшое дообучение хватит пары десяткой тысяч рублей.
    Ответ написан
    Комментировать