1. расцензуренные модельки
ни одна облачная модель не будет полностью открытой. у нее есть фильтры безопасности, запретные темы и тд.
с локальными моделями так-же - по умолчанию базовая версия весов не будет отвечать на незаконные вопросы. однако умные люди нашли способ обйти это ограничения. поэтому обычно после выхода серьзной модели выходит и версия без цензуры.
2. актуальные шутки
во-первых - старый добрый few-shot на лучших примерах.
во-вторых - постоянная обновляема база шуток, анекдотов и контекста. формат такой базвы может быть разный (rag, skills, общий сиспромт или динамический сиспромт). обновляется это или вручную, или сами агенты периодически смотрят популярные видосы в тиктоке и вычленяют шутки.
еще, наверное, есть такая штука: ищем видос в тт с текстом, пасрим текст через OCR, берем самый залайканный комм и используем его в качестве шутки. так можно приличный датасет собрать, и на небольшое дообучение хватит пары десяткой тысяч рублей.