Посоветуйте какую-нибудь мультимодальную нейросеть без цензуры, которая могла бы распознавать любые изображения, желательно с поддержкой русского языка. Можно и без, просто тогда придется сверху ставить обёртку из переводящей нейросети ))
Можно и как онлайн сервис с API и offline версию которую можно скачать например с того же Hugging Face.
Пока из того, что пробовал Gemini Pro Vision самая лучшая, но до конца цензуру не отключить, в 99% случаев все норм, но бывает, что одно фото из 100 заворачивает.