Можно ли обучать нейросеть на базе книг?

Question

STINGRAY_DEVELOP @OWIII

Нейронные сети

Можно ли обучать нейросеть на базе книг?

Условно, например, я хочу создать нейросеть, которая будет генерировать блюда и рецепты разного формата на базе книг по кулинарии. Могу ли я каким-то образом просто скормить ей несколько сотен книг по кулинарии, чтобы она "поумнела"? Или мне нужно ее кормить конкретными данными, в конкретном виде или может какими-то формулами?

Общий вопрос: Можно ли нейросеть скормить тысячи книг по какой-то тематике, чтобы далее она могла владеть любой информацией из этих книг и выдавала на базе них грамотные ответы?

Вопрос задан более года назад
1706 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 2

7 комментариев

rPman @rPman

+ Ещё учитывай, что просто взять текст произвольной книги и использовать для обучения нейросети - это преступление
пока в этой области много неоднозначностей.

чем отличается использование рецептов из книги на сайте и использование этих же рецептов для обучения нейросети? и там и там какой то алгоритм и в обоих случаях публикуется не сама книга а ее производные, почему в одном случае нужно запрещать а в другом разрешать?

ответ зависит от того, со стороны кого ты находишься.

Написано более года назад
Василий Банников @vabka

rPman,
чем отличается использование рецептов из книги на сайте и использование этих же рецептов для обучения нейросети?

Ничем. И то и другое - преступление.
Нарушение авторских прав автора книги, путём создания и публикации производного произведения, которое не было разрешено лицензией.

Написано более года назад
rPman @rPman

Василий Банников,
создания и публикации производного произведения
нет, я спокойно, к примеру могу, используя кулинарную, книгу готовить блюда и снимать об этом видео.

теперь найди в законе упоминание границы, в пределах которых можно трактовать 'производный продукт' как нарушение

я допускаю, что создатель книги может указать эти границы буквально в самой книге, но по умолчанию они не определены

p.s. свобода распространения информации уже давно проиграла эту битву, когда этими границами стали рулить правообладатели, вылезают высеры вида - запись пения птиц банится на ютубе как нарушение прав владельца кого то с треком с птичьим пением.

Написано более года назад
Василий Банников @vabka

rPman,
нет, я спокойно, к примеру могу, используя кулинарную, книгу готовить блюда и снимать об этом видео.

Готовить можешь, а вот текст книги опубликовать - нет.
А вот если это какая-то авторская кухня, которую написал какой-нибудь известный шеф - он может прям книге прописать ограничение "вы можете использовать эти рецепты в целях ознакомления и готовки у себя дома, но использовать их с коммерческими целями запрещено"

теперь найди в законе упоминание границы, в пределах которых можно трактовать 'производный продукт' как нарушение

Для этого в судах всегда привлекается экспертная оценка.
Автор книги обращается в суд и утверждает, что ты нарушил его права, попутно даёт заключение независимого эксперта о том, что твоя нейросеть создана на основе его книги, тк производит идентичные или похожие до степени смешения по стилю повествования тексты.

Тут скорее вопрос о том, сможет ли независимый эксперт такую оценку произвести, но доработка законов под это - это скорее вопрос времени.

Написано более года назад
rPman @rPman

по поводу нейросетей нет еще законодательной базы и прецедентной практики

Написано более года назад
Василий Банников @vabka

rPman, вроде в Америке уже что-то было про это. По крайней мере какие-то художники уже судились.
Результат не вспомню.
+ В Европе и России руководствуются не прецедентами

Написано более года назад
rPman @rPman

Василий Банников, в сложных вопросах лезут в случившуюся практику, всем лень думать, просто в некоторых странах это возведено в абсолют (в смысле достаточно раз где то всплыть то все, решение копируется, хотя как я понимаю там тоже есть лазейки)

еще по поводу нейронки, всем абсолютно очевидно, что качество ИИ (того что на основе языковых моделей) - однозначно определяется собранными обучающими данными, а значит преграды на использование информации любыми конкурентами существующих моделей будут использоваться, вот увидите америка первая запретит всем и вся это делать. Само собой компании, которые успели собрать такие датасеты и обучить нейронки будут во всю этим пользоваться, имя непреодолимое преимущество перед новичками (например не публично уже существующая нейронка может собирать легальный датасет, делая это дешевле на пару порядков чем делать это будут люди, я не про генерацию текстов а именно анализ информации).

Напоминаю, абсолютна вся движуха по aligment/responsible innovation ИИ, создана не для защиты населения от террористов или самого ИИ, смешно даже, как манипулируют страхами, а для того чтобы знания, предоставляемые доступными публично ИИ не позволили другим странам и компаниям получить буст в развитии (а он может быть значительным), отличным примером является мой запрос к chatgpt4 на сугубо техническую тему поведения вещества при сверхвысоких ультразвуковых воздействиях (всего то спрашивал какая максимальная частота ультразвука доступна на текущий момент ради абстрактного обсуждения), чат стал настойчиво интересоваться зачем это мне и отказывался давать ответ потому что это может нанести кому то вред.

Написано более года назад

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+1 ещё

Простой
Какая нейросеть умеет в дизайн?
- 1 подписчик
- 04 мая
- 124 просмотра
2

ответа
Python

+1 ещё

Средний
В Coqui TTS есть поддержка русского языка для озвучки текста?
- 1 подписчик
- 04 мая
- 82 просмотра
1

ответ
Нейронные сети

Средний
В процессе работы нейросетевых моделей насколько активно идёт процесс обмена данными по PCIe с видеокартой?
- 1 подписчик
- 02 мая
- 65 просмотров
2

ответа
Электроника

+1 ещё

Простой
Какие нейронки или программы смогут восстанови эл. схему по фото платы?
- 4 подписчика
- 30 апр.
- 811 просмотров
3

ответа
Android Studio

+1 ещё

Средний
Возможно ли в android studio сделать что то подобное как grad-cam в python?
- 1 подписчик
- 28 апр.
- 65 просмотров
1

ответ
Нейронные сети

Простой
Есть ли нейросеть, с функционалом аналогичным программному комплексу Revit?
- 1 подписчик
- 27 апр.
- 82 просмотра
1

ответ
Python

+1 ещё

Простой
Почему Python не изменяет переменные в цикле?
- 2 подписчика
- 27 апр.
- 944 просмотра
0

ответов
Нейронные сети

Простой
Какая нейронка лучше заменяет лица?
- 1 подписчик
- 27 апр.
- 126 просмотров
2

ответа
Нейронные сети

+1 ещё

Средний
Как автоматически создавать большие отчёты из множества docx файлов?
- 2 подписчика
- 18 апр.
- 436 просмотров
4

ответа
Нейронные сети

Простой
GUI для DeepSeek — есть ли?
- 5 подписчиков
- 17 апр.
- 5644 просмотра
4

ответа
Показать ещё Загружается…

Инженер эксплуатации сети/Начинающий специалист

beeline • Владивосток

от 70 000 ₽

Content Marketing Specialist

MS Dev

от 1 000 до 2 000 $

Аналитик 1С

SM Lab • Москва

от 200 000 ₽

Answer 1 · 2023-05-13 01:17:34

То что ты описываешь называется "языковая модель" - тема достаточно большая и очень сложная, если хочется получать что-то осмысленное.

Если у тебя узкая задача - генерировать рецепты, то лучше как-нибудь предварительно обработать данные и формализовать их, чтобы работать именно с рецептами, а не их текстовым представлением.
В идеале стоит это всё совместить с классическими алгоритмами, чтобы не получился в итоге рецепт помидоров, жареных в огуречном кляре с заправкой из рыбных потрохов.

Советую также почитать про IBM Chef Watson:
https://www.bonappetit.com/entertaining-style/tren...
Там вообще нет по сути никакого машинного обучения.

+ Ещё учитывай, что просто взять текст произвольной книги и использовать для обучения нейросети - это преступление

Answer 2 · 2023-05-13 05:21:23

Можно взять уже обученную языковую модель (из открытых лучшие это bloomz и фейсбуковский opt, из нелегальных но кардинально лучших - llama, ну а чужие платные - chatgpt4 api, не уверен что там открыли доступ на дообучение) и дообучнить (finetune).

Оцени модели на самом сложном бенчмарке MMLU, opt66b - 35, bloom175b - 39, llama65b - 68, gpt35 - 70, gpt4 - 86

Есть набор алгоритмов peft, с помощью которого можно тюнить очень большие модели на слабом железе и небольшом количестве данных.

Такие модели как llama и chatgpt4 можно использовать как обычного человека, буквально, предоставляя ему текст и задавая вопросы (текст+запрос+ответ+запрос... не должны превышать размер контекста, для llama это 2к токенов, для chatgpt - 4к или 8к). Если нужно перед вопросами залить в модель большой объем данных то используют дообучение. Внимание, это ломает модель, она запоминает обучаемые данные но начинает забывать области знаний, которых не было в дообучающей выборке, с этим борются в т.ч. подмешивая в нее данные из стартового датасета, на котором обучалась изначальная модель. Процент данных - вопрос экспериментальный, я не нашел (точнее статьи есть но их надо читать изучать, их много) примеров.

свойство это катастрофическое забывание

Можно ли обучать нейросеть на базе книг?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт