Строка как вход для нейронной сети?

Question

n7olkachev @n7olkachev

Нейронные сети

Строка как вход для нейронной сети?

Есть слова, длиной от 4 до 7 символов, состоящих из строчных букв английского алфавита. Каждому слову в соответствии ставится 1 или 0. Нужно обучить ИНН так, чтобы она сама могла оценивать новые слова.
Попробовал перегонять каждую букву в 26 мерный вектор и прокидывать эти вектора на вход к персептрону. Сеть ничему не обучилась, пишет почти нулевую ошибку, но на деле даже на обучающей выборке дает огромную ошибку.
В какую сторону копать? Может нужна другая архитектура сети? Или же другой метод маппинга слова в инпут?
UPD
Опишу саму задачу, чтобы было понятней. Я хочу научить ИНС определять субъективную оценку "красоты" набора букв. То есть, есть наборы букв, сочетание которых выглядит хорошо, есть наборы букв, сочетание которых выглядит плохо. Например, мне нравится, как выглядит слово "cool", но мне абсолютно не нравится, как выглядит "kkrt". Это субъективно, поэтому вряд ли здесь может помочь что-то кроме ИНС.

Вопрос задан более трёх лет назад
1244 просмотра

2 комментария

Подписаться 2 Оценить 2 комментария

Помогут разобраться в теме Все курсы

Яндекс Практикум

Специалист по Data Science плюс

17 месяцев

Далее
Нетология

Бизнес-аналитик

7 месяцев

Далее
Нетология

Data Scientist: расширенный курс

13 месяцев

Далее

Решения вопроса 2

2 комментария

Комментировать

Пригласить эксперта

Ответы на вопрос 2

18 комментариев

n7olkachev @n7olkachev Автор вопроса

На входе у меня получается массив размерности 26 * 7, т.е. объединенные массивы для всех букв. Буква в массив перегоняется следующим образом: arr[i] = word[i] - 'a' == i ? 1 : 0. Т.е. я ставлю 1 для текущей буквы, 0 для всех других. Если длина слова меньше 7, тогда входные данные добиваются нулями до нужной длинны.

Написано более трёх лет назад
GavriKos @GavriKos

n7olkachev Нет, не то что у вас получается, а человеческим языком постановку задачи. Например - "на вход набор слов, на выходе - является ли фраза нецензурной".

Написано более трёх лет назад
n7olkachev @n7olkachev Автор вопроса

GavriKos: На вход набор букв, на выход: нравится ли мне этот набор букв, т.е., грубо говоря, субъективная оценка красоты рандомного набора букв.

Написано более трёх лет назад
GavriKos @GavriKos

n7olkachev Фух, у вас не 26-мерный вектор. Обычный двухмерный. По сабжу. Попробуйте передавать просто номер букв - условно позицию в алфавите. Если позиция не важна - то еще и отсортируйте.
Либо, второй вариант - это сделать 26 входов, и уже их инитить 0 и 1. Ну и еще - структуру нейросети опишите - там всякое количество слоев, метод обучения, бла бла бла. Все это - в текст вопроса - может кто чего дельнее скажет.

Написано более трёх лет назад
d'Ivan @2ord

n7olkachev: чего-чего?? "красоты"?? Гы гы )))

Написано более трёх лет назад
GavriKos @GavriKos

Роман Мирр Ну а что такого - ИНС вполне подходит для субъективных оценок, когда зависимость входных и выходных параметров плохо подчиняется закономерности

Написано более трёх лет назад
d'Ivan @2ord

GavriKos: Так "когда зависимость входных и выходных параметров плохо подчиняется закономерности", то как Учитель НС обучит?? Это ведь учитель, сам не имеющий представления о том чему учить.
Учитель НС *обязан* знать формально чему обучать. Должны быть примеры "хорошего" и "плохого" слова. Но заранее предупрежу, что задача в данной формулировке нерешаема.

Написано более трёх лет назад
GavriKos @GavriKos

Роман Мирр Ну дык субъективно. Я подаю слово, и говорю - нравится или нет. Обучение с учителем, классическое, не автоматическое. Все уже придумано. Метод оценки обученности - на контрольной выборке.

Написано более трёх лет назад
d'Ivan @2ord

GavriKos: НС, работающее вкупе с лингвистикой - это задача явно не для начинающих. Это задача для дипломной работы, не меньше.

Написано более трёх лет назад
GavriKos @GavriKos

Роман Мирр Это уже другой разговор, тут с вами согласен полностью. Особенно если речь о законченном продукте, а не о just-for-fun.

Написано более трёх лет назад
n7olkachev @n7olkachev Автор вопроса

GavriKos: двухмерный? Как мне запихнуть 4-7 букв всего лишь в два измерения?
Порядок все таки важен. "Красота" -- слово выглядит хорошо, "крстаоа" -- слово выглядит не очень. Поэтому и в 26 входов тоже не получится.
Касательно варианта с просто номеров букв. На сколько я понимаю, НС тогда будет думать, что, условно, 'a' и 'b' -- близкие по значению входы. Но это тоже неверно, между буквами нет такой близости.

Написано более трёх лет назад
GavriKos @GavriKos

n7olkachev 4-7 букв запихиваются в 1 измерение. А у вас 26 строк и 7 колонок, условно - это два измерения.
Про "ИНС будет думать" - все зависит от чувствительности.

Написано более трёх лет назад
n7olkachev @n7olkachev Автор вопроса

Роман Мирр: интересно, почему она нерешаема. Разве это не идеальный пример, когда нужно использовать нейросеть? Я не могу определить закономерность сам, однако знаю выход для каждого из входа.

Написано более трёх лет назад
n7olkachev @n7olkachev Автор вопроса

GavriKos: то есть те же самые 26*7 входов, о которых я и говорил в самом начале?

Написано более трёх лет назад
d'Ivan @2ord

n7olkachev: Предположим, что слово "Красота" кодируется как "1,0,1", а слово "крстаоа" как "1,1,0". На основании какого критерия тогда "1,0,1" *лучше* чем "1,1,0"? На основании какой метрики?

Написано более трёх лет назад
n7olkachev @n7olkachev Автор вопроса

Роман Мирр: если бы я знал эту метрику, нейронная сеть мне была бы не нужна.

Написано более трёх лет назад
d'Ivan @2ord

n7olkachev: а кто сказал, что НС найдёт решение? А если "найдёт", то как тестировать процент ошибки?

Написано более трёх лет назад
n7olkachev @n7olkachev Автор вопроса

Роман Мирр: а в чем вы видите проблему при подготовке тестовых данных? я же могу сказать, какое слово мне нравится, а какое нет.

Написано более трёх лет назад

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 90 просмотров
0

ответов
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 77 просмотров
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 75 просмотров
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 65 просмотров
0

ответов
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 96 просмотров
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 79 просмотров
1

ответ
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1329 просмотров
5

ответов
Нейронные сети

Простой
Отечественные нейронки для кодинга и не только сентябрь 2025?
- 1 подписчик
- 22 сент.
- 243 просмотра
3

ответа
Нейронные сети

Простой
Какая AI модель дешевле в пересчете на решение задачи в программировании?
- 1 подписчик
- 21 сент.
- 275 просмотров
3

ответа
Нейронные сети

Простой
Как настроить оркестрацию вайбкодинга?
- 2 подписчика
- 21 сент.
- 438 просмотров
3

ответа
Показать ещё Загружается…

Project manager / Resource manager

Regex SEO

от 1 500 до 3 000 $

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

Менеджер цифровых проектов

Российский Красный Крест • Москва

от 100 000 ₽

Я бы посоветовал для начала взять задачку попроще. Допустим, анализировать уровень загрязнения воздуха, имея историю предыдущих замеров.
Роман Мирр: это звучит как намек на то, что я чего-то базового не понимаю :) если это так, не могли бы вы конкретизировать, что именно я не улавливаю?

Answer 1 · 2017-01-20 12:38:26

Текст обычно кодируют двумя способами:
1) bag-of-words (или chars, или еще чего) - кодируем вектором длины N (размер словаря), для каждого примера i-й элемент вектора равен кол-ву этих слов\символов в тексте. Плюс различные вариации вроде TF-IDF (когда используем не просто количество, а более сложную метрику), n-grams (когда используем не отдельные слова, а последовательности из 2, 3 и более), skipgrams (когда используем не отдельные слова, а сочетания слов, отстоящие друг от друга на каком-то расстоянии - чтобы выкидывать предлоги, артикли и прочее) и так далее. Закодированный таким образом текст можно прогнать через наивный байесовский классификатор, SVM (обычно показывает лучший результат на порядках 10000-100000 примеров), MLP
2) кодируем вектором длины N (максимально допустимая длина текста), где каждый элемент - это индекс слова\символа. Если текст короче N, то дополняем нулями. С таким вариантом кодирования работают сверточные, рекурентные и рекурсивные сети.

Answer 2 · 2017-01-19 20:19:41

n7olkachev @n7olkachev Автор вопроса

Ошибка была в недостаточности входных данных. Описанный метод работает.

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2017-01-19 11:28:05

26 мерный вектор

ОМГ!

Ну собственно - что значит "оценивать"? Дайте определение что у вас на входе в ИНС и на выходе - в человеческих терминах.

Answer 4 · 2017-01-19 11:57:34

Нужно обучить ИНН так, чтобы она сама могла оценивать новые слова.

"оценивать" - это как?

"Копать" нужно в сторону дополнительного чтения возможностей НС и также о способах кодирования входных данных.

Строка как вход для нейронной сети?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт