Что я делаю не так, и почему нейросеть не генерирует уникальный текст?

Question

Max @Maxxx_py

Что я делаю не так, и почему нейросеть не генерирует уникальный текст?

Есть вот такой код:

from MODULE import data_sr #здесь импорт моих библиотек, в данном случае всё что связано с data_sr пропускаем
import numpy
import sys
import tensorflow
from keras.models import Sequential
from keras.layers import Dense, Dropout, LSTM
from keras.utils import np_utils
from keras.callbacks import ModelCheckpoint


data = open("DATA/text.txt", encoding='utf-8').read() #Здесь у меня текст который я прогнал через ntlk stopwords, здесь текста на 1.6мб, не самое большое количество, но что смог
file = data.lower()

processed_inputs = file
chars = sorted(list(set(processed_inputs)))
char_to_num = dict((c, i) for i, c in enumerate(chars))
input_len = len(processed_inputs)
vocab_len = len(chars)
# print ("Total number of characters:", input_len)
# print ("Total vocab:", vocab_len)

#здесь у меня установка длинны текста, по стандарту 100 символов
try:
    seq_length = int(data_sr.get_lenght())

except TypeError:
    seq_length = 100 

#Здесь функция в которой происходит генерация
def generate_verses():
    x_data = []
    y_data = []

    for i in range(0, input_len - seq_length, 1):
        in_seq = processed_inputs[i:i + seq_length]

        out_seq = processed_inputs[i + seq_length]

        x_data.append([char_to_num[char] for char in in_seq])
        y_data.append(char_to_num[out_seq])

    n_patterns = len(x_data)
    # print ("Total Patterns:", n_patterns)

    X = numpy.reshape(x_data, (n_patterns, seq_length, 1))
    X = X / float(vocab_len)

    y = np_utils.to_categorical(y_data)


    model = Sequential()
    model.add(LSTM(512, input_shape=(X.shape[1], X.shape[2]), return_sequences=True))
    model.add(LSTM(256, return_sequences=True))
    model.add(LSTM(256))
    model.add(Dense(y.shape[1], activation='softmax'))

    model.compile(loss='categorical_crossentropy', optimizer='adam')

    filepath = "DATA/model_weights_saved_more_dense.hdf5" #Моя нейросеть обучена на loss = 1.6
    checkpoint = ModelCheckpoint(filepath, monitor='loss', verbose=1, save_best_only=True, mode='min')
    desired_callbacks = [checkpoint]

    filename = "DATA/model_weights_saved_more_dense.hdf5"
    model.load_weights(filename)
    model.compile(loss='categorical_crossentropy', optimizer='adam')

    num_to_char = dict((i, c) for i, c in enumerate(chars))
    start = numpy.random.randint(0, len(x_data) - 1)
    pattern = x_data[start]

    return ''.join([num_to_char[value] for value in pattern])

Почему моя нейросеть не генерирует текст, а просто берет уже готовый текст из файла text.txt. Без прогонки nltk.stopwords нейросеть сама отбрасывает некоторые слова, но проблема остаётся прежней.
В файле текста примерно на 35-40 тысяч строчек.
Хочу узнать, нейросети нужно больше текста для полноценной генерации, или здесь моя ошибка?

P.s Я задался таким вопросом, когда после какого-то изменения (уже не помню что я сделал) нейросеть сгенерировала уникальный стих

Вопрос задан более трёх лет назад
258 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

8 комментариев

Max @Maxxx_py Автор вопроса

"Уникальный" имеется ввиду стих который как минимум не 1 в 1 с текстом из данных для генерации.

Вот для примера текст который генерирует моя нейросеть: проездом боржом луначарский хочу отвернуть заносчивый нос чувствую стыну грани овладевает

И вот что выдаёт гугл если вбить этот стих: проездом в Боржом, Луначарский. Хочу отвернуть заносчивый нос и чувствую: стыну на грани я, овладевает

Вот какой "уникальный" стих однажды сгенерировала моя нейросеть: тело водичка водица тобою умыться ковша окатиться вдоволь напиться волшебная влага само совершенство тобой насладиться какое блаженство водица водичка вода бесподобная жаждет флора утробная

Надеюсь, понятно объяснил что такое уникальность в моём понимании?

Написано более трёх лет назад
mayton2019 @mayton2019

Max, а где в твоём коде задаёся ямб или хорей?

Написано более трёх лет назад
Max @Maxxx_py Автор вопроса

mayton2019, Ааааа.... ээээээ.... там

Написано более трёх лет назад
mayton2019 @mayton2019

Max, ты читал Алису в стране чудес? Там чеширский кот дает ей совет что если идти куда-нибудь то куда-то наверняка ты придешь.

Вообще дорогие мои нейро-пользователи. Почему нейропользователи? Ну потому-что тут в топике нет никакого программирования. Вы пользуете НС как мясорубку. Кидаете туда камни и грязь и ожидаете на выходе появится нечто.

Ну я не знаю. Это какой-то ... поверхностный подход чтоли. Я вот изучал НС еще лет 15 назад. Но я читал про сети прямого распространения, рекуррентные. Что такое теорема Колмогорова-Арнольда. Как работает правило обучения. Что такое сети Хопфилда. Гроссберга. Какие бывают активационные функции и зачем. Как текст отобразить на операции с вещественными числами. Я пытался БЛИН разбираться.

Вот что сейчас все забили на это? Вы скопипастили исходник и удивляетесь почему он не работает.

Программист должен протащить доказательство своей правоты либо через результат. А его здесь нет.

Либо через какие-то аксиомы проектирования НС. Вот как ваша сетка спроектирована? И почему она ВООБЩЕ должна работать. Это очень синьорный вопрос. И если вы объясните почему она должна работать - то вас сразу надо принять на работу сайнтистом в самые топовые компании.

Написано более трёх лет назад
GrKon @GrKon

Почему сетка ВООБЩЕ должна работать это не синьорский вопрос - это уровень входа.
В интернете полно материала типа введение в нейросети.

Написано более трёх лет назад
mayton2019 @mayton2019

GrKon, ты не поверишь но там не будет все равно ответа на главный вопрос. Почему оно работает или не работает на данном юзкейсе. НС это все таки наука. А вы сводите всё к интернетам. А вы кто в этой схеме? Посредник который спрашивает гугл?

Написано более трёх лет назад
GrKon @GrKon

ты не поверишь, но сетка ВСЕГДА работает - правда не всегда та как от нее ожидают :(

Написано более трёх лет назад
mayton2019 @mayton2019

GrKon, конечно всегда работает. Жаль что не всегда удается получить денежное вознаграждение за ее всегдашнею работу.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

Простой
Как решить проблему с генерацией видео в Kling AI?
- 1 подписчик
- 09 июл.
- 59 просмотров
1

ответ
Хранение данных

+3 ещё

Средний
Как организовать обучение нейронной сети?
- 1 подписчик
- 07 июл.
- 104 просмотра
2

ответа
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 211 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 556 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 495 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 282 просмотра
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 510 просмотров
1

ответ
Нейронные сети

Средний
Как в AI ToolKit для тренировки LorA указать свои модели?
- 1 подписчик
- 09 июн.
- 69 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 214 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 126 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2022-10-26 12:11:24

как минимум у вас нет кода обучения сети и предсказания.
Общая схема (обучение с учителем):
- грузим вход/выход (рабочий 70% и тестовый 30%
- создаем/конфигурируем модель (то, что у вас есть)
- обучаем модель
- получаем результаты по обученной модели
(последних двух пунктов в коде не наблюдается.)

Answer 2 · 2022-10-05 20:18:16

А откуда вытекает утверждение об уникальности? На самом деле я не знаю. Но мне интересно, понимает ли автор свойства своего кода.

Что я делаю не так, и почему нейросеть не генерирует уникальный текст?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт