Что я делаю не так, и почему нейросеть не генерирует уникальный текст?

Question

Max @Maxxx_py

Что я делаю не так, и почему нейросеть не генерирует уникальный текст?

Есть вот такой код:

from MODULE import data_sr #здесь импорт моих библиотек, в данном случае всё что связано с data_sr пропускаем
import numpy
import sys
import tensorflow
from keras.models import Sequential
from keras.layers import Dense, Dropout, LSTM
from keras.utils import np_utils
from keras.callbacks import ModelCheckpoint


data = open("DATA/text.txt", encoding='utf-8').read() #Здесь у меня текст который я прогнал через ntlk stopwords, здесь текста на 1.6мб, не самое большое количество, но что смог
file = data.lower()

processed_inputs = file
chars = sorted(list(set(processed_inputs)))
char_to_num = dict((c, i) for i, c in enumerate(chars))
input_len = len(processed_inputs)
vocab_len = len(chars)
# print ("Total number of characters:", input_len)
# print ("Total vocab:", vocab_len)

#здесь у меня установка длинны текста, по стандарту 100 символов
try:
    seq_length = int(data_sr.get_lenght())

except TypeError:
    seq_length = 100 

#Здесь функция в которой происходит генерация
def generate_verses():
    x_data = []
    y_data = []

    for i in range(0, input_len - seq_length, 1):
        in_seq = processed_inputs[i:i + seq_length]

        out_seq = processed_inputs[i + seq_length]

        x_data.append([char_to_num[char] for char in in_seq])
        y_data.append(char_to_num[out_seq])

    n_patterns = len(x_data)
    # print ("Total Patterns:", n_patterns)

    X = numpy.reshape(x_data, (n_patterns, seq_length, 1))
    X = X / float(vocab_len)

    y = np_utils.to_categorical(y_data)


    model = Sequential()
    model.add(LSTM(512, input_shape=(X.shape[1], X.shape[2]), return_sequences=True))
    model.add(LSTM(256, return_sequences=True))
    model.add(LSTM(256))
    model.add(Dense(y.shape[1], activation='softmax'))

    model.compile(loss='categorical_crossentropy', optimizer='adam')

    filepath = "DATA/model_weights_saved_more_dense.hdf5" #Моя нейросеть обучена на loss = 1.6
    checkpoint = ModelCheckpoint(filepath, monitor='loss', verbose=1, save_best_only=True, mode='min')
    desired_callbacks = [checkpoint]

    filename = "DATA/model_weights_saved_more_dense.hdf5"
    model.load_weights(filename)
    model.compile(loss='categorical_crossentropy', optimizer='adam')

    num_to_char = dict((i, c) for i, c in enumerate(chars))
    start = numpy.random.randint(0, len(x_data) - 1)
    pattern = x_data[start]

    return ''.join([num_to_char[value] for value in pattern])

Почему моя нейросеть не генерирует текст, а просто берет уже готовый текст из файла text.txt. Без прогонки nltk.stopwords нейросеть сама отбрасывает некоторые слова, но проблема остаётся прежней.
В файле текста примерно на 35-40 тысяч строчек.
Хочу узнать, нейросети нужно больше текста для полноценной генерации, или здесь моя ошибка?

P.s Я задался таким вопросом, когда после какого-то изменения (уже не помню что я сделал) нейросеть сгенерировала уникальный стих

Вопрос задан более трёх лет назад
244 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
SF Education

Бэкенд-разработчик на Python

3 месяца

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

8 комментариев

Max @Maxxx_py Автор вопроса

"Уникальный" имеется ввиду стих который как минимум не 1 в 1 с текстом из данных для генерации.

Вот для примера текст который генерирует моя нейросеть: проездом боржом луначарский хочу отвернуть заносчивый нос чувствую стыну грани овладевает

И вот что выдаёт гугл если вбить этот стих: проездом в Боржом, Луначарский. Хочу отвернуть заносчивый нос и чувствую: стыну на грани я, овладевает

Вот какой "уникальный" стих однажды сгенерировала моя нейросеть: тело водичка водица тобою умыться ковша окатиться вдоволь напиться волшебная влага само совершенство тобой насладиться какое блаженство водица водичка вода бесподобная жаждет флора утробная

Надеюсь, понятно объяснил что такое уникальность в моём понимании?

Написано более трёх лет назад
mayton2019 @mayton2019

Max, а где в твоём коде задаёся ямб или хорей?

Написано более трёх лет назад
Max @Maxxx_py Автор вопроса

mayton2019, Ааааа.... ээээээ.... там

Написано более трёх лет назад
mayton2019 @mayton2019

Max, ты читал Алису в стране чудес? Там чеширский кот дает ей совет что если идти куда-нибудь то куда-то наверняка ты придешь.

Вообще дорогие мои нейро-пользователи. Почему нейропользователи? Ну потому-что тут в топике нет никакого программирования. Вы пользуете НС как мясорубку. Кидаете туда камни и грязь и ожидаете на выходе появится нечто.

Ну я не знаю. Это какой-то ... поверхностный подход чтоли. Я вот изучал НС еще лет 15 назад. Но я читал про сети прямого распространения, рекуррентные. Что такое теорема Колмогорова-Арнольда. Как работает правило обучения. Что такое сети Хопфилда. Гроссберга. Какие бывают активационные функции и зачем. Как текст отобразить на операции с вещественными числами. Я пытался БЛИН разбираться.

Вот что сейчас все забили на это? Вы скопипастили исходник и удивляетесь почему он не работает.

Программист должен протащить доказательство своей правоты либо через результат. А его здесь нет.

Либо через какие-то аксиомы проектирования НС. Вот как ваша сетка спроектирована? И почему она ВООБЩЕ должна работать. Это очень синьорный вопрос. И если вы объясните почему она должна работать - то вас сразу надо принять на работу сайнтистом в самые топовые компании.

Написано более трёх лет назад
GrKon @GrKon

Почему сетка ВООБЩЕ должна работать это не синьорский вопрос - это уровень входа.
В интернете полно материала типа введение в нейросети.

Написано более трёх лет назад
mayton2019 @mayton2019

GrKon, ты не поверишь но там не будет все равно ответа на главный вопрос. Почему оно работает или не работает на данном юзкейсе. НС это все таки наука. А вы сводите всё к интернетам. А вы кто в этой схеме? Посредник который спрашивает гугл?

Написано более трёх лет назад
GrKon @GrKon

ты не поверишь, но сетка ВСЕГДА работает - правда не всегда та как от нее ожидают :(

Написано более трёх лет назад
mayton2019 @mayton2019

GrKon, конечно всегда работает. Жаль что не всегда удается получить денежное вознаграждение за ее всегдашнею работу.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 199 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 102 просмотра
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 110 просмотров
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 124 просмотра
0

ответов
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 114 просмотров
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 92 просмотра
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 85 просмотров
2

ответа
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 236 просмотров
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- 22 окт.
- 393 просмотра
1

ответ
Python

Простой
Какие есть удобные API для генерации картинок через AI?
- 3 подписчика
- 20 окт.
- 260 просмотров
1

ответ
Показать ещё Загружается…

Backend developer (Python, FastAPI)

BCraft

До 4 000 $

Python Developer

Strikt

от 100 000 до 150 000 ₽

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Answer 1 · 2022-10-26 12:11:24

как минимум у вас нет кода обучения сети и предсказания.
Общая схема (обучение с учителем):
- грузим вход/выход (рабочий 70% и тестовый 30%
- создаем/конфигурируем модель (то, что у вас есть)
- обучаем модель
- получаем результаты по обученной модели
(последних двух пунктов в коде не наблюдается.)

Answer 2 · 2022-10-05 20:18:16

А откуда вытекает утверждение об уникальности? На самом деле я не знаю. Но мне интересно, понимает ли автор свойства своего кода.

Что я делаю не так, и почему нейросеть не генерирует уникальный текст?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт