Рекуррентная нейросеть для прогнозирования на keras?

Question

Марк Карась @FreeTile

Рекуррентная нейросеть для прогнозирования на keras?

Итак, есть у меня нейросеть, которая на основе 15 предыдущих свечей на криптовалютной бирже предсказывает следующую, ну как есть, она в разработке и большая часть выполнена(была) пока я не понял, что обычная нейронка слабовата на такие дела, после чего я начал работать с рекуррентной нейросетью, и вот тут пошли проблемы. Первая проблема это решейп векторов в тензоры для последующего загона в сеть, но с этим я справился. Потом я не очень понимаю какую именно рекуррентную сеть сделать, выбрал пока с двумя LSTM слоями. Ну и последний вопрос, я не очень понимаю, почему она падает, точнее понимаю, но не знаю как решить.

Ниже прикреплю кусок кода и разьяснения где что выполняется

# Импортирование необходимых библиотек
import os.path

from keras import Sequential
from keras.layers import LSTM, Dense
import sys
import pandas as pd
import tensorflow as tf
from binance.client import Client

# Получение доступа к API биржи бинанс
api_key = 'ключ'
api_secret = 'Секрет'
client = Client(api_key, api_secret)

# Сбор данных о криптовалютах и их изменении цен за определенный период времени
"""if os.path.exists("data.csv"):
    bars = pd.read_csv("data.csv")
else:
    data_file = open("data.csv", "w+")
    data_file.close()
    df = pd.DataFrame(client.get_historical_klines("BTCUSDT", Client.KLINE_INTERVAL_5MINUTE, "90 days ago UTC"))
    df.to_csv("data.csv", index=False)
    bars = pd.read_csv("data.csv")"""

bars = client.get_historical_klines("BTCUSDT", Client.KLINE_INTERVAL_5MINUTE, "30 days ago UTC")

# Подготовка данных для обучения нейросети
data = pd.DataFrame(bars,
                    columns=['timestamp', 'open', 'high', 'low', 'close', 'volume', 'close_time', 'quote_asset_volume',
                             'number_of_trades', 'taker_buy_base_asset_volume', 'taker_buy_quote_asset_volume',
                             'ignore'])
data['timestamp'] = pd.to_datetime(data['timestamp'], unit='ms')
data.set_index('timestamp', inplace=True)
data = data.astype(float) / 255

train_data = data.iloc[:-20]
max_rows = train_data.shape[0] // 15 * 15
train_data = train_data.values[:max_rows].reshape((-1, 15, 11))

train_labels = data.iloc[:-20]
max_rows_labels = train_labels.shape[0] // 15 * 15
train_labels = train_labels.values[:max_rows_labels].reshape((-1, 15, 11))

# Создание модели нейросети
#model = tf.keras.models.Model(inputs=input_layer, outputs=output_layer)
model = Sequential()
model.add(LSTM(128, batch_size=20, return_sequences=True, input_shape=[15, 11]))
model.add(LSTM(64, return_sequences=False))
model.add(Dense(11))

MyOpt = tf.keras.optimizers.SGD(learning_rate=0.1, momentum=0.1, nesterov=False)
# Компиляция модели
model.compile(optimizer=MyOpt,
              loss='mse',
              metrics=["accuracy"])

# Обучение модели на подготовленных данных
model.fit(train_data, train_labels, batch_size=20, epochs=150, validation_split=0.2)

print('Сохранить текущую модель в файл? Y/N')
answer=input()
if answer == 'Y':
    model.save('model.h5')
else:
    sys.exit()

Итак, вот код, сверху всё ясно вроде, берём библиотеки, подрубаемся к api бинанса, вытаскиваем с сервера данные и подготавливаем их для прохода по сети. Данные у нас хранятся в виде векторов, где каждый вектор это набор значений соответствующей свечи на графике цены, то есть на каком уровне открылась, закрылась, наивысшая цена, наименьшая и т.д. Дальше идёт преобразование данных в тензоры по 15 векторов, собственно, чтобы нейросеть училась по предыдущим 15 свечам предсказывать следующую. Дальше идёт создание модели нейронки, потом я немного изменил оптимизатор, чтобы лучше подогнать аргументы для обучения, ну и сама компиляция. Пока сеть ложится на следующем шаге, то есть обучении, выдаётся вот такая ошибка.

Node: 'gradient_tape/mean_squared_error/BroadcastGradientArgs'
Incompatible shapes: [20,11] vs. [20,15,11]
[[{{node gradient_tape/mean_squared_error/BroadcastGradientArgs}}]] [Op:__inference_train_function_5424]

Сама ошибка понятна, но не ясно, что с ней делать. И вообще мне кажется что я где то накосячил с созданием тензоров, так как получается что большую часть обучения сеть будет пропускать. Надо чтобы она брала 15 свеч, предсказывала 16, и следующим шагом брала со 2 по 16 свечи и предсказывала 17 и так до конца эпохи, но я этого видимо реализовать не смог. Прошу помочь, а в частности просто подсказать, в каком направлении идти, так как я не очень понимаю, как нормально настроить рекуррентную сеть

Вопрос задан более двух лет назад
152 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 1

7 комментариев

Марк Карась @FreeTile Автор вопроса
Решейпинг я переписал полностью, я сам сначала не вдуплил как его делать, сейчас когда понял, всё работает (Вроде) Выглядит вот так

train_data_blocks = [] train_labels = [] block_size = 15 for i in range(len(data) - block_size - 1): train_data_block = data.iloc[i:i+block_size].values train_label = data.iloc[i+block_size].values train_data_blocks.append(train_data_block) train_labels.append(train_label) train_data = np.array(train_data_blocks) train_labels = np.array(train_labels)

Дальше уже с самой нейронкой разбираться надо. В прошлом коде я разбивал весь датасет на блоки по 15 векторов, в каждом из которых 11 элементов. Нейросеть должна предсказывать следующий вектор после этих
Написано более двух лет назад
Максим Припадчев @Maksim_64

Марк Карась, Сложно сказать, без тестов, как по мне так должно быть что вроде этого стартуешь с 15 индекса. В training_data, должно попадать i-15:i элементы, в labels должно попадать i-элемент. Но это так на вскидку у тебя данные под рукой.

Написано более двух лет назад
Марк Карась @FreeTile Автор вопроса

Максим Припадчев, Ну я это и реализовал, а потом i переходит на единицу вперёд, всё так и работает теперь, осталось саму нейросеть настроить, а то на loss 5000000000000 смотреть страшно)

Написано более двух лет назад
Максим Припадчев @Maksim_64

Марк Карась, А обучение то вообще происходит? сделай график своей loss функции. Я так понимаю речь сейчас только о тренировочных данных, на тренировочных данных ты должен увидеть постоянно снижающийся loss, если же речь о тестовых то там loss должен U-формы.

Написано более двух лет назад
Марк Карась @FreeTile Автор вопроса

Максим Припадчев, Ну не всегда переобучение может быть, особенно на таких данных, которые никогда не похожи почти что. Нет, график не выводил, завтра займусь визуализацией и оптимизацией процесса

Написано более двух лет назад

Максим Припадчев @Maksim_64

Марк Карась, Глянул, сейчас быстренько пример один , там прогнозируют стоимость акции амазона. 50 дней batch у тебя 15, 51 предсказывает у тебя 16. Так вот он оказался вполне себе рабочим, так одна мелкая опечатка в нем была, а так рабочий я в colabe его запустил, как в аптеке работает. Глянь код.

import pandas as pd
import math
import numpy as np
from datetime import datetime
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
from sklearn.preprocessing import MinMaxScaler
import matplotlib.pyplot as plt
import yfinance as yf


amzn = yf.Ticker("AMZN")
end_date = datetime.now().strftime('%Y-%m-%d')
amzn_hist = amzn.history(start='2017-01-01',end=end_date)

amzn_close = amzn_hist['Close']
amzn_values = amzn_close.values
amzn_values = amzn_values.reshape(-1,1)


trainingScaler = MinMaxScaler(feature_range=(0,1))
amzn_values_scaled = trainingScaler.fit_transform(amzn_values)

raining_split = math.floor(len(amzn_values_scaled) * 0.85) #1267+
training_amzn = amzn_values_scaled[0:training_split]
training_ind_amzn = []
training_dep_amzn = []

for i in range(50, len(training_amzn)):
    training_ind_amzn.append(training_amzn[i-50:i][0])
    training_dep_amzn.append(training_amzn[i][0])

training_ind_amzn, training_dep_amzn = np.array(training_ind_amzn), np.array(training_dep_amzn)
training_ind_amzn = np.reshape(training_ind_amzn, (training_ind_amzn.shape[0], training_ind_amzn.shape[1], 1))

amzn_model = keras.Sequential()
amzn_model.add(layers.LSTM(100, return_sequences=True, input_shape=(training_ind_amzn.shape[1], 1)))
amzn_model.add(layers.Dropout(0.2))
amzn_model.add(layers.LSTM(100, return_sequences=True))
amzn_model.add(layers.Dropout(0.2))
amzn_model.add(layers.LSTM(100))
amzn_model.add(layers.Dropout(0.2))
amzn_model.add(layers.Dense(25))
amzn_model.add(layers.Dense(1))
amzn_model.compile(optimizer='adam',loss='mean_squared_error')
amzn_model.fit(training_ind_amzn, training_dep_amzn, epochs = 60, batch_size = 32)

testing_input_amzn = amzn_values[training_split:]
testing_input_amzn = trainingScaler.fit_transform(testing_input_amzn)
testing_amzn = []
for i in range(50, len(testing_input_amzn) + 50):
    testing_amzn.append(testing_input_amzn[i-50:i][0])
testing_amzn = np.array(testing_amzn)
testing_amzn = np.reshape(testing_amzn, (testing_amzn.shape[0], testing_amzn.shape[1], 1))
predict_amzn = amzn_model.predict(testing_amzn)
predict_amzn = trainingScaler.inverse_transform(predict_amzn)

plt.plot(amzn_values[training_split:], color = 'blue', label = 'AMZN Stock Price')
plt.plot(predict_amzn, color = 'red', label = 'Predicted AMZN Stock Price')
plt.title('Amazon (AMZN)')
plt.xlabel('Number of Days since April 26, 2022')
plt.ylabel('AMZN Stock Price')
plt.legend()
plt.show()

Возьми за основу посмотри, что на что влияет и подстрой под свои данные.

Написано более двух лет назад

Марк Карась @FreeTile Автор вопроса

Максим Припадчев, Кстати неплохо, спасибо за пример, но мне кажется мне дольше обучать её надо, так как тут один выход, а у меня 11) Только оптимизатор я всё же перепробую другие, и попытаюсь метрику сделать, чтобы видно было, насколько точно всё получается

Написано более двух лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- вчера
- 105 просмотров
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- вчера
- 116 просмотров
1

ответ
Python

Простой
Что можно ускорить в коде решателя игры крестики нолики?
- 1 подписчик
- 16 авг.
- 168 просмотров
0

ответов
Python

Простой
Как подключиться по SMTP к Reg ru?
- 1 подписчик
- 15 авг.
- 135 просмотров
0

ответов
Python

+1 ещё

Простой
Как имитировать нажатие пкм в неактивное окно DirectX?
- 1 подписчик
- 15 авг.
- 45 просмотров
1

ответ
Python

+1 ещё

Простой
Как настроить группы при создании нового пользователя в битриксе?
- 1 подписчик
- 14 авг.
- 118 просмотров
0

ответов
Python

+1 ещё

Простой
При добавления строчки @commands.has_permissions в терминале при запуске выдает ошибку?
- 1 подписчик
- 14 авг.
- 91 просмотр
0

ответов
Python

+1 ещё

Простой
Можно ли отключить SSL сертификат при парсинге?
- 1 подписчик
- 13 авг.
- 134 просмотра
0

ответов
Python

Простой
Не работает код, что делать?
- 2 подписчика
- 10 авг.
- 2136 просмотров
4

ответа
Анимация

+1 ещё

Простой
Существет ли AI делающая промежуточную анимацию между 2 кадрами?
- 1 подписчик
- 09 авг.
- 80 просмотров
1

ответ
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python-разработчик (Senior)

BCraft

от 3 500 до 4 500 $

Answer 1 · 2023-07-05 21:34:25

Ну в целом в плане решейпинга, все не правильно. Посмотри размерности своего labels. Это должен быть одномерный массив, длинной соответствующий количеству рядов в массиве features (ты его назвал training data). Потом а на чем ты тренируешься 15 рядов 11 колонок, я про training_data. Это абсурд. Этот код не поправить. Тебе нужен туториал и по нему адаптируюй под свои данные.

Например вот там google colab c предсказаниями акций с использованием kears.Sequential, ну и комментарии кое какие имеются.

Также на медиуме есть туториалы с объяснениями (на английском). В общем гугли keras sequential stock prices example и разбирайся по примерам. Это мертвый код, весь решейпинг переписывать надо. Плюс там надо будет тестовые данные хитро готовить, двигать и подавать в модель в цикле. В общем тебе нужен пример.

Рекуррентная нейросеть для прогнозирования на keras?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт