@notxleb

Как тренировать нейросети с LSTM в keras?

Я хочу предсказывать следующее слово по предыдущему. У меня есть данные вида "[[0,1],[1,2],[3,4] ... ]". Допустим я хочу тренировать через train_on_batch().В каком виде(shape) я должен подавать тренировочные данные?
  • Вопрос задан
  • 826 просмотров
Пригласить эксперта
Ответы на вопрос 1
@ivodopyanov
NLP, python, numpy, tensorflow
https://keras.io/layers/recurrent/

Input shape
3D tensor with shape (batch_size, timesteps, input_dim).

<количество примеров в одном батче, длина последовательности, размерность одного элемента>

LSTM предполагает, что каждый элемент последовательности - это вектор. В случае, когда в базовом варианте они - какие-то числа (например, id слова в словаре), то его перегоняют в one-hot encoding или через embedding слой.
Если длина последовательности разная от примера к примеру, то её обычно добивают нулями так, чтобы для всех в батче была одинаковая.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы