Здравствуйте! Есть некий массив чисел, например: data = [ [1,2,3,4], [5,6,7,8] ]
числа в массивах разные (от 1 до 52), всего по 30 чисел в разной последовательности. Нужно дать прогноз на следующий шаг с вероятностями выпадения всех 52 чисел. Например:
1 - 10%
2 - 5%
...
52 - 0%
Подойдет ли тут LSTM? И как правильно разобрать данные?
Максим Власов,
Так вот, пока "почти но не со всем"- мы можем считать, что это таки колода карт. А раз так - выпадение следующей карты есть процесс случайный и от предыдущих выборов независимый. Если конечно это процесс выбора карты с возвращением ее в колоду.
Если это не колода карт, т.е. имеется объективная (возможно нам неизвестная) зависимость следующего исхода от предыдущих - то такую зависимость можно попробовать выявить, скорее всего - в вероятностном смысле.
Так что или описание объекта в студию - и тогда можно надеяться на какую-то подсказку, или ограничиваемся только тем, что было сказано - и тогда выпадение любой следующей карты равновероятно.
dmshar, спасибо! О равновероятностях. При изучении темы ии видел, что прогнозируют цену акций. Там действительно рандом. Просто подумал, что ии может на основе тысяч 5 результатов выявить псевдослучайность этих выпадений. Выпадение без повторений, и произвольным порядком. Ну по сути это карты. Просто игра с выпадением чисел(это про "не совсем"). Я понимаю, что максимум анализом можно добиться получения распределения выпадений и т.к. в теме ии я совсем новичок, то подумал, что оно может быть более точным.
Для начала нужно определиться, случайные у вас числа, или они связаны с другими числами в групе, или они формируют временные серии. И если формируют, то какая должна быть зависимость - индивидуальная в каждой позиции в группе, или для серии в целом.
Для случайных чисел можно разве что попытаться определить распределение для каждой позиции.
Для временных серий можно попробовать LSTM.