Какие данные необходимы для машинного обучения на предсказании ГСЧ?
В последнее время возникла следующая задача. Есть генератор случайных чисел (стественно псевдослучайных). Числа распределяются в интервале от 1 -1000 включительно. Далее был собран датасет, в котором порядка 45000+-2000, данных чисел, сгенерированных случайным образом. Есть ли возможность обучить нейросеть таким образом, чтобы она предсказала следующее число? Или необходимо больше данных, не количества самих чисел, а входных переменных, от которых зависит число на выходе?
Нейросеть - вряд-ли. Ее основной профиль - работа с гладкими непрерывными величинами. И если речь идет о предсказании то здесь скорее близок термин - приближение. Или экстраполяция.
А если твой ГСЧ - криптостойкий - то это считай дело безнадёжное. Он спецом создавался чтобы никто и никогда не догадался о прогнозах.
ГСЧ - это что-то дискретное. Здесь больше подходит комбинаторика и ГА. Например просто проверить принадлежность твоему датасету какому то классу величин. По повторам. По форме распределения. Если оно не линейное.
В вашем случае задача сводится к предсказанию количества. Сперва попробуйте решить её с помощью "классических" методов машинного обучения (например, линейной регрессией). Ссылка на блиц-проверку. А там необходимоть в ИНС отпадёт.)