Мне видится, что у вас
мало данных для точного прогнозирования.
Это всё равно, что предсказывать, опоздает ли человек на работу, основываясь на статистике о том, насколько он вовремя приходил всё время до этого. Максимум, что можно сделать - это выявить какие-то системные свойства, которые более-менее постоянные и меняются редко. Например, шанс опоздать. Это конкретная цифра, которую можно вычислить, и далее на её основе предсказывать. Но точность предсказания будет равна шансу опоздать. То есть этот самый шанс и будет погрешностью.
Приложения, которые нынче занимаются прогнозированием расписания, когда какой транспорт приедет, имеют в распоряжении гораздо больше информации:
- Информацию о пробках.
- Информацию о GPS координатах каждого транспорта.
Конечно, точность всё равно не 100%. И порой случаются накладки. Например, мимо остановки может проехать фантомный автобус, или, наоборот, может приехать автобус, которого не существует по данным приложения. Но всё равно точность прогнозирования
гораздо выше, чем если основываться лишь на ретроспективном анализе.