Я бы попробовал входные данные подавать по дням(неделям и так далее, насколько глубока у вас история). Условно на вход 30 чисел.
1) за 31 дней до дня Х, купил 0 / 1000
2) за 30 дней до дня Х, купил 1 / 1000
....
30) вчера купил 50 / 1000
Выход интерпретировал как softmax по вариантам + количества товара
1) позвонит сегодня, вероятность 0.1
2) позвонит завтра, вероятность 0.6
3) на этой неделе - 0.1
4) ушёл к конкурентам и не чего покупать не собирается - 0.2
А) закажет товара 8 / 1000
П.С. И что у вас сеть такая примитивная, диплёрнингом и не пахнет, ну добавьте ещё два скрытых слоя по 10-20 нейронов что ли.
П.П.С И батч на 1/5 всей выборки это такое себе.