В реальной жизни это было бы неуместно, а как лучше для диплома - судить вам.
Для разных моделей есть разные эвристики, сколько степеней свободы уместно использовать (например, можно встретить рекомендацию не использовать больше параметров, чем количество семплов / 10). С другой стороны, есть мнение, что правильная регуляризация позволяет ослабить эти требования - см. например
https://jakevdp.github.io/blog/2015/07/06/model-co...
З.Ы. Почему сигмоида? Как минимум на выходе понадобится другая активация типа ReLU.