Не зацикливайтесь на нейронных сетях, есть не менее крутые алгоритмы. Например - градиентный бустинг, в свое время для дипломной работы по определению стоимости жилья по его параметрам, он мне показал наилучшие результаты, хотя все зависит от исходных данных и их обработки. Вот отличная либа для питона
https://github.com/Microsoft/LightGBM есть еще sckikit-learn, но первая умеет работать с gpu, вторая пару лет назад не умела (сейчас не знаю).
В моей задачи была регрессия, в вашем случае классификация, но можно также использовать регрессию, т.е. получать ответ не 0(нет) и 1 (да), а в процентах, чем выше, тем похоже на атаку, мне кажется, так будет понятнее изучать данные. Хотя если у вас в этих данных нет четких ответов, была ли атака при текущих X, то нужно использовать алгоритмы кластеризации (чтобы алгоритм сам определял, не зная ответов ни для каких данных). Алгоритмы кластеризации также есть в scikit-learn