Aldikk,
Во-первых, не "актуаристов" а "актуариев".
Во-вторых, машинное обучение достаточно давно и успешно применяется в этой сфере:
statsoft.ru/coordination/news/news_detail.php?ELEMENT_ID=1910
В-третьих, так в чем все-таки заключается ваша " хорошая идея"?
Единственная книга, которая написана в таком ключе и которую я могу сейчас вспомнить - это
Басс Л., Клементс П., Кацман Р. Архитектура программного обеспечения на практике.
Там есть несколько сквозных примеров, которые можно использовать для такого анализа. Посмотрите, может и пригодиться. Правда "совсем последних" технологий там нет.
Нурлан@daager, Увы, тут автор вопроса - The Whiz - тихонечко удалил свой комментарий, на который вы весьма точно ответили. Поэтому ваш комментарий как бы "повис в воздухе". Не думаю, что такой ход The Whiz этический корректен, но у каждого свое представление об этом.
1. Коэффициент корреляции.
2. Коэффициент детерминации R-квадрат.
3. Скорректированный коэффициент детерминации (adj R-квадрат).
4. Анализ статистики Фишера.
5. Критерий Дарбина-Уотсона.
6. Информационный критерий Акаике
7. Критерий Шварца
..... и еще ряд других.
Вот только для того, что бы понять что, когда и как применять надо сначала подтянуть теорию.
Ну, раз бакалаврская.... https://habr.com/post/358200/
Для "с самого начала" - очень неплохо. Есть обзор проблемы и путей решения, есть анализ методов, есть ссылки на источники, включая использование нейросети для задачи выявления вторжений, есть даже коды реализации.
Для начала вполне хватит, ну а дальше - углубляться. Появятся вопросы - спрашивайте.
Как тут уже сказали, нейронная сеть тут очень далеким боком. Существуют несколько десятков (!!!) методов, которые по информации о состоянии сети или трафика могут распознать была атака или нет, некоторые могут распознать и конкретный тип атак. Как на данных KDD cup99 так и при других способах описания состояния объектов информбезопасности. Тема не новая и достаточно хорошо изученная. Существуют и статьи и книги и даже учебники на эту тему. Если вы хоть расскажете, зачем это вам надо (для учебных целей по ИБ, для учебных целей по ML, для учебных целей по нейронкам, как бакалаврская работа, как магистерская, как научная задача, как задача поставленная перед вами как системным администратором, владеете вы английским, или как обычно "со словарем" :-), - тогда и советовать можно будет что-то более направленное. А так посмотрел - ну лежит у меня на диске около 200 статей-книг по теме "Применение ML для выявления атак", да еще около 100 в закладках Хрома. И это вообще-говоря не предел и не все, что можно найти в сети. Какие из них по вашей мерке, а какие - не по зубам или наоборот, слишком тривиальные?
Опишете себя - можно будет подбирать. А так...
P.S. Кстати, как следует из названия, KDD cup99 - база собранная ДО 1999 года. Сделать что-то реально-актуальное по данным двадцатилетней давности - как то немного сомнительно.
TarasYa, " То-есть нужно изучить математику до уровней 10-11 классов, а потом уже переходить на университетские учебники?" - это шутка такая? Нет конечно, можно в обратном порядке - сначала университетские учебники, а потом - таблицу умножения.
"Hello World" - на любом языке программирования - это как минимум:
-Представление о структуре программы;
-Представление о том, как заставить программу работать.
-Понимание, что такое компиляция и выполнение.
-Сведения о том, где и как можно хранить программы.
-Знакомство с функцией вывода.
Все это понадобиться в дальнейшей работе. Чем раньше познакомитесь - тем лучше.
А что даст нейросеть для сложения? Ну обучите хотя-бы угадывать стоимость билета от длинны маршрута, и то толку будет больше.
Есть целые разделы в статистике и машинном обучении. Так и называются - обнаружение выбросов, обнаружение аномалий. Конкретный метод выбирается исходя из типа имеющихся данных и особенностей прикладной области исследования.
Более того, немного упрощенная процедура выявление выбросов - обязательный этап любого более-менее серьезного исследования.
Литературы - море. По указанным тегам - легко найдете. Будут вопросы - спрашивайте.
Прочитал внимательно. Цитирую.
"научить НС арифметическим операциям, а именно с сложению чисел. "
Вопросы остались:
Зачем использовать нейросеть для сложения чисел?
Где потом можно применить "Наученную" нейросеть?
Какие такие суперзнания получит ТС, выполнив это "упражнение", и где они ему в дальнейшем понадобятся?
К суперзадаче обучения сети "суперинтересной" операции XOR эти вопросы тоже относятся.
Безопасность - от чего? От перехвата информации, от пожара, от внешних помех, от попыток вмешательства, от мышей, от бомжей? В каждом случае способы будут свои.
MaxLich, Это так, если ты переходишь, например из фронтенда в бекэнд, из веб-разработки в разработку для iOS или даже из энтерпрайз-проектов - в геймдев. Но вот переход из Сomputer Science в Data Science (и в Machine Learning в частности) это совершенно другой поворот и гораздо более радикальная смена дислокации. "Только для смелых и решительных" :-)
Поддерживаю. А то все кинулись советовать книги по той части Python, с которыми они работают. Совершенно забыв, что Python для web-приложений и
Python даже для системного администрирования (не говоря уже про машинное обучение или про IoT) - это совершенно разный набор скилзов. Разумеется, после того, как начала осилены хотя-бы на уровне Лутца.
"так посмотри файл открой как текстовый"
Слушаюсь и повинуюсь.
Только зачем "как текстовый"? Я его уже давно как csv открыл, в MS EXCEL просмотрел, структуру всю увидел. Проблем не увидел. Строй себе графики - хоть в EXCEL, хоть в R. Только вот сначала надо понять какие и зачем графики нужны.
Какое мнение? Пусть тот, кто считает себя НЕ тупым раскроет глаза, прочитает мой ответ выше, посмотрит ссылки и попытается опровергнуть то, что там (но и не только там, конечно) пишут. Тогда все смогут понять, что ага, "модель Маккалока-Питтса - и персептрон Розенблатта это одно и то-же" и " персептрон Розенблатта - это физическая реализация." .
Ну, если хотя-бы наоборот, то с большой натяжкой и оговорками, (предварительно оговорив какую-нибудь оригинальную трактовку термина "физическая реализация" в данном контексте) можно было бы как-то согласиться. А так , пока же АРГУМЕНТОВ против высказанного в приведенных источниках мнения нет. Но переход на личности уже наблюдается. Отличная манера отстаивать свое мнение.
дима кубитский, То есть ты продолжаешь утверждать, что "персептрон Розенблатта - это физическая реализация модели Маккалока-Питтса" и между ними нет никакой разницы?
Во-первых, не "актуаристов" а "актуариев".
Во-вторых, машинное обучение достаточно давно и успешно применяется в этой сфере:
statsoft.ru/coordination/news/news_detail.php?ELEMENT_ID=1910
В-третьих, так в чем все-таки заключается ваша " хорошая идея"?