Как обнаружить сканирование портов по логу сетевого трафика?

Question

Nikita1231 @Nikita1231

Как обнаружить сканирование портов по логу сетевого трафика?

Я студент, веду проект, идея которого в следующем: на c++ пишу маленький "сниффер", который следит за трафиком на своей машине, делает предварительный анализ и отдаёт отчёт серверу. Планируется поставить его на машины в аудиториях и отслеживать подозрительную активность с помощью сервера.

Немного подробностей (или воды):
Одной из предварительных проверок я решил сделать анализ на сканирование портов. Для этого я передаю лог, в котором записи имеют следующий вид:

#pragma once
#include <string>
struct PacketInfo {
    std::string srcIp;
    std::string dstIp;
    std::string protocol;
    int srcPort;
    int dstPort;
    int payloadLen;
    int count;

    bool operator==(const PacketInfo& other) const;

    bool operator!=(const PacketInfo& other) const;
};

bool PacketInfo::operator==(const PacketInfo& other) const {
    return srcIp == other.srcIp && dstIp == other.dstIp
        && srcPort == other.srcPort && dstPort == other.dstPort
        && protocol == other.protocol;
}

bool PacketInfo::operator!=(const PacketInfo& other) const {
    return !(*this == other);
}

Как понятно по коду, в логе 10 пакетов с одинаковыми сокетами и одинаковым направлением займут одну запись со счётчиком 10. (если были ответы - будут 2 записи со счётчиками 10).

исходя из этих данных я хочу отследить: были ли какие-то попытки просканировать порты. логично, что нужно смотреть многократные попытки по одним и тем же сокетам но с разными dstPort. Поэтмоу мой анализатор выглядит так (кстати, рекомендации по рефакторингу кода приветсвуются):

#pragma once
#include "IAnalyzer.hpp"
#include "PacketInfo.h"
#include <string>
#include <unordered_map>
#include <set>
#include <unordered_set>
#include <vector>

struct ScanResult {
    std::string srcIp;
    std::string dstIp;
    int uniqueDstPorts;
    bool suspicious;
};

class PortScanningAnalyzer : public IAnalyzer
{
public:
    nlohmann::json analyze(const std::vector<PacketInfo>& packets) override;

private:
    std::vector<ScanResult> detectPortScanning(const std::vector<PacketInfo>& packets, int threshold);
};

#include "PortScanningAnalyzer.h"
#include <nlohmann/json.hpp>

nlohmann::json PortScanningAnalyzer::analyze(const std::vector<PacketInfo>& packets) {
    nlohmann::json result;
    result["rule"] = "portScan";

    const int threshold = 100;

    std::vector<ScanResult> scanResults = detectPortScanning(packets, threshold);

    nlohmann::json counts = nlohmann::json::object();
    std::set<std::string> suspiciousIps;

    for (const auto& r : scanResults) {
        counts[r.srcIp] = counts.contains(r.srcIp) ? counts[r.srcIp].get<int>() + r.uniqueDstPorts : r.uniqueDstPorts;

        if (r.suspicious) {
            suspiciousIps.insert(r.srcIp);
        }
    }

    result["dst_ports_count"] = counts; // это чисто проверочная инфа, потом она будет удалена или изменена
    result["suspicious_ips"] = suspiciousIps;
    result["threshold"] = threshold;

    return result;
}


std::vector<ScanResult> PortScanningAnalyzer::detectPortScanning(const std::vector<PacketInfo>& packets, int threshold) {
    std::unordered_map<std::string, std::unordered_map<std::string, std::set<int>>> portsMap;

    for (const auto& p : packets) {
        if (p.protocol == "TCP" || p.protocol == "UDP") {
            portsMap[p.srcIp][p.dstIp].insert(p.dstPort);
        }
    }

    std::vector<ScanResult> results;

    for (const auto& [srcIp, dstMap] : portsMap) {
        for (const auto& [dstIp, portSet] : dstMap) {
            ScanResult r;
            r.srcIp = srcIp;
            r.dstIp = dstIp;
            r.uniqueDstPorts = static_cast<int>(portSet.size());
            r.suspicious = r.uniqueDstPorts > threshold;
            results.push_back(r);
        }
    }

    return results;
}

А теперь к проблеме.
А вот теперь к проблеме:
я несколько раз пробовал просканировать порты разными способами, в том числе прямо с той же машины, где была эта программа. Даже интереса ради пробовал сканировать из этой машины другую, что (по идее) тоже должно было обнаружиться. И да, так и было, но далеко не все попытки сканирования были замечены. (я пользовался какой-то прогой на телефоне рандомной, она комп просканировала, но моя программа этого не заметила и действительно все счётчики уникальных портов с каждого ip не превышали 4-10 запросов). А когда я пробовал просканить со своей машины порты на другом компе, то там вообще счётчик уникальных портов остановился на ~100 (якобы я отправил не 1000 запросов а 100)

Суть вопроса:
1. Есть ли замечания по нынешнему алгоритму?
2. Какие ещё признаки существуют? например, когда я скормил отчёт чату gpt вместе с логами он упомянул широковещательные пакеты, но так размыто, что я ничего не понял.

P.s.: Для понимания: я не безопасник и не сетевик, я учусь на программной инженерии, где и то и дургое рассматривается поверхностно, но кое-что по сетям понимаю (стараюсь). Поэтому просьба пояснить более-менее доступно, без излишних слэнговых извращений.

Вопрос задан 14 часов назад
146 просмотров

10 комментариев

Подписаться 2 Средний 10 комментариев

Дмитрий @TrueBers

сканирование портов это охренеть какие сложные эвристики в различных ситуациях и конфигурациях, которые должны быть на несколько порядков сложнее твоего. Просто так в сотню строк это не делается. Нужны сотни тысяч строк, чтобы худо-бедно сделать такое.

Написано 14 часов назад
Кот Абсолютный @CityCat4

я не безопасник и не сетевик, я учусь на программной инженерии

"Беда, коль пироги начнет печи сапожник
А сапоги тачать пирожник..." (С) И.А. Крылов "Щука и Кот"

Сленг - это часть профессии. Довольно странно было бы наверное искать врача или юриста, не знающего латыни :)

Написано 13 часов назад
Nikita1231 @Nikita1231 Автор вопроса

Кот Абсолютный, как и странно рассчиытвать ,что челвоек впервые занимающийся чем-то с наскока поймёт весь тот "бред", который можно выдать ,пользуясь исключительно сленгом. Я ведь не прошу объяснять как ребёнку, я прошу обойтись без злоупотребления. То же самое как везде требовать опыт работы, не давая этого самого опыта.

Написано 13 часов назад
Nikita1231 @Nikita1231 Автор вопроса

Дмитрий, прекрасно понимаю, в конце концов с каждым днём появляются новые методы, потому что старые уже раскусили. Поэтому я буду рад ссылкам на книги и ресурсы, где могу изучить тему подробно. Но вообще планирую сделать толко поредварительную проверку прям ОЧЕВИДНЫХ признаков подозрительных действий. Дальше это будет упаковыватсья в отчёт + лог и отдаваться на сервер, где мой препод хочет поставить нейронку на анализ. Нужно понимать ,что проект не претендует на звание коммерчески правильного продукта. Это исключительно внутриуниверситетские эксперименты, которые будут передаваться следующим студентам, те тоже будут допиливать, что-то новое вносить.

Написано 13 часов назад
SunTechnik @SunTechnik

Нет чёткого определения что считается сканирование портов, а что случайным обращением.
Поставьте любой сниффер (tcpdump, wareshark) и посмотрите какие обращения идут к Вашему компьютеру при внешнем сканировании.
Дальше можно думать как реагировать на подобные события.

Написано 12 часов назад
pfg21 @pfg21

учитывая что сейчас сканирование портов делается через сеть с кучи ip-адресов, то выявить простыми методами не смогешь (времена одного единственного адреса с которого тебя школяр от безделья вдруг решил просканить давно прошли).
статистика, выявление закономерностей, ИИ-анализ, бигдата и все такое прочее...
это если суръезно подходить, с закосом на продукт.

Написано 12 часов назад
Nikita1231 @Nikita1231 Автор вопроса

pfg21, да, ИИ тоже будет применяться на сервере (ну, планируется. Как именно это сделать - тоже будем изучать). Я тоже думал о ситуациях, когда используются разные ip, но думал, что это глупости: так сильно заморачиваться ради сканирования рандомного пк в интернете

Написано 11 часов назад
Strabbo @Strabbo

Я не разбираюсь в коде, но попробую помочь с пониманием.
1. Сканирование портов бывают разные, какой метод сканирования твой код может поймать? Например тут есть список методов и их описания.
2. Есть такой софт nfdump, тут есть инфа про него, включая код. Он умеет определять порт скан. Можете подсмотреть в коде как он это делает.
3. scangold может определять TCP scan. тут можете подсмотреть код.
4. Самый легкий вариант ловить TCP syn scan, он хорошо задокументирован и ловится легко.

Написано 11 часов назад
Nikita1231 @Nikita1231 Автор вопроса

Strabbo, благодарю! Именно это мне и нужно было: хоть какая-то информация о распространённых вариантах скана. Запишите это в ответ я засчитаю его и закрою тему. Мне этого, думаю, будет достаточно

Написано 10 часов назад
paran0id @paran0id

Есть такая опенсорсная софтина psad, она это делает, посмотрите как.

Написано 10 часов назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillfactory

DevOps-инженер

6 месяцев

Далее
Нетология

Python-разработчик с нуля

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Компьютерные сети

+4 ещё

Сложный
NAS на базе Proxmox и TrueNAS?
- 1 подписчик
- вчера
- 246 просмотров
3

ответа
Linux

+2 ещё

Средний
Почему nekoray в tun режиме не проксирует запросы от windsurf?
- 1 подписчик
- вчера
- 140 просмотров
1

ответ
C++

Простой
Какой подход выбрать для представления Chunk?
- 1 подписчик
- вчера
- 154 просмотра
1

ответ
Компьютерные сети

+2 ещё

Простой
Почему упала скорость интернета на конкретном устройстве?
- 1 подписчик
- 24 окт.
- 368 просмотров
1

ответ
Компьютерные сети

+1 ещё

Простой
Проблема с интернетом?
- 2 подписчика
- 24 окт.
- 573 просмотра
0

ответов
Компьютерные сети

+1 ещё

Средний
Как найти и ограничить источник бродкаст/мультикаст трафика?
- 2 подписчика
- 23 окт.
- 407 просмотров
2

ответа
Компьютерные сети

+2 ещё

Простой
Возможно ли вывести изображение с ноутбука на три разных андроид телевизора внутри локальной сети(некий аналог anydesk)?
- 2 подписчика
- 22 окт.
- 356 просмотров
2

ответа
Компьютерные сети

+2 ещё

Средний
Как организовать сеть на Микротике с двумя интернет шлюзами?
- 5 подписчиков
- 18 окт.
- 3279 просмотров
6

ответов
Linux

+4 ещё

Простой
Возможно ли получить интернет с openwrt в proxmox?
- 1 подписчик
- 17 окт.
- 351 просмотр
4

ответа
Показать ещё Загружается…

Инженер мониторинга сети

Ростелеком • Екатеринбург

от 52 000 ₽

Главный менеджер управления поддержки продаж сети

ПСБ цифровая лаборатория • Москва

от 110 000 до 130 000 ₽

Начальник проектного отдела (проектирование сетей газоснабжения)

Мособлгаз • Мытищи

от 127 200 до 157 900 ₽

сканирование портов это охренеть какие сложные эвристики в различных ситуациях и конфигурациях, которые должны быть на несколько порядков сложнее твоего. Просто так в сотню строк это не делается. Нужны сотни тысяч строк, чтобы худо-бедно сделать такое.
я не безопасник и не сетевик, я учусь на программной инженерии

"Беда, коль пироги начнет печи сапожник
А сапоги тачать пирожник..." (С) И.А. Крылов "Щука и Кот"

Сленг - это часть профессии. Довольно странно было бы наверное искать врача или юриста, не знающего латыни :)
Кот Абсолютный, как и странно рассчиытвать ,что челвоек впервые занимающийся чем-то с наскока поймёт весь тот "бред", который можно выдать ,пользуясь исключительно сленгом. Я ведь не прошу объяснять как ребёнку, я прошу обойтись без злоупотребления. То же самое как везде требовать опыт работы, не давая этого самого опыта.
Дмитрий, прекрасно понимаю, в конце концов с каждым днём появляются новые методы, потому что старые уже раскусили. Поэтому я буду рад ссылкам на книги и ресурсы, где могу изучить тему подробно. Но вообще планирую сделать толко поредварительную проверку прям ОЧЕВИДНЫХ признаков подозрительных действий. Дальше это будет упаковыватсья в отчёт + лог и отдаваться на сервер, где мой препод хочет поставить нейронку на анализ. Нужно понимать ,что проект не претендует на звание коммерчески правильного продукта. Это исключительно внутриуниверситетские эксперименты, которые будут передаваться следующим студентам, те тоже будут допиливать, что-то новое вносить.
Нет чёткого определения что считается сканирование портов, а что случайным обращением.
Поставьте любой сниффер (tcpdump, wareshark) и посмотрите какие обращения идут к Вашему компьютеру при внешнем сканировании.
Дальше можно думать как реагировать на подобные события.
учитывая что сейчас сканирование портов делается через сеть с кучи ip-адресов, то выявить простыми методами не смогешь (времена одного единственного адреса с которого тебя школяр от безделья вдруг решил просканить давно прошли).
статистика, выявление закономерностей, ИИ-анализ, бигдата и все такое прочее...
это если суръезно подходить, с закосом на продукт.
pfg21, да, ИИ тоже будет применяться на сервере (ну, планируется. Как именно это сделать - тоже будем изучать). Я тоже думал о ситуациях, когда используются разные ip, но думал, что это глупости: так сильно заморачиваться ради сканирования рандомного пк в интернете
Я не разбираюсь в коде, но попробую помочь с пониманием.
1. Сканирование портов бывают разные, какой метод сканирования твой код может поймать? Например тут есть список методов и их описания.
2. Есть такой софт nfdump, тут есть инфа про него, включая код. Он умеет определять порт скан. Можете подсмотреть в коде как он это делает.
3. scangold может определять TCP scan. тут можете подсмотреть код.
4. Самый легкий вариант ловить TCP syn scan, он хорошо задокументирован и ловится легко.
Strabbo, благодарю! Именно это мне и нужно было: хоть какая-то информация о распространённых вариантах скана. Запишите это в ответ я засчитаю его и закрою тему. Мне этого, думаю, будет достаточно
Есть такая опенсорсная софтина psad, она это делает, посмотрите как.

Answer 1 · 2025-10-29 17:29:27

Так и не понял как вы "сканировали порты". Если какой то тулзой - то вполне возможно что в ней уже встроена защита от программ, подобных вашей.

Как обнаружить сканирование портов по логу сетевого трафика?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт