Вообщем есть необходимость найти доступные прокси адреса в конкретном(большом) городе.
Текущий подход берём известные диапазоны для данного города под типы http/socks4/socks5(да из-за aiohttp) а так же посылаем запросы в виде head на целевой сайт(не упадёт там у них нагрузка куда как не маленькая). Так же анализируем по 5 самых используемых портов под каждый тип прокси(есть база на 10000 прокси).
Как можно уменьшить объём передаваемых данных?
Есть ли вероятность что сервер вернёт ответ но не сайт который запрашивается?
Как проверить что прокси подменили ip адрес на свой?
есть, но будет же IP ответившего, должен отличаться от сайта,
Не подумал. =)
На счёт прокси проверялок и правда на небольшом пуле положительных результатов(если они будут) не так критично отправлять запросы на проверку.