Здравствуйте.
С помощью скрипта на python (с использование asyncio и aiohttp) выполняю парсинг сайтов для сбора статистики. После запуска парсинга, примерно 1к-1,5к сайтов парсятся очень быстро, а далее начинаются тормоза. Причем ресурсы сервера почти не используются, сеть также не загружена. Тормозит метод loop.create_connection. Если паралельно с парсингом загружать какой-либо сайт, он тоже тупит. Предполагаю, что проблема с ОС (debian 7.8) но уже не знаю, в каком направлении копать.
Точно не мог. Скрипт асинхронный, проблемы могут возникнуть на блокирующих основной поток вызовах, но таких точно нет, все внимательно перепроверял. Да и гилу то развернуться особо негде, сплошной io, проц почти не нагружен, из блокирующих операций только резолв ДНС внутри asyncio вызывается в ThreadPool'е с большим количеством потоков. (максимум - потери на переключении между потоками, но думаю они ничтожны по сравнению с тормозами на загрузку сайта)
Вы, судя по всему, на своей машине запускаете, может быть вас провайдер ограничивает, видя такое количество соединений? Попробуйте тот же скрипт завести на сервере/vps.