Именно так, сканируют все адреса и порты (иногда только некоторые порты).
Писал свой прокси, запросов от таких автопоисковиков приходила тьма. Обычно это что-то типа GET
mysite.ru/proxytest.txt HTTP/1.0
то есть пробуют через меня получить свой файлик и смотрят на результат. А вот дальше обычно идет рассылка спама через мой прокси :( запросы CONNECT на SMTP порт и отправка писем. Пришлось приделывать механизм авторизации