хороший способ - запустить wget, если он выкачает весь сайт - он однопоточный, то защита там неособо
еще фишка - прикинуться Гуглботом, поверьте на слово - оочень немногие проверяют бота, особенно если с ВПС в США парсить
для ВК и прочих, где царствую спамеры - защита будет всегда, границы - ищите
заголовки - см https://pypi.python.org/pypi/fake-useragent/0.1.2