Задать вопрос
@Gringo0

Парсинг на Python при помощи tor?

Относительно недавно начал заниматься парсингом. Использую tor. Попробовал достаточно много способов из инета, но ip так и не меняется, хотя tor, пароли, подключение настроены нормально. Хотелось бы узнать работает ли вообще сейчас базовый парсинг с помощью tor и зачем нужно прописывать мосты, либо же нужно искать обходные пути?
  • Вопрос задан
  • 72 просмотра
Подписаться 1 Простой 2 комментария
Решения вопроса 1
Mike_Ro
@Mike_Ro
Python, JS, WordPress, SEO, Bots, Adversting
Относительно недавно начал заниматься парсингом. Использую tor.

Жестко.
Попробовал достаточно много способов из инета, но ip так и не меняется

Но нам вы их конечно же не показали.
Хотелось бы узнать работает ли вообще сейчас базовый парсинг с помощью tor

Технически - работал, работает и будет работать. Функционально - не работал и не будет работать, т.к. ip выхода тора палятся так, как не палятся спам-ip дата-центров, ну и про скорость и стабильность работы тора не стоит забывать.
либо же нужно искать обходные пути?

- Если денег нет - использовать публичные списки ip проксей.
- Если денег почти нет - использовать не публичные списки ip проксей.
- Если деньги есть - использовать мобильные прокси.
- Если деньги ЕСТЬ! - использовать резидентские прокси.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 2
borisdenis
@borisdenis
Ленив и вреден...
Относительно работает, так как например я, как владелец сайта, могу в настройках cloudflare указать запрет трафика из тор сетей и всё, что бы вы не делали, вам ко мне не попасть. Другие cdn сети тоже такой функционал предлагают, да и на самом веб сервере такое можно настроить.

Зачем блокировать - через тор крайне мало полезных заходов, в основном мамкины хакеры и т.п.
Ответ написан
@dim5x
ЗИ, ИБ. Помогли? Поблагодарите. Отметьте ответом.
зачем нужно прописывать мосты

Как будто бы это гуглится:
В некоторых странах доступ к сети Tor может быть заблокирован. Мосты, не являющиеся частью публичного списка узлов, позволяют обойти эти блокировки, так как их сложнее обнаружить и заблокировать.


Работает, почему бы не работать. Но, имхо, такой себе способ: скорость непредсказуемая, коннект сейчас есть, а через минуту нет, крупные выходные ноды могут быть блокированы ресурсами, которые вы парсите. Одним словом: зачем?
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
Алабуга Москва
До 370 000 ₽
Betnetix Ростов-на-Дону
от 80 000 до 250 000 ₽
Strikt Москва
от 100 000 до 180 000 ₽