Задать вопрос
@Taya93
Брест

Как парсить сайт на python?

надо спарсить сайт https://koleso.ru/shops/, достать данные о каждом магазине (адрес, телефон, время работы, координаты)

но проблема заключается в том, как это сделать ? не могу найти, где берутся координаты.
помогите пожалуйста
  • Вопрос задан
  • 2531 просмотр
Подписаться 1 Простой Комментировать
Пригласить эксперта
Ответы на вопрос 3
NeiroNx
@NeiroNx
Программист
Для некоторых задач селениум избыточен:
>>> import re
>>> from urllib.request import urlopen
>>> regex = r"createObject\(\"Placemark\",\s?new\sYMaps\.GeoPoint\(([\d\s\.\,]+)\),\s?\"(\w+)\",\s?'([^']+)'\s?\);"
>>> text = str(urlopen("https://koleso.ru/shops/").read(),"windows-1251")
>>> result = [list(x.groups()) for x in re.finditer(regex, text, re.MULTILINE)]
>>> result[0]
['37.834803,55.776082', 'Koleso', '<div><a class="MenuNav_YmapsBalloonPreButton" style="font-size:11px;" href="/shops/3653118/">Карточка магазина</a></div><div class="MenuNav_YmapsBalloonComment"><b>г. Москва</b><br />ш. Энтузиастов, д. 63<br />тел.: +7(499)308-59-93</div>']
>>>

но регулярку надо уметь написать
Ответ написан
@Stqs
senior software developer
Ответ написан
Комментировать
QQQ-RRR
@QQQ-RRR
Я сам недавно начал изучать это направление и использую Selenium.
Сложного ничего если есть минимальные знания HTML, можно конечно и без них
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы