FlipWho, я видела вообще один сайт, коодинаты были в js скрипте, но под тегом с классов hide. те когда я парсила страницу. див с координатами не отпарсился, тк он лежал под классом hide. как можно это обойти?
FlipWho, вот с этим проблемы. как я понимаю, что не всегда координаты хранятся одинаково. где-то в html теге, где-то в js скрипте, гдето подгружается с другого урла.
и вот Вы говорите, что можно распарсить по паттерну, а где этот паттерн узнать, почитать про него ?
Александр спасибо, вроде бы работает, но не совсем разобралась в ващем коде ?
1) import re - это вызов библиотеки для использования регулярных выражений
2) from urllib.request import urlopen - для работы с интернетом
а вот строки 3, 4, 5. можете объяснить ?
как я поняла, в стр №3 мы описываем принцип поиска координат, но почему именно так
стр4 - это читаем нужный урл, где будем искать координаты
стр №5 делаем результат, те генератор списков собирает сроку
а так же такой вопрос: выдает список в разнобой, а как его отсортировать ?
конечно, если Вам не тяжело будет
заранее благодарна
.content.decode('Windows-1251')
это в кодировке Windows-1251