Как спарсить эту страницу с кнопкой?

Question

san_m_m @san_m_m

Python

Как спарсить эту страницу с кнопкой?

Добрый день!

Есть такая страница https://gosuslugi.primorsky.ru/registry/taxi.htm

Подскажите как можно спарсить данную страницу с помощью python? Точнее решить проблему с кнопкой Загрузить...

Вопрос задан более трёх лет назад
128 просмотров

3 комментария

Подписаться 1 Простой 3 комментария

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- вчера
- 75 просмотров
2

ответа
Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- 20 дек.
- 117 просмотров
2

ответа
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 3 подписчика
- 18 дек.
- 187 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 218 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 75 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 198 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 228 просмотров
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 141 просмотр
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 247 просмотров
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 239 просмотров
1

ответ
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 175 000 до 350 000 ₽

Нафига делать ссылку, с адресацией на qna.habr.com?
MinTnt, Извиняюсь, случайно получилось
Сделать Ajax запрос по шаблону (возможно, добавив cookies):

{"id": 17, "method": "pubblock.renderZone", "params": ["registry/taxi", "ajax-all", {"javaClass": "java.util.HashMap", "map": {"blk": 11237099, "notVisibleSF": true, "cmd": "simpleSearch", "defaultForm": "uniSearch", "showOption": false, "innerSearch": false, "ts": 1610490760529, "objCriteria": "([gosudaNomer] contains \"VOPROS\") \u0418\u041b\u0418 ([polnoeNaimen] contains \"VOPROS\") \u0418\u041b\u0418 ([sokrasNaimen] contains \"VOPROS\")"}}]}

Answer 1 · 2021-01-12 19:46:22

Тут нужен selenium, с ним можно нажимать копки и управлять страницей как с обычного браузера
Вот примеры с css selector и id
Но нужно быть осторожным, selenium не позволяет нормально отследить прогрузку страницы, поэтому используйте sleep или WebDriverWait если знаете, какой элемент ищете
Примеры для сайта https://dbkpop.com/db/all-k-pop-idols, не знаю как сейчас, но раньше работали

def expand_table(self):
        css = "button.btn.dropdown-toggle.btn-default"
        self.driver.execute_script(f"document.querySelector('{css}').scrollIntoView();")
        button = self.driver.find_elements_by_css_selector(css)
        if button:
            button[0].click()
            button_all = self.driver.find_elements_by_link_text("All")
            button_all[0].click()
        time.sleep(30)

    def accept_cookie(self):
        try:
            cn = WebDriverWait(self.driver, 10).until(
                EC.presence_of_element_located((By.ID, "cn-accept-cookie"))
            )
            cn.click()
        except:
            pass
        try:
            cn = WebDriverWait(self.driver, 10).until(
                EC.presence_of_element_located((By.ID, "onesignal-popover-cancel-button"))
            )
            cn.click()
        except:
            pass
        time.sleep(10)

Для парсинга лучше используйте lxml или bs4 с движком lxml, он работает намного быстрее, пример с таблицей

def get_table_data(self):
        self.table = self.driver.find_elements_by_id(self.table_id)[-1]
        for th in self.table.find_elements_by_xpath(".//thead//tr")[0].find_elements_by_xpath(".//th"):
            self.table_headers.append(th.text)
        table_data = self.table.find_elements_by_xpath(".//tbody//tr")
        module_logger.info(f"Founded {len(table_data)} tr in table")
        for tr in table_data:
            data = []
            for td in tr.find_elements_by_xpath(".//td"):
                in_td = td.find_elements_by_xpath(".//*")
                if in_td:
                    in_td = in_td[-1]
                    if in_td.tag_name == "a":
                        link = in_td.get_attribute("href")
                        data.append(link)
                    else:
                        text = in_td.text
                        if text:
                            data.append(text)
                else:
                    data.append(td.text)
            self.table_data.append(data)

Как спарсить эту страницу с кнопкой?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт