Ответы, понравившиеся пользователю san_m_m

Задать вопрос

Лайки

Как исправить парсер?
ScriptKiddo @ScriptKiddo
Последовательность действий:
1) Перед кликом проверять наличие iframe виджета
2) Если есть - переключиться на iframe с виджетом
3) Нажать в нем кнопку закрытия
4) Восстановить контекст iframe
5) Продолжить работу

Переключиться на iframe:

# Xpath надо написать самому iframe = driver.find_element_by_xpath("//iframe") driver.switch_to.frame(iframe)

Восстановить контекст iframe

driver.switch_to.default_content()

Либо можно воспользоваться requests

import requests params = { 'name': 'Иванов Иван Иванович', 'numberOrInn': '1111111111', } response = requests.get('https://www.rgs.ru/api/agents/checkAgent', params=params) # {"Status":"NotFound","ErrorCorrelationIds":[],"ErrorCode":null} print(response.text)

Ответ написан более трёх лет назад

Комментировать
Комментировать
Как разделить элементы списка?
Сергей Карбивничий @hottabxp Куратор тега Python
Сначала мы жили бедно, а потом нас обокрали..
my_list = ['Иванов Иван Иванович' ,'','', 'Больница', 'Исполняющий обязанности главного врача'] name = my_list[0].split() name.extend(my_list[3:]) print(name)

['Иванов', 'Иван', 'Иванович', 'Больница', 'Исполняющий обязанности главного врача']

Берем первый элемент из списка, и разделяет по умолчанию(по пробелу). Потом получившийся список расширяем главным списком, только пропускаем 3 первые элемента.

Ответ написан более трёх лет назад

Комментировать
Комментировать
Как вычленить номер автомобиля?
Григорий Боев @ProgrammerForever
Учитель, автоэлектрик, программист, музыкант
В номере присутствуют не все буквы, а только из списка
А, В, Е, К, М, Н, О, Р, С, Т, У и Х
Регулярка такая:

([АВЕКМНОРСТУХавекмнорстухABEKMHOPCTYXabekmhopctyx]\s*\d{3}\s*[АВЕКМНОРСТУХавекмнорстухABEKMHOPCTYXabekmhopctyx]{2}\s*\d{2,3})|([АВЕКМНОРСТУХавекмнорстухABEKMHOPCTYXabekmhopctyx]{2}\s*\d{3}\s*\d{2,3})

Примеры на reg101

Ответ написан более трёх лет назад

Комментировать
Комментировать

Как спарсить таблицу с помощью BP?

soremix @SoreMix Куратор тега Python

yellow

Не хватает куков, которые определяют, что на странице только 10 результатов (или больше), соответственно, если их нет - нет и страниц

Сделал так, все работает

import requests
from bs4 import BeautifulSoup  

s = requests.Session()

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36'}

s.get('https://mintrans.novreg.ru/perm/list.html', headers=headers, cookies={'abc': 'all', 'count': '10'})

links = []
for i in range(1, 4):
    r = s.get(f'https://mintrans.novreg.ru/perm/list%7Bpage-{i}%7D.html', headers=headers, cookies={'abc': 'all', 'count': '10'})
    soup = BeautifulSoup(r.text, 'html.parser')
    data = soup.find('table')
    links.append(data)

Ответ написан более трёх лет назад

4 комментария

Самые активные сегодня

Dupych
- 6 ответов
- 0 вопросов
Кот Абсолютный
- 3 ответа
- 0 вопросов
Tolnik
- 2 ответа
- 0 вопросов
Drno
- 2 ответа
- 0 вопросов
Daemon23RUS
- 2 ответа
- 0 вопросов
AntHTML
- 2 ответа
- 0 вопросов

Как исправить парсер?

Как разделить элементы списка?

Как вычленить номер автомобиля?

Как спарсить таблицу с помощью BP?

Войдите на сайт