Ответы пользователя soremix по тегу «Selenium»

Selenium Ошибка при загрузке страницы?

soremix @SoreMix Куратор тега Python

yellow

https://help.pythonanywhere.com/pages/selenium/

Ответ написан более трёх лет назад

Комментировать

Почему selenium возвращает пустой массив в место страницы?

soremix @SoreMix Куратор тега Python

yellow

А что хотите то? Сурс?

driver.source_code

ps: None - не массив

Ответ написан более трёх лет назад

Комментировать

Selenium WD Как кликнуть на блок без определенного класса?

soremix @SoreMix Куратор тега Python

yellow

Находите свой блок hello = driver.find_element_by_class_name('hello'). От него уже находите другие и кликаете

elements = hello.find_elements_by_tag_name('ну тут тег')
for el in elements:
    el.click()

Либо сразу все искать через xpath

Ответ написан более трёх лет назад

1 комментарий

Python selenium, как сделать проверку при загрузки загрузки файла в указанную директорию?

soremix @SoreMix Куратор тега Python

yellow

Уверен, что в селениуме есть много специальных хендлеров и прочего, чтобы получать информацию о загружаемом файле и тд, но пока никто не видит предлагаю костыль: будем вручную формировать запрос для получения файла, и не выгружая запрос полностью доставать имя файла из заголовков ответа

import requests
import re
import os

#...

headers = {'Content-Type': 'application/x-www-form-urlencoded'}
documents = driver.find_elements_by_class_name("docext-container")

for document in documents:
    # тут ищем родительский элемент, в нем есть нужный нам ID
    document_id = document.find_element_by_xpath('..').get_attribute('data-documentation-id')
    # в пейлод вписываем нужные данные от формы, и вставляем наш ID
    payload='cr_documentation_action=download&documentation_id={}&email='.format(document_id)
    # url для запроса - текущая страница
    # ставим обязательно stream=True, чтобы файл не выкачивался сразу
    r = requests.post(driver.current_url, headers=headers, data=payload, stream=True)
    # название файлов всегда есть в заголовках запроса, response.headers
    # поэтому берем их, видим в нужном ключе "attachment; filename*=UTF-8''hlw-shiptsy-ortodonticheskie-reg.pdf"
    # ну и недолго думая дергаем регуляркой
    document_name = re.search(r'\'\'(.+?\.pdf)', r.headers['Content-Disposition']).group(1)

    # дальше уже нужно проверить наличие файла в папке
    # я так понял путь до папки с загрузками в переменной path_registration_documents, так что:
    if document_name in os.listdir(path_registration_documents):
        print('Не новый')
    else:
        print('Новый док')
        document.click()

Заголовков дополнительных в requests не вставлял, хватило только одного. Авторизация для этого тоже не нужна, но мало ли со временем изменится что нибудь - надо будет добавить.
Ну и os.listdir() нужно свой путь нормально указать, если вдруг неправильно. В общем идея ясна, дальше уже мои полномочия все

Ответ написан более трёх лет назад

7 комментариев

Как конкатенировать дату и имя скриншота?

soremix @SoreMix Куратор тега Python

yellow

Не поддерживается символ : в названии файла

Ответ написан более трёх лет назад

1 комментарий

Как убрать ошибку Selenium?

soremix @SoreMix Куратор тега Python

yellow

Загрузить geckodriver и положить его в папку со скритом, либо добавить путь до него в PATH
https://github.com/mozilla/geckodriver/releases

Ответ написан более трёх лет назад

Комментировать

Python Selenium как выбрать опцию из выпадающего списка?

soremix @SoreMix Куратор тега Python

yellow

driver.find_element_by_class_name('form-control').find_elements_by_tag_name('option')[1].clik()
AttributeError: 'WebElement' object has no attribute 'clik'

Проверить написание четырех букв - меньше секунды жизни

Почему вы думаете, что нашли нужный элемент select? Даже на скриншоте минимум два элемента с классом form-control есть.

Ответ написан более трёх лет назад

1 комментарий

Почему не отрабатывает except?

soremix @SoreMix Куратор тега Python

yellow

Потому что элемент не был найден спустя время, заданное в wait. Поэтому и вызывается TimeoutException.
В блок except не попадает, потому что он отлавливает только AssertionError

Ответ написан более трёх лет назад

Комментировать

Парсинг html при помощи Selenium+Python, некорректный возврат?

soremix @SoreMix Куратор тега Python

yellow

Соответственно, href из него получить не могу

То, что вы получили - называется class, и это нормально, найти href вы не можете не поэтому

Вы находите <div> с классом testCard. У div нет и никогда не было аттрибута href.

Конкретно в данном случае, у него есть лишь class.

Если вы ищите href с вложенного в div элемента а,

то нужно сначала для каждого найденного div найти элементы a, затем у них уже брать href.

for el in slide_elems:
    # Находим вложенный тег <a>
    tag_a = el.find_element_by_tag_name('a')
    print(tag_a.get_attribute('href'))

Ответ написан более трёх лет назад

5 комментариев

Как выдернуть значение на сайте, если оно за двумя вложенными iframe?

soremix @SoreMix Куратор тега Python

yellow

Нужно определенную позицию ккурсора? Он лежит спокойно себе в коде, без всяких айфреймов

<span class="lastInst pid-8918-last">464,60</span>

Ответ написан более трёх лет назад

5 комментариев

Selenium+Telegram?

soremix @SoreMix Куратор тега Python

yellow

Назовите переменную и функцию по разному, почему функция называется драйвер, как и переменная
Ну и нужно будет передать сам driver в функцию third.

# ...
bot.register_next_step_handler(msg, third, driver)
# ...

# ...
def third(message, driver):
# ...

Ответ написан более трёх лет назад

1 комментарий

Как извлечь из элемента конкретный текст?

soremix @SoreMix Куратор тега Python

yellow

import re
s = 'Отправьте "капча 3333"'
print(re.search(r'"(.+?)"', s).group(1))

Ответ написан более трёх лет назад

Комментировать

Запуск Selenium без создания окна?

soremix @SoreMix Куратор тега Python

yellow

options.add_argument("--headless")

Ответ написан более трёх лет назад

Делаю парсер страницы (Python + selenium + beautiful soup). Как проверять ссылки на вхождение подстроки?

soremix @SoreMix Куратор тега Python

yellow

Так и все же где ищите, в BS4 или selenium?

В BS4 можно использовать регулярные выражения

import re
soup.find('a', string=re.compile('содержимому'))

Ответ написан более трёх лет назад

7 комментариев

Как найти элемент selenium по части текста?

soremix @SoreMix Куратор тега Python

yellow

Он и так должен все элементы найти по вхождению, contains ведь и переводится как "содержит".
Для точного поиска использовалось бы

driver.find_element_by_xpath("//div[text()='фото профиля.']")

Так что у вас либо не все элементы являются div'ами, либо еще что-то не так. Показывайте полный код

Ответ написан более трёх лет назад

2 комментария

Driver.execute_script("document.getElementById('main')) возвращает None?

soremix @SoreMix Куратор тега Python

yellow

Пробовал разные сайты, и все равно возвращает None

Вы ничего и не просите вернуть...

js_el = self.driver.execute_script("return document.getElementById('main')")

Ответ написан более трёх лет назад

1 комментарий

Selenium не может найти элемент?

soremix @SoreMix Куратор тега Python

yellow

Все правильно, откуда вы loginForm взяли? У вас же нет его в элементе

Ответ написан более трёх лет назад

2 комментария

Python Selenium элемент неактивен, ошибка?

soremix @SoreMix Куратор тега Python

yellow

Ctrl+F нажмитие, и впишите в поиск свои данные. Увидите, что поля логин два, два пароля и две кнопки отправить. Вам нужны вторые.

Ответ написан более трёх лет назад

2 комментария

Как получить содержимое iframe с помощью python?

soremix @SoreMix Куратор тега Python

yellow

У него src есть, оттуда и парсить

Ответ написан более трёх лет назад

7 комментариев

Как производить сравнение с классом дочернего элемента?

soremix @SoreMix Куратор тега Python

yellow

print(driver.find_elements_by_xpath("/html/body/div[1]/div[2]/div[6]/div[1]/div[3]/div")[0].get_attribute('innerHTML'))

Изучайте

Ответ написан более трёх лет назад

1 комментарий

Войдите на сайт