rusyska55011
@rusyska55011

Что за шифр выдается при парсинге?

Здравствуйте.
Получают страницу сайта CitiLink, записываю ее на файл, прогоняю ее через bs4. Ничего не выдает. Залезаю в файл с кодом страницы, а там непонятный шифр:
5faab565b3daa376326492.png

Также у меня есть скачанная уже другая страница сайта, где все нормально. Однако уже возникала похожая ситуация, и только спустя пары повторных запросов мне выдался нормальный код.
5faab4e0c6110566970246.png

Что это? Из-за чего такое происходит, и как получать нормальную страницу с первого раза?

Если что, вот класс, отвечающий за запись и считывание файлов:
class Html_pages:
    def write(directory, file_name, url, html):  # принимает директорию куда сохранять, имя файла, ссылку страницы, код
        file = open('./Database/Pages/' + directory + '/' + file_name + '.txt',  'w', encoding='utf-8')

        file.write(url + '\n')
        file.write(str(html))

        file.close()

    def get(directory, file_name):
        file = io.open('./Database/Pages/' + directory + '/' + file_name + '.txt', 'r', encoding='utf-8')

        html = ''
        for line in file:
            html += line

        file.close()
        return html
  • Вопрос задан
  • 116 просмотров
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
код Да Винчи
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы