Здравствуйте.
Получают страницу сайта CitiLink, записываю ее на файл, прогоняю ее через bs4. Ничего не выдает. Залезаю в файл с кодом страницы, а там непонятный шифр:
Также у меня есть скачанная уже другая страница сайта, где все нормально. Однако уже возникала похожая ситуация, и только спустя пары повторных запросов мне выдался нормальный код.
Что это? Из-за чего такое происходит, и как получать нормальную страницу с первого раза?
Если что, вот класс, отвечающий за запись и считывание файлов:
class Html_pages:
def write(directory, file_name, url, html): # принимает директорию куда сохранять, имя файла, ссылку страницы, код
file = open('./Database/Pages/' + directory + '/' + file_name + '.txt', 'w', encoding='utf-8')
file.write(url + '\n')
file.write(str(html))
file.close()
def get(directory, file_name):
file = io.open('./Database/Pages/' + directory + '/' + file_name + '.txt', 'r', encoding='utf-8')
html = ''
for line in file:
html += line
file.close()
return html