Код не записывает данные в файл на сервере?

Question

Usenovich @Usenovich

Python

Код не записывает данные в файл на сервере?

Есть парсер который парсит данные и сохраняет их в список потом достает из списка и сохраняет каждую инфу отдельно в файлы и все это работает в цикле. Код прекрасно работает, но на сервере перестало работать. И дает ошибку Message: unknown error: session deleted because of page crash
from unknown error: cannot determine loading status
Скрипт сохраняет данные в список но не создает файл и не записывает в файл данные из списка.

#Библиотеки
from selenium.webdriver.chrome.service import Service
from bs4 import BeautifulSoup
from selenium import webdriver
import time

#Ссылка на сайт
URL = 'https://equanity.notion.site/af08990fbca340b38301653a7da4c9c3'

#Настройки веб-драйвера
options = webdriver.ChromeOptions()
options.headless = True
options.add_argument("--no-sandbox")
options.add_argument("user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36")
options.add_argument('--disable-dev-shm-usage')
options.add_argument("--disable-blink-features=AutomationControlled")

#Путь к веб-драйверу
driver = webdriver.Chrome(executable_path = "/home/tbot/chromedriver",options = options)
driver.maximize_window()

#Получаем название и ссылки всех кнопок в главной странице (Карта Гайда))
def get_info():
    while True:
        try:
            driver.get(url=URL)
            time.sleep(7)
            source = driver.page_source
            soup = BeautifulSoup(source, 'html.parser')
            all_buttons_get = soup.find_all(class_ = "pseudoSelection")
            buttons_name = []
            buttons_href = []

            for item in all_buttons_get:
                try:
                    item_text = item.text
                    item_href = "https://equanity.notion.site" + item.find('a')['href']
                    buttons_name.append(item_text)
                    buttons_href.append(item_href)
                except Exception as ex:print(ex)
            del buttons_name[0:2]
            file = open("/home/tbot/name.txt", "w", encoding = "utf-8")
            file.write("\n".join(buttons_name).join("\n"))
            print(buttons_name)
            print(buttons_href)
            for inf in buttons_name:
                file.write("%s\n" %inf)
            file.close()
        except Exception as ex:print(ex)
        #Получем информацию внутрий кнопок 2-уровня
        count = 1
        try:
            del buttons_href[0:2]
            for hrefs in buttons_href:
                driver.get(url=hrefs)
                time.sleep(7)
                source_2 = driver.page_source
                soup = BeautifulSoup(source_2, 'lxml')
                text = [i.text for i in soup.find_all('div', class_='notion-selectable')]
                li = []
                for i in text:
                    if i not in li:
                        li.append(i)
                del li[0:6]
                #Полученную инфу записываем в файлы
                file = open(f"/home/tbot/data/{count}_info.txt", "w", encoding = "utf-8")
                file.write("\n".join(li).join("\n"))

                for item in li:
                    file.write("%s\n" % item)
                file.close()
                count += 1
        except Exception as ex:print(ex)
        time.sleep(85500)

if __name__ == '__main__':
    get_info()

Вопрос задан более двух лет назад
135 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Хекслет

Python-разработчик

10 месяцев

Далее

Ответы на вопрос 1

2 комментария

Usenovich @Usenovich Автор вопроса

Перво-наперво надо скопировать название ошибки и погуглить. Первая же ссылка.

Конечно же я в первую очередь искал в гугле ответы и как видите в коде уже написано options.add_argument("--no-sandbox") и options.add_argument('--disable-dev-shm-usage'). Это не помогло

Написано более двух лет назад
Алан Гибизов @phaggi Куратор тега Python

Usenovich, вы видели, сколько там рецептов? Всё попробовали?
Я бы, к примеру, создание драйвера попробовал бы делать на каждый раз, а не единожды вначале. Ну и там полно вариантов. Там даже в первом совете есть рекомендации по настройке /dev/shm как временного виртуального диска. Вы возитесь с linux. А это - красные глаза, т.е. многочисленные упорные попытки так или иначе решить проблему, а не бежать с ней за решением…
Ничего у вас не выйдет, бросайте это дело.

Написано более двух лет назад

Ваш ответ на вопрос

Вопрос закрыт для ответов и комментариев

Потому что уже есть похожий вопрос.

Похожие вопросы

Python

Средний
Какие есть удобные API для генерации картинок через AI?
- 1 подписчик
- 5 часов назад
- 33 просмотра
0

ответов
Python

Простой
Дублирование логов в python logging?
- 3 подписчика
- вчера
- 188 просмотров
1

ответ
Python

+1 ещё

Простой
Pycharm для старенького мака??
- 1 подписчик
- 18 окт.
- 180 просмотров
3

ответа
Python

+1 ещё

Средний
Как сделать чтоб аккаунт писал при подписке на канал?
- 1 подписчик
- 16 окт.
- 131 просмотр
0

ответов
Python

+1 ещё

Простой
Какие есть простые легковесные LLM для локального использования?
- 2 подписчика
- 14 окт.
- 521 просмотр
2

ответа
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт.
- 110 просмотров
0

ответов
Python

+1 ещё

Простой
FastAPI Prometheus_fastapi_instrumentator где мне следует разместить?
- 1 подписчик
- 09 окт.
- 141 просмотр
1

ответ
Python

+1 ещё

Простой
Пытаюсь пропустить число 10 двумя способами.(правильный второй код) Почему эти два кода дают разный результат?
- 1 подписчик
- 09 окт.
- 534 просмотра
2

ответа
Python

+2 ещё

Простой
В каком слое DTO объект преобразовывать в словарь перед сохранением в БД?
- 1 подписчик
- 08 окт.
- 144 просмотра
2

ответа
Python

+1 ещё

Простой
Visual Studio Code Имя «pipenv» не распознано как имя командлета?
- 1 подписчик
- 08 окт.
- 125 просмотров
1

ответ
Показать ещё Загружается…

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python разработчик

ITK academy • Казань

от 75 000 ₽

Python разработчик

Космос Про Медиа • Москва

от 180 000 до 200 000 ₽

Приведите полный текст ошибки и название сервера (и сразу навскидку - heroku не поддерживает работу с файлами).
сервер на ubuntu обычный vps/vds сервер. Message: unknown error: session deleted because of page crash
from unknown error: cannot determine loading status
from tab crashed
(Session info: headless chrome=107.0.5304.110)
Stacktrace:
#0 0x5573b5246463
... и т.д. цифры как сверху

Answer 1 · 2022-11-22 22:22:18

Алан Гибизов @phaggi Куратор тега Python

лужу, паяю, ЭВМы починяю

Перво-наперво надо скопировать название ошибки и погуглить. Первая же ссылка.
Вообще-то вы обязались делать это самостоятельно.

Ответ написан более двух лет назад

2 комментария

Код не записывает данные в файл на сервере?

Вопрос закрыт для ответов и комментариев

Минуточку внимания

Войдите на сайт