Почему парсер записывает данные одного цикла в разные строки бд?

Question

Кирилл Петров @Kirill_Kirillov

Начинающий web-developer

Почему парсер записывает данные одного цикла в разные строки бд?

Парсер собирает данные с сайта, и все бы ок, только он записывает теги <p> с каждой новой строки бд(sqlite3), причем другие столбцы просто дублируются, меняется только id, с чем это может быть связано?

def get_page_date(html):
    soup = BeautifulSoup(html, 'lxml')
    news = soup.find('div', class_='article-list').find_all('h3', class_='article-list__item-title')
    for new in news:
        try:
            title = new.find('a',class_= 'link_nodecor').text.strip()
            print(title)
        except:
            title = ''
        try:
            url = 'https://example.ru' + new.find('a',class_= 'link_nodecor').get('href')
            print(url)
            post = requests.get(url).text
            soup = BeautifulSoup(post,'lxml')
            articles = soup.find('div',class_='article').find_all('p')
            for article in articles:
                try:
                    post_text = article.text
                    cursor.execute("INSERT INTO news VALUES (?, ?, ?)", (title, post_text, url))
                    cursor.commit()
                    print(post_text)
                except:
                    post_text = ''
        except:
            url = ''

Как это можно исправить?

Вопрос задан более трёх лет назад
87 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+3 ещё

Простой
Извлечение таблиц со спецификациями из PDF чертежей металлоконструкций — решаемо? Или я встрял?
- нет подписчиков
- 7 часов назад
- 71 просмотр
2

ответа
Python

Простой
Как исправить игнорирование кода при импорте в python?
- 1 подписчик
- 7 часов назад
- 73 просмотра
2

ответа
Python

+2 ещё

Простой
Как проверить что файл подписан конкретной (открепленной) ЭЦП?
- 1 подписчик
- 7 часов назад
- 66 просмотров
0

ответов
Python

Простой
Почему зависает скрипт запущенный из Visual Studio Code?
- 2 подписчика
- 13 часов назад
- 262 просмотра
1

ответ
Python

Простой
Почему не работает pydantic-settings SettingsConfigDict(yaml_file)?
- 1 подписчик
- вчера
- 57 просмотров
2

ответа
Python

Простой
В чем ошибка при вызове import requests?
- 1 подписчик
- 21 июн.
- 90 просмотров
1

ответ
Python

+1 ещё

Средний
Как наводить прицел точно на персонажа?
- 2 подписчика
- 20 июн.
- 421 просмотр
2

ответа
Python

Простой
Еxe файл не воспроизводит музыку. Как решить проблему?
- 2 подписчика
- 19 июн.
- 437 просмотров
1

ответ
Python

Простой
Как ловить exceptions в библиотеке которую я не использую напрямую?
- 1 подписчик
- 18 июн.
- 138 просмотров
2

ответа
Python

+1 ещё

Простой
Имеет ли жизнеспособность идея нового игрового движка на Python?
- 2 подписчика
- 17 июн.
- 4107 просмотров
11

ответов
Показать ещё Загружается…

backend developer (Python) intern

BCraft

от 500 до 1 500 $

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python разработчик

ITK academy • Саратов

от 75 000 ₽

Answer 1 · 2018-08-02 18:10:58

Если смотреть выравнивание кода, то запись в БД не выполняется в цикле, я про вот эти две команды:
cursor.execute("INSERT INTO news VALUES (?, ?, ?)", (title, post_text, url))
cursor.commit()

При таком раскладе в БД попадают только последние значения переменных title, post_text, url, которые были на момент выхода из цикла.
Нужно сместить команду:
cursor.execute("INSERT INTO news VALUES (?, ?, ?)", (title, post_text, url))
на 4 позиции вправо, а
cursor.commit()
оставить как есть.

Почему парсер записывает данные одного цикла в разные строки бд?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт