Как сделать так, что бы каждый новый результат запроса парсера на страницу сохранялся в следующей ячейки столбца excel?

Question

Simple Ian @Simple_Ian

Как сделать так, что бы каждый новый результат запроса парсера на страницу сохранялся в следующей ячейки столбца excel?

Есть парсер на python 3.7, который делает запрос на страницу и сохраняет данные в excel. Нужно что бы каждый новый запрос сохранялся в новую ячейку столбца excel. Я так понимаю нужно написать цикл? Использую openpyxl. На данный момент парсер пишет новые данные в одну и туже ячейку, т.е. переписывает старые данные.
Вот код:

import requests
from bs4 import BeautifulSoup
import openpyxl

# Parser

url = 'https://pythonworld.ru/osnovy/sintaksis-yazyka-python.html'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'lxml')

Parsed = soup.find('h2').text

# excelWriter
# create a new Excell file

xlsfile = openpyxl.Workbook()
xlsfile.sheetnames
sheet = xlsfile['Sheet']

#add data
data = [('Price'), Parsed]
for row, (data) in enumerate(data, start=1):
    sheet['A{}'.format(row)].value = data

#save
xlsfile.save('save.xlsx')

print(Parsed)

Вопрос задан более трёх лет назад
104 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Решения вопроса 1

4 комментария

Simple Ian @Simple_Ian Автор вопроса
Благодарю за ответ

for row, (data) in enumerate(data, start=sheet.max_row+1):

Нет заполненных строк. Данное исправление записывает код со второго столбца, а при следующем запросе ничего не добавляется
Написано более трёх лет назад
Григорий Боев @ProgrammerForever Куратор тега Excel
Simple_Ian, да, не то написал, на питоне редко программирую. Надо так, насколько я понимаю:

start_row = sheet.max_row for row, (data) in enumerate(data, start=1): sheet['A{}'.format(start_row + row)].value = data
Написано более трёх лет назад
Simple Ian @Simple_Ian Автор вопроса

Результат тот же..

Написано более трёх лет назад

Simple Ian @Simple_Ian Автор вопроса

Вот так!
Григорий Боев,

import requests
from bs4 import BeautifulSoup
import openpyxl
import os

# Parser

url = 'https://pythonworld.ru/osnovy/sintaksis-yazyka-python.html'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'lxml')

Parsed = soup.find('h2').text

# excelWriter
# create a new Excell file

filename = 'save.xlsx'
if os.path.exists(filename):
    xlsfile = openpyxl.load_workbook(filename)
else:
    xlsfile = openpyxl.Workbook()

xlsfile.sheetnames
sheet = xlsfile['Sheet']

#add data
data = [Parsed]
max_rows = sheet.max_row
for row, (data) in enumerate(data, start=1):
    sheet['A{}'.format(row+max_rows)].value = data

#save
xlsfile.save('save.xlsx')

print(Parsed)

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+3 ещё

Простой
Можно ли и каким образом прописать команду telegram-боту обрабатывать только определенные изображения (скрины,документы), а остальные игнорировать?
- 1 подписчик
- 40 минут назад
- 19 просмотров
2

ответа
Excel

+1 ещё

Простой
Как вытащить значения, соответствующие ИСТИНЕ в определенном номере столбца?
- 1 подписчик
- 2 часа назад
- 19 просмотров
1

ответ
Парсинг

Средний
Как автоматически скачивать файл с сайта регулярно?
- 1 подписчик
- 2 часа назад
- 30 просмотров
2

ответа
Excel

Средний
Какие есть варианты для программной консолидации excel?
- 2 подписчика
- 5 часов назад
- 88 просмотров
3

ответа
Python

+1 ещё

Простой
Как показать зависимость скорости от O(nlogn)?
- 1 подписчик
- 16 часов назад
- 69 просмотров
2

ответа
Python

Средний
Как из проекта на python RenPY сделать установщик?
- 1 подписчик
- 19 часов назад
- 54 просмотра
1

ответ
Python

+3 ещё

Простой
С чем и как есть gRPC?
- 1 подписчик
- 21 час назад
- 67 просмотров
1

ответ
Excel

Простой
Как создать шаблон для печати в excel?
- 1 подписчик
- 21 час назад
- 31 просмотр
1

ответ
Python

+1 ещё

Простой
Как увеличить паузу между отправкой запроса и получением результата?
- 1 подписчик
- вчера
- 98 просмотров
2

ответа
Python

Простой
Как исправить проблему с установкой torch?
- 1 подписчик
- вчера
- 65 просмотров
0

ответов
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Перенести сайт с tilda

26 апр. 2024, в 13:31

3000 руб./за проект

Консультация веб-дизайнера по созданию сайта в конструкторе

26 апр. 2024, в 13:24

1500 руб./в час

Прием WebRTC через Socket io в unity c#

26 апр. 2024, в 13:12

2000 руб./за проект

Answer 1 · 2020-07-09 10:01:31

Григорий Боев @ProgrammerForever Куратор тега Excel

Учитель, автоэлектрик, программист, музыкант

Перед выгрузкой узнавайте количество уже заполненных строк и потом начинайте со следующей.

for row, (data) in enumerate(data, start=sheet.max_row+1):

Ответ написан более трёх лет назад

4 комментария

Answer 2 · 2020-07-09 12:47:16

Во-первых - вы создаете каждый раз новый файл. Нужно проверять файл на существование

import os

filename = 'save.xlsx'
if os.path.exists(filename):
    xlsfile = openpyxl.load_workbook(filename)
else:
    xlsfile = openpyxl.Workbook()

Во-вторых - писать нужно со смещением. Смещение в данном случае - индекс последней строки на листе

max_rows = sheet.max_row
...
sheet['A{}'.format(row + max_rows)].value = data

Как сделать так, что бы каждый новый результат запроса парсера на страницу сохранялся в следующей ячейки столбца excel?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт