Как исправить ошибку при использовании pandas concat?

Question

artds @artds

Pandas

Как исправить ошибку при использовании pandas concat?

code

from lxml.html import fromstring
from urllib.parse import urljoin
from lxml import etree
from numpy import FLOATING_POINT_SUPPORT
import requests
from pandas import DataFrame, ExcelWriter
import string
import pandas as pd


def get_html(url):
    result = requests.get(url).text
    f = fromstring(result)
    return f

def get_data(html):
    
    df = pd.DataFrame(columns=('Раздел 1', 'Описание раздела 1', 'симвовольный код 1', 'title 1', 'description 1', 'keywords 1', 
                            'Раздел 2', 'Описание раздела 2', 'симвовольный код 2', 'title 2', 'description 2', 'keywords 2', 
                            'Наименование элемента', 'Хлебные крошки', 'url', 'title 1', 'Детальное описание', 'Видео', 'Старая цена', 'Новая цена'))

    for product in html.cssselect('.product-container'):
        a = product.cssselect('a')[0]
        href = a.get('href')
        
        ar = requests.get(href).text
        af = fromstring(ar)



        bread1 = af.cssselect('.breadcrumb a')[2].text_content()
        bread2 = af.cssselect('.breadcrumb a')[3].text_content()
        breadcrumb = af.cssselect('.breadcrumb')[0].text_content()

        title = af.cssselect('#product-name-wrap h1')[0].text_content()
        price = af.cssselect('#our_price_display')[0].text_content()
        

        opis = af.cssselect('.product-info-partblock')[0]
        description = etree.tostring(opis, encoding='utf-8').decode('utf-8')
        
        try:
            video = af.cssselect('.product-info-partblock')[3]
            vedios = etree.tostring(video, encoding='utf-8').decode('utf-8')
        except IndexError:
            vedios = ''
        
        test = ''
        
        klevielodki_list = [('Раздел 1', test), 
                            ('Описание раздела 1', test),
                            ('симвовольный код 1', test),
                            ('title 1', test),
                            ('description 1', test),
                            ('Раздел 2', test),
                            ('Описание раздела 2', test),
                            ('симвовольный код 2', test),
                            ('title 2', test),
                            ('description 2', test),
                            ('keywords 2', test),
                            ('Наименование элемента', title),
                            ('Хлебные крошки', breadcrumb),
                            ('url', href),
                            ('title 1', title),
                            ('Детальное описание', description),
                            ('Видео', vedios),
                            ('Старая цена', price),
                            ('Новая цена', test)]
        
        for xarik in af.cssselect('.product-info-content tr'):
            alfa = xarik.cssselect('td')[0].text_content()
            beta = xarik.cssselect('td')[1].text_content()
            klevielodki_list.append((alfa, beta))
        
        img = 0
        for images in af.cssselect('#thumbs_list_frame li'):
            ia = images.cssselect('a')[0]
            ih = ia.get('href')
            lir = requests.get(ih)
            out = open('img/%s' % ih.split('/')[-2]+'.jpg', 'wb')
            out.write(lir.content)
            out.close()
            img += 1
            klevielodki_list.append(('img%s' % img, ih.split('/')[-2]+'.jpg'))
        
        df = pd.concat(klevielodki_list, ignore_index=True)
        print(df)
    
    writer = ExcelWriter('клевыелодки.xlsx', engine='xlsxwriter')
    df.to_excel(writer, sheet_name='1', header=True, index=False)
    writer.save()   




                
def main():
    html = get_html('https://klevielodki.ru/12-modeli-lodok/?id_category=12&n=245')
    get_data(html)


if __name__ == "__main__":
    main()

парсю сайт, у меня выходит ошибка, помогите пожалуйста

ранее использовал append

df = df.append(dict(klevielodki_list), ignore_index=True)

Exception has occurred: TypeError cannot concatenate object of type '<class 'tuple'>'; 
only Series and DataFrame objs are valid File "/home/artddss/python/em/bicom/klevielodki.py", line 86, 
in get_data df = pd.concat(klevielodki_list, ignore_index=True) File "/home/artddss/python/em/bicom/klevielodki.py", line 99, 
in main get_data(html) File "/home/artddss/python/em/bicom/klevielodki.py", line 103, 
in main() TypeError: cannot concatenate object of type '<class 'tuple'>'; only Series and DataFrame objs are valid

Вопрос задан более двух лет назад
554 просмотра

1 комментарий

Подписаться 1 Сложный 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Data Scientist с нуля

10 месяцев

Далее
Академия Эдюсон

Data Science + ИИ

8 месяцев

Далее
ProductStar × РБК

Профессия: Аналитик данных + ИИ

12 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Pandas

Простой
Почему с помощью функции pd.read_html() с индексом 1 не показывает таблицу?
- 1 подписчик
- 24 дек. 2025
- 160 просмотров
1

ответ
Pandas

Простой
Как забрать значение формулы в Excel таблице через pandas?
- 1 подписчик
- 12 авг. 2025
- 64 просмотра
0

ответов
Pandas

Простой
Как удалить строки в таблице с одинаковыми параметрами по столбцам?
- 1 подписчик
- 22 мая 2025
- 136 просмотров
1

ответ
Excel

+1 ещё

Простой
Как удалить пустые поля в Excel?
- 1 подписчик
- более года назад
- 204 просмотра
0

ответов
Pandas

Простой
Как пронумеровать столбец excel в python?
- 1 подписчик
- более года назад
- 164 просмотра
3

ответа
NumPy

+1 ещё

Средний
Можно ли через numpy или pandas удалить строки в многомерном массиве, элементы которого содержат два и более разных значений?
- 1 подписчик
- более года назад
- 142 просмотра
1

ответ
Pandas

Простой
Почему возникает ошибка «length mismatch: expected axis has 3 elements, new values have 4 elements»?
- 1 подписчик
- более года назад
- 289 просмотров
2

ответа
Pandas

Простой
Как сравнить 2 df в Пандасе?
- 1 подписчик
- более года назад
- 176 просмотров
1

ответ
Pandas

Простой
Как вставить строчки в exel через pandas?
- 1 подписчик
- более года назад
- 40 просмотров
1

ответ
Pandas

Простой
Как объединить две таблицы в pandas?
- 1 подписчик
- более года назад
- 86 просмотров
1

ответ
Показать ещё Загружается…

Не надо ставить как можно больше тэгов. Лучше оставить один, но конкретный, с которым проблема.
См.п.3.1 Регламента. Также обратите внимание на п.3.6

Answer 1 · 2023-07-01 21:46:56

1. Почему не работает. Потому что concat принимает список с фреймами или series'ами. Твой объект это список с кортежами, а должен быть список с фреймами.
Раньше, я так понимаю ты использовал пустой датафрейм и к нему в цикле конкатенировал словарь. Если раньше твой код работал то и сейчас ты можешь собрать список словарей и создать из них фрейм. Например

d1 = {'A':1,'B':2}
d2 = {'A':3,'B':4}
df = pd.DataFrame.from_records([d1,d2])

собирашь в список словари и по этом передаешь методу from_records. Это вместо concat. Если хочется работать с concat. То при каждой итерации ты создаешь отдельный фрейм с данными и одинаковыми колонками, собираешь эти фреймы в список и потом concat будет прекрасно работать например.

dfs = []
for i in range(3):
    df = pd.DataFrame({
        'A':np.random.randn(4),
        'B':np.random.choice(['green','blue','white'], 4)
    })
    dfs.append(df)
final_df = pd.concat(dfs,ignore_index=True)

Принцип должен быть тебе понятен, естественно со своими данными реализуй.

Как исправить ошибку при использовании pandas concat?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт