Как прочитать в экселе пути файлов, скачать их и разсортировать по папках?

Question

Mixa @Mixa

Python

Как прочитать в экселе пути файлов, скачать их и разсортировать по папках?

Идея такова: Есть эксель-файл, в каждой строке которого есть поле с уникальным айди, а дальше иду поля, в каждом из которых прописаны внешние пути файлов.

Задача состоит в том, чтобы пройтись по всем строкам, выкачивая файлы и сохранять их в папке, которую тоже нужно создать, используя для ее названия уникальный айди, указанный в строке.

Я аматор в программировании, но подозреваю, что подобную задачу можно решить с помощью каких-то библиотек для Python. Буду рад получить реккомендации таковых или может уже есть полуготовые решения для такого рода задач?

Вопрос задан более трёх лет назад
178 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 208 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 541 просмотр
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 492 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 280 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 505 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 214 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 124 просмотра
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 330 просмотров
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 663 просмотра
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 345 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2021-11-23 17:45:05

Можете excel конвертировать в csv - так будет намного проще. Эта задача решается за 2 минуты.

или может уже есть полуготовые решения для такого рода задач?

Это простая задача, как 2 копейки. Так что вря тли есть какие-то решения. requests вам в помощь.

Answer 2 · 2021-11-24 08:41:10

С помощью openpyxl (можно конечно pandas, там это элементарно делается) читаете ваш Эксель, затем с помощью цикла и requests качаете файлы, если файлов очень много попробуйте написать асинхронный загрузчик, раз в 10 быстрее будет качать (поможет aiohttp и aiofiles). Ну а для создания папок вам пригодится os

Вот так можно забрать весь столбец из Эксель

import pandas as pd
from glob import glob

file = glob('*.xlsx')[0]
table = pd.read_excel(file)
urls_list = table['Название столбца'].to_list()

А вот пример загрузчика, писал я (на идеальную правильность не претендую, со своей задачей справляется и хорошо)

import asyncio
import os
from os.path import join as pth_join

import aiofiles
import aiohttp

DWNLD_FLDR = "Download"


async def download_file(session: aiohttp.ClientSession, link: str, file_name: str):
    async with session.get(link) as resp:
        if resp.status == 200:
            f = await aiofiles.open(pth_join(DWNLD_FLDR, file_name), "wb")
            await f.write(await resp.read())
            await f.close()
        else:
            print(f"Error: {resp.status}")


async def gather_files(files_urls: list[dict]):
    async with aiohttp.ClientSession(headers=HEADERS) as session:
        tasks = []
        for item in files_urls:
            try:
                if os.stat(pth_join(DWNLD_FLDR, item["file_name"])).st_size:
                    continue
            except FileNotFoundError:
                pass
            task = asyncio.create_task(
                download_file(session, item["file_link"], item["file_name"])
            )
            tasks.append(task)
        await asyncio.gather(*tasks)


def main(file_list):
    os.makedirs(DWNLD_FLDR) if not os.path.exists(DWNLD_FLDR) else None
    asyncio.run(gather_files(file_list))

if __name__ == "__main__":
    main([{'file_name': 'test.txt',  'file_link': 'http://file_url'}, ])

Как прочитать в экселе пути файлов, скачать их и разсортировать по папках?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт