Какие библиотеки использовать для парсинга текстовых файлов (Python)?

Question

Teabrew-py @Teabrew-py

Какие библиотеки использовать для парсинга текстовых файлов (Python)?

Какие библиотеки использовать для парсинга текстовых файлов и поможет ли модуль numba ускорить этот процесс?

Мне нужно распарсить (взять информацию) огромное количество текстовых файлов. Какие модули мне в этом помогут? Слышал о numba, этот модуль позволяет ускорить сам процесс, но вопрос вот в чём: Поможет ли он быстрее брать информацию из файла .txt? Может есть специальные инструменты для таких задач?

Так же коротко о действии самой программы для большего понимания моей цели

Есть куча текстовых файлов, мне нужно взять из них данные и переместить всё в один файл. После чего данный файл будет фильтроваться от лишней информации. В общем, стандартная обработка

Вопрос задан более трёх лет назад
321 просмотр

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 241 просмотр
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 264 просмотра
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 93 просмотра
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 111 просмотров
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 101 просмотр
1

ответ
Python

Простой
Почему может не отображаться страница во view(flet)?
- 1 подписчик
- 25 мар.
- 123 просмотра
1

ответ
Python

Средний
Asyncio + PySide6 + Telethon: список чатов и треды грузятся 30 минут — где искать причину?
- 2 подписчика
- 16 мар.
- 472 просмотра
2

ответа
Python

+2 ещё

Средний
Можно ли получить доступ к сайту?
- 4 подписчика
- 05 мар.
- 1015 просмотров
4

ответа
Python

Простой
Как запретить удаление полей класса?
- 1 подписчик
- 27 февр.
- 327 просмотров
1

ответ
Парсинг

Простой
Как спарсить Интернет Магазин?
- 1 подписчик
- 27 февр.
- 381 просмотр
4

ответа
Показать ещё Загружается…

Python developer

ITK academy • Краснодар

от 220 000 до 300 000 ₽

Python Developer

ITK academy • Краснодар

от 75 000 ₽

Junior AI Automation Engineer / AI-инженер (junior)

OPENCITY • Москва

от 50 000 ₽

Answer 1 · 2022-04-09 17:15:01

Допустим, мы напряжёмся и пропарсим миллион файлов не за полтора часа, а за час, потратив три часа на разработку и отдалку кода. И зачем? Чего мы тут сэкономим? Обычно для разовых операций временем работы заботятся тогда, когда оно действительно велико. Например, если требуется месяц непрерывной работы, то я бы ещё подумал, можно ли его сократить до недели.

Библиотека numba нужна для ускорения собственноручно написанных вычислительных алгоритмов. В парсинге текстовых файлов, скорее всего, узким местом будут исключительно операции ввода-вывода, так что тут она ничем не поможет.

Answer 2 · 2022-04-10 21:39:08

Если хотите ускорить что-то на питонe смотрите в сторону cython, ну и основы что текст читать долго, бинарник быстро, так как не требуется лишних преобразований

Какие библиотеки использовать для парсинга текстовых файлов (Python)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт