Имею базу в формате txt размером 2gb, как отсортировать по количеству символов на строку?

Question

olegun08 @olegun08

Имею базу в формате txt размером 2gb, как отсортировать по количеству символов на строку?

имею базу в формате txt размером 2gb, нужно отсортировать по количеству символов на строку с сохранением в разные файлы.

Вопрос задан более трёх лет назад
353 просмотра

2 комментария

Подписаться 1 Средний 2 комментария

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

Комментировать

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 58 минут назад
- 14 просмотров
0

ответов
Windows

+1 ещё

Средний
Почему Windows 11 не видит раздел?
- 1 подписчик
- 2 часа назад
- 58 просмотров
3

ответа
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 20 часов назад
- 102 просмотра
0

ответов
Windows

+1 ещё

Простой
Как защитить программный Raid-1 от перестроения?
- 2 подписчика
- 06 дек.
- 182 просмотра
2

ответа
Linux

+1 ещё

Простой
Не работает apt update && apt upgrade в Kali Linux. Что делать?
- 2 подписчика
- 04 дек.
- 362 просмотра
2

ответа
Windows

+1 ещё

Простой
Как вручную дать windows ассоциацию на приложение что может открыть .docx файл?
- 3 подписчика
- 01 дек.
- 356 просмотров
1

ответ
Linux

+1 ещё

Простой
На чем практиковаться начинающему админу?
- 3 подписчика
- 30 нояб.
- 925 просмотров
3

ответа
Windows

+1 ещё

Средний
Работа PostgreSQL на процессорах с гетерогенной архитектурой под Windows?
- 2 подписчика
- 29 нояб.
- 378 просмотров
4

ответа
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 209 просмотров
1

ответ
Python

Простой
Как сохранить курсор в строке ввода при перезапуске explorer.exe?
- 1 подписчик
- 28 нояб.
- 138 просмотров
1

ответ
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

с сохранением в разные файлы.

Что это значит?
Если 1 символ в строке, то в первый файл
Если 2, то в другой и так далее?

Answer 1 · 2022-10-06 10:59:37

Для таких операций уже несколько десятилетий в linux существует утилита awk со своим языком программирования (он достаточно простой хоть и странный), так же можно соорудить регулярное выражение и с помощью утилиты sed или grep, несколькими проходами пройти по файлу, и сначала вывести все короткие строки, вторым проходом все длинные.

так же можно написать приложение на любом языке программирования, построчно читать файл, измерять длину строки или какое тебе нужно условие и записывать в нужный файл, кода строк на 5-6

Answer 2 · 2022-10-06 11:30:12

как-то так

awk "{print length,\$0}" FILE_IN |sort -n |cut -d ' ' -f 2- > FILE_OUT

{1} | {2} | {3}
{1} -- добавляем количество символов в начало каждой строки (формируем первый столбец)
{2} -- сортируем строки по первому столбцу
{3} -- удаляем первый столбец

Answer 3 · 2022-10-06 10:41:06

Александр Ананьев @SaNNy32

Внести данные в реляционную базу данных (SQl Server, MySql, PostgreSql) и отсортировать запросом

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2022-10-06 13:39:00

Это задача на смекалку. Тут на самом деле сортировать не надо. Тут нужен роутинг слов в разные файлы.
В 1 проход делается. Разумеется мы должны предполагать что в 2Гб файле будут не сильно длинные строки.

Допустим для среднего текстового файла 80 символов на строку (стандарт такой был в 20м веке) мы получим
80 файлов.

По смыслу это похоже на сортировку подсчетом. Это когда кардинальность выборки крайне низка. Гендер например.

Имею базу в формате txt размером 2gb, как отсортировать по количеству символов на строку?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт