Задать вопрос
@brunot

Как удалить дубли в большом (1,5Гб) файле?

Обычно такую простую задачу решал через эксел - но там лимит 1кк строк. В моем файле 24кк.

Также пробовал emeditor - чистит долго. Какие еще существует быстрые альтернативы для винды?
  • Вопрос задан
  • 1665 просмотров
Подписаться 2 Оценить Комментировать
Пригласить эксперта
Ответы на вопрос 2
dimonchik2013
@dimonchik2013
non progredi est regredi
www.textpad.com

единственный, кто может

f9
Ответ написан
@vilgeforce
Раздолбай и программист
sort, вроде, такое умел. Но он сортирует выходной файл. В принципе, 24ляма * 20 байт SHA1 - 480 Мб памяти под хэш каждой строки, так что можно смело на Питоне писать реализацию.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы