@brunot

Как удалить дубли в большом (1,5Гб) файле?

Обычно такую простую задачу решал через эксел - но там лимит 1кк строк. В моем файле 24кк.

Также пробовал emeditor - чистит долго. Какие еще существует быстрые альтернативы для винды?
  • Вопрос задан
  • 1634 просмотра
Пригласить эксперта
Ответы на вопрос 2
dimonchik2013
@dimonchik2013
non progredi est regredi
www.textpad.com

единственный, кто может

f9
Ответ написан
@vilgeforce
Раздолбай и программист
sort, вроде, такое умел. Но он сортирует выходной файл. В принципе, 24ляма * 20 байт SHA1 - 480 Мб памяти под хэш каждой строки, так что можно смело на Питоне писать реализацию.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы