@Printip

Как сконвертировать в utf 8 большой текстовый файл?

Есть 40 гигов текстового файла (был получен путем парсинга сайтов). Естественно в файле кодировок вагон и тележка. Подскажите пожалуйста как это все добро конвертнуть в utf 8 ?
P.S. в файле куча разных кодировок.
  • Вопрос задан
  • 493 просмотра
Пригласить эксперта
Ответы на вопрос 4
@LiguidCool
Правильный ответ - надо было конвертировать при парсинге.
Ответ написан
@MadridianFox
Web-программист, многостаночник
Сомневаюсь что есть способ конвертировать файл в одну кодировку, когда разные его части имеют разную кодировку.
И вообще, зачем понадобилось складывать всё в один файл?
Не легче ли было записывать полученные данные в базу, ато файл на 40Гб...
Ответ написан
Комментировать
@azsx
команду enconv надо было применять при парсинге для отдельных файлов.
Ответ написан
Комментировать
@abcd0x00
Надо разделять файл обратно, определять в каждом куске кодировку, перекодировать его в общую кодировку, а потом соединять обратно перекодированное.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы