@MarvinD

Как спарсить множество текстовых файлов в CSV (excel)?

Есть куча стандартизированных email-писем (могу их сохранить тем же thunderbird в отдельные eml файлы). Нужно из этих файлов выдрать из содержимого данные по маске "ФИО: ", "email: " ну и втаком духе и поместить в один файл, лучше excel, но по сути и cvs неплохо. Я так с php дело имел раньше (парсер делал простенький, в целом представляю, что это), но тут надо чтобы локальная программулька была. Уже думал вспоминать универ и скомпилить c++ бинарничек для винды, но пока втемлюсь... Может, вообще есть готовые тулзы, чтобы выдрать из массива текстовых файлов нужные данные? Типа выбрать директорию исходников, указать маску по которой выдирать данные - и вуаля. Не очень хочется изобретать кривой велосипед.
  • Вопрос задан
  • 628 просмотров
Решения вопроса 1
@MarvinD Автор вопроса
Лады, никого не напрягаю, поставил таки в netbeans c++, копаюсь по старой памяти, типа:
regex maskStr("^<strong>.*");
...
while (getline (inFile,line)) {
        if ( regex_match(line, maskStr) ) {
            sum = sum + x;
            cout << line << '\n';
        }
}


Вроде пашет, осталось в цикле директорию проходить и в cvs записывать. Честно говоря, не думал, что современная IDE все так приятно может сделать. Теперь и php и c++ в одном флаконе. Спасибо, NetBeans :)
ЗЫ: с перепугу поставил даже VS2019 :) но и в NetBeans все компилится неплохо. Посмотрим, как на других компах пойдет, надеюсь, exe и текстовых файлов будет достаточно для переноса.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 2
fox_12
@fox_12
Расставляю биты, управляю заряженными частицами
man grep
man awk
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы