m_avrina
@m_avrina
Студентота.

Как парсить текстовый документ на С(Не С++)?

Вечер добрый)
Подскажите какие технологии,или что почитать о парсинге текстового файла?
Суть такова беру какую-то страничку с данными,копирую исходный код и вытаскиваю нужную информацию.
По сути работа с файлами?
  • Вопрос задан
  • 499 просмотров
Пригласить эксперта
Ответы на вопрос 3
2ord
@2ord
Текстовые файлы могут сильно разниться:
  1. исходный текст программ
  2. древовидная разметка HTML/XML/JSON
  3. вики-вёрстка
  4. дамп БД
  5. CSV и др. табличные данные
  6. разные специальные форматы

У них нет единого подхода к парсингу.
Ответ написан
Комментировать
@nirvimel
Если это не HTML/XML/JSON или другой формат, для которого существуют специальные парсеры, то остаются только регулярные выражения, например.
Ответ написан
@abcd0x00
Подскажите какие технологии,или что почитать о парсинге текстового файла?

wiki. автоматное программирование

На C ты просто открываешь файл (fopen() + fclose()), читаешь его построчно (fgets()) или посимвольно (getc()) и подаёшь данные в конечный автомат для анализа. Когда же нужно работать со строками, то ты используешь разные функции из string.h.
Это общий подход, но есть и готовые библиотеки для работы с конретными форматами. Но вот когда библиотек нет никаких или их невозможно поставить, тогда ты должен сам всё написать, а сам ты будешь писать через конечный автомат, потому что библиотеки обычно через него и пишутся.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы