Файл - это типа несколько подряд идущих записей вида:
абзац1: Название
абзац2: <картинка>
абзац3: Описание
Нужно весь этот хлам занести в БД, но проблема в том, что шрифты и и переносы как зря( то бишь здесь Описание и Картинка подряд, а там между ними уже пустая строка, а вон там последняя строка описания граничит с новым названием и т.п.), а с режексами у меня грустно( я пока не вкурил толком их).
Какими модулями пользоваться( ссыли на маны приветствую) и какие режексы задействовать?
Regex курить обязательно + любой сложный парсинг имеет ненулевой вариант погрешности
Можешь качнуть Xamarin Studio - мне там тестировалка Regex-оф встроенная понравилась - свою накорябать всё руки не доходят )
В самом деле, регулярные выражения в своем изначальном виде используются для короткой записи регулярных грамматик, и используются для того, чтобы определить является ли слово (строка, текст) выводимым в данной грамматике, т.е. принадлежит ли языку, который порождается данной грамматикой. Ни формат файлов doc, ни xml, ни html не являются регулярными языками.