Как отфильтровать большой файл xml по регулярному выражению?
Есть огромный файл xml с 300000+ строк.
Как мне его отфильтровать, чтобы остались только нужные блоки текста которые соответствуют регулярному выражению?
Может есть специальная программа которая принимает регулярные выражения и оставляет нужный текст который соответствует этой регулярке. И как это сделать быстро (файл большой)? Пробовал это сделать на PHP. Но он очень долго считывает каждую строк из 300000 строк.
Для разбора xml есть спец подход xpath
В каждом языке есть своя реализация. Нужно искать потоковую обработку, чтобы не грузить весь xml в память. Например пд .net есть msdn.microsoft.com/en-us/library/ms950778.aspx