Какие алгоритмы для парсинга текстовых строк являются самыми быстрыми?
Подскажите самые быстрые алгоритмы по парсингу текста в объекты данных. Речь идет о преобразовании строк в определенные объекты данных. Например, парсинг html, xml или css. Насколько я понимаю, нужно смотреть в сторону алгоритмов токенизации строк, где можно создавать некоторое подобие словарей или чего типа того.
Для правильного вопроса надо знать половину ответа
Вообще это классическая задача компиляции - преобразования из одного языка в другой. Обычно выполняется с помощью пары инструментов - лексера, распознающего отдельные лексемы языка, и парсера, который на основе грамматики языка и поступающих на вход лексем строит конечное дерево.
Попробуйте начать с классики - книги красного дракона.