Какие посоветуете библиотеки для парсинга исходного кода?
Суть вопроса:
Нужно парсить исходный код и строить дерево токенов кода.
На вход получаем: myprogramm.txt
На выходе получаем иерархическую структуру кода с названием токенов, их параметрами, вложенными токенами и т.д.
Языки для парсинга: С++, Java, PHP (все вместе либо по отдельности)
Платформа: что либо, что можно выполнить на unix сервере, хоть бэш! ^_^
Странный вопрос - логично, что нужно использовать парсеры конкретных языков.
В принципе, если нужен только разбор в дерево - попробуйте взять ANTLR и грамматики известных языков: https://github.com/antlr/grammars-v4