Стандарты представления лингвистической информации?
Существуют ли какие-нибудь распространенные/общепринятые стандарты для представления лингвистической информации (морфология, синтаксис, семантика), если да, то где можно об этом почитать, что гуглить? Имеются в виду как собственно стандарты хранения, так и типовые наборы атрибутов и тому подобное.
Их достаточно много и каждый день придумываются новые под влиянием NIH-синдрома. Стоит обращать внимание на тагсеты и схему данных в используемых вами решениях для обработки естественного языка. Кто-то любит MULTEXT-East, кто-то АОТ, кто-то придумывает свой или адаптирует зарубежный.