Здравствуйте, мне необходимо вытащить из текста определения слов, т.е. те предложения, в которых словам даётся определение в явном, а в идеале, и неявном виде.
Большое количество определений подходит под конструкцию: "Понятие - его определение.". Есть ли какие-то готовые наработки, позволяющие найти в тексте подобные грамматические конструкции?
Есть ли работы в которых пытаются выявить значение слов из контекста?
Интересуют конкретные кейсы (реализации), доклады, научные статьи и таму подобное по данной теме.
Вам действительно нужно обработать какой-то текст или нужна база определений? Так-то в сети навалом словарей, в которых сделана готовая разметка и не нужно морщить лобик.
dodo101000101, двигайтесь поэтапно. Убедитесь, что тире разделяет ту часть, где нужное слово, и определение. Потом разбирайтесь с тем, что лишнее в слове и до каких пор обрезать определение. Каких-то серебряных пуль вам тут все равно не посоветуют.
Это сложная и интересная тема. На выходе ее должна стоять семантическая сеть. И есть у меня сомнения что на тостере кто-то даст окончательный совет. Да и вообще нельзя тут дать совет. Тут нужно направление. Как. Кодить самому? Или взать опенсорцную библиотеке? Или купить библиотеку.
Мне также интересно откуда проистекает это техническое задание. Как минимум - дипломный проект.
Это скорее для самостоятельного исследования. Прощупываю почву, так сказать. Просто я несколько слышал о подобной технологии на какой-то конференции несколько лет назад, но уже совершенно не помню подробности. Поэтому меня интересуют любые кейсы (реализации), доклады, научные статьи и тому подобное по данной теме.
Я изучал базу википедии. Но не в оригинальном виде. А в семантическом. К ней можно было писать запросы на SparQL и получать ответы. И насколько я помню наполнение это базы было автоматизировано на основании текстов вики.