Я являюсь новичком в этой области и заранее извиняюсь, что мой вопрос может показаться глупым или некорректным, я надеюсь на любую помощь, которая даст мне вектор движения в правильном направлении.
Сейчас я занимаюсь дипломной работой, важной частью которой будет система парсинга запросов на естественном языке. Ранее я занимался просто поисковыми технологиями, без углубления в «понимание» запроса, там можно было обойтись известными простыми алгоритмами на метриках типа tf-idf и теории вероятностей с матстатистикой. Но сейчас же система должна «понимать» некоторые виды запросов и уметь преобразовать его, грубо говоря, в запрос к БД. Если совсем упрощать, на запрос «какие мои друзья живут в Москве» или «мои знакомые живущие в Москве» система должна обратиться к таблице «люди» и выбрать всех, у кого «город=Москва». Надеюсь понятно объяснил.
Последнее время таких систем стало появляться всё больше (хотя в литературе «общение с системой на естественном языке» упоминается последние лет 50). Всякие Siri, Google Now, Facebook Graph Search, умеют «понимать» запрос и давать не просто ранжированную выдачу как классические поисковые системы, а правильное оформление для запрошенного типа информации.
Мне была бы интересна любая информация, любые ссылки, книги, да даже правильные запросы в гугл, которые помогли бы мне в изучении подобных систем и написании собственной (конечно же не такой мощной). Я приму любые источники (можно в личку, если стесняетесь «ляпнуть»), я сам отберу, а при необходимости и достаточном количестве найденой информации могу написать summary-пост на хабр.
P.S.: Уже гуглил по темам «natural language query parsing», «natural language database interface», «syntax/semantic analysis», начинал читать старую-старую книжку «общение с ЭВМ на естественном языке» (бросил, потому что показалось, что «не туда идем»), но исчерпывающей информации всё равно не нашел. Не хватает какого-то такого «толчка» для понимания как всё это объединить в системе.
Вы не поверите, но я прочитал ее дважды несколько лет назад, а потом пол года искал в твердом переплете и на данный момент держу в руках: i.imgur.com/5h9pEHa.jpg
Книга шикаршейшая, я благодаря ей защитил бакалаврскую работу, но к сожалению проблеме именно понимания запросов и поиску по структурированным данным там посвящена лишь небольшая (но тоже классная) глава «XML-поиск» ну и частично упоминается еще в паре мест. Не отрицая достоинства этой книги, хотелось бы раскрыть тему поподробнее и с различных сторон. Пойду, кстати, посмотрю что там после главы рекомендуют в списке литературы.
Тогда очень советую посмотреть лекции яндекса, я в свое время много чего интересного из них узнал на тему рубрицирования\реферирования. Как оказалось алгоритм рубрицирования, придуманный мною, нашел после у них в презенташке, очень приятно стало, что думаю в правильном направлении. Еще очень советую Computer Science Center там есть направление Data Mining, лекции открыты.