Хочу попробовать написать программу на python и sklearn(или любую другую библиотеку для машинного обучения), которая сможет отвечать на вопросы из теста.
Что я имею в виду:
Допустим, у нас есть несколько вопросов, у каждого вопроса есть 3 (может быть разное количество) варианта ответов. Для каждого вопроса мы должны выбрать такой вариант, который подходит лучше всего (правильный).
Конечно, над поиском ответов на запросы пользователей работают крупные поисковые системы, используя искусственный интеллект, но в данной реализации у нас уже есть возможные варианты, а это упрощает задачу.
Можно попробовать найти ответ на вопрос через поисковики: определить количество совпадений текста (можно даже брать тексты с сайтов, которые выскочат) с вариантами ответов. Можно запрашивать вопрос с вариантами ответов, затем смотреть, где страниц вылезло больше.
По идее, можно еще использовать анализ текста. Например, находить наименьшее расстояние между ключевыми словами, анализировать тип вопросов, опять же находить ключевые слова и определять, какой части речи должно быть слово, которое мы ищем.
Допустим, мы определились, как мы будем анализировать текст и запросы. Теперь у нас есть все данные по данному запросу, причем у каждого варианта ответа будут свои данные.
Как нам теперь понять, какой вариант ответа подойдет больше всего? Например, можно в нейронную сеть запускать всю информацию о варианте ответа, писать, правильный он или нет. А уже потом, при использовании, будем смотреть, у какого из вариантов нейронная сеть спрогнозировала шанс выше.
В общем, я буду рад, если вы напишите любую информацию как по анализу текста и запроса, так и по работе с нейронной сетью (причем в анализе текста тоже может быть нейронная сеть). Если есть готовые реализации, то это будет еще лучше.