Какой проект по нейросетям с текстом (лингвистика или вокруг) можно реализовать школьнику?

Question

Александр Фёдоров @Pagliaccio

Внедряю CRM

Какой проект по нейросетям с текстом (лингвистика или вокруг) можно реализовать школьнику?

Коллеги, приветствую.

Дети учатся в школе и одна из них хочет в качестве проекта взять что-нибудь "техническое".
Учиться умеют и любят (на python'е кодить немного умеют), и я хотел бы предложить им покопать в сторону нейронных сетей.
Материала для ликбеза я поднакопил, ссылок на литературу для изучения тоже.

Посоветуйте, пожалуйста, с чего можно начать такое обучение (какую задачу взять в качестве проекта). Желательно в работе с текстами (вторая из ребёнков увлекается филологией).

И, на самом деле, любым ссылка на адекватные обучалки, которые сможет понять школьник 10-ого класса (с хорошим уровнем математики), буду тоже благодарен.

Вопрос задан более трёх лет назад
3480 просмотров

Комментировать

Подписаться 8 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 5

Комментировать

4 комментария

Александр Фёдоров @Pagliaccio Автор вопроса

Спасибо за практически готовый учебный план :)

Написано более трёх лет назад
Вячеслав Шиндин @pro_co_ru

Это конечно хорошо сначала разботанить основной фундамент машинного обучения, но это скучно и нудно, думаю лучше начать с конкретной задачи по какой-то узкой теме, заинтересовать детей, а потом уже расширять кругозор, если тема им понравится.

Написано более трёх лет назад
xdgadd @xdgadd

Вячеслав Шиндин, это ваше субъективное мнение. Мне не было скучно.

В любом случае, без понимания основ типа методов оптимизации или того, что машинка - это метод аппроксимации, хороший проект не сделать.

Написано более трёх лет назад
Вячеслав Шиндин @pro_co_ru

xdgadd, хех, а я вот как-то наоборот.
Сначала в качестве курсового проекта познакомился с самоорганизующимися картами Кохонена (SOM), затем вовлёкся и самостоятельно разботанил классические полносвязные многослойные перцептроны, затем несколько лет спустя, когда занимался парсингом и классификацией, узнал что такое word2vec, затем уже свёрточные нейронные сети, потом машинное обучение, бейесы, опорные вектора, рекуррентные сети, генеративные, деревья решений, бустинг, ансамбли и т.п.

Написано более трёх лет назад

Комментировать

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- вчера
- 100 просмотров
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- вчера
- 112 просмотров
1

ответ
Python

Простой
Что можно ускорить в коде решателя игры крестики нолики?
- 1 подписчик
- вчера
- 161 просмотр
0

ответов
Python

Простой
Как подключиться по SMTP к Reg ru?
- 1 подписчик
- 15 авг.
- 132 просмотра
0

ответов
Python

+1 ещё

Простой
Как имитировать нажатие пкм в неактивное окно DirectX?
- 1 подписчик
- 15 авг.
- 44 просмотра
1

ответ
Python

+1 ещё

Простой
Как настроить группы при создании нового пользователя в битриксе?
- 1 подписчик
- 14 авг.
- 115 просмотров
0

ответов
Python

+1 ещё

Простой
При добавления строчки @commands.has_permissions в терминале при запуске выдает ошибку?
- 1 подписчик
- 14 авг.
- 91 просмотр
0

ответов
Python

+1 ещё

Простой
Можно ли отключить SSL сертификат при парсинге?
- 1 подписчик
- 13 авг.
- 132 просмотра
0

ответов
Python

Простой
Не работает код, что делать?
- 2 подписчика
- 10 авг.
- 2134 просмотра
4

ответа
Анимация

+1 ещё

Простой
Существет ли AI делающая промежуточную анимацию между 2 кадрами?
- 1 подписчик
- 09 авг.
- 79 просмотров
1

ответ
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python разработчик

ITK academy • Казань

от 75 000 ₽

Answer 1 · 2017-10-04 10:15:05

Можно попробовать сделать что-нибудь вроде прогнозирования оценки за сочинение на основе возраста(класса) автора и самого текста сочинения.

Ну и чтобы было ещё интересней, можно заточить нейронную сеть прогнозировать оценки за сочинения по темам касающимся только произведения Война и Мир, Толстого. Как раз для 10-ого класса актуально.

Правда нужно будет где-то раздобыть большое кол-во данных для обучения, сочинения с разными оценками, как двоечные, так и те что на отлично.

Answer 2 · 2017-10-04 11:57:54

Для начала объясните ученикам, что такое машинное обучение и как оно работает. Разумно будет начать с простейшей линейной регрессии и градиентного спуска, потом перейти к задаче классификации и логистической регрессии, рассказать, почему линейные модели справляются не всегда(практически никогда). Далее расскажите про обычные полносвязные сетки и более хорошие методы оптимизации(sgd, momentum etc.)
После этого ваши ученики будут готовы для встречи со свёрточными и рекуррентными сетями. Про word embeddings(w2d, bag-of-words, tf-idf etc.) можно рассказать прямо по ходу.

Ссылки:
1) https://github.com/goto-ru/Basic_ML, задания рассчитаны на учеников 10-11 классов и студентов 1-2 курсов.
2) word2vec
3) Лабы по RNN: 1, 2.
4) karpathy.github.io/2015/05/21/rnn-effectiveness - очень понятно про рекуррентные сети.
5) CNN in NLP: 1, 2, 3.
6) https://distill.pub/ - простым языком про сложные вещи.

Answer 3 · 2017-10-04 13:45:15

Из известных мне, проще всего можно решить задачу распознавания языка документа путем сравнения частотностей символов (по MSE) с известными из тренировочного корпуса.

Answer 4 · 2017-10-04 13:43:51

У меня первокурсники анализируют спам, примеров в Интернете много. Вроде, понимают.

Еще можно закачать анекдотов и сравнивать их, например, со случайными отрывками из литературы и новостей. Скачивать и случайные отрывки нарезать они могут попробовать сами. Заодно вкусят все тяготы лингвистического труда :)

В 11-м классе, если они не сбегут, можно познакомить их с word embeddings и уже скармливать нейронным сетям не просто ключевые слова, а слова "со смыслом" (вектора, то есть).

Answer 5 · 2017-10-04 04:39:02

я хотел бы предложить им покопать в сторону нейронных сетей.

любым ссылка на адекватные обучалки, которые сможет понять школьник 10-ого класса

Вы себя - СЛЫШИТЕ?!
PS: нейросети - это формулы вышмата.

UPD:
Тема: определение всех возможных характеристик слова: часть речи, число, падеж и т.д.

Какой проект по нейросетям с текстом (лингвистика или вокруг) можно реализовать школьнику?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт