Задать вопрос

ivodopyanov

NLP, python, numpy, tensorflow

79

вклад
13

вопросов
156

ответов
28%

решений

Ответы пользователя по тегу Нейронные сети

Как уменьшить размерность задачи для обучения нейронной сети?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

Можно попробовать что-нибудь стандартное типа PCA. Но лучше бы получить информацию о характере возможного заполнения матрицы и попридумывать свои фичи. Построчная сумма - один из вариантов.

Входной слой в 5000 нейронов - это еще не значит, что размерность надо уменьшать. Её надо уменьшать, если из-за длины вектора обучение длится неприемлимо долго.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Рекуррентные нейронные сети на Python?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

1. В машинном обучении обычно обучают на минибатчах - блоках по N примеров, где N обычно не больше 100 - а не по одному.
2. Поэтому там на вход подается не двумерный, а трехмерный массив - <кол-во примеров в минибатче>*<максимальная длина последовательности>*<количество фич \ размерность вектора слова>
3. Прогонять текст через word2vec можно в составе нейронной сети на Keras - есть слой Embedding, в котором можно предустанавливать значения весов. Тогда входные значения - это последовательности id'шников слов.
4. Есть же примеры: https://github.com/keras-team/keras/blob/master/ex...

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как определить типы чисел в тексте?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

Эта задача называется Named Entity Recognition (NER), и state-of-the-art решение в ней - это BiLSTM + CRF. Вот здесь есть пример: https://github.com/farizrahman4u/keras-contrib/blo...

Основная проблема - это как разметить датасет. Я, когда решал недавно такую же проблему, придумал делать так:
1) Заменяем все цифры на какой-то один символ. Например, "0".
2) Разбиваем текст на слова.
3) Строим частотный словарь n-грамм (n = от 1 до какого-нибудь числа k, выбранного вручную), таких, чтобы в них входило хотя бы одно слово с цифрой. N-граммы нужны, потому что есть много числовых фактов из более чем одного слова - те же номера телефонов в формате 7 000 000 00 00 или номера паспортов 0000 000000.
4) Генерим векторные представления для этих n-грамм, используя word2vec или аналоги. Т.е. разбиваем фразу на слова, а потом вокруг какого-то слова с цифрами сливаем вместе n слов и отдаем в модель. Тем самым n-граммы различных вариантов написания телефонных номеров будут находится более-менее рядом.
5) Начинаем вручную размечать n-граммы, отсортированные по частоте. При желании потом можно взять какой-то размеченный кластер и поразмечать n-граммы, отсортированные по расстоянию до центра кластера. Т.е. сначала примерно определили, где находится кластер телефонных номеров, а потом четко обрисовали его границу. Я для всего этого написал бота в телеграмме.
6) В итоге получили кластеризацию n-грамм - далее легко получить маски фраз с метками и натравить на это ту нейронную модель.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как сортировать разные телефонные номера?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

1. Отфильтровать все, что точно не телефон (тексты "нет телефона" и т.д.)
2. Превратить цифры, записанные словами, в числа.
3. Оставить в тексте только цифры и "+".

Если в датасете гарантированно, что с цифрами могут быть только телефоны (нет ip-адресов, почтовых индексов, паспортных данных и прочего) - то должно работать.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Какую литературу почитать про анализ текста нейросетью?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

scikit-learn.org/stable/tutorial/text_analytics/wo...

Ответ написан более трёх лет назад

Комментировать

Комментировать
Что подается на вход нейросети при обучении с подкреплением и что мы имеем на выходе?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

На вход - состояние среды, каким-то образом закодированное плюс возможное действие. На выходе - ценность этого действия. В своей первой статье DeepMind вычисляли ценности для всех действий сразу, поэтому там был не один выход, а N. Но это не обязательно.
Плюс еще есть более сложные модели для обучения с подкреплением типа actor-critic.

Архитектура нейросети зависит от способа кодирования среды. Это может быть и перспетрон, а могут быть сверточные нейронные сети, если мы подаем визуальный сигнал. А может содержать рекурентные сети, если на входе текст или еще какая-нибудь последовательность.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Какие существуют библиотеки для создания нейронных сетей на русском языке?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

Библиотеки и датасеты - это независимые вещи.
Библиотека - это "как" обучать. Датасет - "чему" обучать.
Язык общения относится к "чему".

Ответ написан более трёх лет назад

4 комментария

4 комментария
Какие знания необходимы для изучения нейронных сетей?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

Дифференциальное исчисление, операции с матрицами, теория вероятностей. Вот это вроде основное.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Можно ли обучить нейронную сеть увеличивать разрешение фрактальных изображений?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

Фракталы - это же не растровая графика, зачем тут нейронные сети? Прогнали алгоритм на пару итераций дольше - вот и получили более мелкие элементы.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Знаете ли вы площадку для соревнований между ИИ?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

https://www.codingame.com
https://gym.openai.com

Ответ написан более трёх лет назад

Комментировать

Комментировать
Можно ли развитие алгоритмов ИИ поместить в блокчейн?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

1. Блокчейн не предназначен для хранения большого объема данных. Он же дублируется у всех майнеров. Там можно хранить небольшие записи, байты-килобайты.
2. Вообще мысль интересная, но надо же гарантировать, чтобы время решения задачи для всех майнеров было более-менее одинаковое. Иначе злоумышленник сможет быстро пообучать простые модельки и нагенерить своих блоков.

Ответ написан более трёх лет назад

6 комментариев

6 комментариев
Как научить бота перемещаться в игровом мире используя миникарту?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

1. Если обучение будет происходить в онлайн-режиме (человек играет, а бот паралелльно обучается на получаемых данных), то наверняка обучение придется проводить ооочень долго, чтобы бот хоть чему-нибудь научился.
2. Думаю, от характера карты может сильно зависеть алгоритм - или это лабиринт, или это открытая местность с участками, запрещенными для движения.
3. Вообще, задача поиска пути - это довольно простая проблема. Если вся карта известна, то она решается и без всяких нейронных сетей - например, А*. Может быть, есть какие-то варианты алгоритмов и для частично наблюдаемых сред.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
База разговорных ответов для тренировки чат-бота, который работает по нейро-сети?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

На английском языке есть несколько датасетов, например Ubuntu Dialogue Corpus https://github.com/rkadlec/ubuntu-ranking-dataset-...

На русском языке ничего такого не встречал. Может, твиты сгодятся. Но там же довольно запутанная структура диалога.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Где взять данные для тренировки нейронной сети?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

MNIST + можно его по-всякому поворочать: растянуть\сжать по оси, повернуть вокруг центра и т.д.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Распознавание облаков на спутниковом снимке?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

Какая функция активации на выходе? Softmax?

Плюс ведь тут незачем делать 2 выхода, достаточно одного. 0 - нет облака, 1 - есть облако.

Ответ написан более трёх лет назад

8 комментариев

8 комментариев
На сколько сложно написать нейронную сеть?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

Там проблема не в том, чтобы написать так, чтобы работало без ошибок. А в том, чтобы написать так, чтобы
1) Работало быстро
2) Для этого могло работать на GPU
3) Или работать в кластере
4) Было достаточно универсальным в плане использования
5) Легко было отлаживать
6) Имело удобный API
...
Вот на это, полагаю, уходит основное время при разработке таких вещей, как Tensorflow.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как использовать обученную модель tensorflow?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

Там же есть файл udc_predict.py с примером использования обученной модели для предсказаний

Ответ написан более трёх лет назад

2 комментария

2 комментария
Python как написать игрового бота?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

Написать что-то такое под произвольную игру без доступа к её API - крайне сложная задача.
Думаю, вам сначала сюда: https://gym.openai.com/

Ответ написан более трёх лет назад

Комментировать

Комментировать
Где взять данные для задач классификации?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

Написать парсер веб-страниц

Ответ написан более трёх лет назад

Комментировать

Комментировать
Нейросети и машинное обучение?

ivodopyanov @ivodopyanov
NLP, python, numpy, tensorflow

Искуственный интеллект - это способность программы (агента) делать какой-то выбор в некоторых условиях. Алгоритмы сортировки или поиска пути в графе - это тоже ИИ.

Есть несколько подходов к реализации ИИ. Один из них - это машинное обучение, когда мы предоставляем данные и при помощи какого-то алгоритма "обучаем" агента, формируем в нем математику того, как принимать решение. Другой вариант - это, например, просто закодить логику.

Нейронные сети - одна из моделей машинного обучения. Т.е. это некоторая форма, при помощи которой мы пытаемся описать процесс, требующий принятия решения.

Есть несколько алгоритмов обучения нейронных сетей. Наиболее эффективный в данное время - это backpropagation. Но он не единственный - например, нейронную сеть можно обучать и при помощи генетических алгоритмов. В вакууме они работают сильно медленнее, чем backprop, но при этом лучше паралелляться и не требуют расчета производных.

Ответ написан более трёх лет назад

2 комментария

2 комментария

Самые активные сегодня

Drno
- 6 ответов
- 0 вопросов
Refguser
- 4 ответа
- 0 вопросов
Василий Банников
- 4 ответа
- 0 вопросов
CityCat4
- 4 ответа
- 0 вопросов
Александр Третьяков
- 3 ответа
- 1 вопрос
DevMan
- 4 ответа
- 0 вопросов