Так вот вопрос - может ли мне кто-нибудь из этой области объяснить, что именно нужно изучать и в какую сторону копать? То есть действительно ли мне нужно хорошо знать теорию графов, теорию энтропии, мат. статистику (я понял без нее никак), методы оптимизации и горы теории, которые приводят в предисловии этих книг?
Под этим я и имел, какая нужна база чтобы двигаться, даже архитектуру нужно знать, что в некоторых местах не подойдет кладка из определенного материала, собственно как и нормальному чернорабочему.
vldud, Ага, то есть на самом деле нет необходимости читать все эту обширную теорию, а понять градиентный спуск и попробовать обучить сеть? Этого достаточно для вхождения в область?
freeExec, ну а если я не знаю как уменьшить ошибку сети, то откуда я узнаю что нужно использовать именно метод обратного распространения, это же и есть теоретическая база, разве не так?
freeExec, мне интересует разработка с использованием машинного обучения (я понял это относится к промышленным комбайнам), но у меня сложилось мнение, что использование машинного обучения без должной теоретической базы не имеет большой силы. Отсюда и вопрос - какую базу надо иметь? А ваш ответ, как я понял, подразумевает отсутствие необходимости в наличие достаточно больших теоретических и практических знаний в этих областях, я же верно понял? (Под практическими знаниями я имею ввиду решение теоретических задач, которые обычно дают после прочтения теории в университетах)
freeExec, делать быстро и оптимально большие вычисления, грубо говоря, т.е. не изобретать велосипед чтобы доехать, но все равно же нужно понимать как и зачем, для чего и когда. Да и в итоге, с авторами книг вы не согласны, я правильно понял?
freeExec, как обучать нейронную сеть это просто, но это же далеко не все, почему же для этой цели огромные тяжеловесные библиотеки вроде tensorflow? Не думаю что все так просто.
Ваш ответ расходиться с тем, что я читал в книгах, в одной из них говорится, что основа всему теорема Байеса и использование метода наибольшего правдоподобия.
В коде будет просто присутствовать вызов тех или иных функций, которыми я обучаю сеть, но обучу я ее с какого-то момента без понимания что происходит. Конечно, я согласен, вызов API библиотеки это просто, но это не добавит мне понимания в области.
Денис Загаевский, теория энтропии, методы оптимизации и теория случайных процессов это уже 3 хороших книги (не считая знания математического анализа, который нужно знать, чтобы хоть чутка понимать эти книги). И плюс к этому их даже не достаточно просто прочитать, нужно заниматься с задачниками, чтобы это нормально понять и запомнить (это очевидно). Только эти три предмета уже целые университетские курсы. Пару книг?
Написано
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Под этим я и имел, какая нужна база чтобы двигаться, даже архитектуру нужно знать, что в некоторых местах не подойдет кладка из определенного материала, собственно как и нормальному чернорабочему.