А можете ли посоветовать какую-нибудь подробную литературу или курсы по accord.net? Ничего более-менее дельного никак не находится (кроме информации с оф. сайта, но там не очень понятная подача).
Дело в том, что обычный градиентный спуск слишком сильно "сдвигает" точку при большом градиенте и слишком слабо при малом, хотя понятно, что при большом "наклоне" функции имеет смысл замедлиться. А метод Ньютона как раз это учитывает, поэтому, я подумала, что какой-то его аналог может помочь решить проблему.
И да, в данном случае, функция принимает неотрицательные значения, а её минимум стремится к нулю.
Евгений Перин, Лучше не учить данную нейронку давать ответ да/нет. Ведь есть ещё и промежуточные:
да/скорее всего/не уверен/вряд ли/нет. Можно сделать так: Преобразовать фото к тем векторам и собрать датасет из фото-вектор. Далее, нужно просто "вытаскивать" случайные пары фото и отмечать, насколько они похожи (выбирать один из уровней уверенности и записывать в вектор из одной единицы и нулей).
Далее создаём мелкую нейронку с простой архитектурой, которую учим преобразовывать [v1,v2] -> h, где v - векторы самих фото, а h - вектор их схожести.
Если лень с этим париться, то можно просто установить эмпирическим путём условие (v1-v2)^2
Если нейросеть даёт много ответов да/нет (если, допустим, у фото много параметров), то сравнивать двери можно будет, просто не так эффективно, как можно было сравнивать float-значения.