Первое расхождение уже после первого умножения матриц: умножения матрицы весов связей входного слоя со скрытым. В результате получается матрица со значениями типа 3.27362482790, 5.4859804, 6.4859834 и т.д. Но как такое возможно, если максимальные значения в умножаемых матрицах не превышают единицы?
function(num1[, ...[, numN]])function (x, y[, z])