А присутствие вариативности "шума". Мы же ищем вектор weights, который не решает систему, а МИНИМИЗИРУЕТ ошибку.
Сочетайте разные входные последовательности. В чем проблема. Цена = a_1*X_1 + a_2*X_2 + ... + a_n*X_n.
где X1 например средняя скользящая с окном 7 дней, X2 средняя скользящая с окном 1 месяц, X_3 индекс настроений и т.д.
графические паттерны, ну так у нас есть все средства математического анализа, все что мы "видим" может быть сформулировано.
mayton2019, очень верное замечание. Но в целом такой сервис технически не возможно создать, это возможно, только как конкретное решение внутри компании.
Владимир Коротенко, Ну хорошо существуют толковые парсеры для pdf таблиц. При чем здесь, сервис который все это сделает автоматически еще и извлечет нужные цифры из картинок и потом еще проанализирует, это не связанные с реальностью ожидания.
120gramm, Неи ничего лучшего. Есть алгоритмы которые умеют решать задачи классификации. Для одних данных это логистическая регрессия, для других рандом форест, для третьих лучше будет конволюционная нейронная сеть, для четвертых рекурентная. и т.д. В машинном обучении нет лучших алгоритмов. И для погоды одна нейронка, для акций другая так тоже не бывает.
120gramm, Нет такого "лучше задача классификации или регрессии". Есть бизнес задача, она может поставлена, спрогнозировать будет ли падение или рост это будет задача классификации, или спрогнозировать цену это будет задача регрессии. От того что требуется отталкиваются.
Елена, Без понятия. Сегодняшние так называемые AI системы ничего подобного не умеют. Это нужна для конкретно вашего случая разрабатывать парсер в случае с pdf и классификатор в случае с изображением. И потом производить "анализ" (точнее то что под этим имеется ввиду).
Евгений Лернер, Ну так делайте, для time series есть специальный класс нейронок, RNN. Но только 95 процентов работы с ts это препроцессинг, это особый сложный случай. А там во что вы верите это ваше личное дело.
atsanRickman1996, Ну так ошибка не изменилась. Я же вам объяснил, что вы работает с интерфейсом, а не с массивами напрямую. Возьмите рабочий пример, и попытайтесь имея рабочий пример, изменяя данные получить по смыслу такую же ошибку. ValueError: operands could not be broadcast together with shapes, цифры не важны, потом верните обратно, так начнете понимать, что к чему. Все что мог я объяснил, у меня нету интерфейса вашего.
atsanRickman1996, Разрешение, это еще не размерности массива. Когда происходят операции между массивами то либо количество элементов в одном массиве, равно количеству элементов в другом массиве, либо должен применится bradcasting. У вас где то есть массив 720 на 406, просто таблицу представьте с 720 рядами и 406 колонками и вы пытаетесь произвести операцию с массивом в 400 элементов. Не по одному измерению они не совпадают, такие операции не возможны.
atsanRickman1996, первое это 400. Там должно быть либо 720 либо 406. Но тут это гадания возможно. второй массив должен быть вида (1, 406). Но 400 там точно быть не может. Потому что оперция между массивами не возможна. А вот какие размерности, в точности это еще зависит от какая конкретно операция там происходит. Но 400 там быть не может.
Евгений Лернер, Ваш вопрос был общий и я дал на него общий ответ. Если речь идет об временной последовательности, то это частности. И у библиотек на которых все это дело реализуется имеются отдельные сплиттеры для временной последовательности. Вообще в ML работа с временной последовательностью это отдельное направление.
Евгений Лернер, Да, но это частности, например AIC - используется если данные временная последовательность. Но это различные регуляризации добавление (penalty) при увеличении (complexity). Как таковые к resampling methods они отношения не имеют. Это больше вспомогательные метрики, для сравнения моделей.
N T, Ну это ошибка ушла, надо глянуть пишет ли в базу так как ты ожидаешь. Может быть пишет, а может надо будет с датафреймом поработать. Ну это если что решается на уровне pandas и отдельным вопросом, тогда.
Нигде не ошибся, можешь симуляцию сделать, как в аптеке будет. Наборы наши обычные сеты без порядка, потому что в нужном порядке мы их сами расставим, так что абсолютно верное решение.
Александр Скуснов, При чем здесь PyTorch это библиотека которая предоставляет API для работы нейронными сетями. А вот оптимизация всегда при чем. будь то нейронные сети или классические алгоритмы машинного обучения, Различные функции оптимизации используются в том числе и нейронных сетях. Так вот такого что функция которую необходимо оптимизировать всегда дифференцируема, НЕТ. Потом везде где необходимо оптимизировать например относительно сочетания оптимальных параметров там вообще ГА очень хороший кандидат.
Евгений Лернер, Ну я подозреваю, что в целом существует много разных имплементаций, надо открывать документации и читать, что как сделано и какими математическими свойствами обладает. Метод Ньютона помню такой на практике не используется конечно, там обязательно должен существовать вторая производная , а вот сопряженные градиенты прямо сейчас в голову не приходят, надо гуглить и смотреть что это.
В любом случае было интересно пообщаться, непосредственно алгоритмы оптимизации не мой профиль, я использую их но в деталях с ними не работаю, я все таки аналитик. Спасибо за беседу.
Сочетайте разные входные последовательности. В чем проблема. Цена = a_1*X_1 + a_2*X_2 + ... + a_n*X_n.
где X1 например средняя скользящая с окном 7 дней, X2 средняя скользящая с окном 1 месяц, X_3 индекс настроений и т.д.
графические паттерны, ну так у нас есть все средства математического анализа, все что мы "видим" может быть сформулировано.