Какая структура должна быть у прогнозирующей нейронной сети?
Всем привет!
В качестве дипломной работы решил создать нейронную сеть, которая (теоретически) могла бы прогнозировать курс доллара исходя из новостных статей. Я понимаю, что это в принципе невозможно и результат будет близок к рэндомному, но это же диплом, поэтому результат не так уж и важен :) Хочу попросить совета. Сразу скажу, что про нейронные сети я начал читать буквально пару дней назад, поэтому прошу сильно не кидаться тапками.
Сейчас я спарсил около 147000 статей за последние 9 лет, выделил ключевые слова, лексически их обработал, убрал на мой взгляд ненужные. Таким образом из 90к ключевых слов у меня получилось примерно 40к.
Что касается нейронных сетей, то я понял только примерный принцип их работы: на вход мы подаем некие данные, на выходе получаем вероятность положительного или отрицательного ответа. По крайне мере, такой принцип был описан в гайдах, которые я прочитал) Но там рассматривались сети только с 5-10 входами, на каждый вход подавался 0/1, на выходе получалась вероятность единицы. Я разобрался, как создавать такие сети и как их обучать. Но, к сожалению, статей, описывающих нейронные сети, которые решили бы мою задачу (или близкую к ней), я не нашел.
На данный момент у меня возникло 2 вопроса:
1. Как создать нейронную сеть, которая могла бы обрабатывать ключевые слова? Единственное, что крутится у меня в голове -- создать 40к входов у сети. Но логично, что это неправильно. Тем более, что в определенный момент ключевые слова могут добавиться.
2. Как сделать так, чтобы нейронная сеть выдавала не вероятность наступления события, а направление ряда (курс пойдет вверх, сильно вверх, останется таким же, вниз и т.д.)?
Не прошу описать полностью алгоритм, подскажите только, пожалуйста, названия алгоритмов, техник и т.д., статей, которые могли бы мне помочь :)
Заранее благодарю
В качестве дипломной работы решил создать нейронную сеть, которая (теоретически) могла бы прогнозировать курс доллара исходя из новостных статей
оно так не работает
Не только по отношению к данной валюте, а вообще
Также не думайте, что данная идея вам пришла первому в голову
Также возникло ощущение, что вы не понимаете, как ML работает впринципе в реальном мире
Но, к сожалению, статей, описывающих нейронные сети, которые решили бы мою задачу (или близкую к ней), я не нашел.
Те вы не нашли как делается fact extraction, sentiment analysis, пробы написать проги для прогноза курсов и найти формулы по которым делается наивный прогноз buy/sell на investing.com
Если бы я 10 лет назад, когда задавал аналогичные вопросы по программированию, послушался бы таких советов
Мой совет - смените тему пока есть время
то я бы не стал программистом :) Если вам по факту нечего предложить -- зачем флудить? Я понимаю, что вы очень крутой дата сайенсист, и знаете гораздо больше чем я (тем более, что я знаю 0). Но по факту вы ничего не сказали и, судя по всему, практически не читали мой вопрос.
1. Я не просил писать весь алгоритм за меня, просил лишь дать ключевые слова
2. Я знаю, что спрогнозировать ничего не получится (о чем я так же писал) по огромному ряду причин, но это диплом, и подойдет даже отрицательный результат.
Также не думайте, что данная идея вам пришла первому в голову
О господи, я хоть где-то в своем вопросе претендовал на уникальность?) Если бы где-то было решение моей задачи, я бы ее с радостью украл для диплома -- меньше работы было бы.
наивный прогноз buy/sell
Если я правильно расшифровал то, что вы пытались зашифровать, чтобы показаться умнее, то я чем-то аналогичным как раз и занимался ранее :) Но я поставил себе задачу прогнозирования, отталкиваясь не от прошлых значений ряда, а от совершенно других факторов, пусть даже это будет безуспешно.
И, кстати, по моему експириенсу, люди, которые юзают английские слова там, где вполне логично использовать русские -- обычно являются пустословами, которые пытаются показаться умнее. Ни в коем случае не относится к вам ;) Хотя по факту, как я уже сказал выше, вы ничего и не сказали.......
В финансах есть такая штука "технический анализ". Там прогнозируют курс вообще без всяких внешних источников, чисто по истории колебаний.
Слова\алгоритмы для работы с текстом: word embeddings, RNN, LSTM, CNN, Transformer (самый топчик сейчас)
Но вообще я бы на вашем месте все-таки попробовал более приближенную к земле задачу. В прошлом году появилась довольно любопытная архитектура\статья Neural Ordinal Differential Equations, которую в том числе можно попробовать применить к курсам валют\акций.