Борис: Совершенно верно, но я знаком с Map Reduce только в теории. Поэтому бы и использовал индекс, чтобы разбивать на куски (по сути - потоки) и прогонял бы по очереди. А искать известную часть одной таблицы все-таки лучше по индексу второй.
Сделал очень простую модель, которая пока работает нормально.
Делается два среза данных: изменения вчерашнего относительно позавчерашнего и аналогично за три дня. Далее выставил уровни: первый показатель меньше 90%, второй меньше 70%. Взял примерно наобум :)
Есть и второй теоретический вариант решения. Брать значения за последние семь дней и по такой выборке обучить логистическую регрессию или простенькую нейронную сеть. Думаю в перспективе нужно реализовать этот вариант.
Спасибо за ответ, но я его не понял.
Если под baseline вы имеете ввиду линию тренда и\или среднее-дисперсию, то я такое пробовал. Я могу строить линию регрессии и описательную статистику, но как её применить к задаче я не понял. Всегда находится контр-пример, который делает модель неприменимой.
Написано
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.