Как предсказать погоду на следующие 24 часа?

Question

Ilya Neizvestnyj @Cheloved

Good man

Как предсказать погоду на следующие 24 часа?

Как предсказать погоду на следующие 24ч по данным за предыдущие 10 дней? Для примера берем первые 1440 образцов и по ним предсказываем. Код и ссылки ниже
Таблица данных - https://www.kaggle.com/pankrzysiu/weather-archive-...

Сеть:

import os
import numpy as np
from matplotlib import pyplot as plt
from keras.models import Sequential
from keras import layers
from keras.optimizers import RMSprop

data_dir = "C:/Users/pikro/Downloads/jena_climate"
fname = os.path.join(data_dir, "jena_climate_2009_2016.csv")

f = open(fname)
data = f.read()
f.close()

lines = data.split("\n")
header = lines[0].split(",")
lines = lines[1:]

print(header)
print(len(lines))

"""Parsing the data"""
float_data = np.zeros((len(lines), len(header) - 1))
for i, line in enumerate(lines):
    print(i)
    values = [float(x) for x in line.split(',')[1:]]
    float_data[i:] = values

temp = float_data[:, 1]
plt.plot(range(len(temp)), temp)
plt.show()
plt.plot(range(1440), temp[:1440])
plt.show()

# Normalizing the data
mean = float_data[:200000].mean(axis=0)
float_data -= mean
std = float_data[:200000].std(axis=0)
float_data /= std

print(float_data[0])


def generator(data, lookback, delay, min_index, max_index, shuffle=False, batch_size=128, step=6):
    """Generator yielding timeseries samples and their targets"""
    if max_index is None:
        max_index = len(data) - delay - 1

    i = min_index + lookback

    while 1:
        if shuffle:
            rows = np.random.randint(min_index + lookback, max_index, size=batch_size)
        else:
            if i + batch_size >= max_index:
                i = min_index + lookback
            rows = np.arange(i, min(i + batch_size, max_index))
            i += len(rows)

        samples = np.zeros((len(rows), lookback // step, data.shape[-1]))
        targets = np.zeros((len(rows),))

        for j, row in enumerate(rows):
            indices = range(rows[j] - lookback, rows[j], step)
            samples[j] = data[indices]
            targets[j] = data[rows[j] + delay][1]
        yield samples, targets


"""Preparing the generators"""
lookback = 1440  # 10 days
step = 6  # 5 hours
delay = 144  # 1 hours
batch_size = 128

train_gen = generator(float_data,
                      lookback=lookback,
                      delay=delay,
                      min_index=0,
                      max_index=200000,
                      shuffle=True,
                      step=step,
                      batch_size=batch_size)

val_gen = generator(float_data,
                    lookback=lookback,
                    delay=delay,
                    min_index=200001,
                    max_index=300001,
                    shuffle=True,
                    step=step,
                    batch_size=batch_size)

test_gen = generator(float_data, lookback=lookback, delay=delay, min_index=300001, max_index=None, step=step,
                     batch_size=batch_size)

val_steps = (300000 - 200001 - lookback) // batch_size
print(val_steps)
test_steps = (len(float_data) - 300001 - lookback) // batch_size
print(test_steps)


def evaluate_naive_method():
    batch_maes = []
    for step in range(val_steps):
        samples, targets = next(val_gen)
        preds = samples[:, -1, 1]
        mae = np.mean(np.abs(preds - targets))
        batch_maes.append(mae)
    return np.mean(batch_maes)

model = Sequential()
model.add(layers.GRU(32, dropout=0.2, recurrent_dropout=0.2, input_shape=(None, float_data.shape[1])))
model.add(layers.Dense(1))

model.compile(optimizer=RMSprop(), loss='mae')
history = model.fit_generator(train_gen,
                              steps_per_epoch=500,
                              epochs=30,
                              validation_data=val_gen,
                              validation_steps=val_steps)

model.save("weather.h5")

loss = history.history['loss']
val_loss = history.history["val_loss"]

epochs = range(1, 31)
plt.figure()

plt.plot(epochs, loss, "bo", label="Training loss")
plt.plot(epochs, val_loss, "b", label="Validation loss")
plt.title("Training and validation acc")
plt.legend()

plt.show()

predict = model.predict_generator(test_gen, steps=test_steps)

Пробовал делать так:

test_gen = generator(float_data, lookback=lookback, delay=delay, min_index=300001, max_index=None, step=step,
                     batch_size=batch_size)

val_steps = (300000 - 200001 - lookback) // batch_size
test_steps = (len(float_data) - lookback) // batch_size

model = models.load_model("weather.h5")

predict = model.predict_generator(test_gen, test_steps)
print("____")
for i in predict:
    for j in i:
        print(j, j * std[1])
print(len(predict))

Но числа не сходятся( Там абсолютно другие значения. Может нормализую не так?

Вопрос задан более трёх лет назад
440 просмотров

3 комментария

Подписаться 1 Средний 3 комментария

Сергей Соколов @sergiks

Вероятно, погода не так зависит от предыдущих 10 дней, как хотелось бы.

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

ну тут имеется ввиду, что у нас есть изменение температуры, давления и т. п за 10 дней, также есть обученная модель и надо предсказать температуру.

Написано более трёх лет назад

ScriptKiddo @ScriptKiddo

from random import randint
print(f'Завтра будет {randint(-10, 20)} °C. Одевайтесь потеплее')

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Решения вопроса 1

47 комментариев

sim3x @sim3x

Никак. Погода вообще никак не зависит от данных предыдущих дней.
смелое утверждение

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

Ну тут имеется ввиду, что по данным изменения погоды в течении 10дн,модель обученная на 420552 экземплярах, в которых указаны 14 различных значений (температура, перемещение воздушных масс, давление и т. д (15ое это время и дата) ) предсказывает температуру на следующий день. По ссылке в вопросе есть таблица со всем. Плюс, похожая модель есть на самом kaggle. Но там они демонстрируют эффективность, строят графики и т. п. Сама модель у меня уже есть, она выше

Написано более трёх лет назад
АртемЪ @Jump

Ну тут имеется ввиду, что по данным изменения погоды в течении 10дн
Чтобы предсказать погоду по этим данным вам требуется гадалка, а не нейросеть. Обратитесь к цыганам!

Научное моделирование погоды идет путем сбора данных в реальном времени со множества метеостацнций со всего мира, что позволяет в реальном времени отслеживать перемещения воздушных масс и предсказывать их движение.
Например если вы видите что у вас пониженное давление а в соседнем регионе повышенное - в вашу сторону вероятно начнет дуть ветер со стороны региона с повышенным давлением.
Ну это так - на пальцах.
В реальности все сложнее, там куча данных учитывается.

Написано более трёх лет назад
АртемЪ @Jump

sim3x, Каким образом погода завтра в городе Урюпинск, зависит от того какая погода была неделю назад в этом же самом Урюпинске?
Абсолютно никакой зависимости.

Погоду на завтра в городе Урюпинске можно предсказать зная погоду в соседних городах, и ее отслеживая ее изменения в пределах нескольких часов.
Чтобы предсказать погоду на более долгий срок, нужно отслеживать текущие погодные данные по всей планете.

Написано более трёх лет назад
sim3x @sim3x

АртемЪ,
Действительно
В Урюпинске чередуется -50С и +50С

Другое дело, что температура не зависит только от своего значения
Но говорить, что статистика за 20 лет не даст границ значений и доверительного интервала уж слишком

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

Ну так там и учитывается и направление ветра, и давления, и воздушные массы куча данных каждые 10 мин, но я вас понял) посмотрите таблицу, я же ее не просто так прикрепил, если хотите могу скрин кинуть

Написано более трёх лет назад
АртемЪ @Jump

sim3x, Статистика за 20 лет даст понимание о климате в данном регионе насколько холодные зимы бывают вообще например, или насколько жарко бывает летом. В общем отследить сезонные колебания можно.
Но она совершенно никоим образом не сможет дать ответ сколько градусов будет завтра +10 или +20, не сможет сказать будет ли завтра дождь, или ветер.

Но говорить, что статистика за 20 лет не даст границ значений и доверительного интервала уж слишком
А кто говорит? Речь идет про интервал в дни, а не в года. И про прогнозирование погоды на завтра.
А тут речь идет о статистике не за двадцать лет, а за предыдущие дни - это вообще информация не имеющая никакой ценности для прогнозирования.

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

А предсказанием я называю, т. к функция predict.

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

АртемЪ, Ну сеть как раз и обучена на данных за 10 лет, так то есть и за 20 лет данные, и мы же приблезительно делаем, на 100% нельзя сказать какая завтра будет погода, тем не менее тот же яндекс дает погоду на неделю. По оценки mae разница примерно в 2 градуса, тоесть сеть достаточно точная, цель не создать полноценную метеостанцию, а заузать RNN

Написано более трёх лет назад
Ivan Yakushenko @kshnkvn

Cheloved, успокойтесь, это мусор. Вам уже дали ответ.
Вы никак не можете спрогнозировать на основании предыдущей статистики появление циклонов, антициклонов, фронтов и т.д. А это всё очень сильно влияет на погоду.

Написано более трёх лет назад
АртемЪ @Jump

Cheloved,
Ну так там и учитывается и направление ветра, и давления, и воздушные массы куча данных каждые 10 мин, но я вас понял) посмотрите таблицу
Вы точно меня не поняли.

Таблица в которой есть температура, ветер, давление, и.т.п абсолютно бесполезна - по ней предсказать ничего невозможно.

Нужны таблицы в которых есть эти данные для всех соседних городов и сел, со всех направлений. Вот тогда можно предсказать погоду.

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

Да, я понял, то есть надо брать данные с соседних городов и следить в за передвежением масс и т. п

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

Просто странно что автор keras дает похожую сеть и именно так формулирует задачу

Написано более трёх лет назад
sim3x @sim3x

АртемЪ,
Статистика за 10 дней такая же как и за 20 лет
С поправкой на то, что доверительный интервал будет сильно хуже

Написано более трёх лет назад
АртемЪ @Jump

Cheloved,
Ну сеть как раз и обучена на данных за 10 лет, так то есть и за 20 лет данные, и мы же приблезительно делаем, на 100%
Повторю еще раз - для предсказания погоды даже сеть обученная на данных погоды в этом городе за 200 лет абсолютно бесполезна!

нельзя сказать какая завтра будет погода
Можно, с достаточно высокой вероятностью.

тем не менее тот же яндекс дает погоду на неделю
У яндекса есть данные получаемые в реальном времени от тысяч метеостанций по всей стране и миру.
Вот по ним он и прогнозирует.

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

АртемЪ, Тоесть они получили данные, запихнули в сеть и пишут погоду, тогда и сеть совсем другая?

Написано более трёх лет назад
АртемЪ @Jump

Температура на завтра в Челябинске никак не зависит от того какая температура была неделю назад в Челябинске.

Но она вполне сильно зависит от температуры которая есть сейчас в Москве, Питере, Красноярске, Сургуте, и Караганде.

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

АртемЪ, ну а на неделю тогда как выдать прогноз или на 2? Gismetio выдает, хотя и ясно что не точно

Написано более трёх лет назад
АртемЪ @Jump

Cheloved,
Тоесть они получили данные, запихнули в сеть и пишут погоду, тогда и сеть совсем другая?

Вот пойдите по этой ссылке и посмотрите как оно примерно работает -
https://yandex.ru/pogoda/chelyabinsk/maps/nowcast?...
Пощелкайте переключателями по температуре, ветру и давлению.

Имея карту давлений и температуры можно предсказывать их изменения. Нужна именно карта, а не таблица данных для одного селения.

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

АртемЪ, Ну а сеть как выглядеть тогда будет, нам же надо примерно на неделю прогноз давать

Написано более трёх лет назад
АртемЪ @Jump

sim3x,
Статистика за 10 дней такая же как и за 20 лет
Вот те раз. Абсолютно разные вещи. Статистика за 20 лет отслеживает зависимости сезонных колебаний, а статистика за десять дней вообще не дает никакой полезной информации.

Вот вам статистика температур за десять дней в определенном городе
11, 9, 8, 8, 8, 18, 13, 11, 6, 7, 3
Предскажите погоду на следующий день.
Сможете?

Написано более трёх лет назад
АртемЪ @Jump

Cheloved, А сеть будет гораздо сложнее выглядеть только и всего. И для обработки данных потребуется очень много ресурсов.

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

https://www.kaggle.com/drscarlat/weather-predict-t... ну если полно описывать как предсказывают погоду на keras. Как тогда это работает? Погрешность 2гр максимум

Написано более трёх лет назад
АртемЪ @Jump

Cheloved, По вашей ссылке какой-то сайт, с примерами работы нейросетей.
К погоде не имеет никакого отношения вообще.

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

АртемЪ, Это она и есть, прогнозирует погоду по данным Jena climate, первой строкой написано, ниже графики

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

АртемЪ, Там в коде в начале каждого листинга закомментировано пояснение

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

АртемЪ, Ну я понял, данные не сходятся из за погрешности, из за этого как раз сеть выдает допустим 2гр, а на самом деле температура была 0.32

Написано более трёх лет назад
devalone @devalone

Изучить движения воздушных масс з, построить модель. И по модели прогнозировать дальнейшее их перемещение и влияние на погоду.

Никак. Погода вообще никак не зависит от данных предыдущих дней.

Эти утверждения противоречат друг другу.

Написано более трёх лет назад
АртемЪ @Jump

devalone, В чем именно противоречие?
В одном случае вы моделируете поведение воздуха в атмосфере планеты зная откуда он движется, в какую сторону, какое давление там куда он движется, какой рельеф местности.

В другом случае вы пытаетесь предсказать погоду в определенной точке, на основании данных о погоде в этой точке за предыдущие дни.

Тот факт что три дня назад у вас было +10градусов тепла, а неделю назад +4 никак не влияет на то дойдет ли до вас антициклон находящийся в 500км и движущийся в вашу сторону, или нет.

Написано более трёх лет назад
АртемЪ @Jump

Cheloved,
Это она и есть, прогнозирует погоду по данным Jena climate, первой строкой написано, ниже графики
Она не прогнозирует погоду и не может этого делать.
Это просто модель для изучения нейросетей и не более того.

Написано более трёх лет назад
АртемЪ @Jump

Тот факт что кто-то взял для примера обучения нейросети набор погодных данных в определенной точке, никоим образом не научит нейросеть предсказывать погоду.
Но вполне может дать понятие о принципах работы и обучения нейросети.

Написано более трёх лет назад

sim3x @sim3x

АртемЪ,

In [1]: l = [11, 9, 8, 8, 8, 18, 13, 11, 6, 7, 3]

In [2]: from statistics import stdev, mean

In [3]: mean(l)
Out[3]: 9.272727272727273

In [4]: stdev(l)
Out[4]: 3.9519845417437827

9.27 +-3.95

Написано более трёх лет назад

dmshar @dmshar

Коллеги, вы упускаете из виду один момент. У автора за день имеется 144 измерения, т.е. одно измерение через каждые 25 минут, причем с ярко выраженной сезонностью "утро-день-вечер-ночь". По таким данным вполне по силам сделать предсказание на следующие 1-2 часа более менее точно и на 3-5 часов - допустимо точно. Даже без привлечения данных о погоде в Москве, Владивостоке и ближайшей деревне Ближний Зажопинск.
А вот предсказание погоды на ближайшие 10 дней и даже на ближайшие 10-15 часов по этим данным сделать скорее всего невозможно.
Но один-два-максимум три дня можно сделать более менее адекватное предсказание средней температура за день имея временной ряд среднедневных температур в данной местности за последние лет 20. Более точные прогнозы таки потребуют и пространственного анализа данных и специализированного (тепло-гидро-......) моделирования погоды.
Кроме того, известный факт, что на сегодняшний день предсказание даже с помощью самых точных моделей погоды на 7 дней дает точность предсказания хуже(!!!) чем просто предсказание по среднему значению температуры в этой точке в этот день. Так что все что дальше - точнее всего предсказывать по кофейной гуще.

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

dmshar, надо на кофейной попробовать)
Получается прогнозировать на день. Точность составляет +-2гр. А суть вопроса в том, что я код просил расписать)
А, и измерения раз в 10 мин

Написано более трёх лет назад
dmshar @dmshar

Да, с количеством минут с сутках я просчитался :-). Точность 2 градуса да еще на сутки - с моей точки зрения вполне адекватна. Тогда на 1-2 часа должна быть вообще в пределах пол градуса. В итоге повторю - при таких результатах- вопрос в чем?

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

dmshar, Все, уже не в чем, вопрос закрыт, хотел узнать правильно ли я prediction расписал

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

dmshar, как я посмотрел, сеть выдает 119040 предсказаний, то есть берется 1440 значений до, и идет предсказание на 144 значения после, если я правильно понял)

Написано более трёх лет назад
АртемЪ @Jump

sim3x, А теперь внимание правильный ответ - https://www.gismeteo.ru/diary/4368/2019/4/
Я вам привел данные с 4 по 14 число.
Ваш прогноз на 15 число -9.27 +-3.95
Реальные данные из архива - 13градусов.

Написано более трёх лет назад
sim3x @sim3x

АртемЪ,
9.27 +3.95 = 13.22
lol, неплохо

Написано более трёх лет назад
Ilya Neizvestnyj @Cheloved Автор вопроса

sim3x, нафиг я сеть писал, все и так работает

Написано более трёх лет назад
АртемЪ @Jump

sim3x, А с осадками, давлением и скоростью ветра так же сможете? :)

Написано более трёх лет назад
sim3x @sim3x

АртемЪ,
Статистика сможет
По крайней мере, большая часть истории метеорологии именно она делала большую часть работы

Но точность будет желать лучшего

Написано более трёх лет назад
АртемЪ @Jump

sim3x,
Но точность будет желать лучшего
Примерно на том же уровне, что монетку бросить - орел или решка.
Угадал или не угадал.

Написано более трёх лет назад
sim3x @sim3x

АртемЪ, некоторые так говорят про текущую метеорологию

Написано более трёх лет назад
АртемЪ @Jump

sim3x, Текущая метеорология очень точная в краткосрочных прогнозах.

Написано более трёх лет назад
dmshar @dmshar

Чтобы несколько сгладить накал вашего высоконаучного спора - просто ссылочка, прямо на свежачёк - позавчерашнюю статью;
https://towardsdatascience.com/weather-forecasting...
Прямо в тему.

Написано более трёх лет назад
АртемЪ @Jump

dmshar, Ну собственно оттуда - Weather forecasts are made by collecting quantitative data about the current state of the atmosphere at a given place and using meteorology to project how the atmosphere will change.”

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 107 просмотров
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 176 просмотров
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 219 просмотров
1

ответ
Python

Простой
Как сохранить курсор в строке ввода при перезапуске explorer.exe?
- 1 подписчик
- 28 нояб.
- 146 просмотров
1

ответ
Python

Простой
Ошибка IndexError: string index out of range в написании реализации системы Линденмайера – от чего происходит и как исправить?
- 1 подписчик
- 27 нояб.
- 147 просмотров
1

ответ
Python

+1 ещё

Простой
Как сделать рассылку в viber в фоне?
- 1 подписчик
- 22 нояб.
- 108 просмотров
0

ответов
Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 253 просмотра
1

ответ
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 300 просмотров
1

ответ
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 166 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 281 просмотр
0

ответов
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Вероятно, погода не так зависит от предыдущих 10 дней, как хотелось бы.
ну тут имеется ввиду, что у нас есть изменение температуры, давления и т. п за 10 дней, также есть обученная модель и надо предсказать температуру.
from random import randint print(f'Завтра будет {randint(-10, 20)} °C. Одевайтесь потеплее')

Answer 1 · 2019-10-09 11:57:06

Как предсказать погоду на следующие 24 часа?

Изучить движения воздушных масс з, построить модель. И по модели прогнозировать дальнейшее их перемещение и влияние на погоду.

Как предсказать погоду на следующие 24ч по данным за предыдущие 10 дней?

Никак. Погода вообще никак не зависит от данных предыдущих дней.

Answer 2 · 2019-10-09 21:18:07

Арсений Кравченко @Arseny_Info

R&D engineer

Посмотрите доклады Яндекса, они довольно много про это рассказывали

Ответ написан более трёх лет назад

Комментировать

Как предсказать погоду на следующие 24 часа?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт