Регрессия к среднему. Что за формула?

Question

Aleksey FRZ @leshqow

-l-

Регрессия к среднему. Что за формула?

Встретил на просторах интернета такой вот абзац:

The R2 value here is 0.609 which is ok but not great. The % regression to the mean is calculated as follows

% regression to the mean = 100% x (1 – R) = 1 – (0.608)1/2 = 100 x (1 – 0.779) = 22.1%

Только что то на просторах рунета не могу найти внятного объяснения что это на самом деле.

1. Прав ли я буду если назову это регрессией к среднему ?
2. Как автор получил 0.779 ?
3. Как расчитан коэффицент R2 и почему в формуле используется просто R, а не R2
Оригинал статьи

Вопрос задан более трёх лет назад
246 просмотров

1 комментарий

Подписаться 1 Средний 1 комментарий

Помогут разобраться в теме Все курсы

Skillbox

Математика для Data Science

4 месяца

Далее
ProductStar

Математика и статистика для аналитика на Python

1 месяц

Далее
Яндекс Практикум

Математика для анализа данных

6 месяцев

Далее

Решения вопроса 1

2 комментария

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Математика

Простой
Необходимость сохранения инвариантов при мат. индукции?
- 2 подписчика
- 18 дек.
- 97 просмотров
1

ответ
Excel

+1 ещё

Средний
PowerQuery эффективность применения при работе с большим к-вом файлов?
- 2 подписчика
- 12 дек.
- 84 просмотра
2

ответа
Математика

Простой
Правильное ли док-во существования функции?
- 1 подписчик
- 10 нояб.
- 182 просмотра
1

ответ
Математика

Простой
Почему не используется простая таблица истинности?
- 1 подписчик
- 07 нояб.
- 152 просмотра
1

ответ
Хранение данных

+1 ещё

Сложный
Как сделать Service Structure рабочими в Tempo?
- 1 подписчик
- 06 нояб.
- 54 просмотра
0

ответов
Математика

Простой
Как решается такое задание?
- 1 подписчик
- 02 нояб.
- 213 просмотров
2

ответа
Математика

Простой
Нужно ли это доказывать в обратную сторону?
- 1 подписчик
- 17 окт.
- 179 просмотров
1

ответ
Математика

+1 ещё

Простой
Хороший учебник/статья/книга по производным и началам матанализа?
- 2 подписчика
- 08 окт.
- 335 просмотров
3

ответа
Аналитика

Простой
Где посмотреть примеры оформления кода для экономического анализа данных?
- 1 подписчик
- 11 сент.
- 244 просмотра
2

ответа
Математика

Средний
Какая функция y=f(x) может описывать подобный график с ассиметричным распределением?
- 1 подписчик
- 01 сент.
- 494 просмотра
2

ответа
Показать ещё Загружается…

Стажер Аналитик

ПСБ цифровая лаборатория • Москва

от 30 000 до 60 000 ₽

Frontend / Product Engineer (Tauri + Vue) — Solo Role

Poker Training

от 250 000 до 300 000 ₽

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

это R² и далее 0,608 в степени 1/2 (квадратный корень) = 0,779.

Answer 1 · 2018-04-13 13:24:46

R² — это так называемый коэффициент детерминации. Как он работает?
Изначальная дисперсия переменной y будет D1.
Наладили модель — дисперсия модели D2, которая, надо полагать, меньше D1 (особенно если вся выборка обучающая, без экзаменационной; здравствуй, переобучение!).
Тогда R² = 1 − D2/D1 = (D1 − D2) / D1.

Дисперсия, как известно, измеряется в квадратных попугаях. И, кроме того, для независимых величин D(x+y) = Dx+Dy. Таким образом, √(D1 − D2) ~ √R² — это тот разброс, который мы объяснили моделью.

Но он, по-видимому, натягивает сову на глобус. В его модели объяснённый разброс — 0,780 (ещё и округлять не умеет), необъяснённый — √D2 ~ √(1 − R²) = 0,626, и в зависимости от того, что хочешь доказать, можно манипулировать статистикой в ту или иную сторону. Вот так я могу сказать, что с такими разбросами всего на 0,780 / (0,780+0,626) = 55% умение, и на 45% — удача. Так что нет, коэффициент детерминации, и точка. Повторяю, для независимых величин один разброс частично компенсируется другим, и D(x+y) = Dx+Dy. В квадратных попугаях.

Регрессия к среднему. Что за формула?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт