Как интерпретировать результат теста Шапиро-Уилка и Колмагорова — Смирнова?

Question

Chubaka @BladehelpRunner

Гений мысли

Как интерпретировать результат теста Шапиро-Уилка и Колмагорова — Смирнова?

Я решил поиграться с проверкой распределения на нормальность. Решил проверить распределение возраста среди покупателей (всего 2000 уникальных потребителей) на нормальность
Построил qqplot, провел тест Шапиро - Уилка, по результатам которого должен отклонить нулевую гипотезу о нормальности. Но так же решил провести тест Колмагорова- Смирнова, который показывает значение статистики = 1 и p-value 0. Что значит значение статистики = 1? Вернее как можно интерпретировать эти значения? И всё ли я делаю правильно?
Скрин прикладываю выше

Вопрос задан более двух лет назад
2599 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Аналитика

Простой
Какие сейчас используются качественные программы для pairwise?
- 1 подписчик
- 04 мая
- 24 просмотра
0

ответов
Аналитика

+1 ещё

Простой
Если ли более изящный способ вычисления суммы максимальных значений за день в ретроспективе 1 месяц?
- 5 подписчиков
- 21 мар.
- 2212 просмотров
2

ответа
Аналитика

+1 ещё

Средний
Как построить объясняющую модель временного ряда?
- 2 подписчика
- 08 февр.
- 151 просмотр
0

ответов
Теория вероятностей

+1 ещё

Средний
Как посчитать вероятность по формуле Байеса в экспертной системе?
- нет подписчиков
- 25 янв.
- 80 просмотров
1

ответ
Аналитика

Простой
Какой самый мощный сервис статистики для сайта?
- 1 подписчик
- 07 янв.
- 133 просмотра
2

ответа
Базы данных

+1 ещё

Средний
Есть ли аналог Power bi desktop на mac?
- 2 подписчика
- 05 янв.
- 462 просмотра
2

ответа
IT-образование

+2 ещё

Простой
Какой курс лучше для начала работы бизнес-аналитиком?
- 3 подписчика
- 24 дек. 2024
- 2508 просмотров
5

ответов
Математическая статистика

Средний
Как интерпретировать возникновение точки перегиба на графике дисперсии?
- 2 подписчика
- 26 окт. 2024
- 164 просмотра
0

ответов
Поисковая оптимизация

+4 ещё

Простой
Key Collector работает только на ОС Windows, какой аналог вы порекомендуете для работы на Мас?
- 1 подписчик
- 19 сент. 2024
- 290 просмотров
4

ответа
Аналитика

Простой
Sentry. Как верно настроить отслеживание работы приложения в mac os?
- 1 подписчик
- 14 сент. 2024
- 48 просмотров
0

ответов
Показать ещё Загружается…

Инженер-технолог (электромонтаж и сборка)

ГК «Турбулентность-ДОН» • Ростов-на-Дону

от 100 000 ₽

Fullstack аналитик IT

Wanted. • Москва

До 300 000 ₽

Системный Аналитик 1С

Wanted. • Москва

До 260 000 ₽

Answer 1 · 2023-04-14 18:09:27

Ну все ли вы делаете правильно это совершенно неизвестно, (Это большой вопрос как сделана выборка, что за данные и т.д. вообщем соблюдены ли все условия) и так сходу не ответишь Это надо сидеть и разбираться (иметь ваши данные и время (сразу скажу делать я этого не буду)). А вот на остальное ответить вполне себе можно.

1. График о чем говорит? Нормальное распределение подразумевает, крайне маленькие вероятности у "хвостов" распределения, то есть если вы отклонились более 2 стандартных отклонений то там 5 процентов всего по 2.5 с каждого края, на вашем же графике далекие от среднего значения НЕ являются маловероятными событиями. В статистике это называется fat tails. То есть это не НОРМАЛЬНОЕ распределение не будет такого что 95 процентов лежат в пределах двух стандартных отклонений, это значение будет меньше (Экстремальные величины не являются маловероятными).

2. По поводу теста тут все просто. Что такое p-value? Это вероятность тестовой статистики при условии НУЛЕВАЯ Гипотеза ИСТИННА. Поговорим о логике эксперемента. Допустим мы говорим средний рост прохожего (мужского) пола 175см. Это ПАРАМЕТР популяции который мы хотим затестить посредством СЛУЧАЙНОЙ выборки. Мы выходим на улицу берем 500 (например дизайн эксперемента я опускаю) мужчин измеряем их рост и берем среднее значение это ТЕСТОВАЯ статистика, далее мы нормализуем (трансформируем наши ТЕСТОВУЮ статистику после чего она измерятся не в см а в стандартных отклонениях) ну и находим вероятность ТЕСТОВОЙ статистике из такого распределения где ПАРАМЕТР истинен. Если это вероятность ниже установленного заранее порога, мы отвергаем нулевую гипотезу. Потому что мы говорим это очень маловероятно видеть такую ТЕСТОВУЮ статистику при условии нулевой гипотезы истинной. Это общая направление ИДЕЯ. Частные имплементации могут отличаться в зависимости сколько данных у нас есть что мы знаем о распределении популяции и .т.д. Это была общая логика.

У теста Колмагорова-Смирнова есть своя формула для ТЕСТОВОЙ Статистики которая показывает своего рода "дистанцию" между распределением выборки и в данном случае нормальным распределением (Упрощенно читайте подробнее) и вычисляет ее вероятность. В вашем случае он вам показал что вероятность равна нулю. (То есть уверенно отвергаем нулевую гипотезу).

Это что можно понять из предоставленной вами информации, повторюсь ответить правильно ли вы все сделали возможности нет.

Как интерпретировать результат теста Шапиро-Уилка и Колмагорова — Смирнова?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт