@pgamesorg

Как привести выборку в нормальное распределение?

До применения np.log():
60af947805a45090937953.png

После применения np.log():
60af9423b7c95370956467.png

НО

Я вот хочу проверить две группы Т-Тестом, но прежде решил проверить на нормальность:
60af9508583f5904342406.png
результат оказался очень значимым (т.е выборка распределена не нормально)

Как выбраться из этого, чтобы правильно сделать T-Тест?
  • Вопрос задан
  • 89 просмотров
Пригласить эксперта
Ответы на вопрос 2
@zexer
Если данные у вас не нормальны, то нет особого смысла проводить тесты, основанные на предположении о нормальности данных.
Ответ написан
@dmshar
"Я вот хочу проверить две группы Т-Тестом" - хотеть можно что угодно. Но вот к исследованию данных это не имеет никакого отношения. Если у вас данные не подчиняются нормальному закону распределения, то использовать t-критерий Стьюдента крайне нерационально. Для таких случаев есть другие тесты, из группы непараметрических. Их много. Можно начать с теста Вилкоксона-Манна-Уитни, и/или критерия Колмогорова-Смирнова. Их стандартные реализации есть в scipy.stats. Впрочем, как и кучи других методов, которые могут применятся в таких случаях.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы