Как обеспечить сопоставимость данных с разным объёмом выборки?

Question

XanKraegor @XanKraegor

Как обеспечить сопоставимость данных с разным объёмом выборки?

Здравствуйте! Представьте ситуацию, когда нужно сопоставить данные за один месяц с данными за другой, но при этом данные поступают от разного количества респондентов. При этом то, от кого данные поступают, конечно же влияет на результаты исчисляемых показателей. Можно ли при этом как-то оценить динамику изучаемых показателей, если не использовать самый тривиальный метод, в котором мы сравниваем данные только от тех респондентов, которые есть и в текущем, и в предыдущем периоде?
Прошу дать наводку о существовании каких-либо подходов для такой ситуации.

Вопрос задан более двух лет назад
300 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Аналитика

Простой
Какие сейчас используются качественные программы для pairwise?
- 1 подписчик
- 04 мая
- 24 просмотра
0

ответов
Аналитика

+1 ещё

Простой
Если ли более изящный способ вычисления суммы максимальных значений за день в ретроспективе 1 месяц?
- 5 подписчиков
- 21 мар.
- 2212 просмотров
2

ответа
Аналитика

+1 ещё

Средний
Как построить объясняющую модель временного ряда?
- 2 подписчика
- 08 февр.
- 151 просмотр
0

ответов
Теория вероятностей

+1 ещё

Средний
Как посчитать вероятность по формуле Байеса в экспертной системе?
- нет подписчиков
- 25 янв.
- 80 просмотров
1

ответ
Аналитика

Простой
Какой самый мощный сервис статистики для сайта?
- 1 подписчик
- 07 янв.
- 133 просмотра
2

ответа
Базы данных

+1 ещё

Средний
Есть ли аналог Power bi desktop на mac?
- 2 подписчика
- 05 янв.
- 468 просмотров
2

ответа
IT-образование

+2 ещё

Простой
Какой курс лучше для начала работы бизнес-аналитиком?
- 3 подписчика
- 24 дек. 2024
- 2508 просмотров
5

ответов
Математическая статистика

Средний
Как интерпретировать возникновение точки перегиба на графике дисперсии?
- 2 подписчика
- 26 окт. 2024
- 164 просмотра
0

ответов
Поисковая оптимизация

+4 ещё

Простой
Key Collector работает только на ОС Windows, какой аналог вы порекомендуете для работы на Мас?
- 1 подписчик
- 19 сент. 2024
- 290 просмотров
4

ответа
Аналитика

Простой
Sentry. Как верно настроить отслеживание работы приложения в mac os?
- 1 подписчик
- 14 сент. 2024
- 48 просмотров
0

ответов
Показать ещё Загружается…

Инженер-технолог (электромонтаж и сборка)

ГК «Турбулентность-ДОН» • Ростов-на-Дону

от 100 000 ₽

Fullstack аналитик IT

Wanted. • Москва

До 300 000 ₽

Системный Аналитик 1С

Wanted. • Москва

До 260 000 ₽

Answer 1 · 2023-02-07 19:42:50

Очень обычная ситуация называется Sampling Distribution. По порядку. Есть Population параметр (истинный параметр) для нас он неизвестен, мы осуществляем его измерение посредством случайной выборки при этом размер самой выборки не постоянен что вполне нормально. В таких случаях используется Sampling Distribution. Все формулы mean, std, пропорции и.тд. они идут с учетом размера выборки.
Пример например берем какой нибудь опрос Позитивно ли вы смотрите в будущее? например в один месяц опросили в одном городе 2000 респондентов и получили 30 процентов ответили позитивно. Через 3 месяца мы опросили 1300 респондентов в этом же городе и получили ответ например 50% ответили позитивно. Это абсолютно рабочая ситуация.

Мы можем произвести гипотезные тесты например это настроение улучшилось, или это объяснимо просто делом случая. Посчитать p-value, интервалы ит.д все как обычно. Ну например в моем примере мы их будем сравнивать используя дистрибуцию разниц пропорций в Sampling Distribution. В общем гуглите Sampling Distribution изучайте там все формулы с учетом размера выборки и потом проводите гипотезные тесты относительно параметра который вы измеряете.

Как обеспечить сопоставимость данных с разным объёмом выборки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт