Как обеспечить сопоставимость данных с разным объёмом выборки?

Question

XanKraegor @XanKraegor

Как обеспечить сопоставимость данных с разным объёмом выборки?

Здравствуйте! Представьте ситуацию, когда нужно сопоставить данные за один месяц с данными за другой, но при этом данные поступают от разного количества респондентов. При этом то, от кого данные поступают, конечно же влияет на результаты исчисляемых показателей. Можно ли при этом как-то оценить динамику изучаемых показателей, если не использовать самый тривиальный метод, в котором мы сравниваем данные только от тех респондентов, которые есть и в текущем, и в предыдущем периоде?
Прошу дать наводку о существовании каких-либо подходов для такой ситуации.

Вопрос задан более двух лет назад
336 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Аналитик данных

7 месяцев

Далее
Skillbox

Профессия Data Analyst

12 месяцев

Далее
Нетология

Аналитик данных: расширенный курс

11 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Хранение данных

+1 ещё

Сложный
Как сделать Service Structure рабочими в Tempo?
- 1 подписчик
- 06 нояб.
- 43 просмотра
0

ответов
Аналитика

Простой
Где посмотреть примеры оформления кода для экономического анализа данных?
- 1 подписчик
- 11 сент.
- 240 просмотров
2

ответа
Аналитика

+1 ещё

Простой
Какие есть эффективные средства анализа больших данных?
- 2 подписчика
- 20 авг.
- 201 просмотр
3

ответа
Алгоритмы

+1 ещё

Средний
Как можно предиктить дату регистрации при массиве данных?
- 1 подписчик
- 03 июл.
- 181 просмотр
1

ответ
Аналитика

+1 ещё

Средний
Как быстро локализовать в логах источник изменений метрики?
- 1 подписчик
- 30 июн.
- 104 просмотра
0

ответов
Математика

+3 ещё

Средний
Как выбрать размеры интервалов для неравно интервального вариационного ряда?
- 1 подписчик
- 24 июн.
- 184 просмотра
2

ответа
Аналитика

Простой
Какие сейчас используются качественные программы для pairwise?
- 2 подписчика
- 04 мая
- 67 просмотров
2

ответа
Аналитика

+1 ещё

Простой
Если ли более изящный способ вычисления суммы максимальных значений за день в ретроспективе 1 месяц?
- 5 подписчиков
- 21 мар.
- 2257 просмотров
2

ответа
Аналитика

+1 ещё

Средний
Как построить объясняющую модель временного ряда?
- 2 подписчика
- 08 февр.
- 182 просмотра
0

ответов
Теория вероятностей

+1 ещё

Средний
Как посчитать вероятность по формуле Байеса в экспертной системе?
- нет подписчиков
- 25 янв.
- 97 просмотров
1

ответ
Показать ещё Загружается…

Руководитель отдела поддержки программного обеспечения

Эконика • Москва

от 170 000 до 170 000 ₽

Аналитик

Gen AI Solutions

от 150 000 до 250 000 ₽

Системный аналитик (Мои Сервисы)

Сбер • Москва

от 300 000 ₽

Answer 1 · 2023-02-07 19:42:50

Очень обычная ситуация называется Sampling Distribution. По порядку. Есть Population параметр (истинный параметр) для нас он неизвестен, мы осуществляем его измерение посредством случайной выборки при этом размер самой выборки не постоянен что вполне нормально. В таких случаях используется Sampling Distribution. Все формулы mean, std, пропорции и.тд. они идут с учетом размера выборки.
Пример например берем какой нибудь опрос Позитивно ли вы смотрите в будущее? например в один месяц опросили в одном городе 2000 респондентов и получили 30 процентов ответили позитивно. Через 3 месяца мы опросили 1300 респондентов в этом же городе и получили ответ например 50% ответили позитивно. Это абсолютно рабочая ситуация.

Мы можем произвести гипотезные тесты например это настроение улучшилось, или это объяснимо просто делом случая. Посчитать p-value, интервалы ит.д все как обычно. Ну например в моем примере мы их будем сравнивать используя дистрибуцию разниц пропорций в Sampling Distribution. В общем гуглите Sampling Distribution изучайте там все формулы с учетом размера выборки и потом проводите гипотезные тесты относительно параметра который вы измеряете.

Как обеспечить сопоставимость данных с разным объёмом выборки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт