Ведь дисперсия как-то приближается к размаху т.к к количеству элементов в выборке
т.е в моем представлении, дисперсия должна быть близка к размеру выборки
в момент как мы делим на размер выборки получаем почти тот же результат, что если бы мы просто извлекли корень из числителя
вы только не нервничайте, выпейте валерьянки- а вы хам. Продолжайте оставаться в своей дремучей невежественности. И не забудьте повторить математику начиная с 5-го класса.
import random
random.randint(1000000000,999999999)
import random
random.randint(1000000000,999999999)
Traceback (most recent call last):
File "", line 2, in
random.randint(1000000000,999999999)
File "C:\ProgramData\Anaconda3\lib\random.py", line 222, in randint
return self.randrange(a, b+1)
File "C:\ProgramData\Anaconda3\lib\random.py", line 200, in randrange
raise ValueError("empty range for randrange() (%d,%d, %d)" % (istart, istop, width))
ValueError: empty range for randrange() (1000000000,1000000000, 0)
Во первых, именно для вашего случая скорее всего применять бутстреп смысла особого нет. Если вы верите, что данные распределены по нормальному закону или близкому к нему (ну, или по какому другому из известных законов) - считаете среднее по выборке, считаете доверительные интервалы (при выбранном уровне значимости) и делаете соответствующее заключение обо всей генеральной совокупности.
Если у вас какое-то замысловатое распределение, например многомодальное, или седловое, вы не знаете его параметров и/или если у вас очень мало данных для получения достоверного результата - тогда на помощь приходит бутстреп. Вы отловили своих 300 человек и пытаетесь с их помощью смоделировать всю выборку. Берете из них 10000 раз по двести и считаете свой параметр. Потом по полученным 10000 образцов строите распределение этого параметра - а далее его доверительный интервал. Понятно, что это не идеально, но это возможность работать в условиях малых выборок. И понятно, что такой вывод может оказаться точнее, чем вывод по 300 экземплярах.
Но скорее всего именно для среднего значения, при 1000 образцах и генеральной совокупности порядка миллионов - разница от классического подхода будет не существенна.