置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间。(总体参数最有可能分布在这个区间内)
当总体服从正态分布且σ已知时,或者总体不是正态分布但为大样本时,样本均值μ的抽样分布均为正态分布,其数学期望为总体均值μ,方差为。
对全校中30学生的身高抽样,其平均值为****,那么这个均值能够代表总体的均值吗?(全校学生身高的均值)
如果总体的方差已知为**,且置信水平为95%,那么,此时对应的**值为1.96
这里可以用Z分布的原因,是根据中心极限定理,当样本数≥30时,服从正态分布
从图上理解的话,如果多次对总体的身高进行抽样,每次计算均值并绘制直方图,那么其分布应该如下图。
上边那次30人的抽样结果()应该有95%的可能分布在两个红线之间,所以总体的均值
using Distributions,CairoMakie
CairoMakie.activate!()
let
f=Figure()
Axis(f[1, 1])
d=Normal(0, 1); # 总体均值未知,这里只是画图需要随便设置的mu
x = -5:0.01:5
y = pdf.(d, x)
lines!(x, y)
vlines!([1.96,-1.96],ymax=0.18,color=:red)
current_figure()
end
如果总体服从正态分布,且总体方差σ2未知,则需要用样本方差s2代替σ2,而样本均值经过标准化以后的随机变量则服从自由度为(n-1)的t分布,,根据t分布建立的总体均值μ在1-α置信水平下的置信区间为:
https://www.bilibili.com/video/BV1CA411P7bL
联系客服