统计学中的
标准误(SE: Standard Error)
看到就会头脑发昏…
今天猫妮卡用喝咖啡,一次性给你讲清楚区别。
假设你想知道:学生每天平均喝多少杯咖啡?
学校总人数:总共1000个学生
你只随机抽取了 30 个学生,询问他们每天喝咖啡的数量,得到了:
Alice 每天 0 杯
Bob 每天 2 杯
Charlie 每天 7 杯
...
标准差
标准差(Standard Deviation):描述的是数据本身有多分散
标准差每个人喝咖啡杯数平均喝咖啡杯数
如果每个同学喝咖啡的杯数差异大 ,有人喝10杯,有人一杯都不喝 → 标准差大
数据差异小,绝大多数人每天都喝1杯,有少量人不喝,也有少量人喝2杯 → 标准差小
标准误
标准误 描述的是:如果你想知道学生平均喝几杯咖啡,你可能会通过多次抽样计算平均值,每次平均值都不一样
标准误(Standard Error): 描述样本均值的标准差,反映了样本均值围绕总体均值的离散程度。
第一次抽样 30 人 → 平均 2.3 杯
第二次抽样 30 人 → 平均 2.6 杯
第三次抽样 30 人 → 平均 2.1 杯
标准误量化的就是这些平均值波动的程度。不过,我们每一次抽样都会得到一个标准误,并不需要通过多次抽样计算,标准误其实是衡量此次抽样结果的可靠程度。
均值标准误的计算公式: 样本标准差
基于这个公式,我们可以看出标准误受样本标准差和样本数量的共同影响:
人和人差异大 (s 大) → 平均值不稳 → SE 大
抽样人数多 (n 大) → 平均值稳 → SE 小
也就是说,如果标准误很大,有可能是人与人之间差异大,也有可能是我们抽样太少。如果我们想尽可能的提升我们对平均值预估的准确程度,我们需要尽可能多抽样。
猫妮卡总结:
标准差(Standard Deviation)= “学生喝咖啡差异大吗?”
标准误(Standard Error)= “本次抽样的结果是否贴近真实的均值?”
0 条评论