跳到主要内容

置信区间是什么:95%CI 不是概率,而是方法的命中率

讲清楚置信区间的真实含义,为什么 95% 对应 z=1.96,样本量怎么影响误差幅度,以及在抽样调查和 AB 测试里怎么用,附一个均值区间的实算例子。

发布于 作者 李雷
#统计 #置信区间 #数据分析 #AB测试

置信区间是什么:95%CI 不是概率,而是方法的命中率

我第一次在工作里被人问住,是汇报一个抽样调查结果。我说「真值有 95% 的概率落在这个区间里」,对面做统计的同事摇头。那一刻我才意识到,这句话几乎人人都会说,但它是错的。置信区间不是在描述真值的概率,它在描述你这套抽样方法的命中率。这篇文章把这件事说透,顺带讲清楚 z 值、误差幅度和样本量之间到底是什么关系。

置信区间到底在说什么

先把定义摆正。一个 95% 置信区间的严谨读法是:如果你反复多次重复抽样,每次都用同样的方法算出一个区间,这些区间里大约 95% 会包含那个未知的真实值。

注意主语。真值是固定的,它不会动,要么在你这一个区间里,要么不在,没有「概率」可言。会动的是你的样本,每次抽样得到的区间位置都不一样。所以 95% 是这套程序的属性,不是某一个结果的属性。

举个具体的:样本均值 100,算出 95% 区间 [95.84, 104.16]。正确的说法是「这套方法 95% 的时候是对的」,而不是「真值有 95% 的概率在 95.84 到 104.16 之间」。后者把固定的真值当成了随机变量,这是最常见的误读。

为什么 95% 对应 z = 1.96

很多人背下了 1.96 这个数,却不知道它从哪来。它来自正态分布。

95% 的双侧区间,意味着在正态曲线的两边各留下 2.5% 的尾部。于是你要找的,是让左侧累积面积正好占 97.5% 的那个 z 值。查反正态函数,这个值是 1.95996,大家四舍五入写成 1.96。同理,90% 对应 1.645,99% 对应 2.576。这几个数都是同一套逻辑算出来的,只是尾部留多留少不同。

如果你用的是自定义置信水平,比如 92%,就没有现成的整数好背了,这时候必须现算。好的计算器不查表,而是直接用反正态函数求 z,92% 会精确给出 1.7507。想反过来从单个观测值算它偏离均值几个标准差,可以用 Z 分数计算器,它和这里的临界 z 是同一套正态分布的两面。

误差幅度的公式,和一个实算例子

均值置信区间的完整公式是:

CI = x̄ ± z·(s/√n)

其中 x̄ 是样本均值,s 是标准差,n 是样本量,z 是临界值。中间的 s/√n 叫均值的标准误差,而 z·(s/√n) 整块就是误差幅度,也就是区间从中心往两边各延伸多远。

走一遍真实数字。假设 x̄ = 100,s = 15,n = 50,置信水平 95%:

  • 标准误差 = 15 / √50 = 2.121
  • 误差幅度 = 1.96 × 2.121 = 4.16
  • 区间 = 100 ± 4.16 = [95.84, 104.16]

所以你最后报出去的不是一个光秃秃的 100,而是「均值 100,95% 置信下 ±4.16」。这个区间才是让数字站得住的东西。比例的情况公式换成 p ± z·√(p(1−p)/n),其余道理一样,区间宽度在 p 接近 0.5 时最大。整套运算可以用置信区间计算器直接跑,把上下限对到小数点后第四位,核对手算很方便。

样本量怎么左右误差

公式里那个 √n 是关键。误差幅度和 √n 成反比,这带来一个反直觉的结论:样本量翻四倍,误差才减半。

还是用 s = 15、95% 这组参数:

  • n = 30 时,误差约 5.37
  • n = 120 时,误差约 2.68
  • n = 300 时,误差约 1.70

可以看到从 30 加到 120,数据多了四倍,误差才从 5.37 砍到大约一半。精度是很贵的东西,想把误差再减半,又得四倍数据。这也是为什么收集数据前先估样本量很重要:先定一个能接受的误差上限,反推大概需要多少样本,免得采完才发现区间宽得没法用。

在抽样调查和 AB 测试里怎么用

这两个场景是置信区间最常出场的地方。

抽样调查里,民调那句「支持率 45%,误差 ±3 个百分点」就是比例置信区间。你访了 1000 个人,45% 说支持,工具按比例模式算出误差幅度,报告就从一个单点变成一个带不确定性的区间。这才是负责任的写法。

AB 测试里更要小心。A 版转化率 4.2%,B 版 4.6%,看着 B 赢了。但如果两个版本各自的 95% 区间大面积重叠,这点差距很可能只是抽样波动,不能下结论说 B 更好。先看两组区间是否分得开,再决定要不要放量,能挡掉很多假阳性的「胜利」。

几个容易踩的坑

第一,别再说「真值有 95% 的概率在区间里」。真值固定,是方法 95% 的时候成功,这个区别在严谨场合会被人抓住。

第二,比例要填小数。45% 对应的是 0.45,不是 45。填 45 超出了 0 到 1 的范围,算出来全错。

第三,小样本均值别硬用 z。当 n 小于 30 且你手里只有样本标准差时,z 给出的区间偏窄,该换成尾部更厚的 t 分布,它更谨慎。好的工具会在 n 小于 30 时提醒你这一点。

把这三点记住,再配合上面那套公式,你就能把任何一个均值或比例,从一个孤零零的数字,变成一个经得起追问的区间。


Made by Toolora · Updated 2026-06-13