Z 分数怎么算:标准分把任意数值放进同一把尺子
Z 分数也叫标准分,衡量一个值偏离均值几个标准差。本文讲清公式 z 等于 x 减 μ 再除以 σ、它和正态分布百分位的关系,以及用它做排名和异常值检测的真实例子。
Z 分数怎么算:标准分把任意数值放进同一把尺子
期中考 78 分,期末考 85 分,哪次发挥更好?直接比 78 和 85 会把人带偏,因为两张卷子的难度和班级分布不一样。要公平比较,得先把分数放进同一把尺子,这把尺子就是 Z 分数,也叫标准分。
Z 分数到底量的是什么
Z 分数量的是一个值偏离均值几个标准差。它不是分数本身,而是这个值在它所在分布里的相对位置。公式只有一行:
z =(x − μ)/ σ
其中 x 是原始值,μ 是这组数据的均值,σ 是标准差。分子 x − μ 告诉你这个值离均值多远,除以 σ 把这个距离换算成"几个标准差"。符号代表方向,正号在均值上方,负号在下方;大小代表反常程度,绝对值越大越罕见。
因为 Z 分数把原始单位剥掉了,一次考试成绩(z = +1.2)可以直接和一次身高测量(z = −0.4)对比,它们现在都在同一个标准化尺度上。
一个能跟着算的例子
假设某次考试全班均值 μ = 70,标准差 σ = 10,某人考了 85 分。代进公式:
z =(85 − 70)/ 10 = 15 / 10 = 1.5
这个 1.5 的意思是:这名学生比班级均值高出 1.5 个标准差。换算成位置,大约处在第 93 百分位,也就是说成绩超过了班里约 93% 的人。如果你想动手验证整套数据,可以打开 Z 分数计算器,输入 85、70、10,它会同时给出 z 值、左尾右尾双尾概率和百分位,不用再翻 z 表。
Z 分数和百分位的关系
很多人最关心的其实不是 z 这个数,而是"我排在前百分之几"。这就要靠正态分布。当数据近似正态时,每个 z 都对应一个固定的百分位:
- z = 0,正好是均值,第 50 百分位
- z = +1,约第 84 百分位
- z = +1.96,约第 97.5 百分位
- z = −1,约第 16 百分位
百分位就是左尾比例 Φ(z),即正态分布里落在你这个值以下的份额。这里有个常见的坑要提醒:百分位是左尾,不是右尾。z 为 +2 是约第 97.7 百分位,不是第 2.3。如果你要的是"上方有多少比例",看右尾 P(Z > z) 才对。
z = 1.96 之所以总被提到,是因为从 −1.96 到 +1.96 正好盖住正态分布中心的 95%,两侧各留 2.5%,这就是经典 95% 置信区间和双尾 5% 显著性阈值的来历。
用 Z 分数找异常值
Z 分数还有一个很实用的场景:挑异常值。工业上常用的规则是,偏离均值 ±3σ 以外的就当成异常。换算过来,就是 |z| > 3 的数据点。
比如一列螺栓直径,先算出这批的均值和标准差,再给每个读数打 z 分数。任何 |z| > 3 的螺栓都值得挑出来复检,因为在正态分布里这种偏离自然出现的几率只有约 0.27%,出现得太频繁往往说明生产线出了状况。注意一点:如果这一批就是你要管的全部对象,标准差用总体除数 n;如果只是抽样推断更大批次,用样本除数 n − 1。
我自己踩过的一个坑
我第一次用 Z 分数做月度数据对比时,把"百分位"当成了右尾读,结果把一个明明排在前列的指标汇报成了垫底,被组里同事当场指出来。从那以后我养成习惯:算完 z 先确认一句,百分位是均值以下的比例,z 越大百分位越高。这个低级错误现在想起来还脸热,但也正因为如此,我现在做任何标准化对比都会先把方向核一遍。
什么时候不能盲信 Z 分数
百分位映射依赖一个前提:数据近似正态分布。对严重偏态或双峰的数据,z 值照样能算出来,但由 Φ(z) 得到的百分位会误导人。所以拿到一组陌生数据,先看一眼分布形状,确认大致对称、单峰,再去信百分位。如果还要算均值、标准差、方差这些基础量,可以配合 统计基础计算器 一起用,先把分布摸清楚,再决定 Z 分数能不能信。
Z 分数的价值,说到底就是把各种不同尺度的数据拉到同一把尺子上,让"高了多少、罕见到什么程度"变成可以横向比较的语言。公式简单,但用对方向、选对除数、确认分布形状,才能让它真正帮你做对决策。
Made by Toolora · Updated 2026-06-13