首页 / 科学普及 / 科普知识

科普知识

有一种“不确定”能带来最大的“确定” ——“不确定度”如何让测量更诚实

2026-06-08 科普知识

“ 蒙特卡洛方法的命名灵感源自摩纳哥著名的蒙特卡洛赌场,以在赌场掷骰子游戏中获胜为例，象征着其处理高风险和不确定性的特性。”

一、密封圈引发的全面崩溃

1986年1月28日，美国“挑战者”号航天飞机升空仅73秒后爆炸解体，7名宇航员全部遇难。事后调查揭示，灾难的根源是一个橡胶密封圈在低温下失效。但更深层的原因是：工程师们忽视了密封性能在低温条件下的不确定性——他们用过去的经验代替了严谨的分析。物理学家费曼在调查报告中写下了那句著名的话：“对于一项成功的技术，现实必须凌驾于公关之上，因为自然不可欺骗。”

这场悲剧揭示了一个测量世界的核心真理：任何测量都不是完美的，每个数据背后都藏着一个“不确定”的影子。这个影子不是缺陷，而是自然世界中客观存在的诚实——它就是第四期将主要探讨的：不确定度。

在日常生活中，我们对“不确定”这个词往往带有负面情绪——不确定意味着不可靠、不专业、不值得信任。但在计量学的世界里，不确定度恰恰相反：它是诚实的象征，是科学的底线，是一个测量者对自己最高的要求。一个没有不确定度的测量结果，就像一个人说“我从来不犯错”一样——这很危险。

二、不确定度是谁？

国际计量学词汇表中给出了不确定度的定义：“与测量结果相关联的参数，用于表征合理赋予被测量值的分散性”。这句话听起来很抽象，打个比方就豁然开朗了：如果测量结果是一枚硬币，不确定度就是硬币周围的“光晕”——它告诉你，真实值大概在哪个范围内，而不是精确地指向某一个点。

很多人会把“不确定度”和“误差”混为一谈。误差是测量结果与真实值之间的差距（是个数值），而不确定度则是对这个数值（在数轴上）的分散程度“可能有多大”的判断。是对测量结果可信程度或质量高低的度量‌。‌‌举个例子：你用尺子量一张桌子的长度，读数是1.52米。误差是你的读数与桌子真实长度的差（但你永远不知道真实长度是多少），而不确定度是你对“读数可能分散程度”的合理估计。误差是一个未知的数，而不确定度是一个已知的范围。不确定度是一个非负值。其数值越小，说明测量结果的分散性越小，质量越高，可信度和使用价值也越大；反之，数值越大，则表明结果的可信程度越低。‌‌

更重要的是，不确定度不是失败的标志，而是诚实的宣言。正如计量学家梅尔斯在1919年报告氨蒸气压测量结果时写下的那段著名的话：“我们认为我们报告的值精确到万分之一，我们愿意以同等赔率打赌它精确到五千分之一，如果它的误差超过千分之一，我们准备吃掉仪器、喝掉氨水。”这就是不确定度的精神：敢于对自己的结果负责，敢于说出“我不确定到什么程度”。

三、两位“侦探”——不确定度的两种类型

要评估不确定度，有两种主要形式。（可采用单一类型，也可以两种同时采用）

国际计量学指南（GUM）将它们称为A类评估和B类评估。这两种方法就像两种不同风格的侦探：一个重视实地证据，一个擅长逻辑推理。

A类评估：“实验侦探”

A类评估的口号是“让数据说话”。它通过多次重复测量，用统计学方法计算平均值和标准差。就像一个勤劳的侦探，它不厌其烦地反复勘查现场，收集尽可能多的证据，然后从中归纳出规律。比如，你用同一把尺子量同一张桌子十次，得到十个稍有不同的数字，这些数字的分散程度就是A类不确定度。

A类评估的优势是客观——每个人做同样的实验，得到的不确定度都一样。但它的局限也很明显：有些误差你无法通过重复实验来发现。比如，一把尺子本身就有制造误差，你量一万次也量不出来——因为每次都错在同一个方向、同一个幅度。这种“固定的偏差”叫做系统误差，它是A类评估的盲区。

B类评估：“理论神探”

B类评估的口号是“用知识填补空白”。当你无法反复实验，或者反复实验也无法揭示某些误差时，你需要借助理论、经验和其他人的数据来评估不确定度。它就像一个经验丰富的神探，不需要亲自跑到现场，仅凭线索和逻辑就能推断出结论。

B类评估的例子无处不在。最经典的是四舍五入误差：当你的数字温度计只能显示到整数摄氏度时，真实温度可能在显示值的±0.5℃之间。这个误差服从均匀分布——每个值出现的概率相同。通过纯理论推导，我们可以精确计算出其标准差约为0.29℃。这就是B类评估的魅力——不需要做任何实验，仅凭数学和物理规律就能得出结论。

更复杂的B类评估例子包括：用尼奎斯特定律计算电子器件中的约翰逊噪声（电子热运动产生的噪声电压），用理论公式计算半导体中的散粒噪声（电子随机到达产生的噪声电流），以及利用制造商数据表评估量块的热膨胀系数不确定度。这些评估都不是通过重复实验得到的，而是通过理论推导和外部数据得到的。

值得注意的是，B类评估并非“主观猜测”。它有严格的规则：必须记录所有假设、数据来源和计算过程，确保可追溯、可审计。正如教材中强调的：“可追溯性=可审计性！”如果你的评估无法被其他人检验，那它就不是一个合格的B类评估。

下表对比了两种评估方法的主要差异：

表1：A类与B类不确定度评估对比

四、分布的力量

评估不确定度的关键一步，是选择合适的概率分布来描述误差的分散规律。不同的误差有不同的“性格”，它们的分布形状也各不相同。认识这些分布，就像认识不确定度的“家族成员”。

正态分布

正态分布（又称高斯分布）是不确定度家族中的大明星。它的图形是经典的钟形曲线，中间高两边低，对称而优雅。大自然中，只要某个效果是由大量微小事件累积而成的，它往往就服从正态分布。电子器件中的约翰逊噪声、半导体中的散粒噪声、风吹树叶的沙沙声、雨打屋顶的滴答声——这些看似毫无关联的现象，背后都是正态分布在主导。

正态分布由两个参数完全确定：平均值μ决定中心位置，标准差σ决定分布的宽度。在不确定度分析中，正态分布最常用于描述电子噪声、环境波动、产品质量状态的分散性等场景。

均匀分布

均匀分布是不确定度家族中的“老实人”。它的图形是一个矩形，所有值出现的概率都相同。在缺乏详细信息的情况下，均匀分布是最常用的保守估计——如果你只知道误差的上下限，不知道它在范围内怎样分布，那就假设它均匀分布。四舍五入误差就是最典型的例子：数字温度计显示21℃，真实温度可能在20.5℃到21.5℃之间的任意位置，每个位置的可能性相同。

三角分布

三角分布介于均匀分布和正态分布之间。它同样由上下限定义，但中间值出现的概率更高。当两个相同大小的均匀分布误差叠加时，结果就是三角分布。比如用尺子量物体长度时，两端都要读数，两次四舍五入误差累加后就形成三角分布。换句话说，摆两次骰子的总和的分布就是三角形的。

其他“家族成员”

还有一些较为特殊的分布。弧弦分布（反正弦分布）出现在旋转或振荡系统中，当你随机采样一个正弦波的幅度时，得到的分布就是弧弦形的——两端多中间少，因为正弦波在峰值处停留时间更长。卡方分布则出现在测量方差的分布中，当你想测量噪声功率或噪声幅度时，就会遇到它。还有更多特殊分布，如梯形分布、对数正态分布、柯西分布等，它们各自在特定领域发挥着不可替代的作用。

五、不确定度的“合体术”——如何把多个不确定合并

现实世界的测量很少只有一个误差源。一个看似简单的测量——比如用尺子量桌子的长度——可能同时受到尺子制造误差、读数误差、温度变化引起的热膨胀误差等多种影响。那么，这些不同来源的不确定度如何合并成一个不确定度呢？

方差相加

答案出乎意料之外又在情理之中：方差相加。当两个互不相关的误差同时影响一个测量时，它们的方差（注意，是方差，不是标准差）可以直接相加。这是一个非常美妙的数学结果，也是我们使用标准差和方差作为不确定度度量的根本原因——没有任何其他的分散度量（比如置信区间）拥有这个性质。

换成我们熟悉的语言：标准差按“勾股定理”相加。就像勾股定理中两条直角边的平方和等于斜边的平方，两个不确定度的平方和等于合并后的不确定度的平方。这个规则对于加减法、乘除法、幂律等常见运算都有对应的公式，形成了一套完整的“不确定度传播律”。

这里有一个重要的细节：加法和减法的不确定度合并公式是相同的——减号会消失。这意味着信息的损失，因此我们应该尽可能在计算的最后一步才合并不确定度，而不是每一步都合并。这和四舍五入的道理一样——过早四舍五入，误差会累积。

中心极限定理

当越来越多的误差源叠加在一起时，总误差的分布会越来越接近正态分布——无论每个单独误差服从什么分布。这就是著名的中心极限定理，最早的证明可以追溯到1733年。

最直观的例子是摆骰子：一颗骰子的分布是均匀的，每个面的概率都是1/6，两颗骰子的总和分布变成了三角形，三颗骰子的总和分布就开始变得圆润了。随着骰子数量增加，分布越来越像钟形——这就是中心极限定理在起作用。它解释了为什么自然界中那么多现象都服从正态分布：因为它们都是大量微小随机因素累积的结果。

相关性

前面的讨论都假设不同误差源互不相关。但现实中，误差源之间常常存在相关性。比如，两个用同一台仪器做的测量，仪器的系统误差会同时影响两个结果，产生正相关。而把一根木头锯成两半时，一半偏长则另一半必然偏短，产生负相关。

相关性是一把双刃剑。当两个误差正相关时，它们会“助纽为虐”，让合成不确定度变得更大。但巧妙的是，当两个误差负相关时，它们会“互相抵消”，让合成不确定度变小。最经典的例子是替代测量法：（用同一台电测仪器）先测量一次标准电阻，再测量一次被测电阻，两次测量存在相同的系统误差，求差后误差被大幅消除。这就是相关性“化敌为友”的典范。

教材中用惠斯通电桥的例子生动地展示了这一点：直接测量时，电阻元件的误差可能导致1%的测量误差，但采用替代法后，误差可以降低到万分之一以下。这就是计量的智慧——与其抵制相关性，不如利用相关性。

六、不确定度的“工具箱”——从电子表格到蒙特卡洛

电子表格

在实际工作中，不确定度分析最常用的工具是电子表格。它就像一个整洁的工作台，把所有误差源、标准不确定度、灵敏度系数、自由度等信息整齐地排列在一张表格里，被称为“不确定度预算表”。通过内置函数，可以轻松计算平均值、标准差、覆盖因子等关键参数。

不确定度预算表的每一行代表一个误差源，包括它的物理原因、标准不确定度、分布类型、灵敏度系数、自由度、评估类型（A/B）、误差性质（随机/系统）和备注。最后一行是合成不确定度和有效自由度。它让其他人能清晰地看到你的分析过程和结果。

蒙特卡洛模拟

当测量模复杂、误差分布不对称、系统非线性时，前面的数学公式可能就不够用了。这时候，蒙特卡洛方法登场了。它的思路简单得惊人：用随机数生成器模拟每个输入量的随机波动，代入测量模型计算输出，重复上万次，就能得到输出量的分布、均值和标准差。

蒙特卡洛的强大之处在于它不依赖于线性近似或正态分布假设。当误差分布不对称时，它能正确给出不对称的不确定度区间，当测量模型非线性时，它能揭示线性近似无法捕捉的效应。比如，风速测量的结果是两个水平风速分量的平方和然后再开方，这个非线性运算产生的分布是不对称的瑞利分布，只有蒙特卡洛能准确描述它。

当然，蒙特卡洛也有局限性。它需要大量计算（通常上万次重复），电子表格效率低下且容易出错，专业的编程语言（如Python）是更好的选择。此外，蒙特卡洛只能模拟你已经包含在模型中的误差源，无法揭示你遗漏的因素。它的结果取决于模型的完整性和随机数生成器的质量。

结语：“不确定度”是测量的诚实，也是科学的底线

从挑战者号的悲剧到每天的实验室测量，从电子器件的微小噪声到桥梁建设的巨大误差，不确定度始终如影随形。

在这个数据爆炸的时代，我们每天都在接触各种各样的测量结果：天气预报、体检报告、空气质量指数……理解不确定度，就是掌握了一把解读这些数据的“金钥匙”。下次当你看到一个测量结果时，不妨先问自己：它的不确定度是多少？如果没有不确定度，那这个数字的可信度就值得怀疑。

*本篇部分观点和实例引导来自Metrology Society of Australia (MSA)写给科研和工程领域学生对计量学知识的教材讲义,Metrology Society of Australia (MSA),2023.

在此特别向教材作者Rod White先生致以崇高敬意！

作者：黄楷平北京林电伟业电子技术有限公司、中国仪器仪表学会计量检测技术主题科普教育共建基地

组稿及推荐：中国仪器仪表学会科普工作委员会

科普知识

有一种“不确定”能带来最大的“确定” ——“不确定度”如何让测量更诚实

关注我们

微信公众号

头条号

微信视频号

官方抖音号

官方微博

英文站点