有一种“不确定”能带来最大的“确定” ——“不确定度”如何让测量更诚实

“ 蒙特卡洛方法 的命名灵感源自摩纳哥著名的蒙特卡洛赌场,以在赌场掷骰子游戏中获胜为例,象征着其处理高风险和 不确定性 的特性。”
一、密封圈引发的全面崩溃
1986年1月28日,美国“挑战者”号航天飞机升空仅73秒后爆炸解体,7名宇航员全部遇难。事后调查揭示,灾难的根源是一个橡胶密封圈在低温下失效。但更深层的原因是:工程师们忽视了密封性能在低温条件下的不确定性——他们用过去的经验代替了严谨的分析。物理学家费曼在调查报告中写下了那句著名的话:“对于一项成功的技术,现实必须凌驾于公关之上,因为自然不可欺骗。”
这场悲剧揭示了一个测量世界的核心真理:任何测量都不是完美的,每个数据背后都藏着一个“不确定”的影子。这个影子不是缺陷,而是自然世界中客观存在的诚实——它就是第四期将主要探讨的:不确定度。
在日常生活中,我们对“不确定”这个词往往带有负面情绪——不确定意味着不可靠、不专业、不值得信任。但在计量学的世界里,不确定度恰恰相反:它是诚实的象征,是科学的底线,是一个测量者对自己最高的要求。一个没有不确定度的测量结果,就像一个人说“我从来不犯错”一样——这很危险。

二、不确定度是谁?
国际计量学词汇表中给出了不确定度的定义:“与测量结果相关联的参数,用于表征合理赋予被测量值的分散性”。这句话听起来很抽象,打个比方就豁然开朗了:如果测量结果是一枚硬币,不确定度就是硬币周围的“光晕”——它告诉你,真实值大概在哪个范围内,而不是精确地指向某一个点。
很多人会把“不确定度”和“误差”混为一谈。误差是测量结果与真实值之间的差距(是个数值),而不确定度则是对这个数值(在数轴上)的分散程度“可能有多大”的判断。是对测量结果可信程度或质量高低的度量。举个例子:你用尺子量一张桌子的长度,读数是1.52米。误差是你的读数与桌子真实长度的差(但你永远不知道真实长度是多少),而不确定度是你对“读数可能分散程度”的合理估计。误差是一个未知的数,而不确定度是一个已知的范围。不确定度是一个非负值。其数值越小,说明测量结果的分散性越小,质量越高,可信度和使用价值也越大;反之,数值越大,则表明结果的可信程度越低。
更重要的是,不确定度不是失败的标志,而是诚实的宣言。正如计量学家梅尔斯在1919年报告氨蒸气压测量结果时写下的那段著名的话:“我们认为我们报告的值精确到万分之一,我们愿意以同等赔率打赌它精确到五千分之一,如果它的误差超过千分之一,我们准备吃掉仪器、喝掉氨水。”这就是不确定度的精神:敢于对自己的结果负责,敢于说出“我不确定到什么程度”。

三、两位“侦探”——不确定度的两种类型
要评估不确定度,有两种主要形式。(可采用单一类型,也可以两种同时采用)
国际计量学指南(GUM)将它们称为A类评估和B类评估。这两种方法就像两种不同风格的侦探:一个重视实地证据,一个擅长逻辑推理。
A类评估:“实验侦探”
A类评估的口号是“让数据说话”。它通过多次重复测量,用统计学方法计算平均值和标准差。就像一个勤劳的侦探,它不厌其烦地反复勘查现场,收集尽可能多的证据,然后从中归纳出规律。比如,你用同一把尺子量同一张桌子十次,得到十个稍有不同的数字,这些数字的分散程度就是A类不确定度。
A类评估的优势是客观——每个人做同样的实验,得到的不确定度都一样。但它的局限也很明显:有些误差你无法通过重复实验来发现。比如,一把尺子本身就有制造误差,你量一万次也量不出来——因为每次都错在同一个方向、同一个幅度。这种“固定的偏差”叫做系统误差,它是A类评估的盲区。
B类评估:“理论神探”
B类评估的口号是“用知识填补空白”。当你无法反复实验,或者反复实验也无法揭示某些误差时,你需要借助理论、经验和其他人的数据来评估不确定度。它就像一个经验丰富的神探,不需要亲自跑到现场,仅凭线索和逻辑就能推断出结论。
B类评估的例子无处不在。最经典的是四舍五入误差:当你的数字温度计只能显示到整数摄氏度时,真实温度可能在显示值的±0.5℃之间。这个误差服从均匀分布——每个值出现的概率相同。通过纯理论推导,我们可以精确计算出其标准差约为0.29℃。这就是B类评估的魅力——不需要做任何实验,仅凭数学和物理规律就能得出结论。
更复杂的B类评估例子包括:用尼奎斯特定律计算电子器件中的约翰逊噪声(电子热运动产生的噪声电压),用理论公式计算半导体中的散粒噪声(电子随机到达产生的噪声电流),以及利用制造商数据表评估量块的热膨胀系数不确定度。这些评估都不是通过重复实验得到的,而是通过理论推导和外部数据得到的。
值得注意的是,B类评估并非“主观猜测”。它有严格的规则:必须记录所有假设、数据来源和计算过程,确保可追溯、可审计。正如教材中强调的:“可追溯性=可审计性!”如果你的评估无法被其他人检验,那它就不是一个合格的B类评估。
下表对比了两种评估方法的主要差异:

表1:A类与B类不确定度评估对比
四、分布的力量
评估不确定度的关键一步,是选择合适的概率分布来描述误差的分散规律。不同的误差有不同的“性格”,它们的分布形状也各不相同。认识这些分布,就像认识不确定度的“家族成员”。
正态分布
正态分布(又称高斯分布)是不确定度家族中的大明星。它的图形是经典的钟形曲线,中间高两边低,对称而优雅。大自然中,只要某个效果是由大量微小事件累积而成的,它往往就服从正态分布。电子器件中的约翰逊噪声、半导体中的散粒噪声、风吹树叶的沙沙声、雨打屋顶的滴答声——这些看似毫无关联的现象,背后都是正态分布在主导。
正态分布由两个参数完全确定:平均值μ决定中心位置,标准差σ决定分布的宽度。在不确定度分析中,正态分布最常用于描述电子噪声、环境波动、产品质量状态的分散性等场景。
均匀分布
均匀分布是不确定度家族中的“老实人”。它的图形是一个矩形,所有值出现的概率都相同。在缺乏详细信息的情况下,均匀分布是最常用的保守估计——如果你只知道误差的上下限,不知道它在范围内怎样分布,那就假设它均匀分布。四舍五入误差就是最典型的例子:数字温度计显示21℃,真实温度可能在20.5℃到21.5℃之间的任意位置,每个位置的可能性相同。
三角分布
三角分布介于均匀分布和正态分布之间。它同样由上下限定义,但中间值出现的概率更高。当两个相同大小的均匀分布误差叠加时,结果就是三角分布。比如用尺子量物体长度时,两端都要读数,两次四舍五入误差累加后就形成三角分布。换句话说,摆两次骰子的总和的分布就是三角形的。
其他“家族成员”
还有一些较为特殊的分布。弧弦分布(反正弦分布)出现在旋转或振荡系统中,当你随机采样一个正弦波的幅度时,得到的分布就是弧弦形的——两端多中间少,因为正弦波在峰值处停留时间更长。卡方分布则出现在测量方差的分布中,当你想测量噪声功率或噪声幅度时,就会遇到它。还有更多特殊分布,如梯形分布、对数正态分布、柯西分布等,它们各自在特定领域发挥着不可替代的作用。
五、不确定度的“合体术”——如何把多个不确定合并
现实世界的测量很少只有一个误差源。一个看似简单的测量——比如用尺子量桌子的长度——可能同时受到尺子制造误差、读数误差、温度变化引起的热膨胀误差等多种影响。那么,这些不同来源的不确定度如何合并成一个不确定度呢?
方差相加
答案出乎意料之外又在情理之中:方差相加。当两个互不相关的误差同时影响一个测量时,它们的方差(注意,是方差,不是标准差)可以直接相加。这是一个非常美妙的数学结果,也是我们使用标准差和方差作为不确定度度量的根本原因——没有任何其他的分散度量(比如置信区间)拥有这个性质。
换成我们熟悉的语言:标准差按“勾股定理”相加。就像勾股定理中两条直角边的平方和等于斜边的平方,两个不确定度的平方和等于合并后的不确定度的平方。这个规则对于加减法、乘除法、幂律等常见运算都有对应的公式,形成了一套完整的“不确定度传播律”。
这里有一个重要的细节:加法和减法的不确定度合并公式是相同的——减号会消失。这意味着信息的损失,因此我们应该尽可能在计算的最后一步才合并不确定度,而不是每一步都合并。这和四舍五入的道理一样——过早四舍五入,误差会累积。
中心极限定理
当越来越多的误差源叠加在一起时,总误差的分布会越来越接近正态分布——无论每个单独误差服从什么分布。这就是著名的中心极限定理,最早的证明可以追溯到1733年。
最直观的例子是摆骰子:一颗骰子的分布是均匀的,每个面的概率都是1/6,两颗骰子的总和分布变成了三角形,三颗骰子的总和分布就开始变得圆润了。随着骰子数量增加,分布越来越像钟形——这就是中心极限定理在起作用。它解释了为什么自然界中那么多现象都服从正态分布:因为它们都是大量微小随机因素累积的结果。
相关性
前面的讨论都假设不同误差源互不相关。但现实中,误差源之间常常存在相关性。比如,两个用同一台仪器做的测量,仪器的系统误差会同时影响两个结果,产生正相关。而把一根木头锯成两半时,一半偏长则另一半必然偏短,产生负相关。
相关性是一把双刃剑。当两个误差正相关时,它们会“助纽为虐”,让合成不确定度变得更大。但巧妙的是,当两个误差负相关时,它们会“互相抵消”,让合成不确定度变小。最经典的例子是替代测量法:(用同一台电测仪器)先测量一次标准电阻,再测量一次被测电阻,两次测量存在相同的系统误差,求差后误差被大幅消除。这就是相关性“化敌为友”的典范。
教材中用惠斯通电桥的例子生动地展示了这一点:直接测量时,电阻元件的误差可能导致1%的测量误差,但采用替代法后,误差可以降低到万分之一以下。这就是计量的智慧——与其抵制相关性,不如利用相关性。

六、不确定度的“工具箱”——从电子表格到蒙特卡洛
电子表格
在实际工作中,不确定度分析最常用的工具是电子表格。它就像一个整洁的工作台,把所有误差源、标准不确定度、灵敏度系数、自由度等信息整齐地排列在一张表格里,被称为“不确定度预算表”。通过内置函数,可以轻松计算平均值、标准差、覆盖因子等关键参数。
不确定度预算表的每一行代表一个误差源,包括它的物理原因、标准不确定度、分布类型、灵敏度系数、自由度、评估类型(A/B)、误差性质(随机/系统)和备注。最后一行是合成不确定度和有效自由度。它让其他人能清晰地看到你的分析过程和结果。
蒙特卡洛模拟
当测量模复杂、误差分布不对称、系统非线性时,前面的数学公式可能就不够用了。这时候,蒙特卡洛方法登场了。它的思路简单得惊人:用随机数生成器模拟每个输入量的随机波动,代入测量模型计算输出,重复上万次,就能得到输出量的分布、均值和标准差。
蒙特卡洛的强大之处在于它不依赖于线性近似或正态分布假设。当误差分布不对称时,它能正确给出不对称的不确定度区间,当测量模型非线性时,它能揭示线性近似无法捕捉的效应。比如,风速测量的结果是两个水平风速分量的平方和然后再开方,这个非线性运算产生的分布是不对称的瑞利分布,只有蒙特卡洛能准确描述它。
当然,蒙特卡洛也有局限性。它需要大量计算(通常上万次重复),电子表格效率低下且容易出错,专业的编程语言(如Python)是更好的选择。此外,蒙特卡洛只能模拟你已经包含在模型中的误差源,无法揭示你遗漏的因素。它的结果取决于模型的完整性和随机数生成器的质量。
结语:“不确定度”是测量的诚实,也是科学的底线
从挑战者号的悲剧到每天的实验室测量,从电子器件的微小噪声到桥梁建设的巨大误差,不确定度始终如影随形。
在这个数据爆炸的时代,我们每天都在接触各种各样的测量结果:天气预报、体检报告、空气质量指数……理解不确定度,就是掌握了一把解读这些数据的“金钥匙”。下次当你看到一个测量结果时,不妨先问自己:它的不确定度是多少?如果没有不确定度,那这个数字的可信度就值得怀疑。

*本篇部分观点和实例引导来自Metrology Society of Australia (MSA)写给科研和工程领域学生对计量学知识的教材讲义,Metrology Society of Australia (MSA),2023.
在此特别向教材作者Rod White先生致以崇高敬意!
作者:黄楷平 北京林电伟业电子技术有限公司、中国仪器仪表学会计量检测技术主题科普教育共建基地
组稿及推荐:中国仪器仪表学会科普工作委员会






