![不确定性量化及其在集成电路中的应用](https://wfqqreader-1252317822.image.myqcloud.com/cover/104/53287104/b_53287104.jpg)
1.2 不确定性量化学科简介
从前述示例中可以看出,不确定性是航空器设计、石油勘探、地球物理等诸多领域的共性问题。如何从不确定性中寻找规律,已不再是单一学科知识可以解决的问题。虽然可以通过概率知识对不确定性予以度量,通过统计方法对不确定性予以削减,但即使在大数据时代,高昂的采样成本和固有的仪器误差等现实因素依旧存在,因此人们很难从有限的、夹带噪声的数据中获取足够的信息来减少不确定性。
近二十年来,伴随着计算机性能的提升,基于计算仿真模型的研究成果已广泛应用于诸多领域,该方式也逐渐成为研究不确定性的主要方式。国际学术与工程界随之兴起了不确定性量化(uncertainty quantification)这一新型交叉学科,美国学术出版机构贝格(Begell House)于 2011 年首次创办了该领域的专业学术期刊 International Journal for Uncertainty Quantification(《国际不确定性量化期刊》)。不确定性量化涉及的统计方法、随机空间的建模理论也引起了数学这一基础学科的重视。美国国家科学研究委员会(United States National Research Council,NRC)经过长期全面的调研,在 The Mathematical Sciences in 2025(《2025 年的数学科学》)一书中强调,不确定性量化“通过计算机仿真,实现对现实复杂系统的精确建模和状态预测”[5]。为了进一步推动不确定性量化的理论研究和应用推广,美国工业与应用数学学会(Society for Industrial and Applied Mathematics,SIAM)正式成立了不确定性量化委员会,于2013年开创了两年一届的专业学术会议 “SIAM Conference on Uncertainty Quantification”(SIAM 不确定性量化会议),并于同年和美国统计协会(American Statistical Association, ASA)联合创办了学术期刊 SIAMASA Journal on Uncertainty Quantification(《SIAM-ASA 不确定性量化期刊》),发表本领域的前沿理论成果。至今,不确定性量化已成为应用数学领域最重要的研究方向之一。
不确定性作为诸多学科的共性问题,其量化研究具有鲜明的多学科交叉特性。不确定性量化方法的起点和终点是自然科学与工程技术中的实际问题,其解决工具是数学算法,载体是计算仿真软件,因此,“有效的不确定性量化研究需要一支由应用领域专家、数学家、计算机工程师的跨学科团队”[5]。从诞生之日起,不确定性量化的学科交叉性就使它成为最活跃、参与性最广泛的学科之一。该学科首个专业学术期刊 International Journal for Uncertainty Quantification 的编委会由数学、流体力学、集成电路、机械、结构等领域的专家学者组成。SIAM 的专业学术会议——SIAM Conference on Uncertainty Quantification更是每一届都吸引着全球近千名专业人士的参与。不确定性量化涵盖概率、随机过程、贝叶斯分析、微分方程、数值逼近、图论与复杂网络、遍历理论、测度论等多个数学分支的研究。
鉴于不确定性量化的广泛应用及其对国家科技实力、国防安全和经济发展的重大影响,各国政府和世界 500 强企业都非常重视这一学科。美国能源部、国防部高级研究计划局、国家科学基金会、国家核安全管理局都设立了专项经费,通过与高校、实验室成立联合工作组,在环境保护、核材料埋存、电路设计、飞机研发、智能电网等领域开展了富有成效的基础研究。美国石油巨头之一雪佛龙公司为降低油层勘探与开采成本,先后开发了多款不确定性量化工具。欧洲最大的航空发动机企业之一罗尔斯-罗伊斯公司专门成立了不确定性量化办公室,为发动机叶片的优化设计提供更加高效的计算工具。全球十大防务公司之一的英国 BAE 系统公司更是投人了巨资开展理论与方法研究,以期提高后摩尔时代宇航级芯片产品的可靠性。世界银行等国际金融机构也通过量化分析受贷方的各类不确定性因素,综合评估贷款项目的金融风险。
不确定性量化研究在我国也发展迅速。中国科学院数学与系统科学研究院、北京应用物理与计算数学研究所、南方科技大学、上海交通大学、东南大学、同济大学等多所科研院所和高校已陆续建立相关团队。中国工业与应用数学学会于 2016 年正式成立了不确定性量化专业委员会,旨在通过主办国际国内学术会议、暑期学校,组织专题工作组等方式推进基础研究,凝聚、培养本领域的青年后备人才。
在计算仿真中,认知不确定性主要来源于参数、模型和计算 3 个方面。人们对现实世界的认知来源于对物理、生物、化学等现象的观测。随着观测数据的累积,人们可以借助统计、数学等理论工具,建立数学模型来量化描述数据背后的客观规律。但是,这些数据所代表的参数往往具有较强的时空波动性(异质性),需要大量样本才可实现精准量化。受限于采样技术、采样成本、采样精度、数据传递等客观因素,观测数据与真实状态之间不可避免地存在误差,这也使数学模型中的参数呈现出一定的不确定性。同时,由于认知的局限性与个体的差异性,人们对同一个现象可能会有不同的解读和不同的近似简化,这就造成了每个数学模型都存在模型误差;对于同一规律,不同模型也引入了模型选取的不确定性。伴随着科技的进步,人们建立的数学模型愈加完善,观测样本愈加丰富,但是模型复杂度、数据样本量也相应大幅攀升,需要借助计算仿真的手段对现实问题进行预测。但数值计算需要将构建在连续空间上的数学模型离散处理,例如将微分近似为求差,将积分简化为求和。这些在连续空间上的离散处理势必会引入数值误差,而不同的数值格式会进一步加重计算不确定性。上述来自参数、模型和计算的不确定性直接影响着人们对系统状态的预测和决策,如图1.3所示。
![](https://epubservercos.yuewen.com/99D32C/31751363603461806/epubprivate/OEBPS/Images/1-3.jpg?sign=1739334440-lJY4ytz2dW9KacQkx9gVibMFj7vko12B-0-933f2cb6be4de4354ec755a7ceb5bfcc)
图1.3 系统预测中可能的不确定性来源[6]
不确定性量化方法可以概括为概率框架和非概率框架两大体系。本书聚焦概率框架。在此框架下,不确定性变量可建模为随机变量或随机过程,该变量不仅定义于原有的时空间维度
,同样也在概率空间
中变化。包含这些变量的数学模型也可建模为随机系统,而新模型的解(输出)为原系统状态的概率密度函数或累积分布函数等统计信息。相较于经典的随机微分方程,上述不确定性系统的随机输入来源于实际测量数据,反映了一定的时空关联性[7]。因此,基于维纳过程、泊松过程等理想化过程的经典随机分析数学方法并不直接适用于此类随机系统。
参数不确定性的量化及随机系统状态的预测一直是不确定性量化研究的焦点。经过几十年的发展,参数不确定性量化方法发展为非嵌入式(如蒙特卡洛方法等统计类方法)和嵌入式(如统计矩微分方程法、分布法等随机数学类方法)两类。
1. 非嵌入式参数不确定性量化方法
蒙特卡洛方法(Monte Carlo method)是一种常用的非嵌入式参数不确定性量化方法。蒙特卡洛方法根据随机参数的概率分布,产生一组相互独立的随机样本,再通过将随机样本代入原随机系统,对每个样本进行仿真来获得相应结果。随着样本数量的增加,仿真结果的统计信息会逐渐接近真实分布。蒙特卡洛方法相当于独立、重复地求解原数理方程,可利用原有仿真框架开展并行运算,得到了广泛应用,但是其较慢的收敛速度可能引入高昂的计算成本,故多用于均值、方差等低阶统计矩的求解。为了提升收敛速度,人们陆续开发了拉丁超立方采样 [8] 、准蒙特卡洛方法 [9] 、多级蒙特卡洛方法 [10]等扩展方法,但在应用上仍然有一定局限性。
2. 嵌入式参数不确定性量化方法
以下是几种常用的嵌入式不确定性量化方法。
(1)摄动法
摄动法(perturbation method)将随机域在其均值附近进行有限项的泰勒展开,已被广泛应用于自然科学与工程技术领域 [11] 。在使用中,由于高阶项会造成求解系统异常复杂,故多限于二阶泰勒展开。摄动法适用于小尺度的随机扰动问题,且随机输入和输出的总维度通常小于 10 ,以避免放大不确定性。
(2)算子法
算子法(operator-based method)类似于摄动法。它基于原系统数理控制方程的随机算子,包含诺伊曼展开 [12] 和加权积分 [13] ,但无法考虑过高的随机维度,且强烈依赖于控制方程算子,故更适用于静态(低维)不确定性问题。
(3)统计矩微分方程法
统计矩微分方程(moments differential equation)法的核心目标是求解系统状态的均值、方差等统计矩信息 [14] 。通过对原数理方程进行随机平均运算,可推导出系统状态各阶统计矩的控制方程。但是,在推导过程中,低阶统计矩的控制方程往往需要高阶统计矩信息,进而产生闭包问题,需要额外信息或近似假设作为求解条件。统计矩微分方程法通常适用于线性问题。
(4)分布法
分布法(method of distribution)也称 PDF 方法或 CDF 方法,源于统计物理 [15] 和流体力学 [16] 。该方法引入目标系统状态的精细概率密度函数或精细累积分布函数,旨在推导新函数的控制方程,从而求解目标系统状态的概率密度函数(probability density function, PDF)或累积分布函数(cumulative distribution function, CDF),以获取全部统计信息。近年来,随着数值算法框架的改进,分布法可以与统计类方法结合使用,以获取系统状态的概率分布信息 [17-20] ,对随机常微分方程(组)和随机双曲型方程系统具有较好的效果。
(5)广义多项式混沌法
广义多项式混沌(generalized polynomial chaos)法将目标解表现为随机参数的正交多项式展开。此处的 “混沌” 概念不同于动力系统中的混沌现象,最早指代混沌多项式逼近理论,由维纳于1938年首次提出 [1] 。加尼姆(Roger G. Ghanem)和斯帕诺斯(Pol D. Spanos)随后将多项式混沌与有限元方法相结合,将埃尔米特多项式(Hermite polynomial)用于高斯随机过程的正交基函数,开启了该方法在不确定性量化上的应用 [21] 。为了提高多项式混沌在非高斯参数上的收敛速度和近似效果,修东滨(Dongbin Xiu)和卡尼亚达克斯(George Em Karniadakis)对其进行了泛化 [22] ,建立了可处理任意类型随机参数输入的广义多项式混沌法 [23] 。该方法可以通过嵌入或非嵌入的方式实现,被广泛应用于自然科学与工程技术领域。
除了不确定性的正向传播与量化,人们同样关心反问题中的不确定性,希望通过对原正向系统状态的测量,获取系统的输入信息。例如,在新材料研发中,科学家通过电镜测量合金材料中各类元素的扩散距离,从而估测该材料的互扩散系数;在集成电路制造中,晶圆厂通过对测试芯片进行电学特性测量,优化产线配置,从而提高芯片的成品率。由于原正向系统的输出信息和所需求解的输入信息往往不匹配,此类反问题的解通常有多种可能,呈现出一定分布。为此,人们开发了贝叶斯推理、马尔可夫链蒙特卡洛方法、压缩感知、双滤波同化等方法予以解决。
综上所述,不确定性量化研究的目标是提高仿真计算的预测能力,为科学决策提供全面准确的信息。由于现实问题中的不确定性来源众多,随机输入所带来的高维逼近严重加剧了数学模型计算的复杂性,所引发的维数灾难不仅是科学计算的巨大挑战,也是不确定性量化研究的核心难点。随着大数据、神经网络、存算一体等技术的飞速发展,笔者相信不确定性量化研究可有效汲取这些新兴领域的优点,通过与稀疏格点、拟蒙特卡洛方法、敏感性分析与降维等现有方法的结合,共同缓解维数灾难,推动科学计算向着更高、更快、更准的目标前进。