1.2.1 合理性的概念
在我们的范围内,智能体合理地行动,这意味着合理的智能体应该做正确的事情。基于智能体对环境状态的感知(这可能不是环境的真实状态),一个合理的智能体做出正确的决定或执行正确的动作来响应环境。根据智能体所决定的动作,执行器与环境进行交互,请注意,在实际工程中可能并不是很精确。智能体的人工智能的核心问题是对于这种合理的智能体如何执行正确的动作。
从统计决策理论可知,合理决策应该考虑决策的结果和与决策过程相关联的先验概率。结果可以用性能度量来表示。结果的性能度量可以用不同的方式命名,但为了便于计算,通常首选真实值映射的存在性。由于不确定性,通过引入概率或统计手段,合理的智能体通常会最大化期望的性能。
博弈论:在冯·诺依曼和摩根斯特恩的先驱性探索中,效用被引入作为决策的性能衡量标准。效用函数u通过为每个结果x∈X分配一个效用值u(x)∈R来对性能进行建模。为了对状态的不确定性进行建模,假设状态空间S上的概率分布为p,这就是因冯·诺依曼和摩根斯特恩而闻名的风险决策。这种分布可以通过客观统计或主观认知来获得。基于观测x来表示决策a,从而可得期望效用为
统计估计:在参数估计中,令为θ的估计,损失函数L定义如下,然后取期望E[L]。
●二次损失:L(θ,)=(θ-)2
●绝对值损失:L(θ,)=|θ-|
●截断二次损失:L(θ,)=min{(θ-)2,d2}
类似地,在统计决策中,我们有时使用风险函数来代替损失函数。
数字通信:使用统计中的假设检验设计一个二元数字通信接收器来检测信号“1”或“0”。传输“0”而检测为“1”的代价通常设为1,表示一个错误。相似地,当传输“1”而检测为“0”的代价也设为1,亦表示一个错误。在这种意义上,性能度量就是二元数字通信系统的位错误率(Bit Error Rate,BER)。
请注意,最好根据相应环境的实际需求来设计性能度量指标,而不是根据希望智能体在环境中的行为来设计性能度量指标。