复杂决策问题的解决方法与应用研究:一种基于相似案例分析的方法
上QQ阅读APP看书,第一时间看更新

2.2 关于案例推理技术(CBR)的研究

案例推理技术(CBR)自被提出之后,得到了许多学者的广泛关注,有关CBR的研究成果可以分为五个方面,即CBR研究的兴起与发展、基于案例推理的决策技术、案例属性选择技术、多策略相似性检索方法、有关CBR应用研究及系统开发。本小节将针对这五个方面分别进行文献综述。

2.2.1 CBR研究的兴起与发展

关于CBR的研究最早可以追溯到美国耶鲁大学的Schank和Abelson在1977年出版的著作Scripts, Plans, Goals, and Understanding: An Inquiry into Human Knowledge Structures,在该著作中,他们提出了用脚本的方法表示知识[27]。之后,在Schank于1983年出版的著作Dynamic Memory: A Theory of Reminding and Learning in Computers and People中可以看到突破性的研究,即他首次提出了CBR理论的认知模型及框架,奠定了CBR研究的理论基础[28]。此后,Schank的学生Kolodner于1983年在动态记忆模型的基础上开发了问答式专家系统CYRUS,这成为后续CBR系统研究的基础[29]。其后,CBR的发展大致经历了三个阶段:简单应用阶段(1984~1993年)、快速发展阶段(1994~2003年)和理论逐步完善阶段(2004年至今)。

(1)简单应用阶段

该阶段出现了一些关于CBR的应用系统,如Mediator[30]、Persuader[31]、CASEY[32]和CHEF[33]等,但研究主要集中在美国地区。此外,中国及其他地区的学者们也开始关注CBR的应用研究,如中国科学院的史忠植教授提出记忆网的案例表示模型等[34]。该阶段针对CBR研究的一些特点主要体现为:案例的检索主要通过采用简单的K近邻算法实现;相对比较简单的推理机制;CBR中除案例检索外的其他环节的完成都需要人的参与。

(2)快速发展阶段

在该阶段,CBR理论和方法研究得到广泛关注,两个以CBR为主题的国际会议的召开便能说明这一点。其一是EWCBR(European Conference/Workshop on Case-Based Reasoning)[35],该会议共召开了9届,先分别于1993年和1994年在德国与法国连续召开了两次,后来逢双数年每两年召开一次;其二是ICCBR(International Conference on Case-Based Reasoning)[36],该会议共召开了8届,首次于1995年在葡萄牙召开,后来逢单数年每两年召开一次。2010年这两个学术会议合并召开,统称为第18届ICCBR[36]。该阶段针对CBR研究的一些特点主要体现为:集中在案例表示和CBR模型上;研究范围扩大到欧洲和亚洲等地区;应用领域日趋扩大,与此同时,数据挖掘等领域的思想和方法在CBR研究中得到应用;不确定性理论在CBR研究中得到应用。

(3)理论逐步完善阶段

该阶段ICCBR、EWCBR、IJCAI(International Joint Conference on Artificial Intelligence)和AAAI(American Association for Artificial Intelligence)等国际学术会议推动了CBR理论体系的日趋完善,该阶段针对CBR研究的一些特点主要表现为:多技术融合,如模糊集和粗糙集等在CBR研究中得到进一步的应用[37],又如人工神经网络、遗传算法、数据挖掘和基于规则的推理等方法与技术和CBR进一步融合[37];开始重视案例库的维护,如案例的增加、删除和修改,它是确保CBR具有自增量学习的重要方式[38];集中于案例数据模型和逻辑框架,如提出了CBR的5R循环模型[39]等。

2.2.2 基于案例推理的决策技术

针对基于案例推理的决策技术的研究引起了学者们的广泛关注,学者们立足于不同的实际决策问题,提出了若干基于CBR的决策方法与技术,举例如下。

高莹和钱建华等(1999)[40]提出了基于CBR的群体决策支持的结构框架和过程框架,并介绍了应用这一成果的优点,同时指出了部分需要进一步发展和研究的问题。

Haque等(2000)[41]提出了在并行工程环境下运用CBR为项目经理或工程师提供新产品开发决策支持方法与技术,并针对运用CBR时涉及的案例收集、案例维护以及修正和检索等问题进行了探讨。

赵卫东等(2000)[42]讨论了在复杂决策背景下的基于CBR的决策问题求解策略,提出了一种不完全信息下的CBR决策支持框架,并将之用于医疗诊断。

徐晓臻和高国安(2001)[43]将CBR用于多准则综合评价中,具体讨论了方案库和评价结果库的建立,并将其用关系数据库的格式进行存储,提出了基于灰色关联理论和模糊集理论相结合的相似度计算方法,从而可以准确地检索到相近案例,对给定方案做出定性或者定量评价。

汪季玉和王金桃(2003)[44]从理论上论证了CBR在危机管理应急决策领域的应用价值,提出了一种基于CBR的应急决策支持系统,并探讨了系统的体系框架和推理机制。

路云等(2005)[45]提出了一种基于CBR的企业经营决策支持模型的设计思想和实现方法。该模型通过对案例库中记忆的源案例企业的经营指标进行相似性搜索,在分析源企业实施的各项决策及实施后收到的经营效果的基础上,对目标企业未来经营策略进行指导。

李锋刚(2007)[46]通过结合CBR、优化理论和决策技术,提出了一种新型的基于优化型CBR的智能决策技术,并探讨了决策案例的表示,决策案例的组织和索引、修正、学习,以及决策案例库的维护,同时构建了相应的决策支持系统。

张英菊等(2009)[47]在分析应急案例特征的基础上,设计了一种基于概念树—突发事件本体模型—事件元模型三层架构的应急案例通用的案例描述与组织方法,并设计及开发了基于CBR的应急辅助决策原型系统。

张贤坤(2012)[48]以不确定情形下基于案例推理的应急决策提供逻辑基础为目标,给出了基于CBR的应急决策方法与技术,并重点研究了突发事件不确定性应急案例知识表示及推理问题。

Amailef和Lu(2013)[49]提出了一个移动应急响应决策支持系统,该系统采用了本体支持的CBR方法与技术,用于支持应急决策者快速、有效地做出应急响应决策。此外,还重点针对数据获取、本体知识库构建、推理等进行设计和探讨。

Pla等(2013)[50]提出了一种名为eXiT∗CBR. v2的分布式CBR医疗诊断决策支持工具,用于为分布环境下考虑协同的医疗诊断提供决策支持。

李鹏等(2015)[51]提出了一种基于案例推理的直觉模糊决策方法,并通过一个城市公共突发事件应对的算例说明了提出方法的可行性。

Gómez-Vallejo等(2016)[52]针对医疗诊断决策系统进行了研究,并提出了一种使用CBR技术的医院真菌感染的分类技术。

2.2.3 案例属性选择技术

属性选择是运用CBR进行类比推理的前提和基础,其通常需要从属性空间选出若干最能表示案例问题的属性,或者找到能充分影响预测或分类结果的属性子集。关于这方面的研究已经引起了学者们的广泛关注,并取得了若干研究成果,其中提出的属性选择方法主要包括基于核属性的属性选择方法、基于分辨矩阵和逻辑运算的属性选择方法、归纳属性选择方法、基于互信息的属性选择方法、基于特征选择的属性选择方法、基于遗传算法的属性选择方法和基于知识信息熵的启发式方法等,举例如下。

李峰刚等(2006)[53]在分析属性约简技术的基础上,研究了基于熵的两种属性选择策略,即信息增益法和增益比率法,并分别从不同角度来考察两种属性选择策略对案例分类性能的影响。

顾东晓(2011)[54]针对医疗诊断案例的属性确定问题,提出了一种基于主成分分析的案例属性选择与优化方法,并通过美国威斯康星州医疗诊断数据进行了方法有效性的说明。

Salamó和López-Sánchez(2011)[55]提出了一种基于粗糙集的特征选择方法,并给出了三种特征选择策略用于案例推理,即均值选择(Mean Selection)、半选择(Half Selection)和阈值选择(Selection by Threshold),并通过实验说明了提出的方法比传统的基于粗糙集的方法更有效。

Lin和Chen(2011)[56]提出了基于人工免疫系统算法(AISCBR: artificial immune system algorithm)的CBR方法,实现了自动改善特征选择及权重分配,并在提出的方法中使用了有益特征子集来提高分类结果的准确度。

Herman等(2013)[57]在针对已有的若干基于互信息的特征选择方法研究的基础上,提出了一种同时考虑特征类独立(class-independent)和类依赖(class-dependent)的基于互信息的特征选择方法,并通过实验表明提出的方法能更有效地进行属性特征的选择。

Abdullah等(2014)[58]指出了特征选择问题是一个NP-难问题,并提出了一种指数蒙特卡洛算法(EMC-FS: Exponential Monte-Carlo algorithm)用于解决该问题。此外,还通过数值实验说明了所提出方法的优势。

Song等(2014)[59]提出了一种潜在语义特征选择方法用于组织文档,该方法能减少资源分配网络(RAN: resource allocating network)的输入规模,并能揭露特征间的潜在语义,能提高系统的分类性能。

Peralta和Soto(2014)[60]提出了一种基于L1-正则嵌入式的特征选择模型,与其他类似模型相比,提出的模型侧重关注特征选择过程中的数据稀疏问题。

廖勇(2016)[61]提出了一种基于案例推理的多属性分类方法,并构建了相应的分类决策支持系统。

2.2.4 多策略相似性检索方法

多策略相似性检索方法,即是否能够检索到一个为当前决策问题提供决策方案的源案例。有关这一方面,许多学者从不同视角进行了研究,并取得了一些研究成果,举例如下。

赵卫东等(2000)[42]提出了一种不完全信息下的案例推理综合检索算法,并讨论了在复杂决策背景下的基于CBR的决策问题求解策略。

Li等(2004)[62]通过将禁忌算法融入案例推理技术中优化了CBR搜索过程。

路云等(2005)[45]针对传统指标搜索中只能对确定性指标搜索的问题,提出了一种新的混合相似性搜索方法,即同时考虑了案例属性值为确定数字、确定符号以及模糊概念属性值等情形,并分别给出了相应的计算方法。

李铌等(2008)[63]为提高基于案例的铁路施工决策支持系统的准确性与科学性,提出了将最近相邻法和归纳索引法相结合进行项目相似度计算的方法。

张英菊等(2009)[47]针对应急案例属性复杂及属性值缺失的问题,提出了基于结构相似度和属性相似度双层结构的案例全局相似度计算方法。

顾东晓等(2009)[64]提出了一种考虑属性值为符号型、清晰数和模糊数三种信息形式的案例检索方法及属性权重优化方法。

Xiong(2011)[65]提出了一种相似度计算模型,该计算模型采用模糊规则去评估目标案例与源案例间的相似性,并通过数值分析说明了所提出的计算模型相比传统相似度计算模型的优势。

靖可等(2011)[66]针对现有研究对案例匹配模式认识和应用的不足,通过分析案例推理决策机理,构建了一种基于效果域匹配的案例推理决策模型。

仲秋雁等(2011)[67]提出了一种改进的案例检索方法,即设计了一种基于结构相似度和属性相似度的双重案例检索算法,有效克服了传统最近邻算法中由于案例属性值缺失而无法进行案例相似性计算的缺陷。

Fan等(2014)[68]提出了一种案例属性值为清晰数、清晰符号、区间数、模糊语言变量和随机变量五种信息形式的案例相似度计算方法,并通过煤矿瓦斯爆炸突发事件应急预案制定的决策分析说明了提出方法的可行性与有效性。

樊治平、李永海等(2015)[69]和李永海(2016)[70]针对项目风险应对策略生成方法进行了研究,在研究中考虑了针对项目和项目风险的相似性检索方法。

2.2.5 有关CBR的应用研究及系统开发

CBR提出之后受到了学者们的广泛关注,典型的应用研究主要包括以下几方面。

一是将CBR应用于医疗诊断方面。例如,杨健等(2008)[71]对运用基于案例推理的信息技术来解决中医诊断信息化过程中的关键问题进行了研究,通过建立系统模型给出了案例提取网及案例提取算法,并构建了基于案例的中医诊疗辅助教学系统;Bruland等(2010)[72]开发了一套集成基于案例推理技术与贝叶斯网络技术的医疗支持系统;顾东晓(2011)[54]针对医院诊疗决策问题,对传统的CBR进行改进和优化,通过融入统计学、模糊数学、灰色系统理论、遗传算法等其他理论,进一步改进CBR性能,以适应各种医院诊疗决策问题的实际需要;徐曼和沈江(2013)[73]为提高医疗辅助诊断系统的检索效率,建立了一种基于贝叶斯学习与CBR的信息融合模型;El-Fakdi等(2014)[74]提出了一种名为eXiTCDSS的基于CBR的医疗辅助决策支持系统,并将其应用于真实的经导管主动脉植入手术的医疗辅助决策中。

二是将CBR应用于突发事件应急决策方面。例如,Ricci等(1999)[75]研究了如何利用基于CBR的技术来制定森林火灾突发事件应急救援方案;Liao等(2012)[76]针对环境污染突发事件应急问题进行了研究,并给出了一种基于CBR的应急方案生成方法;Krupka等(2009)[77]提出了一种针对火灾救援应急服务问题的CBR应急服务模型;张英菊等(2009)[47]给出了一种针对台风突发事件应急决策问题的CBR应急方案生成方法;齐雅兰(2006)[78]在对森林火灾蔓延模型比较分析的基础上,给出了一种基于CBR的森林火灾扑救方案生成方法;Fan等(2014)[68]针对CBR案例检索过程的相似度计算进行了改进,改进后的CBR可用于煤矿瓦斯爆炸突发事件应急预案制定决策中。

三是将CBR应用于财务金融预警方面。例如,李一军等(1997)[79]提出了一种基于CBR的股票投资对象选择方法,该方法实现了模拟人类利用具体知识求解问题和学习新知识的思想,并能对类比结果提供有效的解释;Lee(2008)[80]提出了一种集成规则推理和CBR的审计方法,该方法包含了基于规则的筛选和基于CBR的审计推理阶段,并将其应用于银行内部审计数据分析中;Li等(2009)[81]基于CBR开发了一种财务危机预警方法,并将其与传统的其他方法,如多元分析(multiple discriminate analysis, MDA)、Logit、神经网络(neural networks, NN)、支持向量机(support vector machine, SVM)等进行了对比,说明了所提出方法的实用性和有效性;Li和Sun(2009)[82]提出了一种混合SVM的多CBR财务危机预警方法,并以中国若干公司的实际财务数据进行了方法有效性的验证。

四是其他方面的应用。例如,王君等(2006)[83]在分析基于案例推理技术特点和知识管理咨询系统含义的基础上,提出了基于案例推理的知识管理咨询系统架构;Patterson等(2008)[84]提出了一种名为SOPHIA-TCBR的基于文本的CBR知识发现方法,并通过实例分析验证了所提出方法的有效性;周艳春等(2010)[85]针对关系价值度量问题,提出一种基于差异CBR的方法;Kuo(2010)[86]结合案例推理技术与层次分析法,开发了一套为产品回收再利用提供策略的智能决策支持系统;Yu等(2011)[87]提出了一种基于案例推理智能决策技术的农村新能源利用决策支持系统;Yan等(2017)[88]提出了一种基于CBR的模式分类方法,在该方法中使用了一种基于LPM的相似度计算方法,并通过实验进行了验证。