上QQ阅读APP看书，第一时间看更新

理论篇

第1章数据与商业决策支持

随着企业信息化的普及，企业业务过程数据化，海量的业务数据不断积累，同时电子商务、社交网络、移动互联网等的发展，也推动了数据资源的快速增长。数据可以帮助企业把握未来市场的发展方向，支持企业决策已成为共识。如何对这些数据进行有效的分析与挖掘产生有价值的知识，已被越来越多的企业管理者所重视。本章将介绍数据、大数据、数据管理、决策与商业决策等基本概念，介绍数据分析步骤与常用方法、计算机决策支持方法与技术及其发展，为开展商业智能技术的应用奠定基础。

学习目标

● 了解数据、大数据与数据管理，掌握数据分析基本方法；

● 理解企业为何需要数据管理；

● 熟悉商业决策支持及其技术的发展。

1.1 数据与数据管理

1.1.1 数据

生活、学习、工作中人们一直在与数据打交道，比如生活中商品价格与数量、数学计算题中处理的数字就是传统意义上的数据，它们主要是一些数字符号。伴随着人类使用计算机来辅助处理数据，数据处理领域的数据范围得到了很大的扩展，它包括了声音、图像、文本、表单等传统手段无法处理的数据类型。

数据是指对客观世界的事物进行定性、定量描述的原始资料，包括数字、文字、符号、图形、图像以及声音等形式。客观世界的事物身上会有些什么样的数据呢？比如“人”这个客观事物，描述他（她）时有个属性称为“姓名”，可以取值为张三或李四，这就是数据。管理“人”这个对象时，企业就需要处理姓名这个属性，登记每个人的“姓名”取值。类似还有“出生年月”，描述什么时间出生的，以及性别、职业、婚姻状态、家庭住址等。描述人的主要属性如图1-1所示。

要注意的是，人身上会有很多如图1-1所示的描述属性，每个属性的属性值不同。描述一个人可以用这众多的属性值来加以描述，当然还包括他（她）的爱好、体重、喜欢吃什么食物等。实际管理工作中，并不是说人身上有什么属性都收集过来，而是要有所选择。只有那些在管理工作中有用的属性，才被选择收集处理。比如企业管理工作中每个员工喜欢吃什么零食在管理过程中用不到，那就可以不选择这样的属性。

图1-1 描述人的主要属性

同样道理，其他的客观事物也一样具有多种从不同角度描述的属性，这些属性具有不同的取值。

1.数据与信息

数据和信息是紧密相关的两个概念，但它们又有一定的区别，主要表现在如下几个方面。

（1）信息是加工后的数据

信息是一种经过选择、分析、综合的数据，它使用户可以更清楚地了解正在发生什么事。所以，数据是原材料，信息是产品，信息是数据的含义。

（2）数据和信息是相对的

一些数据对某些人来说是信息，而对另外一些人而言则可能只是数据。例如，在运输管理中，运输单对驾驶人来说是信息，这是因为驾驶人可以从该运输单上知道什么时候要为哪个客户运输什么物品。而对负责经营的管理者来说，运输单只是数据，因为从单张运输单中，他无法知道本月经营情况，他并不能掌握现有可用的驾驶人、运输工具等。

（3）信息是观念上的

因为信息是加工了的数据，所以采用什么模型（或公式）、花多长的信息间隔时间来加工数据以获得信息，这些都受人对客观事物变化规律的认识制约，是由人确定的。因此，信息的作用是揭示数据内在的含义，是观念上的。

医生测量某人的体温，体温计上表示的是数据。只有当医生根据这一数据判断此人已经发烧需要治疗时，体温计上的数据才成为信息。

2.信息与知识

知识来源于信息，是对信息加工后获得的产品。知识是信息的一部分，是人类的第二资源，具有指导与推动人们开发和利用第一资源（物质资源）的作用。

3.数据、信息与知识的联系与区别

Ilkka Tuomi（1999）对知识、信息和数据的层次结构进行了再思考，并提出了相反的层次结构，指出当知识被语法、语义等结构描述后成为新信息，新信息被详细定义的数据结构规范后成为新知识。数据、信息、知识之间的转换过程大致如下：数据→信息→知识→新数据→新信息→新知识。

（1）数据、信息、知识三者的联系

数据、信息、知识三者都是对事实的描述，被统一到了对事实的认识过程中。首先，由于人们认识能力的有限性或者所采用的工具的低级性，导致了数据只是对事实的初步认识，甚至存在错误；然后，借助人的思维或者信息技术对上述数据进行处理，经过处理，人们进一步揭示了事实中事物之间的关系，形成信息；最后，在实践中，经过不断处理和反复验证，事实中事物之间的关系被正确揭示，形成知识。

数据、信息和知识之间不存在绝对的界限，从数据到信息再到知识的过程，是一个数据不断变得有序、不断得到验证，并最终揭示事实之中所存在固有逻辑规律的过程。

（2）数据、信息、知识三者的区别

数据与信息、知识的区别主要在于：数据是原始的、彼此分散孤立的、未被加工处理过的记录，它不能回答特定的问题。知识与信息的区别主要在于它们回答的是不同层次的问题，信息可以由计算机处理而获取，知识不是由计算机创造出来的，而是人在实践中获得的经验。

从数据到信息再到知识，是一个从低级到高级的认识过程，随着层次增高，外延、深度、含义、概念化和价值不断增加。在数据、信息、知识中，低层次是高层次的基础和前提，没有低层次就不可能有高层次，数据是信息的源泉，信息是知识的“子集或基石”。信息是数据与知识的桥梁。知识反映信息的本质。

1.1.2 大数据

随着数据处理技术的发展日新月异，现实世界积累的数据也越来越多，于是出现了大数据的概念。大数据及大数据的处理分析应用已经深入到生活、工作的每一个角落。可以毫不夸张地说，只要有人、有设备存在的地方，数据就在不断积累。这些数据包括网络的发展带来的各种社交网络、搜索网、电商平台等产生的数据，也包括移动互联网、通信网产生的流量数据，还有各种传感器、视频监控设备、车联网、全球定位系统（Global Positioning System, GPS）、地理信息系统（Geographic Information System, GIS）等各种实时数据，以及看病诊断的数据等生活数据，每天不断疯狂地产生数据。海量数据的产生，已经超越了传统的常规数据处理工具捕捉、处理和管理的能力，于是出现了相应的大数据的处理分析工具Hadoop、Spark、Storm等。

1.大数据的特点

大数据具有四大特征，即大量化、多样化、快速化、价值密度低，如图1-2所示。

图1-2 大数据的特征

（1）大量化

从数据存储设备的容量变化就可领略到这些年数据量的迅猛变化。过去所说的一般数据量都是用“MB（兆字节）”来计量的，早期的软盘容量只有1.44MB。后来随着数据量存储需求的不断增长，出现了以“GB”为单位的存储设备，1GB等于1024MB。有了“GB”之后，又出现了以“TB”为单位的存储设备，当前度量硬盘容量多是使用“TB”。随着移动互联网、物联网的发展，数据越来越多样化，各种社交网络不断产生数据，各种传感器源源不断收集数据，数据体量越来越大，需要用“PB”或“EB”等更大的度量单位进行度量。

（2）多样化

大数据的数据来源广泛，因此它的数据格式也多。除了传统的结构化数据，还有Web文本、XML、HTML、图像视频等非结构化的数据。

（3）快速化

快速化是指大数据产生的速度快、影响也快。社会环境里能够快速产生海量的多样化的各式数据，比如遍布城市各个角落的视频监控设备，每时每秒都在产生数据，快速地累积海量数据。

（4）价值密度低

随着很多数据的快速产生，其数据量是很大的，整体而言这些数据的利用价值密度并不高。例如前面提到的视频监控数据，特别是用来做楼宇安全监控的设备，由此产生的海量数据，正常状态下这些数据并没有太大价值，只有在非正常状态下的数据才提供有用的信息，发挥作用，所以说大数据具有价值密度低的显著特点。

2.大数据分析

大数据分析是指对规模巨大的数据进行分析，即在研究海量数据的过程中寻找模式、相关性和其他有用的信息，帮助企业更好地适应变化，并做出更明智的决策。随着大数据时代的来临，大数据的处理、分析与利用就成为时代发展的要求。数据蕴含知识，挖掘利用决胜千里。比如在物流领域，随着智能物流的发展，射频识别（Radio Frequency Identification, RFID）、温度传感器、GPS、GIS等可以随时随地产生物流过程中的温度、地理位置等各式运作数据，这些数据能准确反映物流全程有没有冷链物流，帮助实施全过程的冷链监控管理。再如物流的汽车运输数据，包括每次汽车加油的数量、油质、油耗等各类数据，通过采集器采集、深度分析，利用这些海量的业务运作数据，可以为物流企业如何合理调度车辆、加油决策等提供很好的辅助。而车辆上摄像头的数据在了解整个物流过程中的动态、智能检测驾驶人疲劳度、提高安全性等方面也具有很大价值。

所以，收集类似这样的大数据并加以处理，成为当前各行各业发展中需要挖掘的金矿。充分利用大数据，能帮助企业改善业务过程、优化成本结构、提升运作效率。特别是在激烈竞争的市场环境下，如何洞察商机，先行一步，大数据的分析挖掘必不可少。

大数据的处理分析与传统的数据处理有较大差异，常用的大数据分析处理工具包括Hadoop、Apache Spark、Storm等开源工具，以及Cognos、BO、Microsoft Power BI、Oracle、QlikView、Tableau、RapidMiner、FineBI等商业智能大数据分析处理工具，可以提供查询与报告、联机分析处理、数据挖掘、数据可视化等功能。以下简单介绍前几款开源工具，商业智能大数据分析处理工具将在后续章节介绍。

（1）Hadoop

Hadoop是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。它具有高可靠性、高扩展性、高效性、高容错性。Hadoop带有用Java语言编写的框架，能够很好地运行在Linux生产平台上。Hadoop上的应用程序也可以使用C++等其他语言编写。

（2）Apache Spark

Apache Spark是专为大规模数据处理而设计的快速、通用的计算引擎，现在已经成为一个高速发展且应用广泛的生态系统。Spark是加州大学伯克利分校的AMP实验室（UC Berkeley AMP lab）所开源的类Hadoop MapReduce的通用并行框架，Spark拥有Hadoop MapReduce所具有的优点，但不同于MapReduce的是，Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

（3）Storm

Storm是自由的开源软件，是一个分布式的、容错的实时计算系统。Storm可以非常可靠地处理庞大的数据流，用于处理Hadoop的批量数据。Storm很简单，支持许多种编程语言。Storm可以应用于实时分析、在线机器学习、分布式远程过程调用（Remote Procedure Call, RPC），以及数据抽取、转换和加载（Extraction-Transformation-Loading, ETL）等。

1.1.3 数据管理与分析

从现实世界的客观事物身上，抽取出描述它们的属性，就转变为数据世界的数据。企业业务工作中对这些人和事物进行管理的时候，就需要收集、整理、计算、存储、传递这些数据。

比如在人力资源管理工作中，需要确定员工什么时候退出工作岗位，即做员工退休决策，决策前需要收集每位员工的出生日期这类数据。假设当前时间是2020年12月，作为人力资源管理工作者，收集到所有员工出生日期数据，通过对数据进行简单的计算，看哪些员工满足“2021-出生年=60”，就会产生相关的2021年人员退休信息。这个数据可以支持他的管理决策，一是要通知这些人2021年特定月份办理退休手续；二是这些退休人员空缺的岗位需要招聘新的员工顶替，以上信息有助于制订下一年的招聘计划。这就是数据经过加工，得到了支持管理工作的信息。

举一反三，员工的性别、岗位、职务、入职时间等数据在工作中都需要进行收集、加工处理。在数据世界里建立如表1-1所示的二维关系数据模型。

表1-1 员工二维关系数据模型

（续）

将现实世界里面对客观事物的描述转换到数据世界里面，就是建立数据表，得到各种各样的数据表。因此，管理工作与数据密不可分，数据的管理在信息社会中越来越重要。

1.数据管理与数据分析的定义

数据管理是指利用计算机技术对数据进行的收集、组织、存储、加工、传输、使用等过程。目的是便于从数据中快速经过加工处理得到所需要的信息，利用信息支持行动和决策。实现数据有效管理的关键是数据组织，20世纪70年代后，人们借助计算机数据库管理技术，实现了以往人工数据管理阶段和文件管理阶段无法做到的复杂、大量的数据处理，大大提升了数据处理与检索利用的效率，实现了数据管理技术的质的飞跃。

数据分析是指采取有效的统计、分析方法对收集来的大量数据进行分析，将它们加以汇总和理解并消化，以求最大化地开发数据的功能，发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。

2.企业开展数据管理与分析的必要性

首先，通过数据管理，数据加工整理并被转变为信息的过程，可以及时了解到企业正在发生什么。比如企业这个月销售收入是多少，通过简单的数据分析就可以得到。当收入急剧下降时，也可以通过深入的数据分析找到问题发生的原因。

其次，通过数据管理，产生决策所需信息，支持业务决策。比如通过对比分析，把某个部门跟另外一个部门的业绩进行比较，然后找到产生这个差异的原因是什么。或者某一个区域之间，不同产品销售数据的差异，洞悉为什么会有这种差异，从而影响企业的业务决策。

第三，通过数据分析的预测功能，企业能更好地了解或预测未来会发生什么。在历史数据的基础上，开展对销售收入的预测，预测下一个月收入会是多少。也可以是对销售数量的预测，从而获知原材料应该采购多少，科学地开展采购的决策。

第四，通过数据分析，能够发现业务中存在的问题，找出问题在哪里。用数据来说话，企业能够知道各方面如何去做、如何做得更好。

所以说，科学的数据管理与分析对企业来说非常重要。企业可以通过收集、存储、加工、使用自身所产生的各种各样的数据，开展数据的分析，了解客户、了解自身的现状、管理中的问题，并找到解决问题的办法，以改善业务流程，从而使企业管理决策更科学，成本更节约，效率更高。

1.2 数据分析步骤与方法

1.2.1 数据分析步骤

完整的数据分析流程主要包括以下六个环节：明确主题、数据收集、数据处理、数据分析、数据展现、结论与建议，如图1-3所示。

图1-3 数据分析主要流程

1）明确主题。在进行数据分析之前首先要明确为什么要做数据分析，是要对某个主题发起专项探索，比如销售业绩完成情况分析、营收分析等；还是要开展某项异常数据分析，比如用户流失分析、毛利率异常分析等；或是类似月报、季报的对整体或某项活动的效果分析，比如某项营销方案的最终成效分析、某个主题活动日的经营效果分析等。

2）数据收集。根据分析主题获取所需要的数据，数据获取可以通过连接业务数据库获取业务数据，也可以通过一些基于前端页面的数据采集工具获取，如“八爪鱼”等可视化的数据采集工具；还可以通过编写程序的方式从特定来源获取数据。

3）数据处理。数据处理阶段是数据分析的重要步骤，主要做的工作是数据清洗、数据转换、数据提取、数据计算。数据清洗是指检查数据一致性，处理无效值和缺失值等，利用有关技术（如数理统计、数据挖掘或预定义的清理规则）将脏数据转化为满足数据质量要求的数据，发现并纠正数据文件中可识别的错误。处理数据缺失值的一种方式是根据数据前后的关联关系填充平均值，另一种则是直接选择丢弃该条记录不用于数据分析，两种方式各有优劣，操作中应结合具体问题具体分析。在实际操作中，数据清洗通常会占据分析过程的50%～80%的时间。数据转换是将数据从一种表示形式变为另一种表现形式的过程，比如对数转换、平方根转换、倒数转换等。

4）数据分析。数据分析是指为了获取有用的信息，选择合适的统计分析方法对数据加以汇总、概括、总结的过程，比如选择对比分析、分组分析、结构分析、平均分析、交叉分析、异常分析、关联分析、综合评价分析、杜邦分析、漏斗分析、矩阵关联分析法等具体方法进行分析。

5）数据展现。数据展现也可以称作数据可视化，其展现方式一般有图表、表格和文本。好的可视化设计一定是集易读、突出数据价值、易于分析、美观为一体的，最终让数据变得更加简单，方便交流，反之，不仅让数据变得更复杂，而且还会带来错误诱导。图1-4为房地产销售数据展现的优秀效果。

图1-4 数据展现样例（资料来源：FineBI官网）

6）结论与建议。在企业实际数据分析工作中，如果需要将分析结果共享给同事，则需要形成数据分析报告。数据分析报告作为整个数据分析过程的一个总结与呈现，在报告中不仅要有结论更要有建议，通过结论与建议为决策者提供科学、严谨的决策依据，以降低企业运营风险，提高企业核心竞争力。

1.2.2 数据分析常用方法

常用的数据分析方法有对比分析法、分组分析法、结构分析法、平均分析法、交叉分析法等，如表1-2所示。

表1-2 常用数据分析方法

1.对比分析法

对比分析法也称比较分析法，是最常见的数据分析方法之一。是将两个或两个以上相互联系的指标数据进行比较，分析其变化情况，了解事物的本质特征和发展规律。具体开展对比分析时又可以从时间、空间、标准等方面对比。

● 时间对比法：通过时间周期的数据对比，了解目前数据水平的高低。可以是某个周期的时段与上一个周期的相同时段做同比比较，也可以是某个时段与其上一个时长相等的时段做环比比较。

● 空间对比法：在相同时间范围内与不同空间指标数据进行对比。比如将公司当月的不同地区、不同销售部门等的销售数据进行对比分析，可以了解不同地区、不同部门的业绩情况，从而找到不足、重点突破，提升业绩。

● 标准对比法：将数据与拟定的目标数据或标杆企业同指标数据进行对比，发现差距，了解完成情况等。

2.分组分析法

分组分析法是根据目标数据的性质、特征，按照一定指标，将数据总体划分成几个部分，分析其内部结构和相互关系，从而了解事物的发展规律。分组的目的就是为了便于对比，把总体中具有不同性质的对象区分开，把性质相同的对象合并在一起，保持各组内对象属性的一致性、组与组之间属性的差异性，以便进一步运用各种数据分析方法来揭示内在的数量关系，因此分组法必须与对比法结合运用。

根据指标所代表的数据能不能进行运算，分组分析法分为属性指标分组和数量指标分组。

● 属性指标分组分析法：属性指标所代表的数据不能进行运算，只是说明事物的性质、特征。比如根据性别属性指标值将企业的员工分为男、女两组，进行分组分析。

● 数量指标分组分析法：选择数量指标作为分组依据，将数据总体划分为若干个性质不同的部分，分析数据的分布特征和内部联系。比如根据年龄指标将员工分为35岁以下、35～45岁、45～60岁3组，通过数量上的变化来区分各组的不同类型和性质。

3.结构分析法

结构分析法是反映某个体占总体比重的一种分析方法。结构分析法又称比重分析法，是在分组分析法的基础上，计算总体内各组成部分占总体的比重，进而分析总体数据的内部特征。比如分析不同客户占总体的比重，了解客户结构，分析不同商品占总体比重，了解商品陈列结构。类似的方法，还有矩阵分析法、趋势分析法、漏斗分析法。

4.平均分析法

平均分析法是指运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平的分析方法。它是通过特征数据的平均指标，反映事物目前所处的位置和发展水平。再对不同时期、不同类型单位的平均指标进行对比，说明事物的发展趋势和变化规律。

在数据集合中，所有数据都参与计算得到的平均数称为数值平均数，包括算术平均数、几何平均数等；按照数据的大小顺序或出现的频率，选出一个代表值，称为位置平均数，包括中位数和众数等。

● 算术平均数：是利用平均数指标反映特征数据的一般水平，它分为简单算术平均数和加权算术平均数。简单算术平均数是将数据集合中所有数据之和除以数据个数。加权算术平均数是计算具有不同权重的数据的算术平均数。

● 几何平均数：将数据集合中的n个数据乘积的n次方根称为几何平均数。

● 中位数：将数据集合中所有数据按大小顺序进行排序，如果数据个数为奇数，最中间位置的数据称为该数据集合的中位数，如果数据个数为偶数，那么中间两个数据的算术平均数称为该数据集合的中位数。中位数主要反映的是一组数据的集中趋势。例如：数据集合{2，3，6，8，9，11，13}的中位数为8；数据集合{8，9，12，15，16，18，20，22}的中位数为（15+16）/2=15.5。

● 众数：数据集合中出现次数最多的数据称为该数据集合的众数。众数也就是数据中的一种代表数，它反映的是数据的一种集中程度。如果有多个数值出现次数相同且最多，那么这几个数据都是该数据集合的众数。如果数据集合中所有数据出现次数相等，那么这个数据集合没有众数。例如：数据集合{3，5，6，7，8，8}的众数是8。数据集合{5，5，6，8，9，10，10}的众数是5和10。

5.交叉分析法

交叉分析法又称立体分析法，是在纵向分析法和横向分析法的基础上，从交叉、立体的角度出发，由浅入深、由低级到高级的一种分析方法，也可以称为细分分析。这种方法虽然复杂，但它弥补了“各自为政”分析方法所带来的偏差。

交叉分析的主要作用是细分来自多个维度的数据，并发现最相关的维度，以探索数据更改的原因。把统计分析数据制作成二维交叉表格，将具有一定联系的变量分别设置为行变量和列变量，两个变量在表格中的交叉节点即为变量值，通过表格体现变量之间的关系。比如使用交叉分析分析不同性别职工的收入水平是否有差异。

实际使用中通常把这个概念推广到行变量和列变量之间的关系，这样行变量可能由多个变量组成，列变量也可能由多个变量组成。

1.3 商业决策与计算机决策支持

1.3.1 决策与商业决策

1.决策的概念

决策是决策者为达到某种预定目标，运用科学的理论、方法和手段，从若干备选方案中选择或综合成一个满意合理的方案，并付诸实施的过程。决策的简单定义就是从两个以上的备选方案中选择一个的过程。对于企业的决策过程而言，不管是哪一类问题的决策，一定离不开数据，数据支持决策。

在确定决策问题的时候，首先就需要知道收集什么样的基础数据，来具体细分决策问题，从而了解现状、找出问题。这是开展科学决策的第一步，要尽量避免拍脑袋决策。接下来才是研究运用什么样的数据分析方法，比如对比分析、目标分析，分析现状离目标有多远，然后找到解决问题的办法。

2.商业决策

商业决策是对企业在经营过程中所做出的决策过程的总称，是企业长远发展的根本所在。作为企业经营管理人员，为了改进组织绩效，需要不断做出战略层面、战术层面或是运营层面的决策。战略决策考虑企业总体发展方向和高层次问题，一般由公司高管来做。战术决策是为完成战略目标而由中层管理人员做出。运营决策主要涉及具体企业基层运作事项，由基层管理人员做出。

长期以来，企业的商业决策往往依赖于个人智慧、直觉和经验。管理上的直觉和经验对于实践来说非常重要，是管理艺术。但随着数字时代的到来，思考和决策过程也愈加数字化，科学决策技术与艺术思维的融合不断加速。首先是销售管理系统等电子商务数据日积月累、互联网社交数据爆炸式增长、移动网络数据的快速收集等，产生了难以置信的商务分析基础数据，企业当然希望能够有效利用这些数据改进运营效率、提升利润，以便更好地了解客户，合理定价，改善合作伙伴的关系，提升企业产品市场占有率。其次，计算机技术飞速发展，带来了存储能力、计算能力的迅猛进步，特别是大数据处理技术、云计算、5G等技术的出现，让企业能够解决以前数据处理领域的瓶颈问题。再者，先进的高效处理数据和探索海量数据的优化算法、仿真算法、数据可视化技术的快速进步，导致科学决策技术在商业决策过程中的作用越来越大。因此，计算机决策支持方法与技术不断发展，能够有效服务于企业商业决策。

1.3.2 计算机决策支持方法与技术

计算机是当代发展最为迅速的科学技术之一。计算机最早是用于数值计算，20世纪60年代人们用它来进行数据处理，兴起了电子数据处理系统（Electronic Data Processing System，EDPS）的热潮。电子数据处理系统提高了工作效率，把人们从烦琐的事务处理中解脱出来。但其仅局限于具体信息处理，数据没有共享，不考虑整体或部门情况。于是，通过整体分析、系统设计，支持信息共享、部门协调的管理信息系统（Management Information System, MIS）产生了。但MIS难以适应多变的内外部管理环境，对管理人员决策的帮助十分有限。20世纪80年代，在管理信息系统的基础上，管理科学与运筹学结合，计算机决策支持迅速发展起来，于是就出现了基于数据仓库（Data Warehouse，DW）、联机分析（Online Analytical Processing，OLAP）、数据挖掘技术（Data Mining, DM）的商业智能决策支持。

伴随着计算机的诞生和应用，企业决策支持一直朝着计算机支持的方向快速发展，具体开展决策支持的方法与技术可以归为三大类，如图1-5所示。

图1-5 决策支持方法与技术

一类是传统的数据分析方法，应用适当的统计学相关分析方法对收集的数据进行加工，从手工的数据处理到借助计算机应用类似Excel、SPSS等数据处理工具处理分析数据，获取有用信息形成一些结论，实现决策支持。这种传统数据分析方法的数据处理分析效率较低，对分析者有较高的技术层面的要求。

第二类是基于MIS的数据处理与分析。借助于开发好的数据处理与运作系统，使用者能快速地实现数据查询、数据管理，提供规范的数据报告，高效地支持管理行动。这种方式对分析使用者要求不高，但这种数据处理分析技术受限于固化的模式，不够灵活，难以适应变化的数据分析与处理需求。

第三类就是当前迅速发展的大数据处理分析和商业智能技术，这是适应大数据环境，不断发展壮大的新兴数据处理与分析技术。它主要包括三大技术，即DW、OLAP、DM技术。数据仓库技术是针对日渐庞大的大数据而出现的新技术，支持企业异构数据源的快速集成。数据仓库集成的数据可以来自多种系统，不管是来自文本文件，还是数据库系统，都能很好地通过构建数据仓库的模型来实现。在数据仓库的基础上就可以实现及时、准确、多维的数据观察，深入、灵活、随心所欲地洞察数据，快速得到数据分析的结果。更进一步在海量数据基础上开展数据挖掘，找到隐藏在数据里面的、潜在的、有价值的知识。通过数据挖掘的过程找到的知识，比如数据之间的关联关系，在实际工作中就可以用来支持行动的改变、支持决策。如超市里面，将有关联的商品摆放在一起来促进商品销售；在仓储中，根据挖掘到的可能一起出库的关联商品关系，改进储位的安排，提高出库效率；在营销过程中，把有关联关系的两种商品捆绑起来，改进营销策略，修订营销方案等。这种新的数据处理与分析方法越来越受到企业青睐，发挥更加重要的决策支持作用。

1.3.3 计算机决策支持技术的发展

在数据的基础上，计算机决策支持技术是通过一定的方法、手段，借助计算机技术来快速、高效地产生信息的过程，是商业决策支持的重要发展方向。作为管理者，应该熟悉和了解这些方法，并利用计算机技术提升数据管理的能力，才可能更好地实现科学的管理。

商业计算机决策支持技术的发展大概经历了五个阶段，如图1-6所示。

图1-6 商业计算机决策支持技术的发展

第一阶段：开始使用计算机处理业务阶段。1946年第一台计算机出现之后，人们最开始应用它来处理会计业务数据，对大量数据进行加工处理、快速的计算，帮助业务高效地完成。没有计算机，难以想象上万人的工资计算得耗费多少时间精力。

第二阶段：数据库管理系统阶段。随着计算机技术的发展，出现了规范、成熟的数据库系统来装载数据，随着人机界面技术的发展，普通用户也能很好地操作处理数据，至20世纪70年代，数据库技术逐渐广泛应用。

第三阶段：管理信息系统阶段。到20世纪80年代，管理信息系统已经开始普及。在这个过程中，出现了各种业务应用的管理信息系统，包括管理工作的各个环节，企业里面的库存管理、财务管理、采购管理、销售管理、生产管理等工作，都有专门的管理信息系统来实现决策的支持。

第四阶段：ERP发展阶段。到20世纪90年代，原有的业务分散的管理信息系统在运作过程中出现了数据不一致、信息孤岛等问题，于是出现了企业资源计划（Enterprise Resource Planning, ERP）系统，以便达到统一调配、整合企业各种资源的目的。

第五阶段：商业智能技术发展阶段。为了解决现有系统信息孤岛问题，20世纪90年代出现了一种新的数据集成技术，即数据仓库技术。数据仓库技术解决了多种异构数据源的集成问题，同时又有了OLAP技术，商业智能技术于是在企业逐步得到应用推广。在21世纪初，商用化的商业智能系统工具（像Microsoft Power BI、Tableau、FineBI等）开始出现并逐步发展。这些商业智能工具能够提供快速、敏捷地实现数据仓库构建、商业数据理解与分析、移动端互访等整套方案。它已不单单是一套软件，还涵盖了科学决策的管理思想，成为决策支持领域研究与应用的热点。

纵观商业决策支持技术的发展历程，并不是说一种技术完全取代另外一种技术，数据库技术、管理信息系统等也是在同步不断发展、不断完善，在不同的领域发挥各自的作用。通过这些技术，助力实现决策的科学化。科学决策要求从传统的定性决策向定量决策或者定量与定性相结合发展，商业计算机决策支持技术也就越来越重要。科学决策同时也在向多目标决策发展，比如企业的项目投资决策在注重发展经济效益的同时，也需要承担更多的社会责任，要考虑整体社会效益、环境保护，开展多目标决策。在决策的科学化过程中，需要更科学地快速收集数据、灵活整理数据、多维加以分析、实时可视化，这些正是商业智能技术能够发挥作用的地方。

本章小结

本章主要介绍了什么是数据、信息、知识及三者之间的关系，大数据及大数据分析，企业为什么需要数据管理，数据分析的步骤与常用的数据分析方法，决策与商业决策的概念，计算机决策支持方法与技术及其发展。

本章练习

一、思考题

1.什么是数据，数据与信息之间有什么关系？

2.为何说数据是企业的重要资源？

3.企业为什么需要数据管理？

4.多种数据分析方法在实际分析过程中应如何选取？

5.商业决策支持技术呈现一个什么样的发展态势？

二、讨论题

1.选择具体企业进行调查，了解企业数据管理工作中有哪些难点？

2.如何理解大数据及其商业价值？

三、实训题

有如下某仓储的入库数据表和出库数据表，表中每种物流数据的物料编号是唯一的。要求在Excel中利用函数统计每种材料的现有库存数量。

入库数据表

出库数据表

提示：SUMIF函数的语法是SUMIF（range, criteria, sum_range）。

SUMIF函数的参数如下。第一个参数：range为条件区域，用于条件判断的单元格区域。第二个参数：criteria是求和条件，由数字、逻辑表达式等组成的判定条件。第三个参数：sum_range为实际求和区域，需要求和的单元格、区域或引用。

VLOOKUP函数的语法是VLOOKUP（lookup_value,table_array,col_index_num,range_lookup）。

VLOOKUP函数的参数如下。lookup_value：要查找的值，数值、引用或文本字符串；table_array：要查找的区域，数据表区域；col_index_num，返回数据在查找区域的所在列数，正整数；range_lookup：精确匹配/近似匹配，FALSE（或0）/TRUE（或1或不填）。

四、案例分析

市场副总裁的一次决策过程及其决策支持手段

一位负责公司市场的副总裁运用数据分析对预算和实际销售进行对比后发现一个地区的销售额最近下降了。他试图从具体的数据中寻找确切的原因，但一无所获。他觉得应当彻底搞清这件事，因此发送了一封电子邮件给该地区的销售经理询问下降的具体原因。地区销售经理给他回了电话和电子邮件，说他同样也找不出明显的原因。该副总裁准备深入下去，弄清楚到底是怎么回事。这位副总裁调查了如下可能的原因。

（1）经济状况

通过网络，他查询了银行、经济新闻等，包括目前商业经济方面的公开出版物以及公司关于该地区的内部报告。这些资料表明，该地区并没有出现大的经济衰退。

（2）竞争分析

运用同样的资源，他调查了竞争者是否引入了新产品，或是开展了有效广告攻势，以及是否有新的竞争者进入了该地区市场。

（3）书面销售报告

该副总裁随后浏览了销售代表的报告，以发掘其中的问题。一个基于概念的数据检索系统使他能够快速地查找特定的主题，例如产品质量差、功能不够、产品过时等。

（4）数据挖掘分析

他要求员工对销售数据进行数据分析，以挖掘用户数据库和相关统计数据之间任何未知的关系。

这位副总裁接着访问了市场营销决策支持系统，该系统包含了一系列的模型，可以用来分析各类销售模式，包括产品销售模式、销售代表销售模式和主要客户销售模式。但是同样没有发现问题所在。

因此，他决定召开一个地区销售经理以及主要销售人员的会，通过这次会议，他们检查了之前所有运用信息技术的分析结果，以确认可能的解决方案。

由于并没有一个明显的原因可以解释这次销售额的下降，他们觉得最佳的应对方法就是开展一场新渠道的销售活动。在这场活动中，各个销售代表可以通过他们的笔记本计算机向消费者展示其产品。这位副总裁然后运用财务计划模型对这次销售计划进行了一次重新评估，将这次新的促销计划纳入计划，并将其具体分配给地区销售人员。

他通过视频销售会议布置了这次新的活动，并对销售员工进行了多媒体展示运用的培训。

根据以上案例，分析：

1.案例中决策制定何时开始？何时结束？哪些是关键的决策？

2.案例中应用了哪些支持决策者的信息技术？它们在改进决策制定过程中的效果和效率如何？为更好地解决商业中的问题发挥了哪些作用？

理论篇

第1章 数据与商业决策支持