Jupyter数据科学实战
上QQ阅读APP看书,第一时间看更新

第1章 数据科学基本概念

约翰·埃尔德(John Elder)是美国行业经验丰富的大型分析咨询公司Elder Research的创始人。凭借对数据产业的远见卓识,约翰于1995年创办了自己的公司,当时从数据中挖掘信息还是一块充满商机的空白市场,同时也是一项21世纪高阶技能,而如今数据科学(Data Science)已无处不在。

数字时代的爆炸式增长要求专业人士不但要具备很强的技能,而且要具备适应能力和保持技术领先的热情。一项研究表明,对数据科学家及分析师的需求预计将很快超过目前市场的需求总量。据领英网显示,截至2018年8月底,美国存在超过11 000个数据科学家的职位空缺。除非情况有变,数据技能人才的缺口将会持续扩大。在本章中,读者将了解到数据的概念、数据科学家的角色和编程语言Python在数据科学中的重要性。

本章结构

• 数据的概念。

• 数据科学的定义。

• 数据科学家的工作。

• 数据科学应用实例。

• 为何Python适合数据科学?

本章主旨

通过本章的学习,读者能够了解到数据的类型、每天产生的数据量以及在目前已知的应用实例中数据科学家的必要性。