周末好福利:送你三本大数据热门好书

DBAplus社群 2018-07-23 10:04:51
数据采集、数据分析、数据价值挖掘……数据在企业发展中的核心战略性作用已毋庸置疑,作为与时俱进、挺立于企业软实力发展第一线的ITer,怎能不擅长大数据?

 

小编携手@图灵社区,带上三本大数据领域极受欢迎的热门书籍,用实力凝练的干货内容、案例配合的理解阅读来帮助你更好地学习大数据!

 

 

《Spark快速大数据分析》

作者:Holden Karau,Andy Konwinski,

Patrick Wendell,Matei Zaharia

译者:王道远

 

  • Spark作者及核心成员作品,Spark社区贡献者执笔翻译;

  • Spark入门第一书。

 

本书全面介绍Spark核心概念和基本原理,注重Spark用法。教会读者用Python、Java以及Scala的简易API来快速操控大规模数据集,使用简短的代码实现复杂的并行作业,了解从简单的批处理作业到流处理以及机器学习等应用。

 

购书链接:https://item.jd.com/11782888.html

 

《Spark高级数据分析(第2版)》

作者:Sandy Ryza,Uri Laserson,

Sean Owen,Josh Wills
译者:龚少成 邱鑫

 

  • 知名数据公司Cloudera数据科学家联合执笔;

  • Spark大规模数据分析实战宝典;

  • 新版针对Spark近年来的发展,对样例代码和所使用的资料进行了大量更新。

 

本书涵盖大规模数据分析中常用算法、数据集和设计模式。自第1版出版后一直位列亚马逊网站大数据分析类图书前茅。升级版在第1版的基础上,针对Spark近年来的发展,对样例代码和所使用的资料进行了大量更新。

 

新版Spark使用了全新的核心API,MLlib和Spark SQL两个子项目也发生了较大变化,本书为关注Spark发展趋势的读者提供了与时俱进的资料,例如Dataset和DataFrame的使用,以及与DataFrame API高度集成的Spark ML API。

 

购书链接:https://item.jd.com/12371964.html

 

《Python数据科学手册》

作者:Jake VanderPlas

译者:陶俊杰、陈小莉

 

  • 目前图灵最受读者欢迎的数据科学和数据处理好书;

  • 掌握用Scikit-Learn、NumPy等工具高效存储、处理和分析数据;

  • 大量示例+逐步讲解+举一反三,从计算环境配置到机器学习实战,切实解决工作痛点。

 

本书以IPython、NumPy、Pandas、Matplotlib和Scikit-Learn这5个能完成数据科学大部分工作的基础工具为主,从实战角度出发,讲授如何清洗和可视化数据、如何用数据建立各种统计学或机器学习模型等常见数据科学任务,旨在让各领域与数据处理相关的工作人员具备发现问题、解决问题的能力。

 

购书链接:https://item.jd.com/12293703.html

最新评论
访客 2019年09月18日

请问下为什么不用logstash同步呢?

访客 2019年09月16日

写的太好了,我这就开始学

访客 2019年09月16日

Discretized Streams 就要过时了??

访客 2019年09月07日

写的就跟屎一样

访客 2019年09月01日

没看懂啊,PK的时候,没懂,怎就就从 (1,1)变成了…

活动预告