荐书丨推荐三本大数据好书,带你稳站技术风口

dbaplus社群 2019-03-10 11:08:00

码农进阶正当时,时不我待劲争锋。紧跟技术动态是技术人日常,但显然,在数据决定未来的当下,大规模高效地处理数据,紧跟大数据技术潮流变成了大家的不二选择。

 

为帮助大家找到实用顺手的技术方案,小编携手@图灵教育,送上三本大数据好书,为你的数据分析能力助一份力!

 


《Flink基础教程》

作者:埃伦·弗里德曼 , 科斯塔斯·宙马斯

译者:王绍翾

 

  • 凭Flink高效实现容错性实时数据处理;

  • Flink项目核心成员执笔;

  • 阿里巴巴资深技术专家悉心翻译。

 

近年来,流处理变得越来越流行。作为高度创新的开源流处理器,Flink拥有诸多优势,包括容错性、高吞吐、低延迟,以及同时支持流处理和批处理的能力。本文将会介绍Flink的核心设计理念、功能和用途,包括事件时间和处理时间、窗口和水印机制、检查点机制、性能测评,以及Flink如何实现批处理等。

 

购书链接:https://item.jd.com/12425746.html

 

《Spark高级数据分析(第2版)》

作者:[美] 桑迪·里扎 , [美] 于里·莱瑟森 , 

[英] 肖恩·欧文 , [美] 乔希·威尔斯 

译者:龚少成 , 邱鑫

 

  • 涵盖大规模数据分析中常用算法、数据集和设计模式。

 

本书是使用Spark进行大规模数据分析的实战宝典,针对Spark近年来的发展,对样例代码和所使用的资料进行了大量更新。新版Spark使用了全新的核心API,MLlib和Spark SQL两个子项目也发生了较大变化,本书为关注Spark发展趋势的读者提供了与时俱进的资料,例如Dataset和DataFrame的使用,以及与DataFrame API高度集成的Spark ML API。

 

购书链接:https://item.jd.com/12371964.html

 

《Spark机器学习(第2版)》

作者:[印]拉结帝普·杜瓦 , 

[印]曼普利特·辛格·古特拉 ,

 [南非]尼克·彭特里思 

译者:蔡立宇 , 黄章帅 , 周济民

 

  • Spark项目管理委员会成员作品; 

  • 注重技术实践,通过大量实例演示如何创建有用的机器学习系统。

 

本书结合案例研究讲解Spark在机器学习中的应用,并介绍如何从各种公开渠道获取用于机器学习系统的数据。内容涵盖推荐系统、回归、聚类、降维等经典机器学习算法及其实际应用。第2版新增了有关机器学习数学基础以及Spark ML Pipeline API的章节,内容更加系统、全面、与时俱进。

 

购书链接:https://item.jd.com/12461375.html

 

 

欢迎在本文微信订阅号(dbaplus)评论区写下#你觉得当下最火or最实用的大数据技术是什么?为什么?#,小编将从中选出评论点赞数最高的一位,以及评论最精彩的两位读者,送出本期推荐的大数据好书一本,截止时间:下周四(3月14日)中午12:00。

 

注:同一个月里,已获赠者将不可重复拿书。

最新评论
访客 2019年09月18日

请问下为什么不用logstash同步呢?

访客 2019年09月16日

写的太好了,我这就开始学

访客 2019年09月16日

Discretized Streams 就要过时了??

访客 2019年09月07日

写的就跟屎一样

访客 2019年09月01日

没看懂啊,PK的时候,没懂,怎就就从 (1,1)变成了…

活动预告