小编携手@图灵社区,带上三本大数据领域极受欢迎的热门书籍,用实力凝练的干货内容、案例配合的理解阅读来帮助你更好地学习大数据!
本
期
书
单
《Spark快速大数据分析》
作者:Holden Karau,Andy Konwinski,
Patrick Wendell,Matei Zaharia
译者:王道远
Spark作者及核心成员作品,Spark社区贡献者执笔翻译;
Spark入门第一书。
本书全面介绍Spark核心概念和基本原理,注重Spark用法。教会读者用Python、Java以及Scala的简易API来快速操控大规模数据集,使用简短的代码实现复杂的并行作业,了解从简单的批处理作业到流处理以及机器学习等应用。
购书链接:https://item.jd.com/11782888.html
《Spark高级数据分析(第2版)》
作者:Sandy Ryza,Uri Laserson,
Sean Owen,Josh Wills
译者:龚少成 邱鑫
知名数据公司Cloudera数据科学家联合执笔;
Spark大规模数据分析实战宝典;
新版针对Spark近年来的发展,对样例代码和所使用的资料进行了大量更新。
本书涵盖大规模数据分析中常用算法、数据集和设计模式。自第1版出版后一直位列亚马逊网站大数据分析类图书前茅。升级版在第1版的基础上,针对Spark近年来的发展,对样例代码和所使用的资料进行了大量更新。
新版Spark使用了全新的核心API,MLlib和Spark SQL两个子项目也发生了较大变化,本书为关注Spark发展趋势的读者提供了与时俱进的资料,例如Dataset和DataFrame的使用,以及与DataFrame API高度集成的Spark ML API。
购书链接:https://item.jd.com/12371964.html
《Python数据科学手册》
作者:Jake VanderPlas
译者:陶俊杰、陈小莉
目前图灵最受读者欢迎的数据科学和数据处理好书;
掌握用Scikit-Learn、NumPy等工具高效存储、处理和分析数据;
大量示例+逐步讲解+举一反三,从计算环境配置到机器学习实战,切实解决工作痛点。
本书以IPython、NumPy、Pandas、Matplotlib和Scikit-Learn这5个能完成数据科学大部分工作的基础工具为主,从实战角度出发,讲授如何清洗和可视化数据、如何用数据建立各种统计学或机器学习模型等常见数据科学任务,旨在让各领域与数据处理相关的工作人员具备发现问题、解决问题的能力。
购书链接:https://item.jd.com/12293703.html
如果字段的最大可能长度超过255字节,那么长度值可能…
只能说作者太用心了,优秀
感谢详解
一般干个7-8年(即30岁左右),能做到年入40w-50w;有…
230721