《Python大数据处理库PySpark实战》-汪明

《Python大数据处理库PySpark实战》-汪明
内容简介
本书正是一本PySpark入门教材,适合有一定Python基础的读者学习使用。本书分为7章,第1章介绍大数据的基本概念、常用的大数据分析工具;第2章介绍Spark作为大数据处理的特点和算法;第3章介绍Spark实战环境的搭建,涉及Windows和Linux操作系统;第4章介绍如何灵活应用PySpark对数据进行操作;第5章介绍PySpark ETL处理,涉及PySpark读取数据、对数据进行统计分析等数据处理相关内容;第6章介绍PySpark如何利用MLlib库进行分布式机器学习(Titanic幸存者预测);第7章介绍一个PySpark和Kafka结合的实时项目。
下载地址
宝阳读书网 style= 此处内容已经被作者隐藏,请输入验证码查看内容
验证码:
请关注本站微信公众号,回复“验证码”,获取验证码。在微信里搜索“ BoyangLee李宝阳”或者“ boyanglee2022”或者微信扫描右侧二维码都可以关注本站微信公众号。
详情页vip购买

免责声明: 本站所有资源搜集于互联网,所提供下载链接也是站外链接,网站本身不存储任何相关资源文件, 如资源下载链接侵犯到版权方,请发送邮件到1401211620@qq.com,站长核实后会第一时间移除,谢谢!

二维码

联系管理员

在线咨询: 点击这里给我发消息

邮箱:1401211620@qq.com