Hadoop数据分析 snb txt 网盘 pdf kindle 2025 lit 下载

Hadoop数据分析电子书下载地址
内容简介:
通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分,第一部分从非常高的层次介绍分布式计算,讨论如何在集群上运行计算;第二部分则重点关注数据科学家应该了解的工具和技术,意在为各种分析和大规模数据管理提供动力。
书籍目录:
前言 ix
第一部分 分布式计算入门
第1章 数据产品时代 2
1.1 什么是数据产品 2
1.2 使用Hadoop构建大规模数据产品 4
1.2.1 利用大型数据集 4
1.2.2 数据产品中的Hadoop 5
1.3 数据科学流水线和Hadoop生态系统 6
1.4 小结 8
第2章 大数据操作系统 9
2.1 基本概念 10
2.2 Hadoop架构 11
2.2.1 Hadoop集群 12
2.2.2 HDFS 14
2.2.3 YARN 15
2.3 使用分布式文件系统 16
2.3.1 基本的文件系统操作 16
2.3.2 HDFS文件权限 18
2.3.3 其他HDFS接口 19
2.4 使用分布式计算 20
2.4.1 MapReduce:函数式编程模型 20
2.4.2 MapReduce:集群上的实现 22
2.4.3 不止一个MapReduce:作业链 27
2.5 向YARN 提交MapReduce 作业 28
2.6 小结 30
第3章 Python 框架和Hadoop Streaming 31
3.1 Hadoop Streaming 32
3.1.1 使用Streaming在CSV 数据上运行计算 34
3.1.2 执行Streaming作业 38
3.2 Python 的MapReduce框架 39
3.2.1 短语计数 42
3.2.2 其他框架 45
3.3 MapReduce进阶 46
3.3.1 combiner 46
3.3.2 partitioner 47
3.3.3 作业链 47
3.4 小结 50
第4章 Spark内存计算 52
4.1 Spark基础 53
4.1.1 Spark栈 54
4.1.2 RDD 55
4.1.3 使用RDD 编程 56
4.2 基于PySpark的交互性Spark 59
4.3 编写Spark应用程序 61
4.4 小结 67
第5章 分布式分析和模式 69
5.1 键计算 70
5.1.1 复合键 71
5.1.2 键空间模式 74
5.1.3 pair与stripe 78
5.2 设计模式 80
5.2.1 概要 81
5.2.2 索引 85
5.2.3 过滤 90
5.3 迈向最后一英里分析 95
5.3.1 模型拟合 96
5.3.2 模型验证 97
5.4 小结 98
第二部分 大数据科学的工作流和工具
第6章 数据挖掘和数据仓 102
6.1 Hive 结构化数据查询 103
6.1.1 Hive 命令行接口(CLI) 103
6.1.2 Hive 查询语言 104
6.1.3 Hive 数据分析 108
6.2 HBase 113
6.2.1 NoSQL 与列式数据库 114
6.2.2 HBase 实时分析 116
6.3 小结 122
第7章 数据采集 123
7.1 使用Sqoop 导入关系数据 124
7.1.1 从MySQL 导入HDFS 124
7.1.2 从MySQL 导入Hive 126
7.1.3 从MySQL 导入HBase 128
7.2 使用Flume 获取流式数据 130
7.2.1 Flume 数据流 130
7.2.2 使用Flume 获取产品印象数据 133
7.3 小结 136
第8章 使用高级API 进行分析 137
8.1 Pig 137
8.1.1 Pig Latin 138
8.1.2 数据类型 142
8.1.3 关系运算符 142
8.1.4 用户定义函数 143
8.1.5 Pig 小结 144
8.2 Spark 高级API 144
8.2.1 Spark SQL 146
8.2.2 DataFrame 148
8.3 小结 153
第9章 机器学习 154
9.1 使用Spark 进行可扩展的机器学习 154
9.1.1 协同过滤 156
9.1.2 分类 161
9.1.3 聚类 163
9.2 小结 166
第10章 总结:分布式数据科学实战 167
10.1 数据产品生命周期 168
10.1.1 数据湖泊 169
10.1.2 数据采集 171
10.1.3 计算数据存储 172
10.2 机器学习生命周期 173
10.3 小结 175
附录A 创建Hadoop 伪分布式开发环境 176
附录B 安装Hadoop 生态系统产品 184
术语表 193
关于作者 211
关于封面 211
作者介绍:
Benjamin Bengfort
数据科学家,目前正在马里兰大学攻读博士学位,方向为机器学习和分布式计算;熟悉自然语言处理、Python数据科学、Hadoop和Spark分析等。
Jenny Kim
经验丰富的大数据工程师,不仅进行商业软件的开发,在学术界也有所建树,在海量数据、机器学习以及生产和研究环境的Hadoop实施方面有深入研究。目前就职于Cloudera的Hue团队。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
书籍介绍
通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分,第一部分从非常高的层次介绍分布式计算,讨论如何在集群上运行计算;第二部分则重点关注数据科学家应该了解的工具和技术,意在为各种分析和大规模数据管理提供动力。
网站评分
书籍多样性:3分
书籍信息完全性:5分
网站更新速度:6分
使用便利性:9分
书籍清晰度:4分
书籍格式兼容性:9分
是否包含广告:3分
加载速度:4分
安全性:6分
稳定性:7分
搜索功能:9分
下载便捷性:8分
下载点评
- 值得下载(551+)
- 无漏页(527+)
- 速度慢(622+)
- 服务好(298+)
- epub(601+)
- 不亏(619+)
- 格式多(420+)
- 实惠(416+)
- 无缺页(462+)
- txt(259+)
- 全格式(278+)
- 盗版少(417+)
- 博大精深(340+)
下载评价
- 网友 常***翠:
哈哈哈哈哈哈
- 网友 师***怀:
好是好,要是能免费下就好了
- 网友 权***波:
收费就是好,还可以多种搜索,实在不行直接留言,24小时没发到你邮箱自动退款的!
- 网友 堵***洁:
好用,支持
- 网友 车***波:
很好,下载出来的内容没有乱码。
- 网友 养***秋:
我是新来的考古学家
- 网友 冷***洁:
不错,用着很方便
- 网友 温***欣:
可以可以可以
- 网友 石***致:
挺实用的,给个赞!希望越来越好,一直支持。
- 网友 曾***玉:
直接选择epub/azw3/mobi就可以了,然后导入微信读书,体验百分百!!!
- 网友 寿***芳:
可以在线转化哦
喜欢"Hadoop数据分析"的人也看了
地火——刘绍棠长篇小说选 刘绍棠 著 snb txt 网盘 pdf kindle 2025 lit 下载
哑舍·叁漫画版1 畅销百万大作《哑舍·叁》同名漫画 哑舍御用绘师晓泊倾情绘制 snb txt 网盘 pdf kindle 2025 lit 下载
职业院校专业教师企业实践培训与考核指南 ——电子信息类专业 snb txt 网盘 pdf kindle 2025 lit 下载
银行业专业实务公司信贷2015银行业专业人员职业资格考试真题分章练习冲刺模拟试卷银行从业资格考试教材辅导2015年 snb txt 网盘 pdf kindle 2025 lit 下载
怎样打气排球 snb txt 网盘 pdf kindle 2025 lit 下载
现货 英文原版 All the Water in the World 世界上所有的水 snb txt 网盘 pdf kindle 2025 lit 下载
袋鼠跳跳的职业体验记绘本系列:小小消防员的一天 (精装绘本)儿童成长行为习惯教养绘本 儿童生活好习惯养成启蒙 早教亲子睡前故 snb txt 网盘 pdf kindle 2025 lit 下载
单味中药疗法-第5版( 货号:753499285) snb txt 网盘 pdf kindle 2025 lit 下载
高压电工基础 snb txt 网盘 pdf kindle 2025 lit 下载
乌龙院:活宝师徒卷2 (平装) snb txt 网盘 pdf kindle 2025 lit 下载
- 现货 英文原版 All the Love on This Island 岛上所有的爱 snb txt 网盘 pdf kindle 2025 lit 下载
- 学生字帖 笔尖上的国学字帖 新一代速干无墨水写凹槽多功能中小学生练字神器古诗词软笔硬笔钢笔毛笔书法30天写出一好字书籍 snb txt 网盘 pdf kindle 2025 lit 下载
- 青少年管乐队训练曲集·基础2(长号/上低音管乐器[低音谱号谱]/大管) snb txt 网盘 pdf kindle 2025 lit 下载
- 抖音同款】 这本书能让你战胜抑郁症治疗书籍走出抑郁心理心理学书籍心理咨询社会健康与生活抗抑郁焦虑症治疗心理疏导非药物疗法M snb txt 网盘 pdf kindle 2025 lit 下载
- 液压传动与气压传动 snb txt 网盘 pdf kindle 2025 lit 下载
- 一、二级注册结构工程师必备规范汇编 snb txt 网盘 pdf kindle 2025 lit 下载
- 2024年春季新版实验班学霸笔记 五年级下册 数学苏教+语文人教 小学生教材同步讲解训练课堂辅导练习题(套装共2册) snb txt 网盘 pdf kindle 2025 lit 下载
- 旅游电子商务教程(“十二五”职业教育国家规划教材 经全国职业教育教材审定委员会审定) snb txt 网盘 pdf kindle 2025 lit 下载
- 基础会计学(第四版)(G)(郑新成) snb txt 网盘 pdf kindle 2025 lit 下载
- 唐代诗人丛考 中华学术精品 傅璇琮 编 中华书局【正版图书】 snb txt 网盘 pdf kindle 2025 lit 下载
书籍真实打分
故事情节:9分
人物塑造:7分
主题深度:5分
文字风格:3分
语言运用:7分
文笔流畅:4分
思想传递:7分
知识深度:8分
知识广度:6分
实用性:8分
章节划分:9分
结构布局:9分
新颖与独特:8分
情感共鸣:8分
引人入胜:7分
现实相关:5分
沉浸感:5分
事实准确性:5分
文化贡献:4分