{{sellerTotalView > 1 ? __("sellers", {number: sellerTotalView}) : __("seller", {number: sellerTotalView}) }}, {{numTotalView > 1 ? __("items", {number: numTotalView}) : __("item", {number: numTotalView}) }}
免运费
Yami

Nickname

请告诉我们怎么更好地称呼你

更新你的名字
账户 订单 收藏
{{ inviteNavTitle }}
退出登录

切换配送区域

不同区域的库存和配送时效可能存在差异.

历史邮编

{{email ? __('Got it!') : __('Restock Alert')}}

我们将在商品到货后第一时间通知你。

取消
Yami

京东图书

Apache Spark源码剖析

{{buttonTypePin == 3 ? __("Scan to view more PinGo") : __("Scan to start")}}

Apache Spark源码剖析

{{__(":people-members", {'people': item.limit_people_count})}} {{ itemCurrency }}{{ item.valid_price }} {{ itemCurrency }}{{ item.invalid_price }} {{ itemDiscount }}
后结束
{{ itemCurrency }}{{ item.valid_price }}
{{ itemCurrency }}{{ priceFormat(item.valid_price / item.bundle_specification) }}/{{ item.unit }}
{{ itemDiscount }}
{{ itemCurrency }}{{ item.valid_price }} {{ itemCurrency }}{{ priceFormat(item.valid_price / item.bundle_specification) }}/{{ item.unit }} {{ itemCurrency }}{{ item.invalid_price }} {{itemDiscount}}
{{ itemCurrency }}{{ item.valid_price }}
后结束促销
后开始秒杀 后结束秒杀
{{ getSeckillDesc(item.seckill_data) }}
{{ __( "Pay with Gift Card to get sale price: :itemCurrency:price", { 'itemCurrency' : itemCurrency, 'price' : (item.giftcard_price ? priceFormat(item.giftcard_price) : '0.00') } ) }} ({{ itemCurrency }}{{ priceFormat(item.giftcard_price / item.bundle_specification) }}/{{ item.unit }}) 详情
商品有效期

已下架

当前地址无法配送
已售完

商品描述

展开全部描述
编辑推荐

Spark Contributor,Databricks工程师连城,华为大数据平台开发部部长陈亮,网易杭州研究院副院长汪源,TalkingData首席数据科学家张夏天联袂力荐
1.《Apache Spark源码剖析》全面、系统地介绍了Spark源码,深入浅出,细致入微
2.提供给读者一系列分析源码的实用技巧,并给出一个合理的阅读顺序
3.始终抓住资源分配、消息传递、容错处理等基本问题,抽丝拨茧
4.一步步寻找答案,所有问题迎刃而解,使读者知其然更知其所以然

内容简介

《Apache Spark源码剖析》以Spark 1.02版本源码为切入点,着力于探寻Spark所要解决的主要问题及其解决办法,通过一系列精心设计的小实验来分析每一步背后的处理逻辑。
《Apache Spark源码剖析》第3~5章详细介绍了Spark Core中作业的提交与执行,对容错处理也进行了详细分析,有助读者深刻把握Spark实现机理。第6~9章对Spark Lib库进行了初步的探索。在对源码有了一定的分析之后,读者可尽快掌握Spark技术。
作者简介

许鹏,长期致力于电信领域和互联网的软件研发,在数据处理方面积累了大量经验,对系统的可扩展性、可靠性方面进行过深入学习和研究。因此,累积了大量的源码阅读和分析的技巧与方法。目前在杭州同盾科技担任大数据平台架构师一职。对于Linux内核,作者也曾进行过深入的分析。
精彩书评

★与Hadoop、Hive、Storm等老牌大数据系统相比,Spark的代码体积要小得多。然而这样一套精简的系统却同时承载了批处理、流处理、迭代计算、关系查询、图计算等多种计算范式,再加上Scala和函数式编程并不为普通程序员所熟悉,阅读和分析Spark源码并不是一件特别轻松的事情。本书记录了一系列分析Spark源码的实用技巧,并给出了一个合理的阅读顺序,相信可以令学习Spark的读者们事半功倍。
——Spark Contributor,Databricks工程师连城

★介绍Spark的书籍很多,但一般不够全面,而这本书非常系统全面地介绍了Spark源码,深入浅出、细致入微,把Spark的由来、Spark整体框架、Spark各软件栈、Spark环境搭建、Spark部署模式等从源码角度一步步剖析得非常清楚。作者有很强的系统设计、软件工程功底,读者不仅可以从书中学到Spark知识,还可以学习到作者对新技术研究、源码研究很多好的方法和技巧。授人以鱼不如授人以渔,对在校大学生、Spark初学者、大数据开发工程师来说,这本书非常值得拥有。
——华为大数据平台开发部部长陈亮

★难以置信,薄薄的一本书可以兼具如此的广度与深度。除了Spark核心系统,本书还介绍了Streaming、SQL、GraphX、MLLib等扩展库,内容相当全面。但更“赞”的是本书对Spark及各扩展库的运行机理,无不提纲挈领,一一阐明,让读者不但知其然,还能知其所以然。如果想在生产环境中用好Spark,本书值得细读。
——网易杭州研究院副院长汪源

★Spark目前正在蓬勃发展,越来越多的公司把大数据计算任务迁移到Spark平台上来。Spark开发的学习曲线并不陡峭。但是处理大数据,需要的不仅是逻辑正确的程序,还需要高性能的程序。如果想把Spark的性能挖掘到极致,那就需要深入了解Spark的设计思想和运行机制,而要了解这些,没有比读源代码更直接的了。许鹏老师的这本书,对于那些没有时间、精力直接啃源代码或者对Scala语言还不太精通的读者来说是一个福音。
——TalkingData首席数据科学家张夏天
目录

第一部分 Spark概述
第1章 初识Spark
1.1 大数据和Spark
1.1.1 大数据的由来
1.1.2 大数据的分析
1.1.3 Hadoop
1.1.4 Spark简介
1.2 与Spark的第一次亲密接触
1.2.1 环境准备
1.2.2 下载安装Spark
1.2.3 Spark下的WordCount

第二部分 Spark核心概念
第2章 Spark整体框架
2.1 编程模型
2.1.1 RDD
2.1.2 Operation
2.2 运行框架
2.2.1 作业提交
2.2.2 集群的节点构成
2.2.3 容错处理
2.2.4 为什么是Scala
2.3 源码阅读环境准备
2.3.1 源码下载及编译
2.3.2 源码目录结构
2.3.3 源码阅读工具
2.3.4 本章小结
第3章 SparkContext初始化
3.1 spark-shell
3.2 SparkContext的初始化综述
3.3 Spark Repl综述
3.3.1 Scala Repl执行过程
3.3.2 Spark Repl
第4章 Spark作业提交
4.1 作业提交
4.2 作业执行
4.2.1 依赖性分析及Stage划分
4.2.2 Actor Model和Akka
4.2.3 任务的创建和分发
4.2.4 任务执行
4.2.5 Checkpoint和Cache
4.2.6 WebUI和Metrics
4.3 存储机制
4.3.1 Shuffle结果的写入和读取
4.3.2 Memory Store
4.3.3 存储子模块启动过程分析
4.3.4 数据写入过程分析
4.3.5 数据读取过程分析
4.3.6 TachyonStore
第5章 部署方式分析
5.1 部署模型
5.2 单机模式local
5.3 伪集群部署local-cluster
5.4 原生集群Standalone Cluster
5.4.1 启动Master
5.4.2 启动Worker
5.4.3 运行spark-shell
5.4.4 容错性分析
5.5 Spark On YARN
5.5.1 YARN的编程模型
5.5.2 YARN中的作业提交
5.5.3 Spark On YARN实现详解
5.5.4 SparkPi on YARN

第三部分 Spark Lib
第6章 Spark Streaming
6.1 Spark Streaming整体架构
6.1.1 DStream
6.1.2 编程接口
6.1.3 Streaming WordCount
6.2 Spark Streaming执行过程
6.2.1 StreamingContext初始化过程
6.2.2 数据接收
6.2.3 数据处理
6.2.4 BlockRDD
6.3 窗口操作
6.4 容错性分析
6.5 Spark Streaming vs. Storm
6.5.1 Storm简介
6.5.2 Storm和Spark Streaming对比
6.6 应用举例
6.6.1 搭建Kafka Cluster
6.6.2 KafkaWordCount
第7章 SQL
7.1 SQL语句的通用执行过程分析
7.2 SQL On Spark的实现分析
7.2.1 SqlParser
7.2.2 Analyzer
7.2.3 Optimizer
7.2.4 SparkPlan
7.3 Parquet 文件和JSON数据集
7.4 Hive简介
7.4.1 Hive 架构
7.4.2 HiveQL On MapReduce执行过程分析
7.5 HiveQL On Spark详解
7.5.1 Hive On Spark环境搭建
7.5.2 编译支持Hadoop 2.x的Spark
7.5.3 运行Hive On Spark测试用例
第8章 GraphX
8.1 GraphX简介
8.1.1 主要特点
8.1.2 版本演化
8.1.3 应用场景
8.2 分布式图计算处理技术介绍
8.2.1 属性图
8.2.2 图数据的存储与分割
8.3 Pregel计算模型
8.3.1 BSP
8.3.2 像顶点一样思考
8.4 GraphX图计算框架实现分析
8.4.1 基本概念
8.4.2 图的加载与构建
8.4.3 图数据存储与分割
8.4.4 操作接口
8.4.5 Pregel在GraphX中的源码实现
8.5 PageRank
8.5.1 什么是PageRank
8.5.2 PageRank核心思想
第9章 MLLib
9.1 线性回归
9.1.1 数据和估计
9.1.2 线性回归参数求解方法
9.1.3 正则化
9.2 线性回归的代码实现
9.2.1 简单示例
9.2.2 入口函数train
9.2.3 最优化算法optimizer
9.2.4 权重更新update
9.2.5 结果预测predict
9.3 分类算法
9.3.1 逻辑回归
9.3.2 支持向量机
9.4 拟牛顿法
9.4.1 数学原理
9.4.2 代码实现
9.5 MLLib与其他应用模块间的整合

第四部分 附录
附录A Spark源码调试
附录B 源码阅读技巧
前言/序言

笔者接触Spark时间不算很长,而本书之所以能够出版,凭借的是浓厚的兴趣和执着之心。
这一切还要从Storm说起。笔者一直在做互联网相关工作,但接触大数据的时间并不长,当时Hadoop和Storm等非常红火,引起了笔者的“窥视”之心。从2013年开始,笔者打算看看Hadoop的源码实现,观察其代码规模,发觉所花时间可能会很长。恰好其时Storm风头正劲,于是转向Storm源码,0.8版的Storm代码规模不过20 000行左右,感觉还是比较好入手的。
Storm源码分析期间,笔者还学习了Clojure、ZeroMQ、Thrift、ZooKeeper、LMAX Disruptor等新技术,对于实时流数据处理算是有了一个大概的了解。由于听说在实时流数据处理领域Spark技术也很强悍,而且在容错性方面具有天生的优势,更引发了笔者的兴趣,为了弄清楚究竟,于是开始了Spark的源码走读过程。
笔者是以读Spark论文开始的,说老实话觉得晦涩难懂,因为无法将其映射到内存使用、进
程启动、线程运行、消息传递等基本问题上。或许换个方法会更好,故笔者选择直接从源码入手,如此一来事情反而变简单了。在源码分析的过程中,笔者始终抓住资源分配、消息传递、容错处理等基本问题设问,然后一步步努力寻找答案,所有的问题渐渐迎刃而解。
笔者关于源码分析有一个心得,就是要紧紧把握住计算的基本模型,然后结合新分析问题
的业务领域,将业务上的新问题转换到计算处理的老套路上来,然后就可以以不变应万变,而不被一些新技术名词晃花了眼。这里所说的老套路是指从操作系统的角度来看,如果能事先深度了解操作系统,将对分析一些新应用程序大有裨益。
Spark源码采用Scala语言编写,那么阅读Spark源码之前,是否一定要先学Scala呢?笔者个人以为不必,只要你有一些Java或C++编程语言的基础,就可以开始看Spark源码,遇到不懂的地方再去学习,效率反而会大大提高,做到有的放矢。将学习中遇到的知识点,从函数式编程、泛型编程、面向对象、并行编程等几个方面去整理归纳,这样能够快速将Scala语言的框架勾勒出来。
本书第1章和第2章简要介绍了大数据分析技术的产生背景和演进过程;第3~5章详细分析了Spark Core中的作业规划、提交及任务执行等内容,对于要深刻把握Spark实现机理的读者来说,这几章值得反复阅读;第6~9章就Spark提供的高级Lib库进行了简要的分析,分析的思路是解决的主要问题是什么、解决的方案是如何产生的,以及方案是如何通过代码来具体实现的。
在对源码有了一定的分析和掌握之后,再回过头来看一下Spark相关的论文,这时候对论文的理解可能会更顺畅。
Spark的整体框架非常庞大,涵盖的范围也很广,随着笔者在工作中使用得越来越具体,这样的感受也越来越深。另外,必须要说对于Spark来说,笔者所做的分析实在有限,个中错误在所难免,读者诸君还请多多谅解。
在本书成稿期间,电子工业出版社的付睿编辑和李云静编辑给出了极为详细的改进意见,在这里表示衷心的感谢。最后感谢家人的支持和鼓励,亲爱的老婆和懂事的儿子给了笔者坚持的理由和勇气。
许鹏
2015年2月

规格参数

品牌 京东图书
品牌属地 中国
ISBN 9787121254208
著者 许鹏
出版社 电子工业出版社
用纸 胶版纸
包装 平装
出版时间 2015-03-01
页数 304
语言 中文
版次 1

免责声明

产品价格、包装、规格等信息如有调整,恕不另行通知。我们尽量做到及时更新产品信息,但请以收到实物为准。使用产品前,请始终阅读产品随附的标签、警告及说明。

查看详情
加入收藏
{{ $isZh ? coupon.coupon_name_sub : coupon.coupon_ename_sub | formatCurrency }}
{{__("Buy Directly")}} {{ itemCurrency }}{{ item.directly_price }}
数量
{{ quantity }}
{{ instockMsg }}
{{ limitText }}
{{buttonTypePin == 3 ? __("Scan to view more PinGo") : __("Scan to start")}}
由 京东图书 销售
送至
{{ __("Ship to United States only") }}
满$69免运费
正品保证

已加入购物车

继续逛逛

为你推荐

{{ item.brand_name }}

{{ item.item_name }}

{{ item.currency }}{{ item.market_price }}

{{ item.currency }}{{ item.unit_price }}

{{ item.currency }}{{ item.unit_price }}

优惠券

{{ coupon.coupon_name_new | formatCurrency }}
领取 已领取 已领完
{{ getCouponDescStr(coupon) }}
{{ coupon.use_time_desc }}
即将过期: {{ formatTime(coupon.use_end_time) }}

分享给好友

取消

亚米礼卡专享价

使用礼卡支付即可获得礼卡专享价

规则说明

礼卡专享价是部分商品拥有的特殊优惠价格;

购买礼卡专享价商品时,若在结算时使用电子礼卡抵扣支付,且礼卡余额足够支付订单中所有礼卡专享价商品的专享价总和,则可以启用礼卡专享价;

不使用礼卡支付,或礼卡余额不满足上一条所述要求时,将无法启用礼卡专享价,按照普通售价计算,但您仍然可以购买这些商品;

在购买礼卡专享价商品时,若余额不足,可以在购物车或结算页中点击“充值”按钮对礼卡进行购买和充值;

商品若拥有礼卡专享价,会显示“专享”的特殊价格标记;

如有疑问,请随时联系客服;

礼卡专享价相关规则最终解释权归亚米所有。

由 亚米 销售

服务保障

Yami 满$49免运费
Yami 无忧退换
Yami 从美国发货

配送信息

  • 美国

    标准配送 $5.99(不包含阿拉斯加,夏威夷),最终价满$49免运费

    本地配送$5.99(加州,纽约州,新泽西,麻省和宾夕法尼亚,以上州部分地区);最终价满$49免运费

    两日达(包含阿拉斯加夏威夷)运费$19.99起

退换政策

亚米网希望为我们的客户提供最优秀的售后服务,让所有人都能放心在亚米购物。亚米自营商品在满足退换货条件的情况下,可在收到包裹的30天之内退换商品(食品因商品质量问题7天内可退换;为了确保每位客户都能获得安全和高质量的商品,对于美妆类产品,一经开封或使用即不提供退款或退货服务,质量问题除外;其他特殊商品需联系客服咨询)。
感谢您的理解和支持。

查看详情

由 亚米 销售

亚米电子礼品卡使用规则

若购买时选择自动充值,订单完成后礼卡将自动充值到您的账户中;

若购买时选择发送邮件,订单完成后系统将自动发送卡号和密码到您填写的邮箱;

发送邮件时,任何用户均可使用邮件中的卡号密码进行礼卡充值,请妥善保管邮件信息。

如接收邮件遇到问题,请联系客服处理;

发送邮件时,若礼卡没有被兑换,可以补发邮件。若已经被其他用户兑换,则无法补偿;

亚米网电子礼卡可用于购买自营或第三方商品;

亚米网电子礼卡没有有效期限制,长期有效;

亚米网电子礼卡的金额,可分多次使用;

亚米网电子礼卡业务规则,最终解释权归亚米网所有。

退换政策

已消费的电子礼卡不支持退款。

京东图书 销售

服务保障

Yami 满$49免运费
Yami 最优售后
Yami 美国本土发货

配送信息

  • 美国

    标准配送 $5.99(不包含阿拉斯加,夏威夷),最终价满$49免运费

    本地配送$5.99(加州,纽约州,新泽西,麻省和宾夕法尼亚,以上州部分地区);最终价满$49免运费

    两日达(包含阿拉斯加夏威夷)运费$19.99起

退换政策

提供30天内退还保障。产品需全新未使用原包装内,并附有购买凭据。产品质量问题、或错发漏发等,由商家造成的失误,将进行补发,或退款处理。其它原因需退货费用由客户自行承担。

由 京东图书 销售

服务保障

Yami 跨店满$69免运费
Yami 30天退换保障

亚米-中国集运仓

由亚米从中国精选并集合各大优秀店铺的商品至亚米中国整合中心,合并包裹后将一次合包跨国邮寄至您的地址。跨店铺包邮门槛低至$69。您将在多商家集合提供的广泛选品中选购商品,轻松享受跨店铺包邮后的低邮费。

退换政策

提供30天内退换保障。产品需在全新未使用的原包装内,并附有购买凭据。产品质量问题、错发、或漏发等由商家造成的失误,将进行退款处理。其它原因造成的退换货邮费客户将需要自行承担。由于所有商品均长途跋涉,偶有简易外包压磨等但不涉及内部质量问题者,不予退换。

配送信息

亚米中国集运 Consolidated Shipping 运费$9.99(订单满$69 包邮)

下单后2个工作日中国商家发货,所有包裹抵达亚米中国整合中心(除特别情况及中国境内个别法定节假日外)会合并包裹后通过UPS发往美国。UPS从中国发货后到美国境内的平均时间为10个工作日左右,根据直发单号可随时跟踪查询。受疫情影响,目前物流可能延迟5天左右。包裹需要客人签收。如未签收,客人须承担包裹丢失风险。

由 京东图书 销售

服务保障

满$69免运费
正品保证

配送信息

Yami Consolidated Shipping 运费$9.99(订单满$69包邮)


下单后1-2个工作日内发货。 物流时效预计7-15个工作日。 如遇清关,交货时间将延长3-7天。 最终收货日期以邮政公司信息为准。

积分规则

不参加任何折扣活动以及亚米会员积分制度。

退换政策

提供30天内退还保障。产品需全新未使用原包装内,并附有购买凭据。产品质量问题、或错发漏发等,由商家造成的失误,将进行补发,或退款处理。其它原因需退货费用由客户自行承担。

Yami

下载亚米应用

返回顶部

为你推荐

品牌故事

京东图书

为您推荐

Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折

评论{{'('+ commentList.posts_count + ')'}}

分享你的感受,帮助更多用户做出选择。

写评论
{{ totalRating }} 写评论
  • {{i}}星

    {{i}}星

    {{ parseInt(commentRatingList[i]) }}%

Yami Yami
{{ comment.user_name }}

{{ showTranslate(comment) }}收起

{{ strLimit(comment,800) }}查看全部

Show Original

{{ comment.content }}

Yami
查看更多

{{ formatTime(comment.in_dtm) }} 已购买 {{groupData}}

{{ comment.likes_count }} {{ comment.likes_count }} {{ comment.reply_count }} {{comment.in_user==uid ? __('Delete') : __('Report')}}
Yami Yami
{{ comment.user_name }}

{{ showTranslate(comment) }}收起

{{ strLimit(comment,800) }}查看全部

Show Original

{{ comment.content }}

Yami
查看更多

{{ formatTime(comment.in_dtm) }} 已购买 {{groupData}}

{{ comment.likes_count }} {{ comment.likes_count }} {{ comment.reply_count }} {{comment.in_user==uid ? __('Delete') : __('Report')}}

暂无符合条件的评论

评论详情

Yami Yami

{{ showTranslate(commentDetails) }}收起

{{ strLimit(commentDetails,800) }}查看全部

Show Original

{{ commentDetails.content }}

Yami
查看更多

{{ formatTime(commentDetails.in_dtm) }} 已购买 {{groupData}}

{{ commentDetails.likes_count }} {{ commentDetails.likes_count }} {{ commentDetails.reply_count }} {{commentDetails.in_user==uid ? __('Delete') : __('Report')}}

请输入内容

回复{{'(' + replyList.length + ')'}}

Yami Yami

{{ showTranslate(reply) }}收起

{{ strLimit(reply,800) }}查看全部

Show Original

{{ reply.reply_content }}

{{ formatTime(reply.reply_in_dtm) }}

{{ reply.reply_likes_count }} {{ reply.reply_likes_count }} {{ reply.reply_reply_count }} {{reply.reply_in_user==uid ? __('Delete') : __('Report')}}

请输入内容

取消

End

发表评论
商品评分

请输入评论

  • 一个好的昵称,会让你的评论更受欢迎!
  • 修改了这里的昵称,个人资料中的昵称也将被修改。
感谢你的评论
你的好评可以帮助我们的社区发现更好的亚洲商品。

举报

取消

确认删除该评论吗?

取消

历史浏览

品牌故事

京东图书