{{sellerTotalView > 1 ? __("sellers", {number: sellerTotalView}) : __("seller", {number: sellerTotalView}) }}, {{numTotalView > 1 ? __("items", {number: numTotalView}) : __("item", {number: numTotalView}) }}
免運費
Yami

Nickname

請告訴我們怎麼更好地稱呼你

更新你的名字
賬戶 訂單 收藏
{{ inviteNavTitle }}
退出登入

切換配送區域

不同區域的庫存和配送時效可能存在差異。

歷史郵編

{{email ? __('Got it!') : __('Restock Alert')}}

我們將在商品到貨後第一時間通知你。

取消
Yami

京東圖書

大数据 互联网大规模数据挖掘与分布式处理(第2版)

{{buttonTypePin == 3 ? __("Scan to view more PinGo") : __("Scan to start")}}

大数据 互联网大规模数据挖掘与分布式处理(第2版)

{{__(":people-members", {'people': item.limit_people_count})}} {{ itemCurrency }}{{ item.valid_price }} {{ itemCurrency }}{{ item.invalid_price }} {{ itemDiscount }}
後結束
{{ itemCurrency }}{{ item.valid_price }}
{{ itemCurrency }}{{ priceFormat(item.valid_price / item.bundle_specification) }}/{{ item.unit }}
{{ itemDiscount }}
{{ itemCurrency }}{{ item.valid_price }} {{ itemCurrency }}{{ priceFormat(item.valid_price / item.bundle_specification) }}/{{ item.unit }} {{ itemCurrency }}{{ item.invalid_price }} {{itemDiscount}}
{{ itemCurrency }}{{ item.valid_price }}
後結束促銷
後開始秒殺 後結束秒殺
{{ getSeckillDesc(item.seckill_data) }}
{{ __( "Pay with Gift Card to get sale price: :itemCurrency:price", { 'itemCurrency' : itemCurrency, 'price' : (item.giftcard_price ? priceFormat(item.giftcard_price) : '0.00') } ) }} ({{ itemCurrency }}{{ priceFormat(item.giftcard_price / item.bundle_specification) }}/{{ item.unit }}) 詳情
商品有效期

已下架

我們不知道該商品何時或是否會重新有庫存。

當前地址無法配送
已售完

商品描述

展開全部描述
Content Description

本书由斯坦福大学“Web挖掘”课程的内容总结而成,主要关注极大规模数据的挖掘。主要内容包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统。其中相关章节有对应的习题,以巩固所讲解的内容。读者更可以从网上获取相关拓展材料。
Author Description

本书由斯坦福大学“Web挖掘”课程的内容总结而成,主要关注极大规模数据的挖掘。主要内容包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统。其中相关章节有对应的习题,以巩固所讲解的内容。读者更可以从网上获取相关拓展材料。
Comments

Jure Leskovec 斯坦福大学计算机科学系助理教授,研究方向是大型社交和信息网络的数据挖掘。他的研究成果获得了很多奖项,如Microsoft Research Faculty Fellowship、Alfred P. Sloan Fellowship和Okawa Foundation Fellowship,还获得了很多最佳论文奖,同时也被《纽约时报》《华尔街日报》《华盛顿邮报》《麻省理工科技评论》《连线》、NBC、BBC等流行的社会媒体刊载。他还创建了斯坦福网络分析平台(SNAP,https://snap.stanford.edu)。

Anand Rajaraman 数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman的职业生涯非常成功:1996年创办Junglee公司,两年后被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司于2011年被沃尔玛集团收购,Rajaraman被聘为沃尔玛负责全球电子商务业务的高级副总裁。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。

Jeffrey David Ullman 美国国家工程院院士,计算机科学家。早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD创新奖、高德纳奖、冯诺依曼奖等多项科研大奖;他是“龙书”《编译原理》、数据库名著《数据库系统实现》等多部经典著作的合著者;麾下多名学生成为了数据库领域的专家,其中最有名的当属谷歌创始人Sergey Brin;本书第二作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
Catalogue

第1 章 数据挖掘基本概念 1
1.1 数据挖掘的定义 1
1.1.1 统计建模 1
1.1.2 机器学习 1
1.1.3 建模的计算方法 2
1.1.4 数据汇总 2
1.1.5 特征抽取 3
1.2 数据挖掘的统计限制 4
1.2.1 整体情报预警 4
1.2.2 邦弗朗尼原理 4
1.2.3 邦弗朗尼原理的一个例子 5
1.2.4 习题 6
1.3 相关知识 6
1.3.1 词语在文档中的重要性 6
1.3.2 哈希函数 7
1.3.3 索引 8
1.3.4 二级存储器 9
1.3.5 自然对数的底e 10
1.3.6 幂定律 11
1.3.7 习题 12
1.4 本书概要 13
1.5 小结 14
1.6 参考文献 15
第2 章 MapReduce及新软件栈 16
2.1 分布式文件系统 17
2.1.1 计算节点的物理结构 17
2.1.2 大规模文件系统的结构 18
2.2 MapReduce 19
2.2.1 Map 任务 20
2.2.2 按键分组 20
2.2.3 Reduce 任务 21
2.2.4 组合器 21
2.2.5 MapReduce 的执行细节 22
2.2.6 节点失效的处理 23
2.2.7 习题 23
2.3 使用MapReduce 的算法 23
2.3.1 基于MapReduce 的矩阵—向量
乘法实现 24
2.3.2 向量v 法放入内存时的处理 24
2.3.3 关系代数运算 25
2.3.4 基于MapReduce 的选择运算 27
2.3.5 基于MapReduce 的投影运算 27
2.3.6 基于MapReduce 的并、交和差运算 28
2.3.7 基于MapReduce 的自然连接运算 28
2.3.8 基于MapReduce 的分组和聚合运算 29
2.3.9 矩阵乘法 29
2.3.10 基于单步MapReduce 的矩阵乘法 30
2.3.11 习题 31
2.4 MapReduce 的扩展 31
2.4.1 工作流系统 32
2.4.2 MapReduce 的递归扩展版本 33
2.4.3 Pregel 系统 35
2.4.4 习题 35
2.5 通信开销模型 36
2.5.1 任务网络的通信开销 36
2.5.2 时钟时间 37
2.5.3 多路连接 38
2.5.4 习题 41
2.6 MapReduce 复杂性理论 41
2.6.1 Reducer 规模及复制率 41
2.6.2 一个例子:相似性连接 42
2.6.3 MapReduce 问题的一个图模型 44
2.6.4 映射模式 45
2.6.5 并非所有输入都存在时的处理 46
2.6.6 复制率的下界 46
2.6.7 案例分析:矩阵乘法 48
2.6.8 习题 51
2.7 小结 51
2.8 参考文献 53
第3 章 相似项发现 55
3.1 近邻搜索的应用 55
3.1.1 集合的Jaccard 相似度 55
3.1.2 文档的相似度 56
3.1.3 协同过滤——一个集合相似问题 57
3.1.4 习题 58
3.2 文档的shingling 58
3.2.1 k-shingle 58
3.2.2 shingle 大小的选择 59
3.2.3 对shingle 进行哈希 59
3.2.4 基于词的shingle 60
3.2.5 习题 60
3.3 保持相似度的集合摘要表示 61
3.3.1 集合的矩阵表示 61
3.3.2 最小哈希 62
3.3.3 最小哈希及Jaccard 相似度 62
3.3.4 最小哈希签名 63
3.3.5 最小哈希签名的计算 63
3.3.6 习题 66
3.4 文档的局部敏感哈希算法 67
3.4.1 面向最小哈希签名的LSH 67
3.4.2 行条化策略的分析 68
3.4.3 上述技术的综合 69
3.4.4 习题 70
3.5 距离测度 70
3.5.1 距离测度的定义 71
3.5.2 欧氏距离 71
3.5.3 Jaccard 距离 72
3.5.4 余弦距离72
3.5.5 编辑距离 73
3.5.6 海明距离 74
3.5.7 习题 74
3.6 局部敏感函数理论 75
3.6.1 局部敏感函数 76
3.6.2 面向Jaccard 距离的局部敏感函数族 77
3.6.3 局部敏感函数族的放大处理 77
3.6.4 习题 79
3.7 面向其他距离测度的LSH 函数族 80
3.7.1 面向海明距离的LSH 函数族 80
3.7.2 随机超平面和余弦距离 80
3.7.3 梗概 81
3.7.4 面向欧氏距离的LSH 函数族 82
3.7.5 面向欧氏空间的更多LSH函数族 83
3.7.6 习题 83
3.8 LSH 函数的应用 84
3.8.1 实体关联 84
3.8.2 一个实体关联的例子 85
3.8.3 记录匹配的验证 86
3.8.4 指纹匹配 87
3.8.5 适用于指纹匹配的LSH函数族 87
3.8.6 相似新闻报道检测 88
3.8.7 习题 89
3.9 面向高相似度的方法 90
3.9.1 相等项发现 90
3.9.2 集合的字符串表示方法 91
3.9.3 基于长度的过滤 91
3.9.4 前缀索引 92
3.9.5 位置信息的使用 93
3.9.6 使用位置和长度信息的索引 94
3.9.7 习题 96
3.10 小结 97
3.11 参考文献 98
第4 章 数据流挖掘 100
4.1 流数据模型 100
4.1.1 一个数据流管理系统 100
4.1.2 流数据源的例子 101
4.1.3 流查询 102
4.1.4 流处理中的若干问题 103
4.2 流当中的数据抽样 103
4.2.1 一个富于启发性的例子 104
4.2.2 代表性样本的获取 104
4.2.3 一般的抽样问题 105
4.2.4 样本规模的变化 105
4.2.5 习题 106
4.3 流过滤 106
4.3.1 一个例子 106
4.3.2 布隆过滤器 107
4.3.3 布隆过滤方法的分析 107
4.3.4 习题108
4.4 流中独立元素的数目统计 109
4.4.1 独立元素计数问题 109
4.4.2 FM 算法 109
4.4.3 组合估计 110
4.4.4 空间需求 111
4.4.5 习题 111
4.5 矩估计 111
4.5.1 矩定义 111
4.5.2 二阶矩估计的AMS 算法 112
4.5.3 AMS 算法有效的原因 113
4.5.4 更高阶矩的估计 113
4.5.5 限流的处理 114
4.5.6 习题 115
4.6 窗口内的计数问题 116
4.6.1 精确计数的开销 116
4.6.2 DGIM 算法 116
4.6.3 DGIM 算法的存储需求 118
4.6.4 DGIM 算法中的查询应答 118
4.6.5 DGIM 条件的保持 119
4.6.6 降低错误率 120
4.6.7 窗口内计数问题的扩展 120
4.6.8 习题 121
4.7 衰减窗口 121
4.7.1 最常见元素问题 121
4.7.2 衰减窗口的定义 122
4.7.3 最流行元素的发现 123
4.8 小结 123
4.9 参考文献 124
第5 章 链接分析 126
5.1 PageRank 126
5.1.1 早期的搜索引擎及词项作弊 126
5.1.2 PageRank 的定义 128
5.1.3 Web 结构 130
5.1.4 避免终止点 132
5.1.5 采集器陷阱及“抽税”法 134
5.1.6 PageRank 在搜索引擎中的使用 136
5.1.7 习题 136
5.2 PageRank 的快速计算 137
5.2.1 转移矩阵的表示 137
5.2.2 基于MapReduce 的PageRank迭代计算 138
5.2.3 结果向量合并时的组合器使用 139
5.2.4 转移矩阵中块的表示 140
5.2.5 其他高效的PageRank 迭代方法 141
5.2.6 习题 142
5.3 面向主题的PageRank 142
5.3.1 动机 142
5.3.2 有偏
Book Abstract

第9章介绍推荐系统。很多Web应用中都有给用户推荐其感兴趣的数据项的功能。Netflix竞赛就是一个例子,该竞赛期望对用户感兴趣的电影进行预测。而Amazon希望根据顾客的购买兴趣来推荐一款商品。推荐主要有两种方法。一种方法是,我们可以将数据项通过其特征来刻画,比如电影中的明星,然后推荐与已知的用户喜欢的物品具有同样特征的物品。另一种方法是,我们可以考察那些与当前用户具有相似爱好的用户,根据他们喜欢的物品来向当前用户推荐(该技术通常称为协同过滤)。
第10章介绍社会网络及分析算法。最典型的社会网络的例子是Facebook的朋友关系图,其中节点代表人,而两个人如果是朋友的话,他们之间就有边相连。而像Twitter上的粉丝关注构成的有向图也可以看成社会网络。社会网络中一个要解决的普遍问题是识别其中的“社区”,即一个个小规模的节点集合,但是集合内节点之间却有大量的边将它们连接起来。社会网络的其他问题也是图的一般性问题,比如传递闭包或图直径的计算,但是在网络规模如此巨大的情况下问题也变得十分困难。
第11章介绍降维技术。给定一个极大的、通常比较稀疏的矩阵。我们可以将该矩阵想象为两类实体之间的关系表示,比如观众对影片的评级关系。直观上看,只会存在很少量的概念,而且概念的数目会比影片或观众的数目少很多,这些概念可以解释为什么某些观众喜欢某些影片。我们提供了多个将矩阵简化为多个矩阵的乘积的算法,简化后的矩阵某一维要小很多。其中,一个矩阵将一类实体与这些少量的概念相关联,另一个矩阵将概念和另一类实体相关联。如果处理正确的话,这些小矩阵的乘积会十分接近原始矩阵。
最后,第12章讨论极大规模数据集上的机器学习算法。其中的技术包括感知机、支持向量机、基于梯度下降的模型求解、近邻模型和决策树等。
……

規格參數

品牌 京東圖書
品牌屬地 中國

免責聲明

產品價格、包裝、規格等資訊如有調整,恕不另行通知。我們盡量做到及時更新產品資訊,但請以收到實物為準。使用產品前,請始終閱讀產品隨附的標籤、警告及說明。

查看詳情
加入收藏
{{ $isZh ? coupon.coupon_name_sub : coupon.coupon_ename_sub | formatCurrency }}
{{__("Buy Directly")}} {{ itemCurrency }}{{ item.directly_price }}
數量
{{ quantity }}
{{ instockMsg }}
{{ limitText }}
{{buttonTypePin == 3 ? __("Scan to view more PinGo") : __("Scan to start")}}
由 JD@CHINA 銷售
送至
{{ __("Ship to United States only") }}
滿69免運費
正品保證

已加入購物車

繼續逛逛

為你推薦

{{ item.brand_name }}

{{ item.item_name }}

{{ item.currency }}{{ item.market_price }}

{{ item.currency }}{{ item.unit_price }}

{{ item.currency }}{{ item.unit_price }}

優惠券

{{ coupon.coupon_name_new | formatCurrency }}
領取 已領取 已領完
{{ getCouponDescStr(coupon) }}
{{ coupon.use_time_desc }}
即將過期: {{ formatTime(coupon.use_end_time) }}

分享給好友

取消

亞米禮卡專享價

使用禮卡支付即可獲得禮卡專享價

規則說明

禮卡專享價是部分商品擁有的特殊優惠價格;

購買禮卡專享價商品時,若在結算時使用電子禮卡抵扣支付,且禮卡餘額足夠支付訂單中所有禮卡專享價商品的專享價總和,則可以啟用禮卡專享價;

不使用禮卡支付,或禮卡餘額不滿足上一條所述要求時,將無法啟用禮卡專享價,按照普通售價計算,但您仍然可以購買這些商品;

在購買禮卡專享價商品時,若餘額不足,可以在購物車或結算頁中點擊“充值”按鈕對禮卡進行購買和充值;

商品若擁有禮卡專享價,會顯示“專享”的特殊價格標記;

如有疑問,請隨時聯繫客服;

禮卡專享價相關規則最終解釋權歸亞米所有。

由 亞米 銷售

服務保障

Yami 滿$49免運費
Yami 無憂退換
Yami 從美國出貨

配送資訊

  • 美國

    標準配送 $5.99(不含阿拉斯加,夏威夷),最終價滿$49免運費

    本地配送$5.99(加州,紐約州,新澤西,麻省和賓夕法尼亞,以上州部分地區);最終價滿$49免運費

    兩日達(含阿拉斯加夏威夷)運費19.99美元起

退換政策

亞米網希望為我們的客戶提供最優秀的售後服務,讓所有人都能放心在亞米購物。亞米自營商品在滿足退換貨條件的情況下,可在收到包裹的30天之內退換商品(食品因商品質量問題7天內可退換;為了確保每位客戶都能獲得安全和高質量的商品,對於美妝類產品,一經開封或使用即不提供退款或退貨服務,質量問題除外;其他特殊商品需聯繫客服諮詢)。
感謝您的理解和支持。

查看詳情

由 亞米 銷售

亞米電子禮品卡使用規則

若購買時選擇自動儲值,訂單完成後禮品卡將自動儲值至您的帳戶;

若購買時選擇發送郵件,訂單完成後系統將自動發送卡號和密碼到您填寫的郵箱;

寄送郵件時,任何使用者均可使用郵件中的卡號密碼進行禮卡儲值,請妥善保管郵件資訊。

如接收郵件遇到問題,請聯絡客服處理;

發送郵件時,若禮卡沒有被兌換,可以補發郵件。若已經被其他用戶兌換,無法補償;

亞米網電子禮卡可用於購買自營或第三方商品;

亞米網電子禮卡沒有有效期限限制,長期有效;

亞米網電子禮卡的金額,可分多次使用;

亞米網電子禮卡業務規則,最終解釋權歸亞米網所有。

退換政策

已消費的電子禮卡不支持退款。

JD@CHINA 銷售

服務保障

Yami 滿$49免運費
Yami 最優售後
Yami 美國本土出貨

配送資訊

  • 美國

    標準配送 $5.99(不含阿拉斯加,夏威夷),最終價滿$49免運費

    本地配送$5.99(加州,紐約州,新澤西,麻省和賓夕法尼亞,以上州部分地區);最終價滿$49免運費

    兩日達(含阿拉斯加夏威夷)運費19.99美元起

退換政策

提供30天內退還保障。產品需全新未使用原包裝內,並附有購買憑證。產品品質問題、或錯發漏發等,由商家造成的失誤,將進行補發,或退款處理。其它原因需退貨費用由客戶自行承擔。

由 JD@CHINA 銷售

服務保障

Yami 跨店滿$69免運費
Yami 30天退換保障

亞米-中國集運倉

由亞米從中國精選並集合各大優秀店舖的商品至亞米中國整合中心,合併包裹後將一次合包跨國郵寄至您的地址。跨店包郵門檻低至$69。您將在多商家集合提供的廣泛選購商品中選購商品,輕鬆享有跨店鋪包郵後的低郵資。

退換政策

提供30天內退換保障。產品需在全新未使用的原包裝內,並附有購買憑證。產品品質問題、錯發、或漏發等商家造成的失誤,將進行退款處理。其它原因造成的退換貨郵費客戶將需要自行承擔。由於所有商品均長途跋涉,偶有簡易外包壓磨等但不涉及內部品質問題者,不予退換。

配送資訊

亞米中國集運 Consolidated Shipping 運費$9.99(訂單滿$69 包郵)

下單後2個工作天中國商家出貨,所有包裹抵達亞米中國整合中心(除特別情況及中國境內個別法定假日外)會合併包裹後透過UPS發往美國。 UPS從中國出貨後到美國境內的平均時間為10個工作天左右,可隨時根據直發單號追蹤查詢。受疫情影響,目前物流可能延遲5天左右。包裹需要客人簽收。如未簽收,客人須承擔包裹遺失風險。

由 JD@CHINA 銷售

服務保障

滿69免運費
正品保證

配送資訊

Yami Consolidated Shipping 運費$9.99(訂單滿$69包郵)


Seller will ship the orders within 1-2 business days. The logistics time limit is expected to be 7-15 working days. In case of customs clearance, the delivery time will be extended by 3-7 days. The final receipt date is subject to the information of the postal company.

積分規則

不參加任何折扣活動以及亞米會員積分制度。

退換政策

提供30天內退還保障。產品需全新未使用原包裝內,並附有購買憑證。產品品質問題、或錯發漏發等,由商家造成的失誤,將進行補發,或退款處理。其它原因需退貨費用由客戶自行承擔。

Yami

下載亞米應用

返回頂部

為您推薦

品牌故事

京東圖書

为您推荐

Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折

評論{{'('+ commentList.posts_count + ')'}}

分享您的感受,幫助更多用戶做出選擇。

撰寫評論
{{ totalRating }} 撰寫評論
  • {{i}}星

    {{i}} 星

    {{ parseInt(commentRatingList[i]) }}%

Yami Yami
{{ comment.user_name }}

{{ showTranslate(comment) }}收起

{{ strLimit(comment,800) }}查看全部

Show Original

{{ comment.content }}

Yami
查看更多

{{ formatTime(comment.in_dtm) }} 已購買 {{groupData}}

{{ comment.likes_count }} {{ comment.likes_count }} {{ comment.reply_count }} {{comment.in_user==uid ? __('Delete') : __('Report')}}
Yami Yami
{{ comment.user_name }}

{{ showTranslate(comment) }}收起

{{ strLimit(comment,800) }}查看全部

Show Original

{{ comment.content }}

Yami
查看更多

{{ formatTime(comment.in_dtm) }} 已購買 {{groupData}}

{{ comment.likes_count }} {{ comment.likes_count }} {{ comment.reply_count }} {{comment.in_user==uid ? __('Delete') : __('Report')}}

暫無符合條件的評論~

評論詳情

Yami Yami

{{ showTranslate(commentDetails) }}收起

{{ strLimit(commentDetails,800) }}查看全部

Show Original

{{ commentDetails.content }}

Yami
查看更多

{{ formatTime(commentDetails.in_dtm) }} 已購買 {{groupData}}

{{ commentDetails.likes_count }} {{ commentDetails.likes_count }} {{ commentDetails.reply_count }} {{commentDetails.in_user==uid ? __('Delete') : __('Report')}}

請輸入內容

回覆{{'(' + replyList.length + ')'}}

Yami Yami

{{ showTranslate(reply) }}收起

{{ strLimit(reply,800) }}查看全部

Show Original

{{ reply.reply_content }}

{{ formatTime(reply.reply_in_dtm) }}

{{ reply.reply_likes_count }} {{ reply.reply_likes_count }} {{ reply.reply_reply_count }} {{reply.reply_in_user==uid ? __('Delete') : __('Report')}}

請輸入內容

取消

這是到目前為止的所有評論!

發表評論
商品評分

請輸入評論

  • 一個好的暱稱,會讓你的評論更受歡迎!
  • 修改了這裡的暱稱,個人資料中的暱稱也將被修改。
感謝你的評論
你的好評可以幫助我們的社區發現更好的亞洲商品。

舉報

取消

確認刪除該評論嗎?

取消

歷史瀏覽

品牌故事

京東圖書