{{sellerTotalView > 1 ? __("sellers", {number: sellerTotalView}) : __("seller", {number: sellerTotalView}) }}, {{numTotalView > 1 ? __("items", {number: numTotalView}) : __("item", {number: numTotalView}) }}
免運費
Yami

Nickname

請告訴我們怎麼更好地稱呼你

更新你的名字
賬戶 訂單 收藏
{{ inviteNavTitle }}
退出登入

切換配送區域

不同區域的庫存和配送時效可能存在差異。

歷史郵編

{{email ? __('Got it!') : __('Restock Alert')}}

我們將在商品到貨後第一時間通知你。

取消
Yami

京東圖書

大数据是这样计算的:XLab实例入门

{{buttonTypePin == 3 ? __("Scan to view more PinGo") : __("Scan to start")}}

大数据是这样计算的:XLab实例入门

{{__(":people-members", {'people': item.limit_people_count})}} {{ itemCurrency }}{{ item.valid_price }} {{ itemCurrency }}{{ item.invalid_price }} {{ itemDiscount }}
後結束
{{ itemCurrency }}{{ item.valid_price }}
{{ itemCurrency }}{{ priceFormat(item.valid_price / item.bundle_specification) }}/{{ item.unit }}
{{ itemDiscount }}
{{ itemCurrency }}{{ item.valid_price }} {{ itemCurrency }}{{ priceFormat(item.valid_price / item.bundle_specification) }}/{{ item.unit }} {{ itemCurrency }}{{ item.invalid_price }} {{itemDiscount}}
{{ itemCurrency }}{{ item.valid_price }}
後結束促銷
後開始秒殺 後結束秒殺
{{ getSeckillDesc(item.seckill_data) }}
{{ __( "Pay with Gift Card to get sale price: :itemCurrency:price", { 'itemCurrency' : itemCurrency, 'price' : (item.giftcard_price ? priceFormat(item.giftcard_price) : '0.00') } ) }} ({{ itemCurrency }}{{ priceFormat(item.giftcard_price / item.bundle_specification) }}/{{ item.unit }}) 詳情
商品有效期

已下架

我們不知道該商品何時或是否會重新有庫存。

當前地址無法配送
已售完

商品描述

展開全部描述
Content Description

随着大数据分析方法的发展、分析工具的改进,大数据分析的门槛降低了。基于大数据算法平台,数据分析师们已经不再被数据的“大”所困扰,他们可以轻松地探索大数据,挖掘大数据的价值。

《大数据是这样计算的:XLab实例入门》侧重介绍大数据分析方法和算法的应用,选取了10个不同领域的真实数据集,针对每个数据的特点,选择适合的方法和算法,和读者一起体验数据探索、数据分析、建模预测的过程;通过实例计算的结果,读者会更加了解各种方法和算法的长处和局限。《大数据是这样计算的:XLab实例入门》的实例都运行在大数据算法平台XLab上。

《大数据是这样计算的:XLab实例入门》适合对大数据分析感兴趣的读者阅读,也可供数据分析师、算法工程师等专业人员参考使用。

Author Description

杨旭,吉林长春人,2004年获南开大学数学博士学位;随后在南开大学信息学院从事博士后研究工作;2006年加入微软亚洲研究院,进行符号计算、大规模矩阵计算及机器学习算法研究;2010年加入阿里巴巴,从事大数据相关的统计和机器学习算法研发。著有《重构大数据统计》。

Catalogue

第1章 入门 1
1.1 打开大数据之门 1
1.2 接触大数据 2
1.3 数据初探索 4
1.4 进一步分析 10
1.5 训练和预测 17
第2章 简介 23
2.1 主界面介绍 23
2.1.1 工具栏 24
2.1.2 数据列表 26
2.1.3 窗口管理器 28
2.1.4 工作界面 28
2.2 数据查看、运行 29
2.2.1 文本显示 31
2.2.2 复制部分数据 31
2.2.3 显示/隐藏列 32
2.3 脚本编辑、运行 33
2.4 如何获得帮助信息 37
2.4.1 查看帮助手册 37
2.4.2 界面上的帮助信息 38
2.4.3 脚本函数的帮助信息 40
2.5 执行SQL语句 44
第3章 全球机场信息 46
3.1 数据可视化 47
3.2 统计分析 58
3.3 大中型机场的分析 62
3.4 海拔高度排行 64
3.5 数据的关联关系 68
第4章 股票价格 73
4.1 数据处理 74
4.2 数据探索 78
4.3 数据展开 81
4.3.1 组合使用基本函数进行变换 83
4.3.2 利用专门函数一步到位 84
4.4 各股趋势比较 85
4.5 总体趋势 87
第5章 标准普尔500指数 91
5.1 数据类型转换 92
5.2 各指标间的线性关系 93
5.3 按时间变化趋势 96
5.4 数据对比 100
第6章 鸢尾花数据集 107
6.1 属性间的关系 108
6.2 聚类 110
6.2.1 K-Means聚类 111
6.2.2 EM聚类 120
6.3 二分类数据子集 124
6.3.1 使用训练、预测窗体 125
6.3.2 调用训练、预测脚本 131
第7章 MovieLens数据集 136
7.1 数据变换 137
7.2 统计 138
7.3 排行榜 145
7.4 分类排行榜 147
7.5 影片关联分析 149
7.6 属性扩展 157
第8章 汽车评价数据集 161
8.1 数据图示化 162
8.2 对比分析 165
8.3 决策树 169
第9章 Twitter数据 174
9.1 用户信息分析 175
9.2 用户粉丝数量的情况 184
9.3 粉丝的情况 192
9.4 “粉”与“被粉” 197
9.5 信息传播速度 204
9.6 哪些用户更重要 208
9.6.1 粉丝最多的用户 209
9.6.2 用户排名 211
第10章 随机数据 215
10.1 数据生成 215
10.2 计算π值 217
10.3 中心极限定理 222
第11章 新浪网页数据 230
11.1 分词 232
11.2 有区分度的单词 234
11.3 选择特征 235
11.3.1 卡方检验 236
11.3.2 信息增益 238
11.4 主题模型 242
11.4.1 潜在语义分析 242
11.4.2 概率潜在语义分析 253
11.4.3 LDA模型 272
11.5 单词映射为向量 289
第12章 2014年阿里巴巴大数据竞赛 294
12.1 试题介绍 294
12.2 数据 296
12.3 思路 298
12.3.1 用户和品牌的各种特征 298
12.3.2 二分类模型训练 300
12.3.3 比赛考核目标 301
12.4 计算训练数据集 302
12.4.1 原始数据划分 303
12.4.2 计算特征 304
12.4.3 数据预处理标识 304
12.4.4 用户-品牌联合特征 308
12.4.5 用户特征 313
12.4.6 品牌特征 317
12.4.7 整合训练数据的特征 322
12.4.8 计算标签 323
12.5 二分类模型训练 324
12.5.1 正负样本配比 324
12.5.2 朴素贝叶斯算法 325
12.5.3 逻辑回归算法 326
12.5.4 随机森林算法 327
12.6 提交预测结果 328

Book Abstract

推荐序一

阿里云副总裁

周靖人

阿里巴巴的大数据算法平台作为支持天猫、淘宝和支付宝等各种业务的基石,每天有数千名的阿里工程师在平台上处理各式各样的海量数据。作者多年来一直从事阿里巴巴的大数据算法平台的研发,致力于帮助工程师更快捷、更高效地挖掘大数据,进行复杂多样的数据分析。作者根据自己在阿里大数据计算方面的所见所闻,结合多个具体的案例分析,将大数据分析计算的脉络直观、清晰地展现给读者。

本书集中在大数据分析实战上,精选了不同行业和领域的数据集,重点讲解大数据的分析方法和算法。本书的每一个章节都围绕一个实际数据集,从数据探索入手,根据数据自身的特点选取相应的分析方法,并对相关算法和方法进行简要介绍,便于读者理解掌握。同时,本书注重计算结果的分析,使读者对算法的效果有具体的印象,加强对算法的理解。它是大数据领域一本难得的实用好书!

推荐序二

蚂蚁金服副总裁、首席数据科学家

漆远

本书立足于阿里巴巴成熟的大数据算法平台,读者在分析实例时,可以直接关注思路和算法,省去了如何编写复杂的分布式代码实现一个常用算法的困扰。本书的学习门槛低,读者如果用过MATLAB、SAS、R或Excel等任何一款数据分析软件,就可以轻松读懂本书。

作者是阿里巴巴一个核心MPI大数据算法平台的主要建设者和领头人,其开发的算法平台在阿里巴巴和蚂蚁金服集团都广泛使用,很好地支持了数据分析师和工程师的工作。作者结合自身的丰富经验,通过具体案例全面地解析数据探索过程,讲解思路、具体算法的使用及技巧,实战性强:面对具体的数据,引入适合的算法,有简明的算法原理介绍;通过算法应用到数据后的效果展示,读者能感性地了解该算法的作用。

本书可以帮助对大数据分析感兴趣的初学者了解该领域,提高自己在该领域的知识积累。本书所讨论的十多个数据集,涉及不同的场景,用到了各种统计分析和机器学习的算法,可以帮助正在从事该领域的专业人士扩宽知识面,增强大数据实战能力。

看完这本书,也许你会揭下大数据神秘的“面纱”,然后发现它很有意思、很有用!


Introduction

随着大数据分析方法的发展、分析工具的改进,大数据分析的门槛降低了。基于大数据算法平台,数据分析师们已经不再被数据的“大”所困扰,他们可以轻松地探索大数据,挖掘大数据的价值。

本书希望将最新的、常用的大数据分析方法和算法介绍给读者。在内容的组织上,选取了10个不同领域的真实数据集,针对每个数据的特点,选择适合的方法和算法,和读者一起体验数据探索、数据分析、建模预测的过程;通过实例计算的结果,我们会更加了解各种方法和算法的长处和局限。本书的实例都运行在大数据算法平台XLab上。

XLab是阿里巴巴集团内部最大的大数据算法平台,集统计、机器学习、数据分析、挖据和处理于一体,致力于帮助用户享受最新的算法研究成果,使其无须关注算法的底层实现和性能调优,专注数据探索和算法尝试,从而快速地进行业务调整,搭建线上业务。在阿里集团外,大家也有机会接触到XLab,参加2014年阿里巴巴大数据竞赛的几百支高校学生队伍,正是使用XLab来进行大数据分析预测的;面对淘宝商家的数据开发平台,“御膳房”便使用了XLab的分布式算法库XLib。

本书每章一个实例,每个实例各有特点,每章所用的方法也各有侧重,我简单归纳如下,希望能帮助读者把握本书脉络,选择阅读重点。

第1章

围绕着人口普查数据,演示了一些常用的方法,譬如:对数据进行可视化,计算常用统计量,进行多维对应分析,根据数据建立模型判断年收入水平等,希望读者能体会到:大数据分析还是很简单、自然的。

第2章

概略介绍XLab的功能,希望大家能对大数据算法平台有个总体了解。

第3章

分析全球机场信息数据,亮点是地理位置信息(经度、纬度、海拔高度)可视化。

第4章

围绕纽约证券交易所的25家上市公司的股票价格,进行数据预处理、趋势显示和主成分分析。

第5章

分析标准普尔500指数,展示如何通过散布图矩阵,快速发现各数据列间的线性关系;如何将扩展直方图与方差、变异系数等统计量相结合,探寻规律;本章还会将标准普尔500指数与前一章的主成分分析结果进行对比。

第6章

针对鸢尾花数据集,讲解聚类分析中常用的两种方法:K-Means聚类和EM聚类,通过在鸢尾花数据上的实验效果,读者能了解这两种方法擅长处理的情况;在本章后半部分,实验、对比了各种分类算法在该数据集上的效果。

第7章

MovieLens数据集记录了电影信息和观众对电影的打分记录。首先,计算得到各种排行榜,进一步对影片进行关联分析,即如果知道某个观众看了影片A和B,我们可以推测该观众可能还看过哪部其他影片?

第8章

关于汽车评价数据集,重点关注:使用对应分析的方法,将各个属性值间的关系图示化;如何将数据所描述的规则,转换为更为形象和易用的树形决策过程。

第9章

关于Twitter数据,首先尝试不同的统计方法,一起发现些有意思的现象;还可以针对Twitter的关注关系构成的网络,实验信息传播的速度;最后,使用PageRank等方法,我们可以排出这个网络中最重要的人物。

第10章

展示如何生成大规模的随机数据,并演示了两个神奇的例子。

第11章

为新浪网页数据,本章的重点是处理自然语言数据,介绍常用的算法:归一化、分词、TF-IDF值、选择特征等;主题模型是本章的重点,发掘众多文档后面的主题,找出相似的文档;最后介绍奇妙的Word2Vec算法。

第12章

针对2014年阿里巴巴大数据竞赛的赛题数据,展示了完整的大数据问题分析、数据预处理、特征构造、数据集划分、模型训练、预测评估过程。

另外,如果读者对XLab底层算法的实现感兴趣,建议参考我的另一本书《重构大数据统计》。面对海量数据,即使是基本的统计计算,考虑到计算时间和资源消耗,也不能简单地将教科书上的算法并行化,而是要在计算理论和计算方法上进行创新。

因作者水平有限,书中难免有不妥或疏漏之处,敬请广大专家和读者批评、指正!我的电子邮件地址为:yangxu@alibaba-inc.com。

最后,感谢一起做XLab的各位阿里同事!感谢家人的理解和支持!

杨旭

2016年3月


規格參數

品牌 京東圖書
品牌屬地 China

免責聲明

產品價格、包裝、規格等資訊如有調整,恕不另行通知。我們盡量做到及時更新產品資訊,但請以收到實物為準。使用產品前,請始終閱讀產品隨附的標籤、警告及說明。

查看詳情
加入收藏
{{ $isZh ? coupon.coupon_name_sub : coupon.coupon_ename_sub | formatCurrency }}
{{__("Buy Directly")}} {{ itemCurrency }}{{ item.directly_price }}
數量
{{ quantity }}
{{ instockMsg }}
{{ limitText }}
{{buttonTypePin == 3 ? __("Scan to view more PinGo") : __("Scan to start")}}
由 JD@CHINA 銷售
送至
{{ __("Ship to United States only") }}
滿69免運費
正品保證

已加入購物車

繼續逛逛

為你推薦

{{ item.brand_name }}

{{ item.item_name }}

{{ item.currency }}{{ item.market_price }}

{{ item.currency }}{{ item.unit_price }}

{{ item.currency }}{{ item.unit_price }}

優惠券

{{ coupon.coupon_name_new | formatCurrency }}
領取 已領取 已領完
{{ getCouponDescStr(coupon) }}
{{ coupon.use_time_desc }}
即將過期: {{ formatTime(coupon.use_end_time) }}

分享給好友

取消

亞米禮卡專享價

使用禮卡支付即可獲得禮卡專享價

規則說明

禮卡專享價是部分商品擁有的特殊優惠價格;

購買禮卡專享價商品時,若在結算時使用電子禮卡抵扣支付,且禮卡餘額足夠支付訂單中所有禮卡專享價商品的專享價總和,則可以啟用禮卡專享價;

不使用禮卡支付,或禮卡餘額不滿足上一條所述要求時,將無法啟用禮卡專享價,按照普通售價計算,但您仍然可以購買這些商品;

在購買禮卡專享價商品時,若餘額不足,可以在購物車或結算頁中點擊“充值”按鈕對禮卡進行購買和充值;

商品若擁有禮卡專享價,會顯示“專享”的特殊價格標記;

如有疑問,請隨時聯繫客服;

禮卡專享價相關規則最終解釋權歸亞米所有。

由 亞米 銷售

服務保障

Yami 滿$49免運費
Yami 無憂退換
Yami 從美國出貨

配送資訊

  • 美國

    標準配送 $5.99(不含阿拉斯加,夏威夷),最終價滿$49免運費

    本地配送$5.99(加州,紐約州,新澤西,麻省和賓夕法尼亞,以上州部分地區);最終價滿$49免運費

    兩日達(含阿拉斯加夏威夷)運費19.99美元起

退換政策

亞米網希望為我們的客戶提供最優秀的售後服務,讓所有人都能放心在亞米購物。亞米自營商品在滿足退換貨條件的情況下,可在收到包裹的30天之內退換商品(食品因商品質量問題7天內可退換;為了確保每位客戶都能獲得安全和高質量的商品,對於美妝類產品,一經開封或使用即不提供退款或退貨服務,質量問題除外;其他特殊商品需聯繫客服諮詢)。
感謝您的理解和支持。

查看詳情

由 亞米 銷售

亞米電子禮品卡使用規則

若購買時選擇自動儲值,訂單完成後禮品卡將自動儲值至您的帳戶;

若購買時選擇發送郵件,訂單完成後系統將自動發送卡號和密碼到您填寫的郵箱;

寄送郵件時,任何使用者均可使用郵件中的卡號密碼進行禮卡儲值,請妥善保管郵件資訊。

如接收郵件遇到問題,請聯絡客服處理;

發送郵件時,若禮卡沒有被兌換,可以補發郵件。若已經被其他用戶兌換,無法補償;

亞米網電子禮卡可用於購買自營或第三方商品;

亞米網電子禮卡沒有有效期限限制,長期有效;

亞米網電子禮卡的金額,可分多次使用;

亞米網電子禮卡業務規則,最終解釋權歸亞米網所有。

退換政策

已消費的電子禮卡不支持退款。

JD@CHINA 銷售

服務保障

Yami 滿$49免運費
Yami 最優售後
Yami 美國本土出貨

配送資訊

  • 美國

    標準配送 $5.99(不含阿拉斯加,夏威夷),最終價滿$49免運費

    本地配送$5.99(加州,紐約州,新澤西,麻省和賓夕法尼亞,以上州部分地區);最終價滿$49免運費

    兩日達(含阿拉斯加夏威夷)運費19.99美元起

退換政策

提供30天內退還保障。產品需全新未使用原包裝內,並附有購買憑證。產品品質問題、或錯發漏發等,由商家造成的失誤,將進行補發,或退款處理。其它原因需退貨費用由客戶自行承擔。

由 JD@CHINA 銷售

服務保障

Yami 跨店滿$69免運費
Yami 30天退換保障

亞米-中國集運倉

由亞米從中國精選並集合各大優秀店舖的商品至亞米中國整合中心,合併包裹後將一次合包跨國郵寄至您的地址。跨店包郵門檻低至$69。您將在多商家集合提供的廣泛選購商品中選購商品,輕鬆享有跨店鋪包郵後的低郵資。

退換政策

提供30天內退換保障。產品需在全新未使用的原包裝內,並附有購買憑證。產品品質問題、錯發、或漏發等商家造成的失誤,將進行退款處理。其它原因造成的退換貨郵費客戶將需要自行承擔。由於所有商品均長途跋涉,偶有簡易外包壓磨等但不涉及內部品質問題者,不予退換。

配送資訊

亞米中國集運 Consolidated Shipping 運費$9.99(訂單滿$69 包郵)

下單後2個工作天中國商家出貨,所有包裹抵達亞米中國整合中心(除特別情況及中國境內個別法定假日外)會合併包裹後透過UPS發往美國。 UPS從中國出貨後到美國境內的平均時間為10個工作天左右,可隨時根據直發單號追蹤查詢。受疫情影響,目前物流可能延遲5天左右。包裹需要客人簽收。如未簽收,客人須承擔包裹遺失風險。

由 JD@CHINA 銷售

服務保障

滿69免運費
正品保證

配送資訊

Yami Consolidated Shipping 運費$9.99(訂單滿$69包郵)


Seller will ship the orders within 1-2 business days. The logistics time limit is expected to be 7-15 working days. In case of customs clearance, the delivery time will be extended by 3-7 days. The final receipt date is subject to the information of the postal company.

積分規則

不參加任何折扣活動以及亞米會員積分制度。

退換政策

提供30天內退還保障。產品需全新未使用原包裝內,並附有購買憑證。產品品質問題、或錯發漏發等,由商家造成的失誤,將進行補發,或退款處理。其它原因需退貨費用由客戶自行承擔。

Yami

下載亞米應用

返回頂部

為您推薦

品牌故事

京東圖書

为您推荐

Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折

評論{{'('+ commentList.posts_count + ')'}}

分享您的感受,幫助更多用戶做出選擇。

撰寫評論
{{ totalRating }} 撰寫評論
  • {{i}}星

    {{i}} 星

    {{ parseInt(commentRatingList[i]) }}%

Yami Yami
{{ comment.user_name }}

{{ showTranslate(comment) }}收起

{{ strLimit(comment,800) }}查看全部

Show Original

{{ comment.content }}

Yami
查看更多

{{ formatTime(comment.in_dtm) }} 已購買 {{groupData}}

{{ comment.likes_count }} {{ comment.likes_count }} {{ comment.reply_count }} {{comment.in_user==uid ? __('Delete') : __('Report')}}
Yami Yami
{{ comment.user_name }}

{{ showTranslate(comment) }}收起

{{ strLimit(comment,800) }}查看全部

Show Original

{{ comment.content }}

Yami
查看更多

{{ formatTime(comment.in_dtm) }} 已購買 {{groupData}}

{{ comment.likes_count }} {{ comment.likes_count }} {{ comment.reply_count }} {{comment.in_user==uid ? __('Delete') : __('Report')}}

暫無符合條件的評論~

評論詳情

Yami Yami

{{ showTranslate(commentDetails) }}收起

{{ strLimit(commentDetails,800) }}查看全部

Show Original

{{ commentDetails.content }}

Yami
查看更多

{{ formatTime(commentDetails.in_dtm) }} 已購買 {{groupData}}

{{ commentDetails.likes_count }} {{ commentDetails.likes_count }} {{ commentDetails.reply_count }} {{commentDetails.in_user==uid ? __('Delete') : __('Report')}}

請輸入內容

回覆{{'(' + replyList.length + ')'}}

Yami Yami

{{ showTranslate(reply) }}收起

{{ strLimit(reply,800) }}查看全部

Show Original

{{ reply.reply_content }}

{{ formatTime(reply.reply_in_dtm) }}

{{ reply.reply_likes_count }} {{ reply.reply_likes_count }} {{ reply.reply_reply_count }} {{reply.reply_in_user==uid ? __('Delete') : __('Report')}}

請輸入內容

取消

這是到目前為止的所有評論!

發表評論
商品評分

請輸入評論

  • 一個好的暱稱,會讓你的評論更受歡迎!
  • 修改了這裡的暱稱,個人資料中的暱稱也將被修改。
感謝你的評論
你的好評可以幫助我們的社區發現更好的亞洲商品。

舉報

取消

確認刪除該評論嗎?

取消

歷史瀏覽

品牌故事

京東圖書