本書創(chuàng)造性地匯編了數(shù)據(jù)挖掘技術(shù),將統(tǒng)計(jì)數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘進(jìn)行了區(qū)分,對(duì)經(jīng)典和現(xiàn)代統(tǒng)計(jì)方法框架進(jìn)行了擴(kuò)展,以用于預(yù)測(cè)建模和大數(shù)據(jù)分析。本書在第2版的基礎(chǔ)上新增了13章,內(nèi)容涵蓋數(shù)據(jù)科學(xué)發(fā)展歷程、市場(chǎng)份額估算、無(wú)抽樣調(diào)研數(shù)據(jù)預(yù)測(cè)錢包份額、潛在市場(chǎng)細(xì)分、利用缺失數(shù)據(jù)構(gòu)建統(tǒng)計(jì)回歸模型、十分位分析評(píng)估數(shù)據(jù)的預(yù)測(cè)能力,以及一個(gè)無(wú)須精通自然語(yǔ)言處理就能使用的文本挖掘工具。本書適合數(shù)據(jù)挖掘從業(yè)者以及對(duì)機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘感興趣的人閱讀。

統(tǒng)計(jì)挖掘與機(jī)器學(xué)習(xí)(原書第3版)造價(jià)信息

市場(chǎng)價(jià) 信息價(jià) 詢價(jià)
材料名稱 規(guī)格/型號(hào) 市場(chǎng)價(jià)
(除稅)
工程建議價(jià)
(除稅)
行情 品牌 單位 稅率 供應(yīng)商 報(bào)價(jià)日期
挖掘機(jī) 傳動(dòng)方式:液壓;品種:履帶式單斗挖掘機(jī);型號(hào):200;斗容量(m3):1.3 查看價(jià)格 查看價(jià)格

日立

臺(tái)班 13% 天津市驛和澤土方工程有限公司
挖掘機(jī) 品種:履帶式單斗挖掘機(jī);斗容量(m3):0.2;規(guī)格:60-7型 查看價(jià)格 查看價(jià)格

大宇

臺(tái)班 13% 寧夏山推工程機(jī)械有限公司
挖掘機(jī) 傳動(dòng)方式:液壓;品種:履帶式單斗挖掘機(jī);型號(hào):300;斗容量(m3):1.3 查看價(jià)格 查看價(jià)格

徐工

臺(tái)班/月 13% 徐工集團(tuán)阿城辦事處
挖掘機(jī) 傳動(dòng)方式:液壓;品種:履帶式單斗挖掘機(jī);型號(hào):450;斗容量(m3):1.9 查看價(jià)格 查看價(jià)格

徐工

臺(tái)班/月 13% 徐工集團(tuán)北京銷售服務(wù)中心
挖掘機(jī) 品種:履帶式單斗挖掘機(jī);斗容量(m3):1.38;規(guī)格:330型 查看價(jià)格 查看價(jià)格

日立

臺(tái)班 13% 內(nèi)蒙古山推工程機(jī)械有限公司
挖掘機(jī) 品種:輪胎式單斗挖掘機(jī);斗容量(m3):0.1;規(guī)格型號(hào):200-340 查看價(jià)格 查看價(jià)格

廣潤(rùn)

臺(tái)班 13% 盤錦廣潤(rùn)建安工程有限公司
挖掘機(jī) 品種:輪胎式單斗挖掘機(jī);斗容量(m3):0.6;規(guī)格型號(hào):75-80 查看價(jià)格 查看價(jià)格

廣潤(rùn)

臺(tái)班 13% 盤錦廣潤(rùn)建安工程有限公司
挖掘機(jī) 品種:履帶式單斗挖掘機(jī);斗容量(m3):1.5;規(guī)格:300型 查看價(jià)格 查看價(jià)格

大宇

臺(tái)班 13% 內(nèi)蒙古山推工程機(jī)械有限公司
材料名稱 規(guī)格/型號(hào) 除稅
信息價(jià)
含稅
信息價(jià)
行情 品牌 單位 稅率 地區(qū)/時(shí)間
挖掘機(jī) 斗容量1m3 查看價(jià)格 查看價(jià)格

臺(tái) 廣州市2016年2季度信息價(jià)
挖掘機(jī) 斗容量0.6m3 查看價(jià)格 查看價(jià)格

臺(tái)·日 廣州市2015年2季度信息價(jià)
挖掘機(jī) 斗容量1m3 查看價(jià)格 查看價(jià)格

臺(tái) 廣州市2015年2季度信息價(jià)
挖掘機(jī) 斗容量0.6m3 查看價(jià)格 查看價(jià)格

臺(tái)·日 廣州市2015年1季度信息價(jià)
挖掘機(jī) 斗容量1.2m3 查看價(jià)格 查看價(jià)格

臺(tái) 廣州市2015年1季度信息價(jià)
挖掘機(jī) 斗容量1m3 查看價(jià)格 查看價(jià)格

臺(tái)·日 廣州市2014年4季度信息價(jià)
挖掘機(jī) 斗容量1.2m3 查看價(jià)格 查看價(jià)格

臺(tái)·日 廣州市2014年4季度信息價(jià)
挖掘機(jī) 斗容量0.6m3 查看價(jià)格 查看價(jià)格

臺(tái) 廣州市2014年4季度信息價(jià)
材料名稱 規(guī)格/需求量 報(bào)價(jià)數(shù) 最新報(bào)價(jià)
(元)
供應(yīng)商 報(bào)價(jià)地區(qū) 最新報(bào)價(jià)時(shí)間
1.名稱:綜合統(tǒng)計(jì)查詢功能模塊 2.功能:包括巡邏警員軌跡查詢、交通違法信息查詢統(tǒng)計(jì)、交通流數(shù)據(jù)查詢統(tǒng)計(jì)|1個(gè) 2 查看價(jià)格 貴州安豐科技有限公司 四川  成都市 2016-08-11
挖掘機(jī)臺(tái)班價(jià)格 200挖掘機(jī)|1臺(tái)班/臺(tái)時(shí) 2 查看價(jià)格 天津市東麗區(qū)潤(rùn)豐祥建筑工程機(jī)械設(shè)備租賃站 天津  天津市 2015-05-14
學(xué)習(xí)雕塑3 42cm長(zhǎng)X26cm寬X73cm高|1個(gè) 1 查看價(jià)格 廣東慧海園林雕塑工程有限公司 廣東  陽(yáng)江市 2021-12-23
挖掘式風(fēng)炮機(jī)的臺(tái)班費(fèi) 挖掘式|0臺(tái)班 1 查看價(jià)格 0 廣東  佛山市 2009-12-11
定位儀(網(wǎng)絡(luò)) 圖像傳感器:1/3英寸cmOS;有效像素:400W;焦距:2.4mm;視角范圍:水平90°,垂直50°;視頻編解碼:H.264;視頻分辨率:1080P30fps;信噪比:≥50db;最低照度:1Lux;內(nèi)置板檢測(cè)智能圖像算法.|1臺(tái) 1 查看價(jià)格 廣州熹尚科技設(shè)備有限公司 廣東  陽(yáng)江市 2021-09-02
綜合查詢統(tǒng)計(jì)報(bào)表系統(tǒng) 詳見(jiàn)附件|1套 1 查看價(jià)格 廣東中建普聯(lián)科技股份有限公司 全國(guó)   2022-05-13
統(tǒng)計(jì)報(bào)表 包括按空間維度、專業(yè)類型、運(yùn)營(yíng)數(shù)據(jù)統(tǒng)計(jì)、監(jiān)控概覽大屏等.|1套 2 查看價(jià)格 全國(guó)  
查詢統(tǒng)計(jì)應(yīng)用模塊 Infovision SC-TPC 查詢統(tǒng)計(jì)應(yīng)用|1套 3 查看價(jià)格 浙江大華技術(shù)股份有限公司四川辦事處 全國(guó)   2020-04-14

第3版前言

第2版前言

致謝

關(guān)于作者

第1章 引論

第2章 數(shù)據(jù)處理相關(guān)學(xué)科:統(tǒng)計(jì)學(xué)和數(shù)據(jù)科學(xué)

第3章 變量評(píng)估的兩種基本數(shù)據(jù)挖掘方法

第4章 用于評(píng)估成對(duì)變量的基于CHAID的數(shù)據(jù)挖掘方法

第5章 校直數(shù)據(jù)的簡(jiǎn)單性和可取性對(duì)建模十分重要

第6章 排序數(shù)據(jù)對(duì)稱化:提高數(shù)據(jù)預(yù)測(cè)能力的統(tǒng)計(jì)數(shù)據(jù)挖掘方法

第7章 主成分分析:多變量評(píng)估的統(tǒng)計(jì)數(shù)據(jù)挖掘方法

第8章 市場(chǎng)份額估算:一個(gè)特殊的數(shù)據(jù)挖掘案例

第9章 相關(guān)系數(shù)在[-1, 1]內(nèi)取值,是這樣嗎

第10章 邏輯斯諦回歸:回應(yīng)建模方法

第11章 無(wú)抽樣調(diào)研數(shù)據(jù)預(yù)測(cè)錢包份額

第12章 普通回歸:利潤(rùn)建模的強(qiáng)大工具

第13章 回歸變量選擇方法:可忽略的問(wèn)題和重要解決方案

第14章 用CHAID解讀邏輯斯諦回歸模型

第15章 回歸系數(shù)的重要性

第16章 相關(guān)系數(shù)均值:評(píng)估預(yù)測(cè)模型和預(yù)測(cè)變量重要性的統(tǒng)計(jì)數(shù)據(jù)挖掘指標(biāo)

第17章 交互變量指定CHAID模型

第18章 市場(chǎng)細(xì)分:邏輯斯諦回歸建模

第19章 市場(chǎng)細(xì)分:時(shí)間序列數(shù)據(jù)LCA

第20章 市場(chǎng)細(xì)分:理解細(xì)分群體的便捷途徑

第21章 統(tǒng)計(jì)回歸模型:理解模型的簡(jiǎn)單方法

第22章 CHAID:填充缺失值的方法

第23章 大數(shù)據(jù)建模

第24章 藝術(shù)、科學(xué)、數(shù)字和詩(shī)歌

第25章 識(shí)別最佳客戶:描述性、預(yù)測(cè)性和相似性描述

第26章 營(yíng)銷模型評(píng)估

第27章 十分位分析:視角與效果

第28章 T-C凈提升度模型:評(píng)估試驗(yàn)組與對(duì)照組的營(yíng)銷效果

第29章 自助法在營(yíng)銷中的應(yīng)用:一種新的模型驗(yàn)證方法

第30章 用自助法驗(yàn)證邏輯斯諦回歸模型

第31章 營(yíng)銷模型可視化:用數(shù)據(jù)深度挖掘模型

第32章 預(yù)測(cè)貢獻(xiàn)系數(shù):預(yù)測(cè)重要性的度量

第33章 建模是藝術(shù)、科學(xué)與詩(shī)的結(jié)合

第34章 獻(xiàn)給數(shù)據(jù)狂的數(shù)據(jù)分析12步法

第35章 遺傳回歸模型與統(tǒng)計(jì)回歸模型

第36章 數(shù)據(jù)重用:GenIQ模型的強(qiáng)大數(shù)據(jù)挖掘技術(shù)

第37章 數(shù)據(jù)挖掘技術(shù)——離群值的調(diào)整

第38章 過(guò)擬合的全新解決方案

第39章 回顧:為何校直數(shù)據(jù)如此重要

第40章 GenIQ模型的定義與應(yīng)用

第41章 如何為營(yíng)銷模型選擇最佳變量

第42章 解讀無(wú)系數(shù)模型

第43章 文本挖掘:入門、示例及TXTDM軟件

第44章 一些我比較喜歡的統(tǒng)計(jì)子程序

譯后記 2100433B

統(tǒng)計(jì)挖掘與機(jī)器學(xué)習(xí)(原書第3版)作品簡(jiǎn)介常見(jiàn)問(wèn)題

統(tǒng)計(jì)挖掘與機(jī)器學(xué)習(xí)(原書第3版)作品簡(jiǎn)介文獻(xiàn)

基于機(jī)器學(xué)習(xí)的推薦系統(tǒng) 基于機(jī)器學(xué)習(xí)的推薦系統(tǒng)

格式:pdf

大?。?span id="vo0z5lj" class="single-tag-height">605KB

頁(yè)數(shù): 1頁(yè)

評(píng)分: 4.7

基于機(jī)器學(xué)習(xí)的推薦系統(tǒng)

立即下載
第3章機(jī)器零件用鋼 第3章機(jī)器零件用鋼

格式:pdf

大?。?span id="bwphfpq" class="single-tag-height">605KB

頁(yè)數(shù): 97頁(yè)

評(píng)分: 4.3

第3章機(jī)器零件用鋼

立即下載

本書是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域的經(jīng)典暢銷教材,被國(guó)內(nèi)外眾多名校選用。第4版新增了關(guān)于深度學(xué)習(xí)和概率方法的重要章節(jié),同時(shí),備受歡迎的機(jī)器學(xué)習(xí)軟件Weka也再度升級(jí)。書中全面覆蓋了該領(lǐng)域的實(shí)用技術(shù),致力于幫助讀者理解不同技術(shù)的工作方式和應(yīng)用方式,從而學(xué)會(huì)在工程實(shí)踐和商業(yè)項(xiàng)目中解決真實(shí)問(wèn)題。本書適合作為高等院校相關(guān)課程的教材,同時(shí)也適合業(yè)內(nèi)技術(shù)人員閱讀參考。

譯者序

前言

致謝

第一部分 數(shù)據(jù)挖掘基礎(chǔ)

第1章 緒論 2

1.1 數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí) 2

1.1.1 描述結(jié)構(gòu)模式 3

1.1.2 機(jī)器學(xué)習(xí) 5

1.1.3 數(shù)據(jù)挖掘 6

1.2 簡(jiǎn)單的例子:天氣問(wèn)題和其他問(wèn)題 6

1.2.1 天氣問(wèn)題 6

1.2.2 隱形眼鏡:一個(gè)理想化的問(wèn)題 8

1.2.3 鳶尾花:一個(gè)經(jīng)典的數(shù)值型數(shù)據(jù)集 9

1.2.4 CPU性能:引入數(shù)值預(yù)測(cè) 10

1.2.5 勞資協(xié)商:一個(gè)更真實(shí)的例子 11

1.2.6 大豆分類:一個(gè)經(jīng)典的機(jī)器學(xué)習(xí)的成功例子 12

1.3 應(yīng)用領(lǐng)域 14

1.3.1 Web挖掘 14

1.3.2 包含判斷的決策 15

1.3.3 圖像篩選 15

1.3.4 負(fù)載預(yù)測(cè) 16

1.3.5 診斷 17

1.3.6 市場(chǎng)和銷售 17

1.3.7 其他應(yīng)用 18

1.4 數(shù)據(jù)挖掘過(guò)程 19

1.5 機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué) 20

1.6 將泛化看作搜索 21

1.6.1 枚舉概念空間 22

1.6.2 偏差 22

1.7 數(shù)據(jù)挖掘和道德問(wèn)題 24

1.7.1 再識(shí)別 24

1.7.2 使用個(gè)人信息 25

1.7.3 其他問(wèn)題 26

1.8 拓展閱讀及參考文獻(xiàn) 26

第2章 輸入:概念、實(shí)例和屬性 29

2.1 概念 29

2.2 實(shí)例 31

2.2.1 關(guān)系 31

2.2.2 其他實(shí)例類型 34

2.3 屬性 35

2.4 輸入準(zhǔn)備 36

2.4.1 數(shù)據(jù)收集 37

2.4.2 ARFF格式 37

2.4.3 稀疏數(shù)據(jù) 39

2.4.4 屬性類型 40

2.4.5 缺失值 41

2.4.6 不正確的值 42

2.4.7 非均衡數(shù)據(jù) 42

2.4.8 了解數(shù)據(jù) 43

2.5 拓展閱讀及參考文獻(xiàn) 43

第3章 輸出:知識(shí)表達(dá) 44

3.1 表 44

3.2 線性模型 44

3.3 樹(shù) 46

3.4 規(guī)則 49

3.4.1 分類規(guī)則 49

3.4.2 關(guān)聯(lián)規(guī)則 52

3.4.3 包含例外的規(guī)則 53

3.4.4 表達(dá)能力更強(qiáng)的規(guī)則 54

3.5 基于實(shí)例的表達(dá) 56

3.6 聚類 58

3.7 拓展閱讀及參考文獻(xiàn) 59

第4章 算法:基本方法 60

4.1 推斷基本規(guī)則 60

4.2 簡(jiǎn)單概率模型 63

4.2.1 缺失值和數(shù)值屬性 65

4.2.2 用于文檔分類的樸素貝葉斯 67

4.2.3 討論 68

4.3 分治法:創(chuàng)建決策樹(shù) 69

4.3.1 計(jì)算信息量 71

4.3.2 高度分支屬性 73

4.4 覆蓋算法:建立規(guī)則 74

4.4.1 規(guī)則與樹(shù) 75

4.4.2 一個(gè)簡(jiǎn)單的覆蓋算法 76

4.4.3 規(guī)則與決策列表 79

4.5 關(guān)聯(lián)規(guī)則挖掘 79

4.5.1 項(xiàng)集 80

4.5.2 關(guān)聯(lián)規(guī)則 81

4.5.3 高效地生成規(guī)則 84

4.6 線性模型 86

4.6.1 數(shù)值預(yù)測(cè):線性回歸 86

4.6.2 線性分類:logistic回歸 87

4.6.3 使用感知機(jī)的線性分類 89

4.6.4 使用Winnow的線性分類 90

4.7 基于實(shí)例的學(xué)習(xí) 91

4.7.1 距離函數(shù) 92

4.7.2 高效尋找最近鄰 92

4.7.3 討論 96

4.8 聚類 96

4.8.1 基于距離的迭代聚類 97

4.8.2 更快的距離計(jì)算 98

4.8.3 選擇簇的個(gè)數(shù) 99

4.8.4 層次聚類 100

4.8.5 層次聚類示例 101

4.8.6 增量聚類 102

4.8.7 分類效用 104

4.8.8 討論 106

4.9 多實(shí)例學(xué)習(xí) 107

4.9.1 聚集輸入 107

4.9.2 聚集輸出 107

4.10 拓展閱讀及參考文獻(xiàn) 108

4.11 Weka實(shí)現(xiàn) 109

第5章 可信度:評(píng)估學(xué)習(xí)結(jié)果 111

5.1 訓(xùn)練和測(cè)試 111

5.2 預(yù)測(cè)性能 113

5.3 交叉驗(yàn)證 115

5.4 其他評(píng)估方法 116

5.4.1 留一交叉驗(yàn)證法 116

5.4.2 自助法 116

5.5 超參數(shù)選擇 117

5.6 數(shù)據(jù)挖掘方法比較 118

5.7 預(yù)測(cè)概率 121

5.7.1 二次損失函數(shù) 121

5.7.2 信息損失函數(shù) 122

5.7.3 討論 123

5.8 計(jì)算成本 123

5.8.1 成本敏感分類 125

5.8.2 成本敏感學(xué)習(xí) 126

5.8.3 提升圖 126

5.8.4 ROC曲線 129

5.8.5 召回率–精確率曲線 130

5.8.6 討論 131

5.8.7 成本曲線 132

5.9 評(píng)估數(shù)值預(yù)測(cè) 134

5.10 最小描述長(zhǎng)度原理 136

5.11 將MDL原理應(yīng)用于聚類 138

5.12 使用驗(yàn)證集進(jìn)行模型選擇 138

5.13 拓展閱讀及參考文獻(xiàn) 139

第二部分 高級(jí)機(jī)器學(xué)習(xí)方案

第6章 樹(shù)和規(guī)則 144

6.1 決策樹(shù) 144

6.1.1 數(shù)值屬性 144

6.1.2 缺失值 145

6.1.3 剪枝 146

6.1.4 估計(jì)誤差率 147

6.1.5 決策樹(shù)歸納法的復(fù)雜度 149

6.1.6 從決策樹(shù)到規(guī)則 150

6.1.7 C4.5:選擇和選項(xiàng) 150

6.1.8 成本–復(fù)雜度剪枝 151

6.1.9 討論 151

6.2 分類規(guī)則 152

6.2.1 選擇測(cè)試的標(biāo)準(zhǔn) 152

6.2.2 缺失值和數(shù)值屬性 153

6.2.3 生成好的規(guī)則 153

6.2.4 使用全局優(yōu)化 155

6.2.5 從局部決策樹(shù)中獲得規(guī)則 157

6.2.6 包含例外的規(guī)則 158

6.2.7 討論 160

6.3 關(guān)聯(lián)規(guī)則 161

6.3.1 建立頻繁模式樹(shù) 161

6.3.2 尋找大項(xiàng)集 163

6.3.3 討論 166

6.4 Weka 實(shí)現(xiàn) 167

第7章 基于實(shí)例的學(xué)習(xí)和線性模型的擴(kuò)展 168

7.1 基于實(shí)例的學(xué)習(xí) 168

7.1.1 減少樣本集的數(shù)量 168

7.1.2 對(duì)噪聲樣本集剪枝 169

7.1.3 屬性加權(quán) 170

7.1.4 泛化樣本集 170

7.1.5 用于泛化樣本集的距離函數(shù) 171

7.1.6 泛化的距離函數(shù) 172

7.1.7 討論 172

7.2 擴(kuò)展線性模型 173

7.2.1 最大間隔超平面 173

7.2.2 非線性類邊界 174

7.2.3 支持向量回歸 176

7.2.4 核嶺回歸 177

7.2.5 核感知機(jī) 178

7.2.6 多層感知機(jī) 179

7.2.7 徑向基函數(shù)網(wǎng)絡(luò) 184

7.2.8 隨機(jī)梯度下降 185

7.2.9 討論 186

7.3 局部線性模型用于數(shù)值預(yù)測(cè) 187

7.3.1 模型樹(shù) 187

7.3.2 構(gòu)建樹(shù) 188

7.3.3 對(duì)樹(shù)剪枝 188

7.3.4 名目屬性 189

7.3.5 缺失值 189

7.3.6 模型樹(shù)歸納的偽代碼 190

7.3.7 從模型樹(shù)到規(guī)則 192

7.3.8 局部加權(quán)線性回歸 192

7.3.9 討論 193

7.4 Weka實(shí)現(xiàn) 194

第8章 數(shù)據(jù)轉(zhuǎn)換 195

8.1 屬性選擇 196

8.1.1 獨(dú)立于方案的選擇 197

8.1.2 搜索屬性空間 199

8.1.3 具體方案相關(guān)的選擇 200

8.2 離散化數(shù)值屬性 201

8.2.1 無(wú)監(jiān)督離散化 202

8.2.2 基于熵的離散化 203

8.2.3 其他離散化方法 205

8.2.4 基于熵和基于誤差的離散化 205

8.2.5 將離散屬性轉(zhuǎn)換成數(shù)值屬性 206

8.3 投影 207

8.3.1 主成分分析 207

8.3.2 隨機(jī)投影 209

8.3.3 偏最小二乘回歸 209

8.3.4 獨(dú)立成分分析 210

8.3.5 線性判別分析 211

8.3.6 二次判別分析 211

8.3.7 Fisher線性判別分析 211

8.3.8 從文本到屬性向量 212

8.3.9 時(shí)間序列 213

8.4 抽樣 214

8.5 數(shù)據(jù)清洗 215

8.5.1 改進(jìn)決策樹(shù) 215

8.5.2 穩(wěn)健回歸 215

8.5.3 檢測(cè)異常 216

8.5.4 一分類學(xué)習(xí) 217

8.5.5 離群點(diǎn)檢測(cè) 217

8.5.6 生成人工數(shù)據(jù) 218

8.6 將多分類問(wèn)題轉(zhuǎn)換成二分類問(wèn)題 219

8.6.1 簡(jiǎn)單方法 219

8.6.2 誤差校正輸出編碼 220

8.6.3 集成嵌套二分法 221

8.7 校準(zhǔn)類概率 223

8.8 拓展閱讀及參考文獻(xiàn) 224

8.9 Weka實(shí)現(xiàn) 226

第9章 概率方法 228

9.1 基礎(chǔ) 228

9.1.1 最大似然估計(jì) 229

9.1.2 最大后驗(yàn)參數(shù)估計(jì) 230

9.2 貝葉斯網(wǎng)絡(luò) 230

9.2.1 預(yù)測(cè) 231

9.2.2 學(xué)習(xí)貝葉斯網(wǎng)絡(luò) 233

9.2.3 具體算法 235

9.2.4 用于快速學(xué)習(xí)的數(shù)據(jù)結(jié)構(gòu) 237

9.3 聚類和概率密度估計(jì) 239

9.3.1 用于高斯混合模型的期望最大化算法 239

9.3.2 擴(kuò)展混合模型 242

9.3.3 使用先驗(yàn)分布聚類 243

9.3.4 相關(guān)屬性聚類 244

9.3.5 核密度估計(jì) 245

9.3.6 比較用于分類的參數(shù)、半?yún)?shù)和無(wú)參數(shù)的密度模型 245

9.4 隱藏變量模型 246

9.4.1 對(duì)數(shù)似然和梯度的期望 246

9.4.2 期望最大化算法 247

9.4.3 將期望最大化算法應(yīng)用于貝葉斯網(wǎng)絡(luò) 248

9.5 貝葉斯估計(jì)與預(yù)測(cè) 249

9.6 圖模型和因子圖 251

9.6.1 圖模型和盤子表示法 251

9.6.2 概率主成分分析 252

9.6.3 隱含語(yǔ)義分析 254

9.6.4 使用主成分分析來(lái)降維 255

9.6.5 概率LSA 256

9.6.6 隱含狄利克雷分布 257

9.6.7 因子圖 258

9.6.8 馬爾可夫隨機(jī)場(chǎng) 260

9.6.9 使用sum-product算法和max-product算法進(jìn)行計(jì)算 261

9.7 條件概率模型 265

9.7.1 概率模型的線性和多項(xiàng)式回歸 265

9.7.2 使用先驗(yàn)參數(shù) 266

9.7.3 多分類logistic回歸 268

9.7.4 梯度下降和二階方法 271

9.7.5 廣義線性模型 271

9.7.6 有序類的預(yù)測(cè) 272

9.7.7 使用核函數(shù)的條件概率模型 273

9.8 時(shí)序模型 273

9.8.1 馬爾可夫模型和N元法 273

9.8.2 隱馬爾可夫模型 274

9.8.3 條件隨機(jī)場(chǎng) 275

9.9 拓展閱讀及參考文獻(xiàn) 278

9.10 Weka實(shí)現(xiàn) 282

第10章 深度學(xué)習(xí) 283

10.1 深度前饋網(wǎng)絡(luò) 284

10.1.1 MNIST評(píng)估 284

10.1.2 損失和正則化 285

10.1.3 深層網(wǎng)絡(luò)體系結(jié)構(gòu) 286

10.1.4 激活函數(shù) 287

10.1.5 重新審視反向傳播 288

10.1.6 計(jì)算圖以及復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu) 290

10.1.7 驗(yàn)證反向傳播算法的實(shí)現(xiàn) 291

10.2 訓(xùn)練和評(píng)估深度網(wǎng)絡(luò) 292

10.2.1 早停 292

10.2.2 驗(yàn)證、交叉驗(yàn)證以及超參數(shù)調(diào)整 292

10.2.3 小批量隨機(jī)梯度下降 293

10.2.4 小批量隨機(jī)梯度下降的偽代碼 294

10.2.5 學(xué)習(xí)率和計(jì)劃 294

10.2.6 先驗(yàn)參數(shù)的正則化 295

10.2.7 丟棄法 295

10.2.8 批規(guī)范化 295

10.2.9 參數(shù)初始化 295

10.2.10 無(wú)監(jiān)督的預(yù)訓(xùn)練 296

10.2.11 數(shù)據(jù)擴(kuò)充和合成轉(zhuǎn)換 296

10.3 卷積神經(jīng)網(wǎng)絡(luò) 296

10.3.1 ImageNet評(píng)估和深度卷積神經(jīng)網(wǎng)絡(luò) 297

10.3.2 從圖像濾波到可學(xué)習(xí)的卷積層 297

10.3.3 卷積層和梯度 300

10.3.4 池化層二次抽樣層以及梯度 300

10.3.5 實(shí)現(xiàn) 301

10.4 自編碼器 301

10.4.1 使用RBM預(yù)訓(xùn)練深度自編碼器 302

10.4.2 降噪自編碼器和分層訓(xùn)練 304

10.4.3 重構(gòu)和判別式學(xué)習(xí)的結(jié)合 304

10.5 隨機(jī)深度網(wǎng)絡(luò) 304

10.5.1 玻爾茲曼機(jī) 304

10.5.2 受限玻爾茲曼機(jī) 306

10.5.3 對(duì)比分歧 306

10.5.4 分類變量和連續(xù)變量 306

10.5.5 深度玻爾茲曼機(jī) 307

10.5.6 深度信念網(wǎng)絡(luò) 308

10.6 遞歸神經(jīng)網(wǎng)絡(luò) 309

10.6.1 梯度爆炸與梯度消失 310

10.6.2 其他遞歸網(wǎng)絡(luò)結(jié)構(gòu) 311

10.7 拓展閱讀及參考文獻(xiàn) 312

10.8 深度學(xué)習(xí)軟件以及網(wǎng)絡(luò)實(shí)現(xiàn) 315

10.8.1 Theano 315

10.8.2 Tensor Flow 315

10.8.3 Torch 315

10.8.4 CNTK 315

10.8.5 Caffe 315

10.8.6 DeepLearning4j 316

10.8.7 其他包:Lasagne、Keras以及cuDNN 316

10.9 Weka實(shí)現(xiàn) 316

第11章 有監(jiān)督和無(wú)監(jiān)督學(xué)習(xí) 317

11.1 半監(jiān)督學(xué)習(xí) 317

11.1.1 用以分類的聚類 317

11.1.2 協(xié)同訓(xùn)練 318

11.1.3 EM和協(xié)同訓(xùn)練 319

11.1.4 神經(jīng)網(wǎng)絡(luò)方法 319

11.2 多實(shí)例學(xué)習(xí) 320

11.2.1 轉(zhuǎn)換為單實(shí)例學(xué)習(xí) 320

11.2.2 升級(jí)學(xué)習(xí)算法 321

11.2.3 專用多實(shí)例方法 322

11.3 拓展閱讀及參考文獻(xiàn) 323

11.4 Weka實(shí)現(xiàn) 323

第12章 集成學(xué)習(xí) 325

12.1 組合多種模型 325

12.2 裝袋 326

12.2.1 偏差–方差分解 326

12.2.2 考慮成本的裝袋 327

12.3 隨機(jī)化 328

12.3.1 隨機(jī)化與裝袋 328

12.3.2 旋轉(zhuǎn)森林 329

12.4 提升 329

12.4.1 AdaBoost算法 330

12.4.2 提升算法的威力 331

12.5 累加回歸 332

12.5.1 數(shù)值預(yù)測(cè) 332

12.5.2 累加logistic回歸 333

12.6 可解釋的集成器 334

12.6.1 選擇樹(shù) 334

12.6.2 logistic模型樹(shù) 336

12.7 堆棧 336

12.8 拓展閱讀及參考文獻(xiàn) 338

12.9 Weka實(shí)現(xiàn) 339

第13章 擴(kuò)展和應(yīng)用 340

13.1 應(yīng)用機(jī)器學(xué)習(xí) 340

13.2 從大型的數(shù)據(jù)集學(xué)習(xí) 342

13.3 數(shù)據(jù)流學(xué)習(xí) 344

13.4 融合領(lǐng)域知識(shí) 346

13.5 文本挖掘 347

13.5.1 文檔分類與聚類 348

13.5.2 信息提取 349

13.5.3 自然語(yǔ)言處理 350

13.6 Web挖掘 350

13.6.1 包裝器歸納 351

13.6.2 網(wǎng)頁(yè)分級(jí) 351

13.7 圖像和語(yǔ)音 353

13.7.1 圖像 353

13.7.2 語(yǔ)音 354

13.8 對(duì)抗情形 354

13.9 無(wú)處不在的數(shù)據(jù)挖掘 355

13.10 拓展閱讀及參考文獻(xiàn) 357

13.11 Weka實(shí)現(xiàn) 359

附錄A 理論基礎(chǔ) 360

附錄B Weka工作平臺(tái) 375

索引 388

參考文獻(xiàn)2100433B

本書通過(guò)講解監(jiān)督學(xué)習(xí)的兩大支柱——回歸和分類——將機(jī)器學(xué)習(xí)納入統(tǒng)一視角展開(kāi)討論。書中首先討論基礎(chǔ)知識(shí),包括均方、*小二乘和*大似然方法、嶺回歸、貝葉斯決策理論分類、邏輯回歸和決策樹(shù)。然后介紹新近的技術(shù),包括稀疏建模方法,再生核希爾伯特空間中的學(xué)習(xí)、支持向量機(jī)中的學(xué)習(xí)、關(guān)注EM算法的貝葉斯推理及其近似推理變分版本、蒙特卡羅方法、聚焦于貝葉斯網(wǎng)絡(luò)的概率圖模型、隱馬爾科夫模型和粒子濾波。此外,本書還深入討論了降維和隱藏變量建模。全書以關(guān)于神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)架構(gòu)的擴(kuò)展章節(jié)結(jié)束。此外,書中還討論了統(tǒng)計(jì)參數(shù)估計(jì)、維納和卡爾曼濾波、凸性和凸優(yōu)化的基礎(chǔ)知識(shí),其中,用一章介紹了隨機(jī)逼近和梯度下降族的算法,并提出了分布式優(yōu)化的相關(guān)概念、算法和在線學(xué)習(xí)技術(shù)。

統(tǒng)計(jì)挖掘與機(jī)器學(xué)習(xí)(原書第3版)相關(guān)推薦
  • 相關(guān)百科
  • 相關(guān)知識(shí)
  • 相關(guān)專欄

最新詞條

安徽省政采項(xiàng)目管理咨詢有限公司 數(shù)字景楓科技發(fā)展(南京)有限公司 懷化市人民政府電子政務(wù)管理辦公室 河北省高速公路京德臨時(shí)籌建處 中石化華東石油工程有限公司工程技術(shù)分公司 手持無(wú)線POS機(jī) 廣東合正采購(gòu)招標(biāo)有限公司 上海城建信息科技有限公司 甘肅鑫禾國(guó)際招標(biāo)有限公司 燒結(jié)金屬材料 齒輪計(jì)量泵 廣州采陽(yáng)招標(biāo)代理有限公司河源分公司 高鋁碳化硅磚 博洛尼智能科技(青島)有限公司 燒結(jié)剛玉磚 深圳市東海國(guó)際招標(biāo)有限公司 搭建香蕉育苗大棚 SF計(jì)量單位 福建省中億通招標(biāo)咨詢有限公司 泛海三江 威海鼠尾草 廣東國(guó)咨招標(biāo)有限公司 Excel 數(shù)據(jù)處理與分析應(yīng)用大全 甘肅中泰博瑞工程項(xiàng)目管理咨詢有限公司 山東創(chuàng)盈項(xiàng)目管理有限公司 拆邊機(jī) 當(dāng)代建筑大師 廣西北纜電纜有限公司 大山檳榔 上海地鐵維護(hù)保障有限公司通號(hào)分公司 舌花雛菊 甘肅中維國(guó)際招標(biāo)有限公司 華潤(rùn)燃?xì)猓ㄉ虾#┯邢薰? 湖北鑫宇陽(yáng)光工程咨詢有限公司 GB8163標(biāo)準(zhǔn)無(wú)縫鋼管 中國(guó)石油煉化工程建設(shè)項(xiàng)目部 韶關(guān)市優(yōu)采招標(biāo)代理有限公司 莎草目 建設(shè)部關(guān)于開(kāi)展城市規(guī)劃動(dòng)態(tài)監(jiān)測(cè)工作的通知 電梯平層準(zhǔn)確度 廣州利好來(lái)電氣有限公司 蘇州弘創(chuàng)招投標(biāo)代理有限公司