注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)數(shù)據(jù)挖掘與R語(yǔ)言(原書第2版)

數(shù)據(jù)挖掘與R語(yǔ)言(原書第2版)

數(shù)據(jù)挖掘與R語(yǔ)言(原書第2版)

定 價(jià):¥99.00

作 者: [葡] 路易斯·托爾戈 著,李洪成 譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 數(shù)據(jù)科學(xué)與工程技術(shù)叢書
標(biāo) 簽: 暫缺

ISBN: 9787111596660 出版時(shí)間: 2018-05-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 343 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書面向初學(xué)者,通過(guò)實(shí)踐案例講解如何用R進(jìn)行數(shù)據(jù)挖掘。全書包括兩部分,第 一部分介紹R和數(shù)據(jù)挖掘的基礎(chǔ)知識(shí),第二部分為案例研究,通過(guò)預(yù)測(cè)海藻數(shù)量、預(yù)測(cè)股票市場(chǎng)收益、偵測(cè)欺詐交易以及微陣列樣本分類四個(gè)案例培養(yǎng)構(gòu)建解決方案的能力,掌握工具的使用技巧。本書適合作為高校學(xué)生或業(yè)界新手了解R和數(shù)據(jù)挖掘的入門讀本,其中的代碼和數(shù)據(jù)均可免費(fèi)下載。

作者簡(jiǎn)介

  路易斯·托爾戈(Luis Torgo) 加拿大達(dá)爾豪斯大學(xué)計(jì)算機(jī)科學(xué)系教授,葡萄牙波爾圖大學(xué)計(jì)算機(jī)科學(xué)系副教授,紐約大學(xué)斯特恩商學(xué)院特邀教授,人工智能和數(shù)據(jù)分析實(shí)驗(yàn)室(LIAAD,隸屬于INESC Tec)研究員。他擁有近30年的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘研究經(jīng)驗(yàn),在基于樹(shù)的回歸方法和基于效用的預(yù)測(cè)方法方面貢獻(xiàn)卓著。:譯者簡(jiǎn)介: 李洪成 統(tǒng)計(jì)學(xué)博士,現(xiàn)為上海金融學(xué)院副教授,R語(yǔ)言和SPSS統(tǒng)計(jì)分析軟件專家,研究方向?yàn)榻鹑诮y(tǒng)計(jì)和數(shù)據(jù)挖掘。他的代表著作有《SPSS數(shù)據(jù)分析教程》《時(shí)間序列預(yù)測(cè)實(shí)踐教程》等,譯著有《R并行編程實(shí)戰(zhàn)》《機(jī)器學(xué)習(xí)與R語(yǔ)言》等。

圖書目錄

推薦序
中文版序
譯者序
前言
致謝
第1章 簡(jiǎn)介 1
1.1 如何閱讀本書 2
1.2 重現(xiàn)性 2
第一部分 R與數(shù)據(jù)挖掘簡(jiǎn)介
第2章 R簡(jiǎn)介 6
2.1 R起步 6
2.2 與R控制臺(tái)的簡(jiǎn)單交互 8
2.3 R對(duì)象和變量 9
2.4 R函數(shù) 11
2.5 向量 14
2.6 向量化 15
2.7 因子 16
2.8 生成序列 18
2.9 數(shù)據(jù)子集 20
2.10 矩陣和數(shù)組 22
2.11 列表 25
2.12 數(shù)據(jù)框 28
2.13 數(shù)據(jù)框的擴(kuò)展 31
2.14 對(duì)象、類和方法 34
2.15 管理R會(huì)話 35
第3章 數(shù)據(jù)挖掘簡(jiǎn)介 37
3.1 數(shù)據(jù)挖掘鳥瞰圖 37
3.2 數(shù)據(jù)收集和業(yè)務(wù)理解 38
3.2.1 數(shù)據(jù)和數(shù)據(jù)集 39
3.2.2 導(dǎo)入數(shù)據(jù)到R 40
3.3 數(shù)據(jù)預(yù)處理 45
3.3.1 數(shù)據(jù)清洗 45
3.3.2 變換變量 53
3.3.3 生成變量 55
3.3.4 降維 66
3.4 建模 74
3.4.1 探索性數(shù)據(jù)分析 75
3.4.2 使用關(guān)聯(lián)規(guī)則的依賴建模 94
3.4.3 聚類 101
3.4.4 異常檢測(cè) 112
3.4.5 預(yù)測(cè)分析 120
3.5 評(píng)估 147
3.5.1 Holdout和隨機(jī)子抽樣 148
3.5.2 交叉驗(yàn)證 150
3.5.3 Bootstrap估計(jì) 153
3.5.4 推薦程序 154
3.6 報(bào)告和部署 155
3.6.1 通過(guò)動(dòng)態(tài)文檔進(jìn)行報(bào)告 155
3.6.2 通過(guò)Web應(yīng)用程序進(jìn)行部署 158
第二部分 數(shù)據(jù)挖掘案例研究
第4章 預(yù)測(cè)海藻數(shù)量 164
4.1 問(wèn)題描述與目標(biāo) 164
4.2 數(shù)據(jù)說(shuō)明 164
4.3 加載數(shù)據(jù)到R 165
4.4 數(shù)據(jù)可視化和總結(jié) 167
4.5 數(shù)據(jù)缺失 173
4.5.1 將缺失部分剔除 173
4.5.2 嘗試找到缺失值最有可能的賦值 175
4.5.3 通過(guò)變量的相關(guān)關(guān)系填補(bǔ)缺失值 176
4.5.4 通過(guò)探索類似個(gè)案填補(bǔ)缺失值 179
4.6 獲取預(yù)測(cè)模型 180
4.6.1 多元線性回歸 181
4.6.2 回歸樹(shù) 185
4.7 模型評(píng)價(jià)和選擇 189
4.8 預(yù)測(cè)7種海藻的頻率 200
4.9 小結(jié) 202
第5章 預(yù)測(cè)股票市場(chǎng)收益 203
5.1 問(wèn)題描述與目標(biāo) 203
5.2 可用的數(shù)據(jù) 204
5.2.1 從CSV文件讀取數(shù)據(jù) 205
5.2.2 從網(wǎng)站上獲取數(shù)據(jù) 205
5.3 定義預(yù)測(cè)任務(wù) 206
5.3.1 預(yù)測(cè)什么 206
5.3.2 預(yù)測(cè)變量是什么 208
5.3.3 預(yù)測(cè)任務(wù) 212
5.3.4 模型評(píng)價(jià)準(zhǔn)則 213
5.4 預(yù)測(cè)模型 215
5.4.1 如何應(yīng)用訓(xùn)練集數(shù)據(jù)來(lái)建模 215
5.4.2 建模工具 216
5.5 從預(yù)測(cè)到實(shí)踐 222
5.5.1 如何應(yīng)用預(yù)測(cè)模型 222
5.5.2 與交易相關(guān)的評(píng)價(jià)準(zhǔn)則 223
5.5.3 模型集成:仿真交易 224
5.6 模型評(píng)價(jià)和選擇 230
5.6.1 蒙特卡羅估計(jì) 230
5.6.2 實(shí)驗(yàn)比較 231
5.6.3 結(jié)果分析 235
5.7 交易系統(tǒng) 243
5.7.1 評(píng)估最終測(cè)試數(shù)據(jù) 243
5.7.2 在線交易系統(tǒng) 247
5.8 小結(jié) 248
第6章 偵測(cè)欺詐交易 249
6.1 問(wèn)題描述與目標(biāo) 249
6.2 可用的數(shù)據(jù) 249
6.2.1 加載數(shù)據(jù)到R 250
6.2.2 探索數(shù)據(jù)集 250
6.2.3 數(shù)據(jù)問(wèn)題 256
6.3 定義數(shù)據(jù)挖掘任務(wù) 263
6.3.1 問(wèn)題的不同解決方法 263
6.3.2 評(píng)價(jià)準(zhǔn)則 265
6.3.3 實(shí)驗(yàn)方法 270
6.4 計(jì)算離群值的排序 271
6.4.1 無(wú)監(jiān)督方法 271
6.4.2 有監(jiān)督方法 280
6.4.3 半監(jiān)督方法 290
6.5 小結(jié) 295
第7章 微陣列樣本分類 296
7.1 問(wèn)題描述與目標(biāo) 296
7.1.1 微陣列實(shí)驗(yàn)背景簡(jiǎn)介 296
7.1.2 數(shù)據(jù)集ALL 297
7.2 可用的數(shù)據(jù) 297
7.3 基因(特征)選擇 302
7.3.1 基于分布特征的簡(jiǎn)單過(guò)濾方法 302
7.3.2 ANOVA過(guò)濾 304
7.3.3 使用隨機(jī)森林進(jìn)行過(guò)濾 306
7.3.4 使用特征聚類的組合進(jìn)行過(guò)濾 308
7.4 遺傳學(xué)異常的預(yù)測(cè) 309
7.4.1 定義預(yù)測(cè)任務(wù) 309
7.4.2 模型評(píng)價(jià)標(biāo)準(zhǔn) 309
7.4.3 實(shí)驗(yàn)過(guò)程 310
7.4.4 建模技術(shù) 311
7.4.5 模型比較 313
7.5 小結(jié) 320
參考文獻(xiàn) 321
主題索引 332
數(shù)據(jù)挖掘術(shù)語(yǔ)索引 337
R函數(shù)索引 339

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)