注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)計(jì)算機(jī)科學(xué)理論與基礎(chǔ)知識(shí)數(shù)據(jù)科學(xué):理論、方法與R語(yǔ)言實(shí)踐

數(shù)據(jù)科學(xué):理論、方法與R語(yǔ)言實(shí)踐

數(shù)據(jù)科學(xué):理論、方法與R語(yǔ)言實(shí)踐

定 價(jià):¥69.00

作 者: 尼娜
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 程序設(shè)計(jì) 計(jì)算機(jī)/網(wǎng)絡(luò)

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787111529262 出版時(shí)間: 2016-03-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 321 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)從實(shí)用的角度較為全面地展現(xiàn)了數(shù)據(jù)科學(xué)的主要內(nèi)容,并結(jié)合大量的實(shí)際項(xiàng)目案例,利用R語(yǔ)言詳細(xì)地講解了數(shù)據(jù)項(xiàng)目的開(kāi)發(fā)過(guò)程和關(guān)鍵技術(shù)。本書(shū)包括三個(gè)部分共11章的內(nèi)容,主要介紹了數(shù)據(jù)科學(xué)項(xiàng)目的處理過(guò)程、選擇合適的建模方法,也討論了bagging算法、隨機(jī)森林、廣義加性模型、核和支持向量機(jī)等高級(jí)建模方法。此外,還討論了文檔編制和結(jié)果部署,以及如何向組織內(nèi)不同的受眾展現(xiàn)項(xiàng)目結(jié)果。本書(shū)適合作為高等院校高年級(jí)本科生和研究生及從事數(shù)據(jù)管理與分析工程技術(shù)人員的主要參考書(shū)。

作者簡(jiǎn)介

暫缺《數(shù)據(jù)科學(xué):理論、方法與R語(yǔ)言實(shí)踐》作者簡(jiǎn)介

圖書(shū)目錄

目  錄譯者序序言前言第一部分 數(shù)據(jù)科學(xué)引論第1章 數(shù)據(jù)科學(xué)處理過(guò)程21.1 數(shù)據(jù)科學(xué)項(xiàng)目中的角色21.2 數(shù)據(jù)科學(xué)項(xiàng)目的階段41.2.1 制定目標(biāo)51.2.2 收集和管理數(shù)據(jù)51.2.3 建立模型71.2.4 模型評(píng)價(jià)和批判81.2.5 展現(xiàn)和編制文檔91.2.6 模型部署和維護(hù)101.3 設(shè)定預(yù)期111.4 小結(jié)12第2章 向R加載數(shù)據(jù)142.1 運(yùn)用文件中的數(shù)據(jù)142.1.1 在源自文件或URL的良結(jié)構(gòu)數(shù)據(jù)上使用R152.1.2 在欠結(jié)構(gòu)數(shù)據(jù)上使用R172.2 在關(guān)系數(shù)據(jù)庫(kù)上使用R192.2.1 一個(gè)生產(chǎn)規(guī)模的示例202.2.2 從數(shù)據(jù)庫(kù)向R系統(tǒng)加載數(shù)據(jù)232.2.3 處理PUMS數(shù)據(jù)252.3 小結(jié)28第3章 探索數(shù)據(jù)293.1 使用概要統(tǒng)計(jì)方法發(fā)現(xiàn)問(wèn)題303.2 用圖形和可視化方法發(fā)現(xiàn)問(wèn)題343.2.1 可視化檢測(cè)單變量的分布353.2.2 可視化檢測(cè)兩個(gè)變量間的關(guān)系423.3 小結(jié)51第4章 管理數(shù)據(jù)524.1 清洗數(shù)據(jù)524.1.1 處理缺失值524.1.2 數(shù)據(jù)轉(zhuǎn)換564.2 為建模和驗(yàn)證采樣614.2.1 測(cè)試集和訓(xùn)練集的劃分614.2.2 創(chuàng)建一個(gè)樣本組列624.2.3 記錄分組634.2.4 數(shù)據(jù)溯源634.3 小結(jié)63第二部分 建模方法第5章 選擇和評(píng)價(jià)模型665.1 將業(yè)務(wù)問(wèn)題映射到機(jī)器學(xué)習(xí)任務(wù)675.1.1 解決分類問(wèn)題675.1.2 解決打分問(wèn)題685.1.3 目標(biāo)未知情況下的處理695.1.4 問(wèn)題到方法的映射715.2 模型評(píng)價(jià)715.2.1 分類模型的評(píng)價(jià)725.2.2 打分模型的評(píng)價(jià)765.2.3 概率模型的評(píng)價(jià)785.2.4 排名模型的評(píng)價(jià)825.2.5 聚類模型的評(píng)價(jià)825.3 模型驗(yàn)證845.3.1 常見(jiàn)的模型問(wèn)題的識(shí)別 845.3.2 模型可靠性的量化855.3.3 模型質(zhì)量的保證865.4 小結(jié)88第6章 記憶化方法896.1 KDD和KDD Cup 2009896.2 構(gòu)建單變量模型916.2.1 使用類別型特征926.2.2 使用數(shù)值型特征946.2.3 使用交叉驗(yàn)證估計(jì)過(guò)擬合的影響966.3 構(gòu)建多變量模型976.3.1 變量選擇976.3.2 使用決策樹(shù)996.3.3 使用最近鄰方法1026.3.4 使用樸素貝葉斯1056.4 小結(jié)108第7章 線性回歸與邏輯斯諦回歸1107.1 使用線性回歸1107.1.1 理解線性回歸1107.1.2 構(gòu)建線性回歸模型1137.1.3 預(yù)測(cè)1147.1.4 發(fā)現(xiàn)關(guān)系并抽取建議1177.1.5 解讀模型概要并刻畫(huà)系數(shù)質(zhì)量1187.1.6 線性回歸要點(diǎn)1227.2 使用邏輯斯諦回歸1237.2.1 理解邏輯斯諦回歸1237.2.2 構(gòu)建邏輯斯諦回歸模型1247.2.3 預(yù)測(cè)1257.2.4 從邏輯斯諦回歸模型中發(fā)現(xiàn)關(guān)系并抽取建議1297.2.5 解讀模型概要并刻畫(huà)系數(shù)1307.2.6 邏輯斯諦回歸要點(diǎn)1367.3 小結(jié)137第8章 無(wú)監(jiān)督方法1388.1 聚類分析1388.1.1 距離1398.1.2 準(zhǔn)備數(shù)據(jù) 1408.1.3 使用hclust()進(jìn)行層次聚類1428.1.4 k-均值算法1508.1.5 分派新的點(diǎn)到簇1548.1.6 聚類要點(diǎn)1568.2 關(guān)聯(lián)規(guī)則1568.2.1 關(guān)聯(lián)規(guī)則概述1568.2.2 問(wèn)題舉例1578.2.3 使用arules程序包挖掘關(guān)聯(lián)規(guī)則1588.2.4 關(guān)聯(lián)規(guī)則要點(diǎn)1658.3 小結(jié)165第9章 高級(jí)方法探索1669.1 使用bagging和隨機(jī)森林方法減少訓(xùn)練方差1679.1.1 使用bagging方法改進(jìn)預(yù)測(cè)1679.1.2 使用隨機(jī)森林方法進(jìn)一步改進(jìn)預(yù)測(cè)1709.1.3 bagging和隨機(jī)森林方法要點(diǎn)1739.2 使用廣義加性模型學(xué)習(xí)非單調(diào)關(guān)系1739.2.1 理解GAM1749.2.2 一維回歸示例1749.2.3 提取非線性關(guān)系1789.2.4 在真實(shí)數(shù)據(jù)上使用GAM1799.2.5 使用GAM實(shí)現(xiàn)邏輯斯諦回歸1829.2.6 GAM要點(diǎn)1839.3 使用核方法提高數(shù)據(jù)可分性1839.3.1 理解核函數(shù)1849.3.2 在問(wèn)題中使用顯式核函數(shù)1879.3.3 核方法要點(diǎn)1909.4 使用SVM對(duì)復(fù)雜的決策邊界建模1909.4.1 理解支持向量機(jī)1909.4.2 在人工示例數(shù)據(jù)中使用SVM1929.4.3 在真實(shí)數(shù)據(jù)中使用SVM1959.4.4 支持向量機(jī)要點(diǎn)1979.5 小結(jié)197第三部分 結(jié)果交付第10章 文檔編制和部署20010.1 buzz數(shù)據(jù)集20010.2 使用knitr產(chǎn)生里程碑文檔20210.2.1 knitr是什么20210.2.2 knitr 技術(shù)詳解20410.2.3 使用knitr編寫(xiě)buzz數(shù)據(jù)文檔20510.3 在運(yùn)行時(shí)文檔編制中使用注釋和版本控制20810.3.1 編寫(xiě)有效注釋20810.3.2 使用版本控制記錄歷史20910.3.3 使用版本控制探索項(xiàng)目21310.3.4 使用版本控制分享工作21710.4 模型部署22010.4.1 將模型部署為R HTTP服務(wù)22010.4.2 按照輸出部署模型22210.4.3 要點(diǎn)22310.5 小結(jié)224第11章 有效的結(jié)果展現(xiàn)22611.1 將結(jié)果展現(xiàn)給項(xiàng)目出資方22711.1.1 概述項(xiàng)目目標(biāo)22811.1.2 陳述項(xiàng)目結(jié)果22911.1.3 補(bǔ)充細(xì)節(jié)23011.1.4 提出建議并討論未來(lái)工作23111.1.5 向項(xiàng)目出資方展現(xiàn)的要點(diǎn)23211.2 向最終用戶展現(xiàn)模型23211.2.1 概述項(xiàng)目目標(biāo)23211.2.2 展現(xiàn)模型如何融入用戶的工作流程23311.2.3 展現(xiàn)如何使用模型23511.2.4 向最終用戶展現(xiàn)的要點(diǎn)23611.3 向其他數(shù)據(jù)科學(xué)家展現(xiàn)你的工作23611.3.1 介紹問(wèn)題23611.3.2 討論相關(guān)工作23711.3.3 討論你的方法23811.3.4 討論結(jié)果和未來(lái)工作23911.3.5 向其他數(shù)據(jù)科學(xué)家展現(xiàn)的要點(diǎn)24011.4 小結(jié)240附錄A 使用R和其他工具241附錄B 重要的統(tǒng)計(jì)學(xué)概念263附錄C 更多的工具和值得探索的思路292參考文獻(xiàn)297索引299

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)