123,123

內(nèi)容簡介

　　《大數(shù)據(jù)處理技術(shù)與應(yīng)用》對大數(shù)據(jù)的概念、挖掘、應(yīng)用進(jìn)行了系統(tǒng)的介紹，并且配備了相關(guān)的案例以及實(shí)際操作過程。這種理論與實(shí)踐相結(jié)合的方式能夠極大地幫助讀者掌握大數(shù)據(jù)領(lǐng)域的相關(guān)理論知識(shí)?！洞髷?shù)據(jù)處理技術(shù)與應(yīng)用》共分為10章，主要內(nèi)容包含互聯(lián)網(wǎng)大數(shù)據(jù)概述、互聯(lián)網(wǎng)大數(shù)據(jù)采集與獲取實(shí)戰(zhàn)要領(lǐng)、做好數(shù)據(jù)預(yù)處理的實(shí)戰(zhàn)方法、數(shù)據(jù)相關(guān)性分析與回歸分析的黃金法則、如何利用關(guān)聯(lián)規(guī)則進(jìn)行大數(shù)據(jù)挖掘、大數(shù)據(jù)分析中的四種常見分類算法、大數(shù)據(jù)分析中的四種常見聚類算法，以及自組織神經(jīng)網(wǎng)絡(luò)算法與人工神經(jīng)網(wǎng)絡(luò)算法、互聯(lián)網(wǎng)大數(shù)據(jù)分析應(yīng)用——產(chǎn)品個(gè)性化推薦系統(tǒng)、大數(shù)據(jù)分析在具體行業(yè)中的應(yīng)用等?！洞髷?shù)據(jù)處理技術(shù)與應(yīng)用》知識(shí)體系完善且適用，可作為高等院校大數(shù)據(jù)、人工智能等相關(guān)專業(yè)課程的教材，也可作為從事數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)工作以及其他相關(guān)工程技術(shù)工作人員的參考書。

作者簡介

　　彭進(jìn)香，湖南應(yīng)用技術(shù)學(xué)院信息工程學(xué)院院長，副教授，市級優(yōu)秀教師，“十三五”校級首批重點(diǎn)建設(shè)學(xué)科——計(jì)算機(jī)應(yīng)用技術(shù)學(xué)科建設(shè)負(fù)責(zé)人。近年來主持和參與省、市級教研、科研項(xiàng)目20多項(xiàng)，指導(dǎo)省大學(xué)生研究性學(xué)習(xí)和創(chuàng)新性實(shí)驗(yàn)計(jì)劃項(xiàng)目2項(xiàng)，發(fā)表研究論文20多篇，主編和參編教材6部，專利1項(xiàng)，軟件著作權(quán)2項(xiàng)。對互聯(lián)網(wǎng)企業(yè)從事數(shù)據(jù)挖掘有較深的研究，在大數(shù)據(jù)挖掘、分析及實(shí)戰(zhàn)場景應(yīng)用方面具有深厚經(jīng)驗(yàn)。

圖書目錄

第1章互聯(lián)網(wǎng)大數(shù)據(jù)概述
1．1 認(rèn)識(shí)大數(shù)據(jù)
1．1．1 大數(shù)據(jù)的定義
1．1．2 大數(shù)據(jù)的特征
1．1．3 未來十年大數(shù)據(jù)分析的發(fā)展趨勢
1．2 常用大數(shù)據(jù)處理、分析工具介紹
1．2．1 大數(shù)據(jù)的存儲(chǔ)工具
1．2．2 大數(shù)據(jù)的軟件開發(fā)工具
1．2．3 大數(shù)據(jù)的挖掘工具
1．2．4 大數(shù)據(jù)的可視化工具
小結(jié)
第2章互聯(lián)網(wǎng)大數(shù)據(jù)采集與獲取實(shí)戰(zhàn)要領(lǐng)
2．1 互聯(lián)網(wǎng)大數(shù)據(jù)采集與處理技術(shù)概述
2．1．1 數(shù)據(jù)采集的基本流程與關(guān)鍵技術(shù)
2．1．2 數(shù)據(jù)處理的基本流程與關(guān)鍵技術(shù)
2．2 Web頁面數(shù)據(jù)獲取實(shí)戰(zhàn)方法
2．2．1 Jsoup技術(shù)與頁面數(shù)據(jù)獲取
2．2．2 應(yīng)對特定領(lǐng)域的Deep Web數(shù)據(jù)獲取技術(shù)
2．3 利用爬蟲抓取互聯(lián)網(wǎng)大數(shù)據(jù)實(shí)戰(zhàn)技巧
2．3．1 Python爬蟲工作原理
2．3．2 利用HtmlParser實(shí)現(xiàn)網(wǎng)頁鏈接的提取實(shí)戰(zhàn)
小結(jié)
第3章做好數(shù)據(jù)預(yù)處理的實(shí)戰(zhàn)方法
3．1 數(shù)據(jù)預(yù)處理概述
3．1．1 數(shù)據(jù)預(yù)處理的目的
3．1．2 數(shù)據(jù)預(yù)處理的方法
3．2 從問題分析到數(shù)據(jù)清洗實(shí)戰(zhàn)策略
3．2．1 數(shù)據(jù)清洗的步驟
3．2．2 缺失值的識(shí)別與處理技巧
3．2．3 異常值的判斷、檢驗(yàn)與處理
3．3 數(shù)據(jù)集成與數(shù)據(jù)轉(zhuǎn)換實(shí)戰(zhàn)方法
3．3．1 數(shù)據(jù)集成常見方法
3．3．2 數(shù)據(jù)轉(zhuǎn)換過程中的離散化
3．4 數(shù)據(jù)的特征選擇
3．4．1 常用數(shù)據(jù)特征選擇方法
3．4．2 Relief算法與費(fèi)希爾判別法的應(yīng)用
3．5 數(shù)據(jù)預(yù)處理實(shí)戰(zhàn)案例分析
小結(jié)
第4章數(shù)據(jù)相關(guān)性分析與回歸分析的黃金法則
4．1 什么是數(shù)據(jù)集
4．1．1 數(shù)據(jù)集的概念與常見類型
4．1．2 高效進(jìn)行數(shù)據(jù)度量的實(shí)戰(zhàn)技巧
4．2 做好數(shù)據(jù)相關(guān)性分析
4．2．1 進(jìn)行數(shù)據(jù)相關(guān)性分析的作用
4．2．2 常用的數(shù)據(jù)相關(guān)分析方法
4．3 做好數(shù)據(jù)回歸分析實(shí)戰(zhàn)要領(lǐng)
4．3．1 數(shù)據(jù)回歸分析方法概述
4．3．2 數(shù)據(jù)回歸分析所能解決的實(shí)際問題
小結(jié)
第5章如何利用關(guān)聯(lián)規(guī)則進(jìn)行大數(shù)據(jù)挖掘
5．1 關(guān)聯(lián)規(guī)則
5．1．1 什么是關(guān)聯(lián)規(guī)則
5．1．2 關(guān)聯(lián)規(guī)則挖掘的應(yīng)用場景
5．2 關(guān)聯(lián)規(guī)則挖掘?qū)崙?zhàn)流程分析
5．2．1 關(guān)聯(lián)規(guī)則常見分類與四個(gè)基本屬性
5．2．2 快速找出最大高頻項(xiàng)目組的實(shí)戰(zhàn)技巧
5．3 關(guān)聯(lián)規(guī)則發(fā)掘中重要的Apriori算法
5．3．1 Apriori算法的基本原理
5．3．2 Apriori算法運(yùn)行的基本流程
5．4 針對Apriori算法缺點(diǎn)的其他關(guān)聯(lián)規(guī)則挖掘算法
5．4．1 Apriori算法的兩大缺點(diǎn)
5．4．2 基于劃分規(guī)則的算法
5．4．3 FP-Growth算法
小結(jié)
第6章大數(shù)據(jù)分析中的四種常見分類算法
6．1 分類算法概述
6．1．1 有關(guān)分類算法的基本概念
6．1．2 分類算法的常見應(yīng)用場景
6．2 KNN算法
6．2．1 KNN算法的工作原理與特點(diǎn)
6．2．2 快速找到最優(yōu)k值的實(shí)用策略
6．3 決策樹與隨機(jī)森林算法
6．3．1 決策樹算法
6．3．2 Bagging與Boosting的區(qū)別
6．3．3 隨機(jī)森林分類算法的優(yōu)勢與應(yīng)用場景
6．4 樸素貝葉斯分類算法
6．4．1 樸素貝葉斯分類算法運(yùn)行原理分析
6．4．2 貝葉斯網(wǎng)絡(luò)
6．4．3 貝葉斯決策理論
6．5 支持向量機(jī)
6．5．1 支持向量機(jī)的基本思想與特點(diǎn)
6．5．2 最優(yōu)分類面和廣義最優(yōu)分類面
6．5．3 非線性支持向量機(jī)與核函數(shù)
小結(jié)
第7章大數(shù)據(jù)分析中的四種常見聚類算法
7．1 大數(shù)據(jù)分析聚類算法概述
7．1．1 聚類分析的相關(guān)概念及應(yīng)用場景
7．1．2 聚類算法運(yùn)行基礎(chǔ)：簇與距離度量
……
第8章自組織神經(jīng)網(wǎng)絡(luò)算法與人工神經(jīng)網(wǎng)絡(luò)算法
第9章互聯(lián)網(wǎng)大數(shù)據(jù)分析應(yīng)用產(chǎn)品個(gè)性化推薦系統(tǒng)
第10章大數(shù)據(jù)分析在具體行業(yè)中的應(yīng)用
參考文獻(xiàn)

作　者：	彭進(jìn)香，張莉著
出版社：	清華大學(xué)出版社
叢編項(xiàng)：
標(biāo)　簽：	暫缺

ISBN：	9787302553731	出版時(shí)間：	2020-08-01	包裝：	平裝
開本：	16開	頁數(shù)：	240	字?jǐn)?shù)：

大數(shù)據(jù)處理技術(shù)與應(yīng)用

購買這本書可以去

內(nèi)容簡介

作者簡介

圖書目錄

本目錄推薦

WPS Office辦公應(yīng)用案例教程

效率是這樣練成的：Excel高效數(shù)…

Excel函數(shù)與公式秒查秒懂（529集…

Excel商務(wù)數(shù)據(jù)分析：思維、策略…

Excel與Power BI數(shù)據(jù)分析及可視…

MS office高效辦公必修

DeepSeek極速辦公：告別內(nèi)卷，讓…

WPS Office實(shí)例教程

LaTeX論文寫作教程

Excel人力資源管理從入門到精通…