注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡家庭與辦公軟件大數據處理技術與應用

大數據處理技術與應用

大數據處理技術與應用

定 價:¥49.00

作 者: 彭進香,張莉 著
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302553731 出版時間: 2020-08-01 包裝: 平裝
開本: 16開 頁數: 240 字數:  

內容簡介

  《大數據處理技術與應用》對大數據的概念、挖掘、應用進行了系統(tǒng)的介紹,并且配備了相關的案例以及實際操作過程。這種理論與實踐相結合的方式能夠極大地幫助讀者掌握大數據領域的相關理論知識。《大數據處理技術與應用》共分為10章,主要內容包含互聯網大數據概述、互聯網大數據采集與獲取實戰(zhàn)要領、做好數據預處理的實戰(zhàn)方法、數據相關性分析與回歸分析的黃金法則、如何利用關聯規(guī)則進行大數據挖掘、大數據分析中的四種常見分類算法、大數據分析中的四種常見聚類算法,以及自組織神經網絡算法與人工神經網絡算法、互聯網大數據分析應用——產品個性化推薦系統(tǒng)、大數據分析在具體行業(yè)中的應用等?!洞髷祿幚砑夹g與應用》知識體系完善且適用,可作為高等院校大數據、人工智能等相關專業(yè)課程的教材,也可作為從事數據挖掘、機器學習工作以及其他相關工程技術工作人員的參考書。

作者簡介

  彭進香,湖南應用技術學院信息工程學院院長,副教授,市級優(yōu)秀教師,“十三五”校級首批重點建設學科——計算機應用技術學科建設負責人。近年來主持和參與省、市級教研、科研項目20多項,指導省大學生研究性學習和創(chuàng)新性實驗計劃項目2項,發(fā)表研究論文20多篇,主編和參編教材6部,專利1項,軟件著作權2項。對互聯網企業(yè)從事數據挖掘有較深的研究,在大數據挖掘、分析及實戰(zhàn)場景應用方面具有深厚經驗。

圖書目錄

第1章 互聯網大數據概述
1.1 認識大數據
1.1.1 大數據的定義
1.1.2 大數據的特征
1.1.3 未來十年大數據分析的發(fā)展趨勢
1.2 常用大數據處理、分析工具介紹
1.2.1 大數據的存儲工具
1.2.2 大數據的軟件開發(fā)工具
1.2.3 大數據的挖掘工具
1.2.4 大數據的可視化工具
小結
第2章 互聯網大數據采集與獲取實戰(zhàn)要領
2.1 互聯網大數據采集與處理技術概述
2.1.1 數據采集的基本流程與關鍵技術
2.1.2 數據處理的基本流程與關鍵技術
2.2 Web頁面數據獲取實戰(zhàn)方法
2.2.1 Jsoup技術與頁面數據獲取
2.2.2 應對特定領域的Deep Web數據獲取技術
2.3 利用爬蟲抓取互聯網大數據實戰(zhàn)技巧
2.3.1 Python爬蟲工作原理
2.3.2 利用HtmlParser實現網頁鏈接的提取實戰(zhàn)
小結
第3章 做好數據預處理的實戰(zhàn)方法
3.1 數據預處理概述
3.1.1 數據預處理的目的
3.1.2 數據預處理的方法
3.2 從問題分析到數據清洗實戰(zhàn)策略
3.2.1 數據清洗的步驟
3.2.2 缺失值的識別與處理技巧
3.2.3 異常值的判斷、檢驗與處理
3.3 數據集成與數據轉換實戰(zhàn)方法
3.3.1 數據集成常見方法
3.3.2 數據轉換過程中的離散化
3.4 數據的特征選擇
3.4.1 常用數據特征選擇方法
3.4.2 Relief算法與費希爾判別法的應用
3.5 數據預處理實戰(zhàn)案例分析
小結
第4章 數據相關性分析與回歸分析的黃金法則
4.1 什么是數據集
4.1.1 數據集的概念與常見類型
4.1.2 高效進行數據度量的實戰(zhàn)技巧
4.2 做好數據相關性分析
4.2.1 進行數據相關性分析的作用
4.2.2 常用的數據相關分析方法
4.3 做好數據回歸分析實戰(zhàn)要領
4.3.1 數據回歸分析方法概述
4.3.2 數據回歸分析所能解決的實際問題
小結
第5章 如何利用關聯規(guī)則進行大數據挖掘
5.1 關聯規(guī)則
5.1.1 什么是關聯規(guī)則
5.1.2 關聯規(guī)則挖掘的應用場景
5.2 關聯規(guī)則挖掘實戰(zhàn)流程分析
5.2.1 關聯規(guī)則常見分類與四個基本屬性
5.2.2 快速找出最大高頻項目組的實戰(zhàn)技巧
5.3 關聯規(guī)則發(fā)掘中重要的Apriori算法
5.3.1 Apriori算法的基本原理
5.3.2 Apriori算法運行的基本流程
5.4 針對Apriori算法缺點的其他關聯規(guī)則挖掘算法
5.4.1 Apriori算法的兩大缺點
5.4.2 基于劃分規(guī)則的算法
5.4.3 FP-Growth算法
小結
第6章 大數據分析中的四種常見分類算法
6.1 分類算法概述
6.1.1 有關分類算法的基本概念
6.1.2 分類算法的常見應用場景
6.2 KNN算法
6.2.1 KNN算法的工作原理與特點
6.2.2 快速找到最優(yōu)k值的實用策略
6.3 決策樹與隨機森林算法
6.3.1 決策樹算法
6.3.2 Bagging與Boosting的區(qū)別
6.3.3 隨機森林分類算法的優(yōu)勢與應用場景
6.4 樸素貝葉斯分類算法
6.4.1 樸素貝葉斯分類算法運行原理分析
6.4.2 貝葉斯網絡
6.4.3 貝葉斯決策理論
6.5 支持向量機
6.5.1 支持向量機的基本思想與特點
6.5.2 最優(yōu)分類面和廣義最優(yōu)分類面
6.5.3 非線性支持向量機與核函數
小結
第7章 大數據分析中的四種常見聚類算法
7.1 大數據分析聚類算法概述
7.1.1 聚類分析的相關概念及應用場景
7.1.2 聚類算法運行基礎:簇與距離度量
……
第8章 自組織神經網絡算法與人工神經網絡算法
第9章 互聯網大數據分析應用產品個性化推薦系統(tǒng)
第10章 大數據分析在具體行業(yè)中的應用
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號