注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡數(shù)據(jù)庫數(shù)據(jù)挖掘

數(shù)據(jù)挖掘

數(shù)據(jù)挖掘

定 價:¥38.00

作 者: 宋萬清 著
出版社: 中國鐵道出版社
叢編項: 高等學校大數(shù)據(jù)技術與應用規(guī)劃教材
標 簽: 暫缺

ISBN: 9787113251673 出版時間: 2019-01-01 包裝: 平裝
開本: 正16開 頁數(shù): 180 字數(shù):  

內(nèi)容簡介

  本書著力于介紹數(shù)據(jù)挖掘基礎知識、基本原理、常用算法,主要內(nèi)容包括數(shù)據(jù)挖掘概述、 數(shù)據(jù)的描述與可視化、數(shù)據(jù)的采集和預處理、數(shù)據(jù)的歸約、關聯(lián)規(guī)則挖掘、分類與預測、 非 線性預測模型、聚類分析、深度學習簡介、使用 Weka 進行數(shù)據(jù)挖掘。本書通俗易懂,注重基 礎知識、基本原理和基本方法,注重啟發(fā)和引申,以培養(yǎng)學生獨立思考和獨立發(fā)現(xiàn)的能力。 本書適合作為數(shù)據(jù)科學與大數(shù)據(jù)、信息管理、統(tǒng)計等專業(yè)的本科層次基礎課教材,也可 作為相關專業(yè)研究生層次的參考用書。

作者簡介

  宋萬清:上海工程技術大學電子電氣工程學院教授,主要研究方向:狀態(tài)監(jiān)測與故障診斷,隨機信號分析,大數(shù)據(jù)處理,機電一體化控制與現(xiàn)場總線技術。主講了智能控制、系統(tǒng)辨識、數(shù)據(jù)挖掘等25門本科生與研究生課程。

圖書目錄

第 1 章 數(shù)據(jù)挖掘概述 ...................... 1
1.1 什么是數(shù)據(jù)挖掘 ...................... 1
1.1.1 數(shù)據(jù)、信息和知識 ........ 1
1.1.2 數(shù)據(jù)挖掘的定義 ............ 2
1.1.3 數(shù)據(jù)挖掘的發(fā)展簡史 .... 3
1.2 數(shù)據(jù)挖掘的基本流程
及方法概述 ............................. 4
1.2.1 數(shù)據(jù)挖掘的基本流程 .... 4
1.2.2 數(shù)據(jù)挖掘的任務
和方法概述 ................... 6
1.3 數(shù)據(jù)挖掘的應用 ...................... 9
1.3.1 數(shù)據(jù)挖掘在商務
領域的應用 ................... 9
1.3.2 數(shù)據(jù)挖掘在醫(yī)療
和醫(yī)學領域的應用 ...... 10
1.3.3 數(shù)據(jù)挖掘在銀行
和保險領域的應用 ...... 10
1.3.4 數(shù)據(jù)挖掘在社交
媒體領域的應用 ......... 11
習題 ............................................... 11
第 2 章 數(shù)據(jù)的描述與可視化.......... 12
2.1 概述 ...................................... 12
2.2 數(shù)據(jù)對象與屬性類型............. 12
2.2.1 什么是屬性 ................. 12
2.2.2 標稱屬性 ..................... 12
2.2.3 二元屬性 ..................... 13
2.2.4 序數(shù)屬性 ..................... 13
2.2.5 數(shù)值屬性 ..................... 14
2.2.6 離散屬性與連續(xù)
屬性 ............................ 14
2.3 數(shù)據(jù)的基本統(tǒng)計描述 ............ 15
2.3.1 中心趨勢度量 ............. 15
2.3.2 度量數(shù)據(jù)散布:極差、
四分位數(shù)、方差、
標準差和四分位數(shù)
極差 ............................ 17
2.3.3 數(shù)據(jù)基本統(tǒng)計的
圖形描述 .................... 19
2.4 數(shù)據(jù)可視化 ........................... 23
2.4.1 基于像素的可視化 ...... 23
2.4.2 幾何投影可視化.......... 25
2.4.3 基于圖符的可視化 ...... 27
2.4.4 層次可視化 ................. 28
2.4.5 可視化復雜對象和
關系 ............................ 30
2.5 數(shù)據(jù)相似性和相異性度量 ..... 32
2.5.1 數(shù)據(jù)矩陣與相異性
矩陣 ............................ 32
2.5.2 標稱屬性的鄰近性
度量 ............................ 33
2.5.3 二元屬性的鄰近性
度量 ............................ 34
2.5.4 數(shù)值屬性的相異性:
閔可夫斯基距離 ......... 36
2.5.5 序數(shù)屬性的鄰近性
度量 ............................ 37
2.5.6 混合類型屬性的
相異性 ........................ 38
2.5.7 余弦相似性 ................. 40
習題............................................... 40
第 3 章 數(shù)據(jù)的采集和預處理 .......... 42
3.1 概述 ...................................... 42
3.1.1 大數(shù)據(jù)采集的特點 ...... 42數(shù)據(jù)挖掘
2
3.1.2 大數(shù)據(jù)采集的方法 ...... 43
3.2 數(shù)據(jù)預處理的目的和任務 ..... 44
3.3 數(shù)據(jù)清洗 ............................... 45
3.3.1 缺失值清洗 ................. 46
3.3.2 異常值清洗 ................. 48
3.3.3 格式內(nèi)容清洗 ............. 50
3.3.4 邏輯錯誤清洗 ............. 50
3.3.5 非需求數(shù)據(jù)清洗 .......... 51
3.3.6 關聯(lián)性驗證 ................. 51
3.4 數(shù)據(jù)集成 ............................... 52
3.5 數(shù)據(jù)變換 ............................... 53
習題 ............................................... 56
第 4 章 數(shù)據(jù)的歸約........................ 57
4.1 概述 ...................................... 57
4.2 屬性的選擇與數(shù)值歸約 ......... 57
4.2.1 屬性的評估準則 .......... 58
4.2.2 屬性子集選擇方法 ...... 59
4.2.3 數(shù)值歸約 ..................... 60
4.3 線性回歸 ............................... 61
4.4 主成分分析 ........................... 63
習題 ............................................... 66
第 5 章 關聯(lián)規(guī)則挖掘 .................... 67
5.1 概述 ...................................... 67
5.2 關聯(lián)規(guī)則的分類 .................... 68
5.3 關聯(lián)規(guī)則的研究步驟............. 68
5.3.1 關聯(lián)規(guī)則挖掘算法的
分類 ............................ 69
5.3.2 各種算法類型的
對比 ............................ 70
5.4 Apriori 算法分析 ................... 70
5.5 實例分析 ............................... 70
5.6 關聯(lián)規(guī)則的推廣(GRI) ...... 72
5.7 關聯(lián)規(guī)則的深入挖掘............. 74
習題 ............................................... 75
第 6 章 分類與預測........................ 76
6.1 概述 ...................................... 76
6.1.1 基本概念 ..................... 76
6.1.2 數(shù)據(jù)分類的
一般方法 .................... 77
6.2 決策樹模型 ........................... 77
6.2.1 決策樹的工作原理 ...... 78
6.2.2 決策樹的適用問題 ...... 78
6.2.3 ID3 算法 ..................... 79
6.2.4 決策樹的結(jié)點劃分 ...... 80
6.3 貝葉斯分類模型 .................... 81
6.3.1 貝葉斯定理 ................. 81
6.3.2 貝葉斯模型的特點 ...... 82
6.4 線性判別模型 ....................... 82
6.5 邏輯回歸模型 ....................... 83
6.5.1 邏輯回歸模型
概述 ............................ 83
6.5.2 邏輯回歸模型的
基本概念 .................... 83
6.6 模型的評估與選擇 ................ 85
6.6.1 評估分類器性能的
度量 ............................ 85
6.6.2 保持方法和隨機
二次抽樣 .................... 90
6.6.3 交叉驗證 ..................... 90
6.6.4 自助法 ........................ 91
6.6.5 使用統(tǒng)計顯著性檢驗
選擇模型 .................... 91
習題............................................... 93
第 7 章 非線性預測模型 ................. 94
7.1 概述 ...................................... 94
7.2 支持向量機 ........................... 94
7.2.1 支持向量機分類
原理 ............................ 95
7.2.2 非線性支持向量機 ...... 99
7.2.3 支持向量機回歸
預測 .......................... 102
7.2.4 基于支持向量機的
預測分析 .................. 106
7.3 神經(jīng)網(wǎng)絡 ............................. 108
7.3.1 人工神經(jīng)網(wǎng)絡模型
與分類 ...................... 108
7.3.2 BP 神經(jīng)網(wǎng)絡 ............. 112目 錄
3
7.3.3 RBF 神經(jīng)網(wǎng)絡 ........... 117
7.3.4 基于神經(jīng)網(wǎng)絡的
預測分析................... 121
習題 ............................................. 124
第 8 章 聚類分析 ......................... 125
8.1 概述 .................................... 125
8.2 k-均值聚類 ......................... 126
8.3 k-中心聚類 ......................... 129
8.4 聚類評估 ............................. 130
8.4.1 外部法 ...................... 130
8.4.2 內(nèi)部法 ...................... 131
8.4.3 可視化方法 ............... 131
習題 ............................................. 131
第 9 章 深度學習簡介 .................. 133
9.1 概述 .................................... 133
9.2 來自人類視覺機理的啟發(fā) ... 134
9.3 深層神經(jīng)網(wǎng)絡...................... 136
9.4 卷積神經(jīng)網(wǎng)絡...................... 137
9.4.1 卷積和池化 ............... 138
9.4.2 CNN 網(wǎng)絡框架 .......... 141
9.4.3 CNN 的應用 .............. 142
9.5 RNN 循環(huán)神經(jīng)網(wǎng)絡 ............. 144
9.5.1 RNN 的結(jié)構(gòu) .............. 145
9.5.2 RNN 的缺陷 .............. 146
9.5.3 RNN 的應用 .............. 147
9.6 生成對抗網(wǎng)絡 ..................... 147
9.6.1 GAN 的原理與架構(gòu) .. 148
9.6.2 GAN 的應用 .............. 150
習題............................................. 151
第 10 章 使用 Weka 進行
數(shù)據(jù)挖掘 ....................... 153
10.1 概述 .................................. 153
10.2 Weka 關聯(lián)數(shù)據(jù)挖掘的
基本操作 ........................... 153
10.3 數(shù)據(jù)格式 ........................... 158
10.4 關聯(lián)規(guī)則挖掘 ................... 160
10.5 分類與回歸 ....................... 163
10.6 聚類分析 ........................... 166
習題............................................. 167
附錄 A 拉格朗日優(yōu)化法 ............... 169
參考文獻........................................ 177

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號