注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)挖掘/數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)挖掘競(jìng)賽實(shí)戰(zhàn):方法與案例

數(shù)據(jù)挖掘競(jìng)賽實(shí)戰(zhàn):方法與案例

數(shù)據(jù)挖掘競(jìng)賽實(shí)戰(zhàn):方法與案例

定 價(jià):¥99.00

作 者: 許可樂(lè)
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787302658467 出版時(shí)間: 2024-05-01 包裝: 平裝-膠訂
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)圍繞數(shù)據(jù)挖掘競(jìng)賽,講解了各種類(lèi)型數(shù)據(jù)挖掘競(jìng)賽的解題思路、方法和技巧,并輔以對(duì)應(yīng)的實(shí)戰(zhàn)案例。全書(shū)共11章。第1章介紹數(shù)據(jù)挖掘競(jìng)賽的背景、意義和現(xiàn)狀。從第2章開(kāi)始,介紹了各種不同類(lèi)型的數(shù)據(jù)挖掘競(jìng)賽包括結(jié)構(gòu)化數(shù)據(jù)、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)(圖像)、計(jì)算機(jī)視覺(jué)(視頻)、強(qiáng)化學(xué)習(xí)。每種類(lèi)型的數(shù)據(jù)挖掘競(jìng)賽包含理論篇和實(shí)戰(zhàn)篇:理論篇介紹通用的解題流程和關(guān)鍵技術(shù);實(shí)戰(zhàn)篇選取比較有代表性的賽題,對(duì)賽題的優(yōu)秀方案進(jìn)行深入分析,并提供方案對(duì)應(yīng)的實(shí)現(xiàn)代碼。本書(shū)適合數(shù)據(jù)挖掘競(jìng)賽愛(ài)好者、人工智能相關(guān)專(zhuān)業(yè)在校大學(xué)生、人工智能方向從業(yè)人員及對(duì)人工智能感興趣的讀者閱讀。

作者簡(jiǎn)介

  許可樂(lè)畢業(yè)于法國(guó)巴黎六大,目前任教于國(guó)防科技大學(xué)計(jì)算機(jī)學(xué)院,入選湖湘青年英才人才計(jì)劃,Kaggle Grandmaster。長(zhǎng)期從事智能模型開(kāi)發(fā)與迭代研究。主持或參與自然科學(xué)基金、重點(diǎn)研發(fā)、國(guó)防科技創(chuàng)新特區(qū)等相關(guān)項(xiàng)目十余項(xiàng),獲軍隊(duì)科技進(jìn)步獎(jiǎng)一項(xiàng),擔(dān)任某重大工程項(xiàng)目副總設(shè)計(jì)師。在面向復(fù)雜開(kāi)放環(huán)境的智能模型算法、支持OODA決策的深度強(qiáng)化學(xué)習(xí)方法等領(lǐng)域取得一系列原創(chuàng)性的成果,所提出算法在包括ACM KDD Cup 等國(guó)際人工智能和數(shù)據(jù)挖掘競(jìng)賽中獲獎(jiǎng)40余項(xiàng),部分已經(jīng)國(guó)防關(guān)鍵領(lǐng)域得到實(shí)踐檢驗(yàn)。在相關(guān)智能領(lǐng)域的公認(rèn)的會(huì)議和期刊發(fā)表論文80余篇,相關(guān)論文被引用1700余次?,F(xiàn)任中國(guó)自動(dòng)化學(xué)會(huì)混合智能專(zhuān)委會(huì)委員、中國(guó)計(jì)算機(jī)學(xué)會(huì)語(yǔ)音對(duì)話與聽(tīng)覺(jué)專(zhuān)委會(huì)執(zhí)行委員,歐盟/英國(guó)科研基金評(píng)審專(zhuān)家,擔(dān)任AAAI等10余個(gè)國(guó)際頂級(jí)會(huì)議程序委員,擔(dān)任20余個(gè)國(guó)際期刊審稿人,獲CCF BDCI優(yōu)秀指導(dǎo)老師獎(jiǎng)。

圖書(shū)目錄

第1章  數(shù)據(jù)挖掘競(jìng)賽介紹 1
1.1  數(shù)據(jù)挖掘競(jìng)賽的發(fā)展 1
1.2  數(shù)據(jù)挖掘競(jìng)賽的意義 4
1.3 競(jìng)賽平臺(tái)介紹 5
1.4  各種競(jìng)賽的特點(diǎn) 8
1.5  競(jìng)賽常用工具 9
第2章  結(jié)構(gòu)化數(shù)據(jù):理論篇 13
2.1  探索性數(shù)據(jù)分析 13
2.2  數(shù)據(jù)預(yù)處理 18
2.2.1  缺失值 18
2.2.2  異常值 20
2.2.3  內(nèi)存優(yōu)化 21
2.3  特征構(gòu)造 23
2.3.1  時(shí)間特征 23
2.3.2  單變量特征 25
2.3.3  組合特征 27
2.3.4  降維/聚類(lèi)特征 28
2.3.5  目標(biāo)值相關(guān)特征 30
2.3.6  拼表特征 33
2.3.7  時(shí)序特征 39
2.4  特征篩選 41
2.4.1  冗余特征過(guò)濾 41
2.4.2  無(wú)效/低效特征過(guò)濾 42
2.4.3  過(guò)擬合特征過(guò)濾 45
2.5  模型 49
2.5.1  結(jié)構(gòu)化數(shù)據(jù)常用模型 49
2.5.2  模型超參數(shù)優(yōu)化 55
2.5.3  線下驗(yàn)證 58
2.6  集成學(xué)習(xí) 62
2.6.1  投票法 62
2.6.2  平均法 63
2.6.3  加權(quán)平均法 64
2.6.4  Stacking 66
2.6.5  Blending 67
第3章  結(jié)構(gòu)化數(shù)據(jù):實(shí)戰(zhàn)篇 70
3.1  賽題概覽 70
3.2  數(shù)據(jù)探索 71
3.2.1  標(biāo)簽分布 71
3.2.2  缺失值 72
3.2.3  異常值 73
3.2.4  相關(guān)性 73
3.3  優(yōu)秀方案解讀 74
3.3.1  特征工程 75
3.3.2  模型 77
3.3.3  集成學(xué)習(xí) 80
第4章  自然語(yǔ)言處理:理論篇 82
4.1  探索性數(shù)據(jù)分析 84
4.1.1  文本詞數(shù)統(tǒng)計(jì) 84
4.1.2  高頻詞統(tǒng)計(jì) 85
4.2  數(shù)據(jù)預(yù)處理 86
4.3  數(shù)據(jù)增強(qiáng) 88
4.3.1  同義詞替換 88
4.3.2  回譯 89
4.3.3  文本生成 89
4.3.4  元偽標(biāo)簽 90
4.4  模型 91
4.4.1  NLP競(jìng)賽的萬(wàn)金油—BERT 91
4.4.2  常用模型backbone及其特點(diǎn) 93
4.4.3  設(shè)計(jì)BERT類(lèi)模型的輸入 95
4.4.4  設(shè)計(jì)BERT類(lèi)模型的neck 98
4.4.5 設(shè)計(jì)BERT類(lèi)模型的輸出 100
4.5  模型集成 103
4.6  訓(xùn)練技巧 103
4.6.1  動(dòng)態(tài)驗(yàn)證 104
4.6.2  分層學(xué)習(xí)率 106
4.6.3  對(duì)抗訓(xùn)練 108
4.6.4  使用特殊詞處理復(fù)雜信息 111
4.6.5  任務(wù)內(nèi)掩碼語(yǔ)言建模 113
4.6.6  多樣本dropout 114
4.6.7  模型權(quán)重初始化 116
4.6.8  動(dòng)態(tài)填充 117
4.6.9  根據(jù)文本詞數(shù)順序推理 118
4.6.10  梯度檢查點(diǎn) 119
4.6.11  拓展模型輸入長(zhǎng)度限制 120
第5章  自然語(yǔ)言處理:實(shí)戰(zhàn)篇 121
5.1  賽題背景 121
5.2  數(shù)據(jù)介紹 122
5.3  評(píng)價(jià)指標(biāo) 123
5.4  冠軍方案 124
5.4.1 解碼網(wǎng)絡(luò) 125
5.4.2  特征抽取網(wǎng)絡(luò) 127
5.4.3  掩碼預(yù)訓(xùn)練 127
5.4.4  訓(xùn)練技巧 128
5.4.5  模型集成 131
第6章  計(jì)算機(jī)視覺(jué)(圖像):理論篇 134
6.1  通用流程 135
6.1.1  數(shù)據(jù)預(yù)處理 135
6.1.2  數(shù)據(jù)增強(qiáng) 136
6.1.3  預(yù)訓(xùn)練 141
6.1.4  模型 142
6.1.5  損失函數(shù) 143
6.1.6  集成學(xué)習(xí) 143
6.1.7  通用技巧 143
6.2  分類(lèi)任務(wù) 147
6.2.1  任務(wù)介紹及常用模型 147
6.2.2  損失函數(shù) 148
6.2.3  常用技巧 149
6.3  分割任務(wù) 150
6.3.1  任務(wù)介紹及常用模型 150
6.3.2  損失函數(shù) 151
6.3.3  常用技巧 152
6.4  檢測(cè)任務(wù) 154
6.4.1  任務(wù)介紹及常用模型 154
6.4.2  損失函數(shù) 155
6.4.3  常用技巧 161
第7章  計(jì)算機(jī)視覺(jué)(圖像):實(shí)戰(zhàn)篇 165
7.1  競(jìng)賽介紹 165
7.2  數(shù)據(jù)探索 166
7.2.1  數(shù)據(jù)基本情況 167
7.2.2  類(lèi)型分布 167
7.2.3  圖像分布 168
7.2.4  標(biāo)注分布 170
7.3  優(yōu)秀方案解讀 170
7.3.1  檢測(cè)部分 171
7.3.2  分割部分 175
7.4  更多方案 180
第8章  計(jì)算機(jī)視覺(jué)(視頻):理論篇 182
8.1  視頻數(shù)據(jù)與圖像數(shù)據(jù)的區(qū)別 182
8.2  常用模型 185
8.3  預(yù)訓(xùn)練數(shù)據(jù)集 188
8.4  任務(wù)介紹 189
第9章  計(jì)算機(jī)視覺(jué)(視頻):實(shí)戰(zhàn)篇 192
9.1  賽題背景 192
9.2  數(shù)據(jù)介紹和評(píng)價(jià)指標(biāo) 192
9.3  冠軍方案 193
第10章  強(qiáng)化學(xué)習(xí):理論篇 200
10.1  智能體設(shè)計(jì) 201
10.1.1  觀測(cè)輸入設(shè)計(jì) 201
10.1.2  收益設(shè)計(jì) 204
10.1.3  動(dòng)作設(shè)計(jì) 205
10.2  模型設(shè)計(jì) 206
10.3 算法設(shè)計(jì) 207
10.3.1  強(qiáng)化學(xué)習(xí)算法 207
10.3.2  超參數(shù)調(diào)節(jié) 208
10.3.3  訓(xùn)練技巧 210
10.3.4  算法性能評(píng)估 211
第11章  強(qiáng)化學(xué)習(xí):實(shí)戰(zhàn)篇 212
11.1  賽題任務(wù) 212
11.2  環(huán)境介紹 213
11.3  評(píng)價(jià)指標(biāo) 213
11.4  冠軍方案 214
 
 

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)