注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)計(jì)算機(jī)科學(xué)理論與基礎(chǔ)知識(shí)探秘大模型應(yīng)用開(kāi)發(fā)

探秘大模型應(yīng)用開(kāi)發(fā)

探秘大模型應(yīng)用開(kāi)發(fā)

定 價(jià):¥108.00

作 者: 李瀚
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書(shū)可以去


ISBN: 9787121496561 出版時(shí)間: 2025-02-01 包裝: 平裝-膠訂
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)圍繞大模型的生產(chǎn)實(shí)施流程,系統(tǒng)介紹大模型的應(yīng)用實(shí)踐方法。第一部分系統(tǒng)地介紹了機(jī)器學(xué)習(xí)的場(chǎng)景分類、深度學(xué)習(xí)的崛起以及基礎(chǔ)模型。第二部分聚焦于應(yīng)用挑戰(zhàn),詳細(xì)講解問(wèn)題定義、流程、技術(shù),包括嵌入和標(biāo)記化、向量數(shù)據(jù)庫(kù)、微調(diào)、部署與推理等。另外,展示了LLM相關(guān)的編排與集成策略,以及兩個(gè)實(shí)際索引技術(shù)的案例。本書(shū)不僅介紹了應(yīng)用案例,還對(duì)前沿技術(shù)和未來(lái)發(fā)展進(jìn)行了展望,包括可解釋性、GANs、強(qiáng)化學(xué)習(xí)和模型自動(dòng)化。團(tuán)隊(duì)協(xié)作、項(xiàng)目管理和持續(xù)集成等實(shí)踐內(nèi)容也得到充分涵蓋。最后,通過(guò)一個(gè)實(shí)踐案例章節(jié),讀者學(xué)習(xí)如何調(diào)試、部署和運(yùn)維大模型的LLM應(yīng)用。這本書(shū)將幫助從業(yè)者掌握從基礎(chǔ)概念到實(shí)際應(yīng)用的全過(guò)程,使他們能夠構(gòu)建穩(wěn)健的應(yīng)用,將機(jī)器學(xué)習(xí)和深度學(xué)習(xí)引入現(xiàn)實(shí)世界。

作者簡(jiǎn)介

  李瀚,資深A(yù)I系統(tǒng)架構(gòu)師。長(zhǎng)期從事AI平臺(tái)及AI驅(qū)動(dòng)的應(yīng)用系統(tǒng)(推薦、搜索和大模型等)的架構(gòu)設(shè)計(jì)與開(kāi)發(fā)工作,在AI工程領(lǐng)域擁有深刻的認(rèn)知和豐富的實(shí)戰(zhàn)經(jīng)驗(yàn),曾設(shè)計(jì)并開(kāi)發(fā)了企業(yè)級(jí)機(jī)器學(xué)習(xí)平臺(tái)和大型模型應(yīng)用開(kāi)發(fā)平臺(tái)等創(chuàng)新產(chǎn)品,服務(wù)多家世界500強(qiáng)企業(yè)AI轉(zhuǎn)型咨詢和項(xiàng)目落地。參與編寫(xiě)《MLOps工程實(shí)踐:工具、技術(shù)與企業(yè)級(jí)應(yīng)用》。徐斌,擁有10年以上的網(wǎng)絡(luò)安全經(jīng)驗(yàn),在硅谷領(lǐng)先的網(wǎng)絡(luò)安全公司從事數(shù)據(jù)分析平臺(tái)的設(shè)計(jì)開(kāi)發(fā)工作。精通網(wǎng)絡(luò)安全防護(hù)、漏洞分析與滲透測(cè)試,尤其擅長(zhǎng)結(jié)合數(shù)據(jù)分析和AI技術(shù)優(yōu)化安全系統(tǒng)的檢測(cè)與響應(yīng)能力,如通過(guò)深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等AI技術(shù)分析大量的安全數(shù)據(jù),實(shí)時(shí)發(fā)現(xiàn)潛在威脅,提升安全防護(hù)的效率。

圖書(shū)目錄

目錄
第1章 AI 2.0時(shí)代到來(lái) 1
1.1 ChatGPT旋風(fēng) 2
1.1.1 ChatGPT是什么 2
1.1.2 豐富的應(yīng)用 3
1.1.3 有喜有憂 4
1.2 認(rèn)識(shí)AI 2.0時(shí)代 5
1.2.1 何謂大模型 5
1.2.2 AI 1.0時(shí)代與AI 2.0時(shí)代特點(diǎn)分析 8
1.2.3 新“工業(yè)革命”來(lái)臨 11
1.3 本章小結(jié) 12
第2章 基座大模型準(zhǔn)備 13
2.1 大模型的歷史與未來(lái) 14
2.1.1 發(fā)展史 14
2.1.2 未來(lái)趨勢(shì) 15
2.2 基座大模型訓(xùn)練過(guò)程 16
2.2.1 預(yù)訓(xùn)練 17
2.2.2 人類反饋的強(qiáng)化學(xué)習(xí) 21
2.3 選擇合適的基座大模型 22
2.3.1 主流基座大模型介紹 22
2.3.2 選型標(biāo)準(zhǔn) 25
2.4 本章小結(jié) 27
第3章 GPU相關(guān)知識(shí) 28
3.1 基礎(chǔ)知識(shí) 29
3.1.1 顯卡與GPU 29
3.1.2 GPU與CPU 30
3.2 GPU的優(yōu)勢(shì) 32
3.2.1 GPU與深度學(xué)習(xí) 32
3.2.2 CUDA編程 34
3.3 準(zhǔn)備合適的GPU 36
3.3.1 選擇合適的GPU(顯卡)供應(yīng)商 36
3.3.2 英偉達(dá)與AMD 37
3.3.3 英偉達(dá)GPU各項(xiàng)參數(shù) 39
3.3.4 選型建議 46
3.4 本章小結(jié) 47
第4章 應(yīng)用開(kāi)發(fā)概覽 48
4.1 關(guān)鍵概念 49
4.1.1 提示 49
4.1.2 上下文學(xué)習(xí) 50
4.2 應(yīng)用趨勢(shì) 56
4.2.1 趨勢(shì)變遷 56
4.2.2 產(chǎn)品形態(tài) 59
4.3 技術(shù)實(shí)現(xiàn) 60
4.3.1 對(duì)齊方法 60
4.3.2 優(yōu)劣勢(shì)比較 63
4.3.3 應(yīng)用流程 65
4.4 本章小結(jié) 66
第5章 文檔處理 67
5.1 分塊 68
5.1.1 分塊的作用 68
5.1.2 分塊的策略 69
5.1.3 策略選擇 72
5.2 詞元化 73
5.2.1 概念和方法 73
5.2.2 Token采樣策略 76
5.3 嵌入 78
5.4 本章小結(jié) 84
第6章 向量數(shù)據(jù)庫(kù) 85
6.1 基本概念 86
6.2 相關(guān)算法 87
6.2.1 向量相似性算法 87
6.2.2 工程中常用的向量搜索折中算法 88
6.3 核心價(jià)值 92
6.4 定位 95
6.5 主流產(chǎn)品 97
6.6 本章小結(jié) 98
第7章 微調(diào) 99
7.1 背景與挑戰(zhàn) 100
7.1.1 背景知識(shí) 100
7.1.2 技術(shù)挑戰(zhàn) 102
7.2 參數(shù)高效微調(diào)技術(shù) 104
7.3 工具實(shí)踐 113
7.3.1 開(kāi)源工具包 113
7.3.2 模型微調(diào)服務(wù) 118
7.4 本章小結(jié) 121
第8章 推理優(yōu)化概論 122
8.1 優(yōu)化目標(biāo) 123
8.2 理論基礎(chǔ) 124
8.2.1 模型大小的指標(biāo) 124
8.2.2 模型大小對(duì)推理性能的影響 127
8.2.3 大模型相關(guān)分析 131
8.3 常見(jiàn)優(yōu)化技術(shù) 141
8.3.1 模型壓縮 141
8.3.2 Offloading 147
8.3.3 多GPU并行化 147
8.3.4 高效的模型結(jié)構(gòu) 148
8.3.5 FlashAttention 149
8.3.6 PagedAttention 149
8.3.7 連續(xù)批處理 150
8.4 本章小結(jié) 151
第9章 部署推理工具 152
9.1 推理架構(gòu)概述 153
9.2 Web服務(wù) 156
9.2.1 Streamlit與Gradio 158
9.2.2 FastAPI與Flask 160
9.3 推理執(zhí)行引擎 161
9.3.1 服務(wù)器端推理 161
9.3.2 端側(cè)推理 176
9.4 推理服務(wù) 181
9.5 對(duì)話類系統(tǒng) 194
9.6 本章小結(jié) 196
第10章 提示工程 197
10.1 理論與技術(shù) 198
10.1.1 提示的價(jià)值 198
10.1.2 應(yīng)用領(lǐng)域 198
10.1.3 提示工程技術(shù) 199
10.2 開(kāi)發(fā)工具 208
10.2.1 OpenAI Playground 210
10.2.2 Dify 211
10.2.3 PromptPerfect 213
10.3 本章小結(jié) 214
第11章 編排與集成 215
11.1 相關(guān)理論 216
11.1.1 面臨的問(wèn)題 216
11.1.2 核心價(jià)值 217
11.1.3 功能構(gòu)成 217
11.2 典型架構(gòu)模式 218
11.2.1 RAG 218
11.2.2 Agent 222
11.3 常見(jiàn)編排框架 235
11.3.1 LangChain框架 235
11.3.2 LlamaIndex框架 248
11.3.3 Semantic Kernel框架 253
11.4 本章小結(jié) 264
第12章 應(yīng)用示例 265
12.1 整體架構(gòu) 266
12.2 開(kāi)發(fā)過(guò)程 267
12.2.1 環(huán)境準(zhǔn)備 267
12.2.2 實(shí)現(xiàn)解析 269
12.2.3 打包部署 276
12.2.4 示例演示 281
12.3 本章小結(jié) 284
參考文獻(xiàn) 285

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)