注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)庫理論云數(shù)據(jù)湖:構(gòu)建健壯的云數(shù)據(jù)架構(gòu)

云數(shù)據(jù)湖:構(gòu)建健壯的云數(shù)據(jù)架構(gòu)

云數(shù)據(jù)湖:構(gòu)建健壯的云數(shù)據(jù)架構(gòu)

定 價:¥89.00

作 者: [美]魯克米尼·戈帕蘭
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787111762751 出版時間: 2024-09-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  本書詳細(xì)介紹了可用于數(shù)據(jù)處理的表格格式、云產(chǎn)品、框架、存儲層,以及如何將這些內(nèi)容組合在一起,以獲得適合自己需求的高性能解決方案。作者在書中提供的決策框架將幫助你明智地決定選擇哪種數(shù)據(jù)湖。本書是大數(shù)據(jù)領(lǐng)域每個人的書。閱讀本書后,你將了解構(gòu)建云數(shù)據(jù)湖所需的所有基礎(chǔ)知識,并能夠以多種方式應(yīng)用這些知識。本書主要面向數(shù)據(jù)架構(gòu)師、數(shù)據(jù)開發(fā)人員和數(shù)據(jù)運(yùn)維專業(yè)人員,他們希望廣泛地了解設(shè)置和運(yùn)營云數(shù)據(jù)湖的各個方面。

作者簡介

  Rukmani Gopalan是微軟經(jīng)驗(yàn)豐富的產(chǎn)品管理負(fù)責(zé)人。除了開發(fā)高度可擴(kuò)展的服務(wù)和令人愉悅的端到端客戶體驗(yàn)外,她還與零售、制造和醫(yī)療保健等不同行業(yè)的各種客戶合作,在云上構(gòu)建他們的大數(shù)據(jù)分析解決方案。 在從單一的本地數(shù)據(jù)平臺遷移時,Rukmani還致力于在云上構(gòu)建高度可擴(kuò)展的數(shù)據(jù)湖架構(gòu)。

圖書目錄

目錄
前言1
第1章 大數(shù)據(jù)—超越喧囂9
1.1 什么是大數(shù)據(jù)10
1.2 彈性數(shù)據(jù)基礎(chǔ)設(shè)施的挑戰(zhàn)14
1.3 云計(jì)算基礎(chǔ)15
1.3.1 云計(jì)算術(shù)語16
1.3.2 云的價值主張17
1.4 云數(shù)據(jù)湖架構(gòu)19
1.4.1 本地數(shù)據(jù)倉庫解決方案的限制20
1.4.2 什么是云數(shù)據(jù)湖架構(gòu)21
1.4.3 云數(shù)據(jù)湖架構(gòu)的優(yōu)勢21
1.5 開啟云數(shù)據(jù)湖之旅23
1.6 總結(jié)26
第2章 云上的大數(shù)據(jù)架構(gòu)27
2.1 為什么Klodars公司要遷移到云27
2.2 云數(shù)據(jù)湖架構(gòu)基礎(chǔ)28
2.2.1 淺談數(shù)據(jù)的多樣性29
2.2.2 云數(shù)據(jù)湖存儲31
2.2.3 大數(shù)據(jù)分析引擎33
2.2.4 云數(shù)據(jù)倉庫39
2.3 現(xiàn)代數(shù)據(jù)倉庫架構(gòu)41
2.3.1 參考架構(gòu)41
2.3.2 現(xiàn)代數(shù)據(jù)倉庫架構(gòu)的用例43
2.3.3 現(xiàn)代數(shù)據(jù)倉庫架構(gòu)的優(yōu)勢和挑戰(zhàn)45
2.4 數(shù)據(jù)湖倉一體架構(gòu)45
2.4.1 參考架構(gòu)46
2.4.2 數(shù)據(jù)湖倉一體架構(gòu)的用例52
2.4.3 數(shù)據(jù)湖倉一體架構(gòu)的優(yōu)勢和挑戰(zhàn)54
2.4.4 數(shù)據(jù)倉庫和非結(jié)構(gòu)化數(shù)據(jù)56
2.5 數(shù)據(jù)網(wǎng)格56
2.5.1 參考架構(gòu)57
2.5.2 數(shù)據(jù)網(wǎng)格架構(gòu)的用例59
2.5.3 數(shù)據(jù)網(wǎng)格架構(gòu)的優(yōu)勢和挑戰(zhàn)59
2.6 什么是適合的架構(gòu)60
2.6.1 了解客戶60
2.6.2 了解業(yè)務(wù)驅(qū)動因素61
2.6.3 考慮增長和未來場景62
2.6.4 設(shè)計(jì)注意事項(xiàng)62
2.6.5 混合方法64
2.7 總結(jié)64
第3章 數(shù)據(jù)湖的設(shè)計(jì)注意事項(xiàng)66
3.1 設(shè)置云數(shù)據(jù)湖基礎(chǔ)設(shè)施66
3.1.1 確定目標(biāo)67
3.1.2 規(guī)劃架構(gòu)和可交付成果70
3.1.3 云數(shù)據(jù)湖實(shí)施74
3.1.4 發(fā)布和運(yùn)行75
3.2 在數(shù)據(jù)湖中組織數(shù)據(jù)75
3.2.1 數(shù)據(jù)生命中的一天75
3.2.2 數(shù)據(jù)湖區(qū)76
3.2.3 組織機(jī)制79
3.3 數(shù)據(jù)治理簡介80
3.3.1 數(shù)據(jù)治理的參與者81
3.3.2 數(shù)據(jù)分類83
3.3.3 元數(shù)據(jù)管理、數(shù)據(jù)目錄和數(shù)據(jù)共享84
3.3.4 數(shù)據(jù)訪問管理85
3.3.5 數(shù)據(jù)質(zhì)量和可觀測性86
3.3.6 Klodars公司的數(shù)據(jù)治理89
3.3.7 數(shù)據(jù)治理總結(jié)90
3.4 管理數(shù)據(jù)湖成本91
3.4.1 揭秘云上的數(shù)據(jù)湖成本92
3.4.2 數(shù)據(jù)湖成本策略94
3.5 總結(jié)96
第4章 可擴(kuò)展的數(shù)據(jù)湖97
4.1 可擴(kuò)展性探秘97
4.1.1 什么是可擴(kuò)展性98
4.1.2 日常生活中的規(guī)模98
4.1.3 數(shù)據(jù)湖架構(gòu)中的可擴(kuò)展性101
4.2 數(shù)據(jù)湖處理系統(tǒng)的內(nèi)部104
4.2.1 內(nèi)部數(shù)據(jù)復(fù)制105
4.2.2 內(nèi)部ELT/ETL處理107
4.2.3 關(guān)于其他交互式查詢的說明110
4.3 可擴(kuò)展數(shù)據(jù)湖解決方案的注意事項(xiàng)110
4.3.1 選擇合適的云產(chǎn)品111
4.3.2 峰值容量規(guī)劃114
4.3.3 數(shù)據(jù)格式和作業(yè)配置文件116
4.4 總結(jié)117
第5章 優(yōu)化云數(shù)據(jù)湖架構(gòu)以提高性能118
5.1 度量性能的基礎(chǔ)知識118
5.1.1 性能的目標(biāo)和指標(biāo)120
5.1.2 度量性能121
5.1.3 優(yōu)化以提高性能122
5.2 云數(shù)據(jù)湖性能124
5.2.1 SLA、SLO和SLI124
5.2.2 示例:Klodars公司如何管理其SLA、SLO和SLI125
5.3 性能驅(qū)動因素126
5.3.1 復(fù)制作業(yè)的性能驅(qū)動因素127
5.3.2 Spark作業(yè)的性能驅(qū)動因素129
5.4 性能調(diào)優(yōu)的優(yōu)化原則和技術(shù)132
5.4.1 數(shù)據(jù)格式132
5.4.2 數(shù)據(jù)組織和分區(qū)138
5.4.3 在Apache Spark上選擇正確的配置140
5.5 減少數(shù)據(jù)傳輸開銷142
5.6 優(yōu)質(zhì)產(chǎn)品和性能143
5.6.1 大型虛擬機(jī)案例144
5.6.2 閃存案例144
5.7 總結(jié)145
第6章 深入了解數(shù)據(jù)格式146
6.1 為什么我們需要這些開放數(shù)據(jù)格式146
6.1.1 為什么我們需要存儲表格數(shù)據(jù)147
6.1.2 為什么在云數(shù)據(jù)湖中存儲表格數(shù)據(jù)是一個問題148
6.2 Delta Lake149
6.2.1 為什么開發(fā)Delta Lake149
6.2.2 Delta Lake如何工作152
6.2.3 什么時候使用Delta Lake153
6.3 Apache Iceberg154
6.3.1 為什么開發(fā)Apache Iceberg154
6.3.2 Apache Iceberg是如何工作的155
6.3.3 什么時候使用Apache Iceberg157
6.4 Apache Hudi159
6.4.1 為什么孵化Apache Hudi159
6.4.2 Apache Hudi如何工作160
6.4.3 什么時候使用Apache Hudi163
6.5 總結(jié)164
第7章 架構(gòu)的決策框架165
7.1 云數(shù)據(jù)湖評估166
7.2 云數(shù)據(jù)湖評估分析168
7.2.1 從零開始169
7.2.2 將現(xiàn)有數(shù)據(jù)湖或數(shù)據(jù)倉庫遷移到云169
7.2.3 改進(jìn)現(xiàn)有的云數(shù)據(jù)湖170
7.3 決策框架的第1階段:評估171
7.3.1 了解客戶需求171
7.3.2 了解改進(jìn)的機(jī)會172
7.3.3 了解業(yè)務(wù)驅(qū)動因素174
7.3.4 確定需求的優(yōu)先級來完成評估階段175
7.4 決策框架的第2階段:定義176
7.4.1 確定云數(shù)據(jù)湖的設(shè)計(jì)選擇178
7.4.2 規(guī)劃云數(shù)據(jù)湖項(xiàng)目可交付成果181
7.5 決策框架的第3階段:實(shí)施183
7.6 決策框架的第4階段:操作185
7.7 總結(jié)186
第8章 數(shù)據(jù)啟迪未來的六大經(jīng)驗(yàn)187
8.1 第1課:關(guān)注云數(shù)據(jù)湖的工作方式和時間,而不是“如果”和
  “為什么”188
8.2 第2課:權(quán)力越大,責(zé)任越大—數(shù)據(jù)也不例外188
8.3 第3課:客戶引領(lǐng)技術(shù),而不是技術(shù)引領(lǐng)客戶190
8.4 第4課:改變是不可避免的,所以要做好準(zhǔn)備192
8.5 第5課:建立同理心,分清輕重緩急192
8.6 第6課:巨大的影響不會在一夜之間發(fā)生193
8.7 總結(jié)194
附錄 云數(shù)據(jù)湖決策框架模板195

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號