注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡計算機科學理論與基礎知識縱橫大數(shù)據(jù):云計算數(shù)據(jù)基礎設施

縱橫大數(shù)據(jù):云計算數(shù)據(jù)基礎設施

縱橫大數(shù)據(jù):云計算數(shù)據(jù)基礎設施

定 價:¥49.00

作 者: 何小朝 著
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 計算機理論、基礎知識 計算機與互聯(lián)網(wǎng)

ISBN: 9787121232138 出版時間: 2014-05-01 包裝: 平裝
開本: 其他 頁數(shù): 264 字數(shù):  

內(nèi)容簡介

  大數(shù)據(jù)的概念很火,但人們對它的認識卻是混亂的:有人說大數(shù)據(jù)就是指所有的數(shù)據(jù),有人說大數(shù)據(jù)是指線上行為、日志等半結構/非結構化的數(shù)據(jù)形態(tài),有人說大數(shù)據(jù)就是以Hadoop為代表的新技術……到底什么是大數(shù)據(jù)?同樣風風火火了很久的云計算與大數(shù)據(jù)有什么關系?令人眼花繚亂的眾多大數(shù)據(jù)技術的本質是什么?各有什么優(yōu)缺點?爭論不休的“小變大”與“大變小”技術策略到底孰正孰邪?企業(yè)究竟應該如何定位與使用大數(shù)據(jù),難道是為了Hadoop而Hadoop?未來的技術方向究竟如何?本書結合現(xiàn)代企業(yè)數(shù)據(jù)管理實踐,從策略、技術、應用、企業(yè)數(shù)據(jù)架構等多個維度,體系化地對大數(shù)據(jù)及相關技術進行了全面深入的論述:首先對大數(shù)據(jù)相關概念予以澄清;接著深入剖析各種大數(shù)據(jù)技術的內(nèi)在本質,指出其各自的優(yōu)缺點、適用場景與相互關系;同時對大數(shù)據(jù)技術“分”與“合”這兩種廣受爭議的技術策略的內(nèi)在聯(lián)系進行了分析與討論,明確指出現(xiàn)代數(shù)據(jù)管理技術的發(fā)展趨勢;最后結合大數(shù)據(jù)時代企業(yè)新一代數(shù)據(jù)架構規(guī)劃的實際,對大數(shù)據(jù)及相關技術在企業(yè)數(shù)據(jù)體系中的具體定位給出了切實可行的建議,并且面向云數(shù)據(jù)中心建設,提出了大數(shù)據(jù)云――云計算數(shù)據(jù)基礎設施的概念與方法。

作者簡介

  北京大學計算科學技術系博士后,中國航空史研究會會員,科技部中小企業(yè)創(chuàng)新基金評審專家,第一屆中國軟件十大杰出青年候選人。1992年起從事軟件的設計、開發(fā)與管理工作,涉及信息系統(tǒng)、數(shù)據(jù)管理、圖形圖像、嵌入式系統(tǒng)及工業(yè)設計與生產(chǎn)等多個領域,目前為止主持設計與開發(fā)大中型軟件系統(tǒng)與產(chǎn)品二十余項;在國內(nèi)外核心期刊上發(fā)表科技論文20余篇,被美國EI《工程索引》檢索6篇。曾任北京北大青鳥信息工程有限責任公司總工程師,北京青鳥華光科技有限公司技術管理部部長、總經(jīng)理助理、總工程師,大唐微電子科技有限公司高級項目經(jīng)理等職;自2003年起,在北美從事軟件系統(tǒng)分析與設計工作近七年之久?,F(xiàn)任北京安德爾國際軟件有限公司總經(jīng)理,董事,北京先進數(shù)通科技有限公司BI事業(yè)部首席架構師。科技部中小企業(yè)創(chuàng)新基金評審委員中國航空史研究會會員公安部安防技術專家委員會委員中國青年科技工作者協(xié)會會員

圖書目錄

第1部分 大數(shù)據(jù)概論
第1章 大數(shù)據(jù)與云計算 2
1.1 云計算概論 3
1.2 大數(shù)據(jù)概論 4
1.2.1 現(xiàn)代數(shù)據(jù)管理需求分析 4
1.2.2 大數(shù)據(jù)的引入 9
1.2.3 大數(shù)據(jù)的定義與特征 10
1.2.4 大數(shù)據(jù)與互聯(lián)網(wǎng) 12
1.2.5 大數(shù)據(jù)戰(zhàn)略、大數(shù)據(jù)與大數(shù)據(jù)技術 14
1.3 大數(shù)據(jù)的技術實現(xiàn)――云計算 15
1.4 本章小結 16
第2章 關系數(shù)據(jù)庫的挑戰(zhàn)與應對 17
2.1 關系數(shù)據(jù)庫技術的核心特征 18
2.2 主流關系數(shù)據(jù)庫的挑戰(zhàn) 22
2.2.1 經(jīng)典DBMS的挑戰(zhàn) 22
2.2.2 Shared Disk 23
2.2.3 Shared Nothing 24
2.3 改進型關系數(shù)據(jù)庫 26
2.3.1 技術改進 26
2.3.2 主要產(chǎn)品代表 30
2.4 本章小結 40
第3章 非SQL技術簡介 41
3.1 大數(shù)據(jù)技術家族 42
3.1.1 NoSQL 42
3.1.2 關系數(shù)據(jù)庫聯(lián)邦NewSQL 42
3.1.3 分布式海量文件管理 43
3.1.4 Map Reduce 43
3.2 分與合――云計算的兩種技術路線 44
3.3 本章小結 44
第 2部分 “分”為云――數(shù)據(jù)切分
第4章 NoSQL 46
4.1 NoSQL的引入 47
4.1.1 概念詮釋與特征分析 47
4.1.2 NoSQL的本質 50
4.2 NoSQL家族 52
4.2.1 NoSQL產(chǎn)品目錄與分類 52
4.2.2 Hadoop之HBase 54
4.2.3 Facebook之Cassandra 58
4.2.4 MongoDB與CouchDB 61
4.2.5 Oracle NoSQL DB 63
4.2.6 Memcached與Redis 65
4.2.7 圖數(shù)據(jù)庫Neo4J 65
4.2.8 其他NoSQL數(shù)據(jù)庫 67
4.2.9 問題與疑惑 67
4.3 NoSQL技術探研 68
4.3.1 NoSQL理論基礎 68
4.3.2 NoSQL技術手段 75
4.3.3 NoSQL技術解析 83
4.4 NoSQL與關系數(shù)據(jù)庫 88
4.5 本章小結 89
第5章 NewSQL――關系數(shù)據(jù)庫聯(lián)邦 90
5.1 數(shù)據(jù)庫聯(lián)邦的引入 91
5.1.1 企業(yè)業(yè)務數(shù)據(jù)管理面臨的問題 91
5.1.2 垂直分庫 92
5.1.3 水平分表 93
5.1.4 讀寫分離 95
5.1.5 聯(lián)邦的引入 97
5.2 “聯(lián)邦”的設計與實踐 99
5.2.1 企業(yè)級“聯(lián)邦”架構設計 99
5.2.2 公共基礎服務設計 103
5.2.3 聯(lián)邦的元數(shù)據(jù)庫 106
5.2.4 聯(lián)邦的應用實踐 107
5.3 “聯(lián)邦”技術分析 108
5.3.1 關于“垂直分庫” 108
5.3.2 如何“水平分表” 110
5.3.3 關于“讀寫分離” 112
5.3.4 基本方法――分布與聚合 114
5.3.5 關于分布式事務 116
5.3.6 關聯(lián)操作 117
5.2.7 冗余策略 119
5.2.8 異步解耦策略 120
5.2.9 使用緩存 122
5.2.10 其他問題 123
5.4 數(shù)據(jù)庫聯(lián)邦、NoSQL與主流關系數(shù)據(jù)庫 124
5.4.1 技術與應用――八仙過海,各顯神通 124
5.4.2 互聯(lián)網(wǎng)的神話 126
5.5 本章小結 128
第6章 文件系統(tǒng)聯(lián)邦 129
6.1 問題的引入 130
6.1.1 關于幾個數(shù)據(jù)概念的澄清 130
6.1.2 文件數(shù)據(jù)管理的困難 131
6.1.3 文件系統(tǒng)聯(lián)邦的引入 133
6.2 典型開源技術介紹 135
6.2.1 MogileFS 135
6.2.2 FastDFS 136
6.2.3 MogileFS與FastDFS的對比 138
6.3 技術分析 139
6.4 本章小結 140
第7章 平民化的分布計算――MapReduce 141
7.1 分布式計算概述 142
7.1.1 幾個概念的澄清 142
7.1.2 分布式計算技術綜述 143
7.1.3 MapReduce的引入 147
7.2 MapReduce技術介紹 148
7.2.1 設計思想 148
7.2.2 MapReduce框架介紹 152
7.3 MapReduce技術分析 160
7.3.1 關于效率 160
7.3.2 關于擴展性 162
7.3.3 關于可靠性與可用性 163
7.3.4 關于MapReduce與關系數(shù)據(jù)庫 164
7.3.5 關于適用的數(shù)據(jù)類型 167
7.3.6 關于數(shù)據(jù)存儲與管理 168
7.4 MapReduce的應用實踐 169
7.5 本章小結 170
第8章 后Hadoop時代 171
8.1 Hadoop體系及其困惑 172
8.2 Google的新三駕馬車 173
8.2.1 新一代搜索引擎Caffeine 173
8.2.2 大規(guī)模圖處理系統(tǒng)Pregel 174
8.2.3 Dremel――秒級實現(xiàn)PB級數(shù)據(jù)分析 175
8.3 Symphony MapReduce 181
8.4 后Hadoop時代即將來臨 181
8.5 本章小結 183
第9章 InfiniData―一種關系型云數(shù)據(jù)庫的設計與實踐 184
9.1 現(xiàn)代企業(yè)數(shù)據(jù)管理需求再分析 185
9.1.1 新的企業(yè)數(shù)據(jù)需求――海量關系數(shù)據(jù)管理 185
9.1.2 技術分析 187
9.2 關系型云數(shù)據(jù)庫架構設計 188
9.2.1 關系型云數(shù)據(jù)庫的引入 188
9.2.2 技術架構設計 189
9.3 云存儲層 192
9.3.1 邏輯架構 193
9.3.2 物理架構 194
9.3.3 關系模型云存儲元 196
9.4 云計算層 198
9.4.1 MapReduce云計算引擎 198
9.4.2 集群式云計算引擎 200
9.4.3 兩種引擎的比較 201
9.5 云存儲索引層 202
9.5.1 存儲索引的管理 202
9.5.2 索引云運行時動態(tài)創(chuàng)建 203
9.6 技術分析 203
9.7 本章小結 205
第3部分 云計算的分與合
第10章 合為“云”――數(shù)據(jù)整合 208
10.1 數(shù)據(jù)整合的需求分析 209
10.2 存儲整合云 210
10.3 數(shù)據(jù)庫整合云 211
10.4 本章小結 213
第11章 關于分與合的討論 214
11.1 困惑――分與合,孰是孰非? 215
11.2 分為技,合為神 216
11.3 分為雨,合為云――大數(shù)據(jù)云 217
11.4 數(shù)據(jù)管理技術發(fā)展趨勢總結 219
11.4.1 數(shù)據(jù)管理物理基礎設施發(fā)展趨勢 219
11.4.2 數(shù)據(jù)管理軟基礎設施發(fā)展趨勢 220
11.5 本章小結 221
第12章 企業(yè)大數(shù)據(jù)技術體系與云計算數(shù)據(jù)基礎設施 222
12.1 現(xiàn)代企業(yè)數(shù)據(jù)管理需求再分析 223
12.2 新一代企業(yè)數(shù)據(jù)體系建設 225
12.2.1 新一代企業(yè)數(shù)據(jù)體系建設的定義與內(nèi)容 225
12.2.2 新一代企業(yè)數(shù)據(jù)分類體系 228
12.2.3 新一代企業(yè)數(shù)據(jù)分布與流轉規(guī)劃 230
12.3 大數(shù)據(jù)技術在企業(yè)數(shù)據(jù)架構中的定位 234
12.3.1 技術規(guī)劃戰(zhàn)略 234
12.3.2 大數(shù)據(jù)技術架構規(guī)劃 235
12.3.3 典型場景――電子渠道線上行為分析 238
12.4 云計算數(shù)據(jù)基礎設施概念的引入 240
12.5 本章小結 242
后記――超越技術 243
參考文獻 245

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號