注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件開(kāi)源大數(shù)據(jù)分析引擎Impala實(shí)戰(zhàn)

開(kāi)源大數(shù)據(jù)分析引擎Impala實(shí)戰(zhàn)

開(kāi)源大數(shù)據(jù)分析引擎Impala實(shí)戰(zhàn)

定 價(jià):¥59.00

作 者: 賈傳青
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 計(jì)算機(jī)/網(wǎng)絡(luò) 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘 數(shù)據(jù)庫(kù)

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787302390022 出版時(shí)間: 2015-03-01 包裝:
開(kāi)本: 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  Impala是 Cloudera公司主導(dǎo)開(kāi)發(fā)的新型查詢(xún)系統(tǒng),它提供 SQL語(yǔ)義,能查詢(xún)存儲(chǔ)在 Hadoop的 HDFS和 HBase中的 PB級(jí)大數(shù)據(jù)。Impala 1.0版比原來(lái)基于 MapReduce的 Hive SQL查詢(xún)速度提升 3~90倍,因此, Impala有可能完全取代 Hive。作者基于自己在本職工作中應(yīng)用 Impala的實(shí)踐和心得編寫(xiě)了《開(kāi)源大數(shù)據(jù)分析引擎Impala實(shí)戰(zhàn)》。《開(kāi)源大數(shù)據(jù)分析引擎Impala實(shí)戰(zhàn)》共分 10章,全面介紹開(kāi)源大數(shù)據(jù)分析引擎 Impala的技術(shù)背景、安裝與配置、架構(gòu)、操作方法、性能優(yōu)化,以及最富技術(shù)含量的應(yīng)用設(shè)計(jì)原則和應(yīng)用案例?!堕_(kāi)源大數(shù)據(jù)分析引擎Impala實(shí)戰(zhàn)》緊扣目前計(jì)算技術(shù)發(fā)展熱點(diǎn),適合所有大數(shù)據(jù)分析人員、大數(shù)據(jù)開(kāi)發(fā)人員和大數(shù)據(jù)管理人員參考使用。

作者簡(jiǎn)介

暫缺《開(kāi)源大數(shù)據(jù)分析引擎Impala實(shí)戰(zhàn)》作者簡(jiǎn)介

圖書(shū)目錄

第1章 Impala概述、安裝與配置
1.1 Impala概述
1.2 Cloudera Manager安裝準(zhǔn)備
1.3 CM及 CDH安裝
1.4 Hive安裝
1.5 Impala安裝
第2章 Impala入門(mén)示例
2.1 數(shù)據(jù)加載
2.2 數(shù)據(jù)查詢(xún)
2.3 分區(qū)表
2.4 外部分區(qū)表
2.5 笛卡爾連接
2.6 更新元數(shù)據(jù)
第3章 Impala概念及架構(gòu)
3.1 Impala服務(wù)器組件
3.1.1 Impala Daemon
3.1.2 Impala Statestore
3.1.3 Impala Catalog
3.2 Impala應(yīng)用編程
3.2.1 Impala SQL方言
3.2.2 Impala編程接口概述
3.3 與Hadoop生態(tài)系統(tǒng)集成
3.3.1 與Hive集成
3.3.2 與HDFS集成
3.3.3 使用HBase
第4章 SQL語(yǔ)句
4.1 注釋
4.2 數(shù)據(jù)類(lèi)型
4.2.1 BIGINT
4.2.2 BOOLEAN
4.2.3 DOUBLE
4.2.4 FLOAT
4.2.5 INT
4.2.6 REAL
4.2.7 SMALLINT
4.2.8 STRING
4.2.9 TIMESTAMP
4.2.10 TINYINT
4.3 常量
4.3.1 數(shù)值常量
4.3.2 字符串常量
4.3.3 布爾常量
4.3.4 時(shí)間戳常量
4.3.5 NULL
4.4 SQL操作符
4.4.1 BETWEEN操作符
4.4.2 比較操作符
4.4.3 IN操作符
4.4.4 IS NULL操作符
4.4.5 LIKE操作符
4.4.6 REGEXP操作符
4.5 模式對(duì)象和對(duì)象名稱(chēng)
4.5.1 別名
4.5.2 標(biāo)示符
4.5.3 數(shù)據(jù)庫(kù)
4.5.4 表
4.5.5 視圖
4.5.6 函數(shù)
4.6 SQL語(yǔ)句
4.6.1 ALTER TABLE
4.6.2 ALTER VIEW
4.6.3 COMPUTE STATS
4.6.4 CREATE DATABASE
4.6.5 CREATE FUNCTION
4.6.6 CREATE TABLE
4.6.7 CREATE VIEW
4.6.8 DESCRIBE
4.6.9 DROP DATABASE
4.6.10 DROP FUNCTION
4.6.11 DROP TABLE
4.6.12 DROP VIEW
4.6.13 EXPLAIN
4.6.14 INSERT
4.6.15 INVALIDATE METADATA
4.6.16 LOAD DATA
4.6.17 REFRESH
4.6.18 SELECT
4.6.19 SHOW
4.6.20 USE
4.7 內(nèi)嵌函數(shù)
4.7.1 數(shù)學(xué)函數(shù)
4.7.2 類(lèi)型轉(zhuǎn)換函數(shù)
4.7.3 時(shí)間和日期函數(shù)
4.7.4 條件函數(shù)
4.7.5 字符串函數(shù)
4.7.6 特殊函數(shù)
4.8 聚集函數(shù)
4.8.1 AVG
4.8.2 COUNT
4.8.3 GROUP_CONCAT
4.8.4 MAX
4.8.5 MIN
4.8.6 NDV
4.8.7 SUM
4.9 用戶(hù)自定義函數(shù)UDF
4.9.1 UDF概念
4.9.2 安裝UDF開(kāi)發(fā)包
4.9.3 編寫(xiě)UDF
4.9.4 編寫(xiě)UDAF
4.9.5 編譯和部署UDF
4.9.6 UDF性能
4.9.7 創(chuàng)建和使用UDF示例
4.9.8 UDF安全
4.9.9 Impala UDF的限制
4.10 Impala SQL &Hive QL
4.11 將 SQL移植到Impala上
第5章 Impala shell
5.1 命令行選項(xiàng)
5.2 連接到Impalad
5.3 運(yùn)行命令
5.4 命令參考
5.5 查詢(xún)參數(shù)設(shè)置
第6章 Impala管理
6.1 準(zhǔn)入控制和查詢(xún)隊(duì)列
6.1.1 準(zhǔn)入控制概述
6.1.2 準(zhǔn)入控制和YARN
6.1.3 并發(fā)查詢(xún)限制
6.1.4 準(zhǔn)入控制和Impala客戶(hù)端協(xié)同工作
6.1.5 配置準(zhǔn)入控制
6.1.6 使用準(zhǔn)入控制指導(dǎo)原則
6.2 使用YARN資源管理(CDH5)
6.2.1 Llama進(jìn)程
6.2.2 檢查計(jì)算的資源和實(shí)際使用的資源
6.2.3 資源限制如何生效
6.2.4 啟用Impala資源管理
6.2.5 資源管理相關(guān)impala-shell參數(shù)
6.2.6 Impala資源管理的限制
6.3 為進(jìn)程,查詢(xún),會(huì)話設(shè)定超時(shí)限制
6.4 通過(guò)代理實(shí)現(xiàn)Impala高可用性
6.5 管理磁盤(pán)空間
第7章 Impala存儲(chǔ)
7.1 文件格式選擇
7.2 Text
7.2.1 查詢(xún)性能
7.2.2 創(chuàng)建文本表
7.2.3 數(shù)據(jù)文件
7.2.4 加載數(shù)據(jù)
7.2.5 LZO壓縮
7.3 Parquet
7.3.1 創(chuàng)建Parquet表
7.3.2 加載數(shù)據(jù)
7.3.3 查詢(xún)性能
7.3.4 Snappy/Gzip壓縮
7.3.5 與其他組件交換 Parquet數(shù)據(jù)文件
7.3.6 Parquet數(shù)據(jù)文件組織方式
7.4 Avro
7.4.1 創(chuàng)建Avro表
7.4.2 使用Hive創(chuàng)建的Avro表
7.4.3 通過(guò)JSON指定Avro模式
7.4.4 啟用壓縮
7.4.5 模式進(jìn)化
7.5 RCFile
7.5.1 創(chuàng)建RCFile表和加載數(shù)據(jù)
7.5.2 啟用壓縮
7.6 SequenceFile
7.6.1 創(chuàng)建和加載數(shù)據(jù)
7.6.2 啟用壓縮
7.7 HBase
7.7.1 支持的 Hbase列類(lèi)型
7.7.2 性能問(wèn)題
7.7.3 適用場(chǎng)景
7.7.4 數(shù)據(jù)加載
7.7.5 啟用壓縮
7.7.6 限制
7.7.7 示例
第8章 Impala分區(qū)
8.1 分區(qū)技術(shù)適用場(chǎng)合
8.2 分區(qū)表相關(guān) SQL語(yǔ)句
8.3 分區(qū)修剪
8.4 分區(qū)鍵列
8.5 使用不同的文件格式
第9章 Impala性能優(yōu)化
9.1 最佳實(shí)踐
9.2 連接查詢(xún)優(yōu)化
9.3 使用統(tǒng)計(jì)信息
9.4 基準(zhǔn)測(cè)試
9.5 控制資源使用
9.6 性能測(cè)試
9.7 使用 EXPLAIN信息
9.8 使用 PROFILE信息
第10章 Impala設(shè)計(jì)原則與應(yīng)用案例
10.1 設(shè)計(jì)原則
10.2 應(yīng)用案例

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.afriseller.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)