第一章 今天復雜的計算環(huán)境
復雜. 復雜. 還是復雜
多重技術和協(xié)議
各種各樣的廠商
各種各樣的用戶
無處不在的位置
日新月異的變化
更大的商業(yè)需求
令人望而生畏的工作環(huán)境
所有權總成本 TCO 方面的幾個問題
如何定義所有權總成本
所有權總成本的工業(yè)化評估
所有權總成本研究揭示的意義
導致所有權總成本居高不下的幾個原因
一種典型的方案:辦公室系統(tǒng)的選擇
可用性已經成為所有權總成本最大的貢獻者
總 結
第二章 實現(xiàn)更高的可用性
判定用戶對可用性的需求
服務水平協(xié)議
幫助用戶確立他們對可用性的需求
可用性的級別及測定
高可用性級別 High Availability Level
不間斷運行級別 Continuous Operations level
不間斷可用性級別 Continuous Availability Level
可用性指標的量化
可用性:用戶為主的測量標準
端對端可用性的測量
總 結
第三章 系統(tǒng)可用性計劃的要點
明確系統(tǒng)部件
注重處理關鍵性部件
可用性四大要素
總 結
第四章 建立系統(tǒng)管理制度
過程. 數(shù)據(jù). 工具和組織
個人計算機 PC 領域的系統(tǒng)管理
或此類工作的不足
集中式:令IT企業(yè)離而復歸
熟悉需要管理的系統(tǒng)
管理的基礎:5個階段
階段1:樹立目標
階段2:制訂計劃
階段3:貫徹執(zhí)行
階段4:質量測量
階段5:跟蹤控制
確立系統(tǒng)管理制度
第五章 加強服務水平的管理
服務水平管理
過程要求
數(shù)據(jù)和測量要求
組織要求
工具要求
服務水平管理的益處
問題處理管理
過程要求
數(shù)據(jù)和測量要求
組織要求
工具要求
問題處理管理的益處
變更管理
過程要求
數(shù)據(jù)和測量要求
組織要求
工具要求
變更管理的益處
安全管理
過程要求
數(shù)據(jù)和測量要求
組織要求
工具要求
安全管理的益處
資產和配置管理
過程要求
數(shù)據(jù)和測量要求
組織要求
工具要求
可用性管理
過程要求
數(shù)據(jù)和測量要求
組織要求
工具要求
可用性管理的益處
第六章 計算環(huán)境:從集中式到分布式
系統(tǒng)管理制度
集中式計算環(huán)境
分布式計算環(huán)境
今天計算環(huán)境中的系統(tǒng)管理
確定合理的職能與控制
選擇一種實施戰(zhàn)略
推行一種部署戰(zhàn)略 Deployment Strategy
例外性管理
政策化管理
性能數(shù)據(jù)標準化
分布式系統(tǒng)管理員所承擔的責任
系統(tǒng)管理體系結構的清晰界定
過程專管所屬
總 結
第七章 滿足多重可用性需要的技術
冗余 Redundancy
硬件冗余舉例
軟件冗余舉例
環(huán)境冗余舉例
影響成功的關鍵性因素
關鍵資源的備份 Backup
備份的方法
硬件備份舉例
軟件備份舉例
IT操作備份舉例
獲得成功的關鍵因素
集 群
集群與冗余之比較
硬件和軟件集群舉例
IT操作集群舉例
環(huán)境集群舉例
獲得成功的關鍵性因素
容錯 Fault Tolerence
硬件容錯舉例
軟件容錯舉例
環(huán)境容錯舉例
獲得成功的關鍵性因素
隔離或者分區(qū)
硬件隔離舉例
軟件隔離舉例
隔離的其他優(yōu)點
獲得成功的關鍵性因素
自動化操作
控制臺和網絡操作舉例
工作負荷量 Workload 管理舉例
系統(tǒng)資源監(jiān)測舉例
問題處理管理應用程序
資源分布舉例
備份和恢復舉例
獲得成功的關鍵性因素
安全接入機制
安全接入的幾個步驟
安全的類型
密碼管理
獲得成功的關鍵性因素
標準化
硬件標準化舉例
軟件標準化舉例
網絡標準化舉例
過程和程序標準化舉例
名稱標準化舉例
獲得成功的關鍵性因素
向標準化過渡
總 結
第八章 系統(tǒng)可靠性之特殊技術
使用可靠的部件
硬件部件可靠性實現(xiàn)最大化之技術
軟件部件可靠性實現(xiàn)最大化之技術
人員相關類可靠性實現(xiàn)最大化之技術
環(huán)境相關類可靠性實現(xiàn)最大化之技術
供應商可靠性的幾項指標
利用程序設計使故障率實現(xiàn)最小化
正確性 correctness
堅固性 robustness
擴展性 extensibility
復用性 reusability
采取措施應對獨立于環(huán)境之外的干擾
使用發(fā)電機
使用獨立的空調設備
使用消防裝置
使用升高地板
安裝設備輪鎖
將計算機房設在二樓
采取故障避免 也稱免錯 fault avoidance
措施
分析問題的傾向及其統(tǒng)計結果
使用先進的硬件技術
使用軟件維修工具
總 結
第九章 系統(tǒng)可恢復性之特殊技術
故障識別自動化技術
奇偶校驗檢查存儲器
錯誤檢查和校正 ECC 存儲器
數(shù)據(jù)確認例行程序 data vaiidation routine
快速恢復技術
最低限度使用缺乏穩(wěn)定性的存儲媒體
對中央存儲器進行定期的數(shù)據(jù)更新
自動文件保存特性
總 結
第十章 系統(tǒng)可維修性之特殊技術
聯(lián)機系統(tǒng)的重新定義
添加或者拆除輸入/輸出 I/O 設備
可選性子系統(tǒng)斷電
確認或者拒絕變更
出錯信息可掌握技術
使用標準化通用術語
采納普遍的應用軟件已使用的術語
提供發(fā)生的問題. 原因和影響以及如何
進行處理的信息
提供上下文相關性 context-sensitive 幫助
提供選項以便更加詳細地查看更多的
誤差信息
在錯誤被清除后, 繼續(xù)提供誤差信息的
可用性
完善文件資料技術
手頭要有一本《操作手冊》
編寫關于基本問題隔離和恢復的指南手冊
提供系統(tǒng)配置圖表
實現(xiàn)資源標簽加注
提供一個技術圖書館
安裝最新的修改和補丁程序
fixes and patches
總 結
第十一章 系統(tǒng)可管理性之特殊技術
使用可管理的系統(tǒng)部件
簡單網絡管理協(xié)議 SNMP
公共管理信息協(xié)議 CMIP
桌式管理界面 DMI
公共信息管理格式 CIM
聯(lián)線管理 WfM
管理應用程序
系統(tǒng)管理問題 Sytems Management lssus
自動化的系統(tǒng)管理能力
系統(tǒng)管理應用程序和工作系統(tǒng) Framework
加強IT人員的系統(tǒng)管理制度教育
信息系統(tǒng)的商業(yè)價值
管理原理
基本的數(shù)值分析技術
總 結
第十二章 總結性論述
系統(tǒng)管理制度的意義
首先從何處入手
故障停機分析
確定故障的單點 single point
現(xiàn)有條件下的挖潛
推薦一項實用策略
總 結
附錄A 部分選用產品的可用性特征
可選用操作系統(tǒng)之可用性特征
美國Novell公司推出的NetWare操作系統(tǒng)的
可用性特征
美國Sun公司推出的Solaris 8操作系統(tǒng)的
可用性特征
IBM公司推出的AIX操作系統(tǒng)的可用性特征
美國微軟公司推出的Windows2000服務器及專業(yè)
版之可用性特征
IBM公司推出的OS/400操作系統(tǒng)之可用性
特征
可選用硬件部件之可用性特征
美國IBM公司推出的S/390綜合服務器之
可用性特征
美國IBM公司推出的AS/400中等系統(tǒng)之
可用性特征
美國IBM公司推出的RS/6000之可用性特征
康柏公司推出的Proliant服務器之可用性特征
可選用軟件部件之可用性特征
美國Oracle 甲骨文 公司推出的Oracle8i數(shù)據(jù)庫之
可用性特征
附錄 主要譯名中英文對照表