《ITSM-AV-01可用性計劃》由會員分享,可在線閱讀,更多相關(guān)《ITSM-AV-01可用性計劃(12頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、編號:ITSM-4-AV-01
版本號:V1.0
受控狀態(tài):受控
密級:內(nèi)部公開
XXXXXXt限公司
XXXXX給滿數(shù)字化分析模型項目
2019年度可用性計劃
版權(quán)聲明和保密須知
本文件中出現(xiàn)的任何文字敘述、文檔格式、插圖、照片、方法、過程等內(nèi)容,除另有特別注明,版權(quán)均屬XXXXXX有
限公司所有,受到有關(guān)產(chǎn)權(quán)及版權(quán)法保護。任何單位和個人未經(jīng)XXXXXX有限公司的書面授權(quán)許可,不得復(fù)制或引用本文件的任何片斷,無論通過電子形式或非電子形式。
Copyright?2019XXXXXX有限公司版權(quán)所有
文檔信息
文檔編號:ITSM-4-AV-01
文檔分類:內(nèi)部公開
編
2、寫人:技術(shù)部門
審批人:
版本記錄
版本號
版本日期
修改
審批人
修改履歷
V1.0
2019.9.12
技術(shù)部門
創(chuàng)建文檔
目錄
1概述4
1.1 文檔目標4
2可用性的測量4
3 IT服務(wù)可用性需求分析4
3.1 業(yè)務(wù)需求5
3.2 維護指標6
3.3 運行指標6
4 IT服務(wù)可用性目標7
4.1 計劃不可用時間7
4.2 可用性監(jiān)控指標8
4.3 可用性監(jiān)控指標度量標準8
4.4 監(jiān)控方式及報告周期8
4.5 2019年度可用性監(jiān)測計劃表9
1
3、概述
1.1文檔目標
為了在2019年更好的確保智能倉儲物流平臺滿足客戶要求,特制定本計劃,旨在明確IT服務(wù)
可用性的目標,管理并改進IT服務(wù)可用性,在預(yù)算范圍內(nèi)使運維團隊提供的服務(wù)能夠最大化地滿足組織的需求。
2可用性的測量
1)IT基礎(chǔ)架構(gòu)的復(fù)雜程度:該服務(wù)包括了應(yīng)用系統(tǒng)、網(wǎng)絡(luò)、弱電和數(shù)據(jù)庫及服務(wù)器等硬件設(shè)施,復(fù)雜度為中等。
2)IT服務(wù)組件的可靠性:在項目中運行的設(shè)備由廠家負責維保,我公司提供備份已備替換。
軟件系統(tǒng)及數(shù)據(jù)庫經(jīng)過公司內(nèi)部測試,目前穩(wěn)定性可在96%以上。
3)對故障作出快速有效反應(yīng)的能力:長期安排一位工程師現(xiàn)場駐點,提供遠程網(wǎng)絡(luò)、電話等方式在線服務(wù),如現(xiàn)場故
4、障不能及時解決,2個小時內(nèi)派工程師達到現(xiàn)場,7X24小時支持
服務(wù)。
4)IT部門或供應(yīng)商提供的維護的質(zhì)量:交由公司的商務(wù)部對對供應(yīng)商的資質(zhì)能力進行檢查,定期巡檢和登記備案。設(shè)備安裝上線之前已進行了交付驗收測試。
3 IT服務(wù)可用性需求分析
建立和維護與組織業(yè)務(wù)需求相一致的IT服務(wù)可用性計劃,必須明確組織業(yè)務(wù)和客戶的需求,在此基礎(chǔ)上制定的IT服務(wù)可用性計劃才能最大化地支持組織業(yè)務(wù)的發(fā)展運作和用戶的工作,符合組織的利益。
3.1 業(yè)務(wù)需求
智能倉儲物流平臺管理系統(tǒng)中硬件網(wǎng)絡(luò)設(shè)備和服務(wù)器、網(wǎng)絡(luò)線路是用戶單位的關(guān)鍵IT系統(tǒng),定
義為關(guān)鍵業(yè)務(wù),其業(yè)務(wù)需求如下:
指標
定義
承諾標準
5、
非重大故障系
統(tǒng)恢復(fù)時間
除操作系統(tǒng)不能啟動、硬件損壞機器不能啟動、重
要系統(tǒng)數(shù)據(jù)丟失外的其他故障
<1個工作日
重大故障系統(tǒng)
恢復(fù)時間
操作系統(tǒng)不能啟動、硬件損壞機器不能啟動、重要
系統(tǒng)數(shù)據(jù)丟失
<24小時
系統(tǒng)平均無故
障工作時間
系統(tǒng)單臺設(shè)備兩次故障(不含系統(tǒng)維護)間的平均時間。
月平均無故障工
作時間段》700小時
根據(jù)以上可用性需求分析的結(jié)果,對IT服務(wù)的可用性需求進行分類,如下:
可用性分類
可用性級別
每年服務(wù)中斷時間
容錯性
94.999%
5分鐘
彈性(冗余)
95.99%
53分鐘
局可用性
97.9%
8.8小
6、時
一>可用性
93-97.5%
87.6-43.8小時
在本年度的IT服務(wù)組件可用性識別考慮的因素包括:
(1) 應(yīng)用系統(tǒng)、中間件和操作系統(tǒng)方面,包括單點故障、不當配置選項、設(shè)計缺陷、低效的開發(fā)方法、代碼編寫錯誤等
(2) 硬件和網(wǎng)絡(luò)方面,包括單點故障、過時的固件、不當?shù)奈臋n維護、廠商支持水平不夠、缺乏抗靜電防范措施、缺乏后備資源、線纜連接標識混亂等
(3) 配套設(shè)施方面,包括空調(diào)能力不足、電源中斷、電源不穩(wěn)定、火災(zāi)與洪水、物理安全疏漏等
(4) 出口設(shè)施方面,包括單一供電線路和單一電信線路
(5) 人員方面,包括低劣的質(zhì)量控制規(guī)程、缺乏紀律約束、缺乏專業(yè)技能等
3.
7、2 維護指標
表3-1系統(tǒng)維護指標表
指標名稱
指標定義及計算方法
指標值
系統(tǒng)可用率
指某個增值業(yè)務(wù)平臺業(yè)務(wù)中斷時長與統(tǒng)計總時長之比系
業(yè)務(wù)中斯時間(分鐘)
統(tǒng)可用率=統(tǒng)計息時長(例中)X100%
>99%
服務(wù)滿意度
a二£一
14(4為各季度滿意度得分值)
>90
故障處理及時率
口M00%
>95
工單處理及時率
按時完成的工單數(shù)
L工電蟋Xi。。%
>95
3.3 運行指標
表3-2系統(tǒng)運行指標表
設(shè)備名稱
指標名稱
峰值告警閾值
平均告警閾值
服務(wù)器
CPU^IJ用率
90%
50%
磁盤利用率
90%
65%
8、
內(nèi)存利用率
90%
65%
數(shù)據(jù)庫表空間利用率
85%
70%
網(wǎng)絡(luò)設(shè)備
運行流量
90%
50%
引擎板(主控)
運行流量
90%
50%
CPU
處理器荷載
90%
50%
4 IT服務(wù)可用性目標
服務(wù)
內(nèi)容描述
可用性目標
備注
無線控制器
AP信號
98%
引擎板
主控板
99%
16口萬兆交換板
網(wǎng)絡(luò)交換
95%
48口千兆交換板
網(wǎng)絡(luò)交換
95%
WA2620-FIT
無線局域網(wǎng)室內(nèi)型雙頻接入點
99%
SFP-GE-SX-MM850D
光模塊-SFP-GE-多模
模塊
99
9、%
LSWM1AC300
300W交流系統(tǒng)電源模塊
99%
SWP-IMC7-IMP
H3CiMC-智能管理
平臺標準版
99%
4.1 計劃不可用時間
2019年IT服務(wù)提供的可用時間段為:5X8小時,7X24小時技術(shù)支持。
服務(wù)提供次要時段,如較容易承受停機故障的時間:工作日的24:00?4:00之間。
服務(wù)提供的關(guān)鍵時段:
計劃內(nèi)的系統(tǒng)的升級需要停止服務(wù),再進行程序更新,更新完成后再把服務(wù)啟動;因此每次升級導(dǎo)致物聯(lián)網(wǎng)平臺系統(tǒng)有半小時左右不可用。出于對業(yè)務(wù)影響最小化的考慮,此操作會提前三天左右通知并安排在下班后或者周末進行。每年計劃有4小時左右要對設(shè)
10、備進行一次表結(jié)
構(gòu)維護操作,屆時系統(tǒng)將不可用。
4.2 可用性監(jiān)控指標
系統(tǒng)/服務(wù)組件
指標
描述
存儲系統(tǒng)
平均響應(yīng)時間
某一階段內(nèi)的平均響應(yīng)時間
是否可以登錄
網(wǎng)絡(luò)端口的可連通性
互聯(lián)網(wǎng)
連通性
測試到指定網(wǎng)站的連通性
4.3 可用性監(jiān)控指標度量標準
指標
度量標準
注釋
連續(xù)工作時間
設(shè)備功能正常,不出功能性故障
人為操作失誤造成的故障同樣視為設(shè)備故障;不影響實質(zhì)性服務(wù)功能的故障不考慮在本指標的度量范圍內(nèi)
故障頻率
在一段時間內(nèi)發(fā)生故障的頻率
恢復(fù)時間
從發(fā)生故障到恢復(fù)服務(wù)提供所經(jīng)歷的時間
響應(yīng)時間
發(fā)出指令到相關(guān)設(shè)備做出回
11、應(yīng)的時間
對一條數(shù)據(jù)通路中的所有設(shè)備,應(yīng)分別計算各自的響應(yīng)時間和總響應(yīng)時間
網(wǎng)絡(luò)可連通性
通過IP是否能夠連通到設(shè)備
是否可登陸
通過正常步驟是否能夠成功登陸
4.4 監(jiān)控方式及報告周期
系統(tǒng)/服務(wù)組件
報告周期
監(jiān)控方式
負責人
無線控制器
每月
軟件及人工監(jiān)控
實施工程師
引擎板
每月
軟件及人工監(jiān)控
實施工程師
16口萬兆交換板
每月
軟件及人工監(jiān)控
實施工程師
48口千兆交換板
每月
軟件及人工監(jiān)控
實施工程師
WA2620-FIT
每月
軟件及人工監(jiān)控
實施工程師
SFP-GE-SX-MM850D
每月
12、
軟件及人工監(jiān)控
實施工程師
LSWM1AC300
每月
軟件及人工監(jiān)控
實施工程師
SWP-IMC7-IMP
每月
軟件及人工監(jiān)控
實施工程師
按照月度進行可用性監(jiān)控數(shù)據(jù)匯總,包括網(wǎng)絡(luò),IT基礎(chǔ)架構(gòu)系統(tǒng),應(yīng)用系統(tǒng)的可用性情況。
根據(jù)上述分析和總結(jié),2019年度可用性計劃時間表如下:
4.5 2019年度可用性監(jiān)測計劃表
分類
子類
項目
子項
2019年行動計劃
責任人
監(jiān)測內(nèi)容及時間頻率
第一季度
第二季度
第三季度
第四季度
業(yè)務(wù)軟件
平臺
管理軟件
降低軟件出
錯率
程序bug
每月,
由系統(tǒng)集成部進行遠程監(jiān)測,內(nèi)部
13、系統(tǒng)升級之后進
行推送
全年
實施工程
師
響應(yīng)、解決問題速度
每周,
系統(tǒng)登錄、頁面訪問、數(shù)據(jù)查詢等
全年
實施工程
師
網(wǎng)絡(luò)環(huán)境監(jiān)控
客戶網(wǎng)絡(luò)排查
每天早上9點遠程監(jiān)測
全年
實施
工程
師
網(wǎng)絡(luò)流量監(jiān)
控
各時段網(wǎng)絡(luò)流量查看
每天早上9點遠程監(jiān)測
全年
實施工程
師
數(shù)據(jù)分析
每天下午5點遠程監(jiān)測
全年
實施工程
師
操作系統(tǒng)
Windows
監(jiān)控
API網(wǎng)關(guān)保養(yǎng)
每月初
遠程監(jiān)測,現(xiàn)場駐場工程師配合
全年
實施工程
師
cpu、內(nèi)存等硬件巡檢
每天早上9點
遠程監(jiān)測,現(xiàn)場駐場工程師配合
全年
實施
14、工程
師
安全性
每周五
遠程監(jiān)測
全年
實施工程師
性能分析
每月初
遠程監(jiān)測,現(xiàn)場駐場工程師配合
全年
實施工程
師
DB
SQLSERVER
監(jiān)控
歸檔日志
每周五
遠程監(jiān)測,現(xiàn)場駐場工程師配合
全年
實施工程
師
數(shù)據(jù)文件、表空間巡檢
每周五
遠程監(jiān)測,現(xiàn)場駐場工程師配合
全年
實施工程
師
數(shù)據(jù)庫性能分析
每周五
遠程監(jiān)測,現(xiàn)場駐場工程師配合
全年
實施工程師
集群狀態(tài)巡檢
每周五
遠程監(jiān)測,現(xiàn)場駐場工程師配合
全年
實施工程
師
集群健康巡檢
每周五
遠程監(jiān)測,現(xiàn)場駐場工程師配合
全
15、年
實施工程師
存儲設(shè)備
磁盤陣列
監(jiān)控
存儲控制器巡檢
每周,,現(xiàn)場駐場工程師配合
全年
實施工程
師
存儲磁盤巡檢
每周,,現(xiàn)場駐場工程師配合
全年
實施
工程
師
硬件
設(shè)備
網(wǎng)絡(luò)交換
機
監(jiān)控
設(shè)備狀態(tài)巡檢
每周1,現(xiàn)場駐場工程師配合
全年
實施
工程
師
配置備份
每周1,現(xiàn)場駐場工程師配合
全年
實施
工程
師
服務(wù)器
設(shè)備指示燈
現(xiàn)場巡檢
每周1,現(xiàn)場駐場工程師配合
全年
實施
工程
師
CP應(yīng)行率
系統(tǒng)優(yōu)化和維護
每周1,現(xiàn)場駐場工程師配合
全年
實施
工程
師
磁盤冗余
系統(tǒng)維護
每周1,現(xiàn)場駐場工程師配合
全年
實施
工程
師
內(nèi)存占用率
系統(tǒng)維護
每周1,現(xiàn)場駐場工程師配合
全年
實施
工程
師