《系統(tǒng)運維管理-IT基礎設施運維管理規(guī)范》由會員分享,可在線閱讀,更多相關《系統(tǒng)運維管理-IT基礎設施運維管理規(guī)范(12頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、
IT 基礎設施運維管理規(guī)范
文件編號:運維-002-V1.0
目 錄
運維管理規(guī)范 4
1. 目的 4
2. 適用范圍 4
3. 規(guī)范性引用及參考 4
4. 本文術語,定義和縮略語 5
5. 基本要求 6
5.1運維管理原則 6
5.2制度和流程管理 6
5.3 文檔管理 6
5.4設備和軟件管理 6
5.5供應商管理 7
5.6督促檢查 7
6. 運行維護 8
6.1日常操作及監(jiān)控分析 8
6.2 數(shù)據(jù)與介質管理 8
6.3機房管理 9
6.4 網(wǎng)絡管理 9
6.5 弱電管理 10
6.6桌面維護 10
6.7服務器及系統(tǒng)變更 11
6
2、.8 配置管理 12
6.9 事件與問題管理 12
7. 應急管理 12
7.1應急準備 12
7.2應急處置 13
運維管理規(guī)范
1. 目的
為規(guī)范公司運維工作,使相關工作具有持續(xù)改善及相互協(xié)作性,同時加強計算機設備的管理及維護,確保維修工作的及時性,降低計算機設備的報修率,實現(xiàn)業(yè)務與技術的融合,將業(yè)務部門與IT 部門緊密結合在一起,根據(jù)公司管理要求及計算機應用的需要,由運維部制定。
2. 適用范圍
本規(guī)范規(guī)定了運維管理工作的要求。
本規(guī)范適用于維信理財集團(中國) 總部,包括全國各分部及門店。
3. 規(guī)范性引用及參考
◆ IT 服務管理國際標準ISO/IE
3、C 20000
◆ 企業(yè)獲得ISO/IEC 20000認證的權威指南
◆ 全球著名IT 服務管理書庫(ITSM Library)
◆ IT 服務質量管理原則
◆ 理解ISO/IEC 20000在IT 服務中的地位
◆ ISO/IEC 20000規(guī)范和實踐準則
◆ IT 服務管理國際標準ISO/IEC 20000
◆ GB/T 20269—2006 信息安全技術 信息系統(tǒng)安全管理要求
◆ ISO 31000:2009 風險管理 原則和指南(Risk management -- Principles and guidelines)
◆ JR-T 0060—2010 金融
4、信息系統(tǒng)安全等級保護基本要求
◆ JR/T 0074-2012 金融IT 服務管理基本規(guī)范
◆ 中國金融標準化報告(2011)
4. 本文術語,定義和縮略語
1、 IT: Information Technology 信息技術
2、 DNS: Domain Name Service 域名服務
3、 DHCP: Dynamic Host Configuration Protocol 動態(tài)主機配置協(xié)議
4、 VPN: Virtual Private Network 虛擬專用網(wǎng)
5、 OA: Office Automation 辦公自動化系統(tǒng)
6、 ISO: Interna
5、tional Organization for Standardization 國際標準化組織
編訂日期:30.7.2014 批準日期: 生效日期:
7、 故障: IT設備或系統(tǒng)喪失規(guī)定的功能,導致服務中斷或降質,或對正常運行造成潛在威脅。
8、 異常: IT設備或系統(tǒng)的狀態(tài)發(fā)生超出預期的變化或性能指標參數(shù)超出正常范圍,有可能引發(fā)或已經(jīng)引發(fā)故障,需要引起運維人員關注或處理。
9、 資料: IT設備或系統(tǒng)的運行記錄,包括IT 設備或系統(tǒng)的配置、故障歷史記錄、軟硬件擴容或調整記錄、權限變更申請記錄等。
10、運行維護:本規(guī)范中的運行維護包括IT 基礎設施維護、IT 應用系統(tǒng)運維維護、安全
6、管理、網(wǎng)絡接入、內(nèi)容信息以及綜合管理等。
5. 基本要求
5.1運維管理原則
公司按集中與分散相結合的原則,設立機房、各部門配備電腦。計算機系統(tǒng)本著“總體規(guī)劃、分步建設”的方式實施建立。
計算機系統(tǒng)建設應綜合考慮成本、費用、效率、效果、先進性及適用性,選擇最優(yōu)技術、經(jīng)濟方案。
5.2制度和流程管理
運維管理制度應包括但不限于機房管理、網(wǎng)絡與系統(tǒng)管理、數(shù)據(jù)和介質管理、配置管理、安全管理、監(jiān)控管理、文檔管理、設備和軟件管理、供應商管理等制度。
運維操作流程應包括但不限于日常操作、事件處理、問題處理、系統(tǒng)變更、應急處置等流程。
5.3 文檔管理
對運維過程中涉及的各類文檔進行管理,
7、可按照制度文檔、技術文檔、合同文檔、審批記錄、日志記錄等進行分類,并妥善保存。 5.3.2 對文檔的版本應當進行控制。
文檔在使用時應能讀取、使用較新版本,防止作廢文件的逾期使用。
5.4設備和軟件管理
建立計算機相關設備和軟件管理制度,對設備和軟件的使用、安裝、維修(升級)等進行規(guī)范。明確設備和軟件管理責任人。對設備進行標識,標識應放在設備明顯位置。
規(guī)定設備和軟件的使用年限,定期進行盤點,并對設備狀態(tài)進行評估和更新。
對外送設備的維修進行嚴格管理,防止數(shù)據(jù)泄露。
對擬下線和擬報廢設備的存儲介質中的全部信息進行清除或銷毀。對正式下線設備和軟件交指定部門統(tǒng)一管理、保存或處置,并保留
8、相應記錄。設備和軟件報廢應符合公司現(xiàn)行資產(chǎn)管理規(guī)定。
5.5供應商管理
對供應商支持運維服務的相關活動進行統(tǒng)一管理。
在與供應商簽訂的合同中明確其應承擔的責任、義務,并約定服務要求和范圍等內(nèi)容。
應定期收集、更新供應商信息,組織對供應商的服務質量、履約情況、人員工作情況等內(nèi)容進行評價,并跟蹤和記錄供應商改進情況。加強運維外包服務管理,主要包括:
a) 明確外包公司應當承擔的責任及追究方式;
b) 明確界定外包人員的工作職責、活動范圍、操作權限;
c) 對外包人員工作情況進行監(jiān)督和檢查,并留存相應記錄;
d) 對駐場外包人員的入場和離場進行管理;
e) 定期評估外包的服務質
9、量;
f) 制定外包服務意外終止的應急措施。
5.6督促檢查
定期檢查審計,對運維制度的執(zhí)行情況和運維工作開展情況定期進行檢查和審計,以督促運維工作持續(xù)改進。
指定人員負責對日常操作執(zhí)行情況進行檢查,確保運維管理制度和操作流程的有效執(zhí)行。對檢查和審計結果采取糾正、預防措施。
6. 運行維護
6.1日常操作及監(jiān)控分析
未經(jīng)許可,任何人不得隨便使用電腦及相關設備。 不得更換電腦硬件和軟件,拒絕使用來歷不明的軟件和移動設備。
電腦發(fā)生故障時,使用者作簡易處理仍不能排除的,應立即報告IT ,非專業(yè)管理人員不得擅自拆開機箱或調換設備配件。
計算機及其相關設備的報廢需經(jīng)過IT 部門或專職
10、人員鑒定,確認不符合使用要求后方可申請報廢。
運維應采取各種監(jiān)控措施,配備視頻、語音、系統(tǒng)監(jiān)控和報警工具,對影響信息系統(tǒng)正常運行的關鍵對象,包括機房環(huán)境、網(wǎng)絡、通信線路、主機、存儲、數(shù)據(jù)庫、核心交易業(yè)務相關的應用系統(tǒng)、安全設備等進行監(jiān)控。
主要監(jiān)控指標具體如下:
a) 機房:電力狀態(tài)、空調運行狀態(tài)、消防設施狀態(tài)、溫濕度、漏水、人員及設備進出等;
b) 網(wǎng)絡與通信:設備運行狀態(tài)、中央處理器使用率、通信連接狀態(tài)、網(wǎng)絡流量、核心節(jié)點間網(wǎng)絡
延時、丟包率等;
c) 主機:設備運行狀態(tài)、中央處理器使用率、內(nèi)存利用率、磁盤空間利用率、通信端口狀態(tài)等;
d) 存儲:設備運行狀態(tài)、數(shù)據(jù)交換延時
11、、存儲電池狀態(tài)等;
e) 安全設備:設備運行狀態(tài)、中央處理器使用率、內(nèi)存利用率、端口狀態(tài)、數(shù)據(jù)流量、并發(fā)連接數(shù)、安全事件記錄情況等;
6.2 數(shù)據(jù)與介質管理
配合數(shù)據(jù)應用部,對核心業(yè)務數(shù)據(jù)進行周備份,并每季度進行恢復性測試。對設備和人員出入進行管理。進入機房應限制和監(jiān)控其活動范圍,并有專人陪同;未經(jīng)批準不得接入生產(chǎn)環(huán)境。
6.3機房管理
對機房環(huán)境、供電、空調、消防、安防等基礎設施的運行維護、設備和人員出入、機房工作人員等進行規(guī)范管理。
應指定機房管理負責人。
確保機房環(huán)境整潔和安全,包括:
a) 應定期檢查防水、防雷、防火、防潮、防塵、防鼠、防靜電等措施的有效性;
b)
12、應保持機房環(huán)境衛(wèi)生,設備擺放合理,歸類;
c) 不得隨意出入機房。
d) 未經(jīng)審批不得接入其它用電設備。
6.4 網(wǎng)絡管理
確保網(wǎng)絡、系統(tǒng)的正常運行。網(wǎng)絡管理應包括:
a) 繪制網(wǎng)絡拓撲圖,并保持更新;
b) 應保持網(wǎng)絡設備的可用性,及時維修、更換故障設備;
c) 應負責網(wǎng)絡系統(tǒng)的參數(shù)配置、調優(yōu);
d) 應定期對系統(tǒng)容量進行檢查和評估;
e) 應定期檢查網(wǎng)絡設備的用戶、口令及權限設置的正確性;
f) 應定期對整個網(wǎng)絡連接進行檢查,確保所有交換機端口處于受控狀態(tài);
g) 應對網(wǎng)絡信息點進行管理,編制信息點使用表,并及時維護和更新,確保與實際情況一致。計
算機網(wǎng)絡跳線
13、應整齊干凈,跳線標識清晰;
h) 應制定網(wǎng)絡訪問控制策略,應合理設置網(wǎng)絡隔離設施上的訪問控制列表,關閉與業(yè)務無關的端口;編制文檔并保持更新;訪問控制策略的變更應履行審批手續(xù)。
權限管理應包括如下要求:
a) 權限分配應履行審批手續(xù),權限設置后應復核;
b) 應按照最小安全訪問原則分配用戶權限;
c) 應在用戶賬戶變化時,同時變更或撤銷其權限;
d) 應定期檢查權限設置的有效性。
6.5 弱電管理
嚴格按圖紙施工,在保證系統(tǒng)功能質量的前提下,提高工藝標準要求,確保施工質量。質量檢查制度,現(xiàn)場管理人員將定期進行質量檢查并貫穿到整個施工過程中。統(tǒng)運行驗收:當設備安裝完畢并調試運
14、行無誤后,由公司派現(xiàn)場調試人員進行系統(tǒng)聯(lián)調,并向上級匯報調試結果。運維對弱電設備的綜合管理,包括技術資料、檔案的收集。同時,每月一次對弱電設備運行狀況進行檢查,并及時處理匯報問題。
6.6桌面維護
日常數(shù)據(jù)注意事項:
a. 個人文件(Excel 、Word 、PDF 等)建議員工不要存放在系統(tǒng)盤(通常為C 盤),可以存放在其它盤符。
b. 工程師可通過多種方式或途徑來告知員工如何進行日常文件的備份,如:口述、郵件、培訓等。
c. 未經(jīng)許可,禁止使用U 盤,移動硬盤,手機或其它外設,如:網(wǎng)盤、郵箱等,盜取公司內(nèi)部文件。
重裝系統(tǒng)前注意事項:
a. 詢問用戶有哪些相關數(shù)據(jù)需要備份,
15、如桌面、我的文檔、收藏夾、郵件等。 b. 用戶Email 的備份:如客戶端為Outlook 則導出相關OST 或PST 文件;硬件損壞需更換或維修時,運維人員進行測試,明確是否真實異常,不可隨意更換。
關于賬號、權限、密碼
a. 必須嚴格按照公司制定的IT 策略進行管理,不可私自制定規(guī)范。
b. 禁止私自把個人管理員權限借給他人或告知他人。
c. 禁止為他人開設規(guī)定以外的權限,如:本地管理員、其他部門目錄訪問權限、上網(wǎng)權限、電話權限等。
d. 更改任何類型用戶權限時需得到相關審批層級確認才可執(zhí)行。
e. 如電腦無特殊應用需求,則一律為“user”普通權限。
f. 人員離職時,
16、總部和分部應及時通過OA 確認,刪除離職人員的相關賬號與信息。
g. 妥善保管自己所知的密碼。
6.7服務器及系統(tǒng)變更
不得在服務器上使用帶有病毒和木馬的軟件、光盤和可移動存貯設備,使用上述設備前一定要先做好病毒檢測;不得利用服務器從事工作以外的事情,無工作需要不得擅自拆卸服務器零部件,嚴禁更換服務器配套設備。不得擅自刪除、移動、更改服務器數(shù)據(jù);不得故意破壞服務器系統(tǒng);不得擅自修改服務器系統(tǒng)時間。
使用空閑主機,對服務器系統(tǒng)補丁進行升級測試,運行平穩(wěn)后,各服務器升級安裝補丁,彌補系統(tǒng)漏洞;為服務器系統(tǒng)做好病毒 及木馬的實時監(jiān)測,及時升級病毒庫。
管理員對管理員賬戶與口令嚴格保密、重
17、要數(shù)據(jù)庫,網(wǎng)站,APP 等服務器由研發(fā)配合定期修改密碼,以保證系統(tǒng)安全,防止對系統(tǒng)的非法入侵。
任何無關人員不得擅自進入主機房,需要進入的須征得服務器管理人員同意。應注意保護機房內(nèi)的設備和物品,未經(jīng)允許的非管理人員不得擅自操作機房內(nèi)設備。
嚴禁攜帶易燃易爆和強磁物品及其它與機房工作無關的物品進入機房,機房內(nèi)嚴禁吸咽。除管理員外,任何人不得隨意改動服務器內(nèi)系統(tǒng)及環(huán)境配置。
除系統(tǒng)管理員或授權參加系統(tǒng)管理的人員外,任何用戶不得以任何方式獲?。ɑ蚱髨D獲取)超級用戶權限。
6.8 配置管理
明確配置管理負責人。
建立配置文檔庫,對服務器、存儲、網(wǎng)絡、安全設備,操作系統(tǒng)、應用軟件、數(shù)據(jù)庫等進
18、行管理。
定期對配置進行備份及文檔庫歸類。
及時檢查并定期審計,對發(fā)現(xiàn)的不一致情況及時糾正修改。
6.9 事件與問題管理
對運維事件的處理進行規(guī)范,對發(fā)生的所有事件,根據(jù)事件的影響程度和影響范圍評估事件處理優(yōu)先級并及時處理。
對所有事件響應、處理、結束等過程進行跟蹤、監(jiān)督及檢查。對問題進行分析、提出解決方案,通過變更管理審批后部署實施。
7. 應急管理
7.1應急準備
明確網(wǎng)絡、系統(tǒng)等事件的應急指揮決策機制,負責網(wǎng)絡與系統(tǒng)事件的預防預警、應急處置、報告和調查處理工作。
網(wǎng)絡與系統(tǒng)應急管理應遵循“誰主管誰負責、誰運行誰負責”、“統(tǒng)一指揮、密切協(xié)同;注重預防、減少風險;科學處置、
19、及時報告;以人為本、公平優(yōu)先”的原則。
應急準備應符合如下要求:
a) 系統(tǒng)管理員、網(wǎng)絡管理員、安全管理員等關鍵崗位應熟練掌握應急預案,能有效處置相關事件;
b) 在自身力量不足以滿足應急要求的情況下,應與相關供應商簽署服務保障協(xié)議。協(xié)議內(nèi)容應包
括雙方聯(lián)系人、聯(lián)系方式、服務內(nèi)容及范圍、應急處理方式等。應定期檢查和評估協(xié)議的執(zhí)行情況,確保服務保障措施落實到位,確保在應急處置中相關單位能提供及時有效的技術支持;
c) 應建立有效的應急通訊聯(lián)絡系統(tǒng),確保信息暢通;
7.2應急處置
在發(fā)生網(wǎng)絡與系統(tǒng)事件后,迅速采取應急措施,盡快恢復信息系統(tǒng)正常運行,如有重要情況應及時上報。
暫時無法確定事件原因、責任和結論的,應先給出事件的初步分析判斷,并組織力量盡快查找原因,給出解決方法,采取整改措施。