運維服務(wù)管理體系建設(shè)方案.doc
《運維服務(wù)管理體系建設(shè)方案.doc》由會員分享,可在線閱讀,更多相關(guān)《運維服務(wù)管理體系建設(shè)方案.doc(22頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第1章 運維服務(wù)管理體系建設(shè)1.1 IT服務(wù)管理概述現(xiàn)今,隨著計算機技術(shù),特別是網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,對于許多行政單位,許多企業(yè)而言,IT技術(shù)越來越深入到核心業(yè)務(wù),影響策略制定和企業(yè)的發(fā)展。從而對IT環(huán)境的可靠性,可用性和快速適應(yīng)性提出了越來越高的要求,與此同時,IT環(huán)境(包括軟/硬件及相關(guān)技術(shù))卻變得越來越復(fù)雜。因此,對于一個單位而言: 如何把有限的IT資源最有效的作用于核心業(yè)務(wù)的發(fā)展 如何最快地獲取專業(yè)的支持能力 如何實現(xiàn)對系統(tǒng)的完善管理,提高系統(tǒng)的可靠性和可用性 如何提高用戶的工作效率,增加最終用戶滿意度 如何跟上IT技術(shù)的發(fā)展,及時更新相關(guān)技術(shù) 如何提高對IT系統(tǒng)利用的靈活性 如何更好地
2、管理IT運營成本 以提高服務(wù)能力,將會是單位可能面臨的問題。 IT服務(wù)管理(ITSM)是一套幫助企業(yè)對IT系統(tǒng)的規(guī)劃、研發(fā)、實施和運營進行有效管理的方法,是一套指導(dǎo)IT服務(wù)的方法論。ITIL是英國國家電腦局(CCTA)于八十年代開發(fā)的一套IT業(yè)界的服務(wù)管理標準庫,它把業(yè)界在IT管理方面最好的方法歸納起來,形成規(guī)范,旨在為企業(yè)的IT部門提供一套從計劃、研發(fā)、實施到運維的標準方法。它一經(jīng)提出,便被歐洲各大公司紛紛采納,隨后在澳洲,美洲和亞洲流行開來,目前已成為IT服務(wù)管理事實上的標準。通過參考這些標準,我們可以充分借鑒國際化標準的IT服務(wù)管理最佳經(jīng)驗,使我們“站在巨人的肩膀上”來設(shè)計、規(guī)劃及運維I
3、T服務(wù),盡可能少走彎路,有效提高IT服務(wù)的質(zhì)量。 ITIL框架圖ITIL是基于流程的方法論。IT部門可用其檢查是否用一種可控的和可訓(xùn)練有素的方法為最終用戶交付所需的IT服務(wù)。ITIL合并了一套最佳的實踐慣例,可適用于幾乎所有IT組織,無論其規(guī)模大小,或采取何種技術(shù)。ITIL對IT服務(wù)管理實踐中涉及的許多重要問題進行了系統(tǒng)的分析,包括全面的檢查清單、任務(wù)、程序、責(zé)任等與任何IT服務(wù)組織密切相關(guān)的問題。這些概念的定義也涵蓋了大多數(shù)IT服務(wù)組織的主要行為。IT服務(wù)組織可以借助ITIL的指導(dǎo)建立和拓展自己的IT服務(wù)流程。1.2 運維服務(wù)管理流程體系運維務(wù)管理最核心的是“服務(wù)支持”(ServiceSup
4、port)和“服務(wù)提供”(ServiceDelivery)兩個模塊。各流程相互貫穿和作用,形成有機整體,共同建立一個健全的服務(wù)管理體系。 如下圖所示: 1.2.1 服務(wù)支持服務(wù)支持的內(nèi)容描述了一個客戶如何訪問適當(dāng)?shù)姆?wù),以支持其業(yè)務(wù)。服務(wù)支持包含以下內(nèi)容:1.2.1.1 服務(wù)臺我們?yōu)槠髽I(yè)建設(shè)服務(wù)臺,提供統(tǒng)一報障電話,統(tǒng)一報障、統(tǒng)一維修接口,越秀工商可以通過統(tǒng)一的報障電話申請服務(wù)、查詢服務(wù)處理進程,監(jiān)控服務(wù)質(zhì)量。服務(wù)臺(ServiceDesk)是IT服務(wù)組織和用戶相互聯(lián)系的接入點。服務(wù)臺曾經(jīng)被稱為幫助臺(HelpDesk)。HelpDesk的主要任務(wù)是記錄,分解和監(jiān)控提出的問題。一個服務(wù)臺可以具
5、備更寬范的角色,如接收變更請求(RFC),并且可以支撐多種流程中的操作。服務(wù)臺是服務(wù)提供者和用戶之間的日常工作的單一聯(lián)系點。它也是報告突發(fā)事件和提交服務(wù)請求的焦點。正因為如此,服務(wù)臺的職責(zé)是保持將服務(wù)相關(guān)信息,行為和契機通知用戶,并追蹤了解用戶每日的行為。例如,服務(wù)臺可能扮演用戶提交變更請求的聯(lián)系點,基于變更管理流程傳達變更實施計劃,并保持將變更實施進程通知用戶。變更管理應(yīng)該確保服務(wù)臺隨時保持對變更行為情況的掌握。在任何對SLA產(chǎn)生影響的事件面前,服務(wù)臺處于第一線,并維護高速的信息流通道。圍繞突發(fā)事件,服務(wù)臺有可能在其權(quán)限范圍被授權(quán)實施變更。此類變更的范圍可能被預(yù)先定義。當(dāng)所有相關(guān)變更發(fā)生時,
6、變更管理流程將被告知。基本上,當(dāng)對任何CI的規(guī)范做出修改之前,變更流程都需要對其進行預(yù)先審批。1.2.1.2 突發(fā)事件管理突發(fā)事件管理流程致力于解決突發(fā)事件,并快速恢復(fù)服務(wù)供應(yīng)。突發(fā)事件被記錄下來,并且事件記錄的質(zhì)量決定了相關(guān)的其它流程的效力。服務(wù)臺接近于突發(fā)事件管理流程和問題管理流程,并處于它們之間。如果沒有適當(dāng)?shù)目刂?,變更有可能引入新的突發(fā)事件。因此需要建立有效途徑對變更進行跟蹤。這是為什么建議持續(xù)不斷地將突發(fā)事件記錄在同一個CMDB中,并分類為“問題”,“已知錯誤”,“變更記錄”等信息,以促進服務(wù)臺界面的信息溝通能力,簡化事件調(diào)查和報告。突發(fā)事件的優(yōu)先權(quán)及其升級需要作為服務(wù)級別管理流程中
7、的一部分進行協(xié)商,并在SLA中備案。突發(fā)事件管理的目標:突發(fā)事件管理的目標是盡可能迅速地根據(jù)SLA中定義的普通服務(wù)級別作出反應(yīng),使產(chǎn)生問題后對業(yè)務(wù)行為及組織和用戶的影響最小。突發(fā)事件管理也應(yīng)該保留對事件的有效記錄,以便于衡量和改進流程,并向其它流程匯報。突發(fā)事件流程如下圖所示:1.2.1.3 問題管理對于突發(fā)事件有兩種處理方法,一種是對其做出服務(wù)快速響應(yīng),盡快恢復(fù)其正常運行,另一種是鑒別和解決問題根源。這兩種方法之間存在微妙的區(qū)別,而且經(jīng)常被互相混淆。對其做好區(qū)分具有重要意義。如果問題被懷疑存在于IT架構(gòu)內(nèi)部,問題管理流程將會瞄準其潛在的根源。一個問題可能是被突發(fā)事件暴露出來的,但是顯然,問題
8、管理的目標是解決問題根源,預(yù)防其可能產(chǎn)生的干擾,而不是迅速恢復(fù)系統(tǒng)運行。當(dāng)問題被識別后(被識別的問題通常稱之為已知錯誤),通常需要進行一個業(yè)務(wù)決策,決定是否采取永久性措施改進系統(tǒng)架構(gòu),以預(yù)防再次發(fā)生新的突發(fā)事件。如果需要,提交一個變更請求來實現(xiàn)改進。為了有效和高效地識別突發(fā)事件背后的問題根源及其發(fā)展趨勢,問題管理流程需要準確全面的突發(fā)事件的記錄。問題管理流程同樣需要和可用性管理流程密切聯(lián)絡(luò),以確定這些趨勢并明確補救措施的重要性。流程:1.2.1.4 配置管理配置管理致力于控制一個變化中的IT架構(gòu)(標準化和狀態(tài)監(jiān)控),鑒別配置項目(清冊,相互關(guān)聯(lián),審核與注冊),收集和管理有關(guān)IT架構(gòu)的文檔,為所
9、有其它流程提供IT架構(gòu)的相關(guān)信息。配置管理是所有其它服務(wù)管理流程不可分割的一部分。擁有當(dāng)前架構(gòu)中所有部件的最新的,準確的,全面的和詳細的信息,并管理其變更,使這些信息有效而高效地支持其它流程運行。變更管理可以與配置管理集成。至少,建議在配置管理系統(tǒng)中控制變更的登錄和實施,并自在配置管理系統(tǒng)的幫助下對變更影響做出評估。因此所有變更請求應(yīng)該被輸入配置管理數(shù)據(jù)庫(CMDB),并隨著變更請求的進展隨時更新記錄,直至其實施。配置管理系統(tǒng)識別一個變更項目和架構(gòu)中其它部件的關(guān)系,將這些部件的所有人召集到影響評估流程中來。不管一個變更是否在架構(gòu)中實施,相互關(guān)聯(lián)的配置管理記錄應(yīng)該在CMDB中得到更新。最好在變更
10、發(fā)生時,使用集成工具自動地更新記錄。CMDB應(yīng)該開放給整個服務(wù)支持組,使所有人理解部件失效可能的原因,從而使突發(fā)事件和問題可以被更容易地解決。CMDB還應(yīng)當(dāng)被用來把突發(fā)事件及問題記錄和其它記錄聯(lián)系起來,比如失效的配置項目(ConfigurationItem-CI)和用戶之間的聯(lián)系。如果缺少了配置管理流程的集成,發(fā)布管理將難以實現(xiàn),并可能錯誤連連。服務(wù)交付流程同樣依賴于CMDB中的數(shù)據(jù)。例如:服務(wù)級別管理需要識別相互結(jié)合在一起的部件,并在此基礎(chǔ)上設(shè)置支持協(xié)議,交付服務(wù)。IT財務(wù)管理需要知道每個業(yè)務(wù)部門使用的IT架構(gòu)部件,尤其是對于收費的項目。IT服務(wù)持續(xù)性和可用性管理需要識別部件,用于問題風(fēng)險分
11、析和部件失效影響分析。下圖顯示了配置管理和其它服務(wù)管理流程之間的關(guān)系:圖:能力管理,變更管理,配置管理和發(fā)布管理之間的關(guān)系1.2.1.5 變更管理變更管理專注于對IT架構(gòu)實施可控的變更。此流程的目標是確定所需的變更,并決定這些變更如何在對IT服務(wù)產(chǎn)生最小的不利影響的范圍內(nèi)得以實施。同時確保其變更是可追溯的,而且是經(jīng)過整個組織內(nèi)部有效地磋商和協(xié)調(diào)的。在客戶組織提交變更請求后,由配置管理流程監(jiān)控其狀態(tài),與問題管理和若干其它流程進行協(xié)調(diào)。變更實施履行一特定的路徑,包括定義,計劃,建立,測試,接受,實施,和評估。變更管理流程依賴于配置數(shù)據(jù)的準確性,以確保獲知所有實行變更造成的影響。因此變更管理與配置管
12、理之間有密切的聯(lián)系。變更流程的詳細內(nèi)容應(yīng)在SLA中存檔,確保用戶知道提交變更申請的程序,項目目標及時間,以及實施變更造成的影響。變更的詳細內(nèi)容需要通知服務(wù)臺。即使變更經(jīng)過了全面測試,仍然很有可能存在實施變更的過程中發(fā)生各種困難,這些困難可能緣于變更沒有按需求或預(yù)期運行,或者對變更對功能造成的影響產(chǎn)生質(zhì)疑。變更咨詢會議(ChangeAdvisoryBoard-CAB)由可向變更管理小組提供專家意見的人員組成。這個會議很可能由來自于所有領(lǐng)域的IT及業(yè)務(wù)單位的人參與。1.2.1.6 發(fā)布管理發(fā)布是指一組配置項目(ConfigurationItemsCI)經(jīng)過測試被引入處于活動狀態(tài)的環(huán)境中。發(fā)布管理的
13、主要目標是確保發(fā)布信息被成功地公布,包括歸納綜合,測試與存檔。發(fā)布管理確保只有經(jīng)過測試和正確授權(quán)的軟硬件版本才能提供給IT運行環(huán)境。發(fā)布管理與配置管理和變更管理的行為密切相關(guān)。真實的變更實施經(jīng)常通過發(fā)布管理行為得以貫徹。變更的結(jié)果可能經(jīng)常來自于新硬件,新版本軟件,以及新的文檔(自行建立,或購買而來)等。對它們進行控制,并打包和頒發(fā)。有關(guān)存檔安全和公布程序應(yīng)該和變更管理和配置管理流程緊密集成。發(fā)布的程序也可能作為突發(fā)事件管理和問題管理流程中不可分割的一部分,同時還和CMDB密切相連,以維護及時更新的記錄。1.2.2 服務(wù)提供服務(wù)提供主要包括:服務(wù)級別管理、IT服務(wù)財務(wù)管理、能力管理、持續(xù)持續(xù)管理
14、、可用性管理等。1.2.2.1 服務(wù)級別管理服務(wù)級別管理的目標是縷清與客戶之間有關(guān)IT服務(wù)的協(xié)議,并付諸實施。 因此, 服務(wù)級別管理需要收集客戶需求, IT服務(wù)組織可提供的設(shè)施,以及可用的財務(wù)資源。 服務(wù)級別管理針對提供給客戶的服務(wù) (聚焦客戶的)。因此是基于客戶需求建立服務(wù) (需求拉動),而非單純基于現(xiàn)有技術(shù)所及(供應(yīng)驅(qū)動),從而使IT服務(wù)組織提高客戶滿意度。服務(wù)級別管理闡述的內(nèi)容有: l 如何在服務(wù)級別協(xié)議(Service Level Agreement SLA)中清楚地定義條款, 使其可優(yōu)化IT服務(wù)成本, 并為用戶所接受。l 如何監(jiān)控和討論所提供的服務(wù)。l 如何管理IT服務(wù)組織的供應(yīng)商及
15、其下包合同。 服務(wù)級別管理(Service Level Management SLM)流程是用來確保服務(wù)級別協(xié)議,并支持運行級別協(xié)議及其它合同,保證所有對服務(wù)質(zhì)量的影響減少到最小。此流程在服務(wù)質(zhì)量和SLA基礎(chǔ)上評估各種變更造成的影響,包含預(yù)期變更前的影響, 也包含評估實施變更后的影響。SLA中某些最重要的目標和服務(wù)可用性、以及在容許周期內(nèi)對突發(fā)事件形成決策有關(guān)。SLM是服務(wù)支持和服務(wù)交付的關(guān)鍵。由于它依賴于其它流程的存在性, 有效性及運行效率, 它不可孤立存在。一個缺乏基礎(chǔ)支持流程的SLA是沒有意義的, 缺乏支持的SLA就失去了承認其內(nèi)容的基礎(chǔ)。1.2.2.2 IT服務(wù)的財務(wù)管理財務(wù)管理針對于
16、IT服務(wù)的謹慎從事。例如,當(dāng)所提供的IT服務(wù)在進行中時,財務(wù)管理將提供其導(dǎo)致的成本信息。這樣使考慮IT架構(gòu)或IT服務(wù)的改變時,能夠合理地考慮成本和利益(價格和性能)之間的關(guān)系。財務(wù)管理中對成本的鑒別、分配、預(yù)測和監(jiān)控使成本成為可知因素,減少成本和預(yù)算的差距。 重點結(jié)合IT服務(wù)組織的贏利, IT服務(wù)的財務(wù)管理描述了多種支付方法,包括設(shè)立支付和定價的目標,以及預(yù)算計劃。財務(wù)管理負責(zé)對成本及IT服務(wù)投資回報的會計核算,并管理任何來自于客戶的成本。財務(wù)管理需要與能力管理(Capacity Management),配置管理(Configuration Management,包含資產(chǎn)數(shù)據(jù)),以及SLM的良
17、好接口, 來確定服務(wù)的真實成本。 在IT組織預(yù)算談判階段和客戶的IT耗費核算階段, 財務(wù)管理很可能與業(yè)務(wù)關(guān)系管理(Business Relationship Management)及IT組織密切相關(guān)。1.2.2.3 能力管理能力管理是優(yōu)化成本,獲得時間,以及開發(fā)IT資源的流程,來支持與客戶簽訂的服務(wù)條款。能力管理針對資源管理,性能管理,需求管理,建模,能力計劃, 負載管理,以及應(yīng)用軟件能力推測。能力管理強調(diào)用計劃來確保所簽訂的服務(wù)級別可以被履行和成長。能力管理負責(zé)確保在所有時間具備足夠的可用能力,以滿足業(yè)務(wù)需求。 能力管理不是簡單地與系統(tǒng)部件的性能相關(guān), 而是直接與業(yè)務(wù)需求相關(guān)。 在那些與能力
18、問題相關(guān)的困難面前, 能力管理在突發(fā)事件決策和問題鑒別過程中被引入。能力管理提交變更請求以確保得到適當(dāng)?shù)目捎媚芰Α?這些RFC被提交給變更管理流程, 其實施可能影響若干CI, 包括硬件, 軟件和文檔,并需要提供有效的版本管理。能力管理應(yīng)該在評估所有變更時被引入, 用來確定變更導(dǎo)致的在能力和性能上的影響。 這種影響在變更實施前后都有可能出現(xiàn)。 能力管理應(yīng)該特別關(guān)注變更在一定周期后引起的累積性變化。 容易被忽略的單個的變更往往在經(jīng)過累積后, 引起響應(yīng)時間衰減, 文件存儲問題, 和對處理能力的過度需求。1.2.2.4 IT服務(wù)持續(xù)性管理此流程在業(yè)務(wù)中斷時對IT服務(wù)進行災(zāi)難恢復(fù)措施的準備和計劃。 業(yè)務(wù)
19、持續(xù)性管理為客戶組織遇到災(zāi)難時準備好緊急預(yù)案, 根據(jù)此預(yù)案采取與IT服務(wù)相關(guān)的預(yù)防災(zāi)難發(fā)生的措施。 IT服務(wù)持續(xù)性管理流程對技術(shù), 財務(wù)和管理資源需求做好計劃和協(xié)調(diào), 確保災(zāi)難發(fā)生后可持續(xù)提供服務(wù), 并就其內(nèi)容達成客戶同意。IT服務(wù)持續(xù)性管理與一個組織在業(yè)務(wù)中斷后在某個可允許范圍內(nèi)繼續(xù)運作的能力密切相關(guān)。 至少要保證最基本的業(yè)務(wù)運行所需要的IT服務(wù), 預(yù)先對其服務(wù)級別作出規(guī)定, 并和客戶達成一致。 有效的IT服務(wù)持續(xù)性需要一個平衡的風(fēng)險縮減措施, 例如有彈性的系統(tǒng)和備份恢復(fù)設(shè)施。 配置管理流程中的數(shù)據(jù)被用來輔助其計劃和預(yù)防措施。 需要對架構(gòu)和業(yè)務(wù)變更對持續(xù)性計劃造成的潛在影響進行評估。 有關(guān)I
20、T和業(yè)務(wù)的計劃應(yīng)該提交變更管理程序。 在持續(xù)性管理流程中, 服務(wù)臺承擔(dān)著重要角色。1.2.2.5 可用性管理可用性管理是確保資源, 方法和技術(shù)得以適當(dāng)拓展的流程, 以支持與客戶簽訂的IT服務(wù)條款。 可用性管理針對所遇到的問題, 如優(yōu)化維護等, 并且設(shè)計測量指標, 最大程度減少意外突發(fā)事件的數(shù)量??捎眯怨芾砼cIT服務(wù)的設(shè)計, 實施, 測量和管理相關(guān), 確保規(guī)定的業(yè)務(wù)需求中有關(guān)可用性的內(nèi)容被貫徹。 可用性管理需要理解IT服務(wù)失效發(fā)生的原因和恢復(fù)服務(wù)所需的事件。 突發(fā)事件管理和問題管理提供了關(guān)鍵輸入SLA中描述的可用性的目標在可用性管理流程中被監(jiān)控, 并包含在其報表中。 此外, 在支持服務(wù)核查制度所
21、提供的測量和報表中, 可用性管理對服務(wù)級別管理(SLM)流程提供了支持。1.3 運維服務(wù)管理規(guī)劃1.3.1 第一階段:服務(wù)磨合階段第一階段,又稱為運維服務(wù)磨合階段,工作目標主要是通過服務(wù)管理,將客戶現(xiàn)有的無序救火式突發(fā)事件服務(wù)有序化,實現(xiàn)突發(fā)事件管理,所有的突發(fā)事件將運用技術(shù)、管理與流程相結(jié)合的方式,做到統(tǒng)一管理,統(tǒng)一任務(wù)分發(fā),安排合適的人員處理合適的事件。所有的突發(fā)事件全過程可控制、跟蹤、即時回饋,讓每一個客戶能夠隨時查詢到事件處理過程,不會出現(xiàn)焦慮、服務(wù)要求長時間無人響應(yīng)或服務(wù)要求根本無人響應(yīng)的情況,從而提高客戶滿意度,提高運行維護效率,提高客戶使用業(yè)務(wù)信息系統(tǒng)的效率,從而做到提高總體生產(chǎn)
22、力?,F(xiàn)今客戶大都沒有真正意義上的配置管理系統(tǒng)。配置管理系統(tǒng),顧名思義,含有業(yè)務(wù)信息系統(tǒng)及終端設(shè)備詳細清單,配置情況,針對于業(yè)務(wù)信息系統(tǒng)的操作系統(tǒng)服務(wù)運行情況,終端運行軟件情況,使用軟件資產(chǎn)情況等,以及每一次配置改變的記錄,做到配置的改變都有跡可查,將軟硬件資產(chǎn)系統(tǒng)化的管理起來。用一句話概括我們上述兩項服務(wù):將無序的突發(fā)事件有序化,將紙制的配置管理信息化。就是我們突發(fā)事件管理以及配置管理的目標。ITSM所定義處理突發(fā)事件的工作目標是規(guī)避與盡快恢復(fù)。運維服務(wù)的目標不是盡可能多,盡可能快的完成服務(wù),而應(yīng)該是盡量避免事件的發(fā)生,當(dāng)然,這不是一步可以到位的,因此,在第一階段,我們需要做到盡快恢復(fù)客戶的正
23、常使用,故:在處理突發(fā)事件時,我們不分析事件發(fā)生的原因,只收集有價值的事件/故障信息,并在最短的時間內(nèi)將客戶的設(shè)備恢復(fù)到正常使用狀態(tài)。針對于重復(fù)/頻繁發(fā)生的突發(fā)事件,我們需要轉(zhuǎn)問題管理流程,予以處理。問題管理,也就是事件的原因分析以及根除此事件的解決方法管理,我們需要對突發(fā)事件發(fā)生的原因,使用專業(yè)的方式予以分析,如使用國際QA標準,使用魚骨圖,使用柏拉圖等方式來分析出可能的原因,并對原因予以檢測和測試,提出根本解決事件的方案。魚骨圖分析法柏拉圖分析法問題管理,僅提出解決問題之道,也就是根除某突發(fā)事件的方案,具體的處理步驟,交由實施管理來執(zhí)行。實施管理,又叫做發(fā)布管理,因根除故障特別是信息系統(tǒng)缺
24、陷時,需要嚴格處理過程,避免在線運行業(yè)務(wù)受到不可預(yù)計的影響。我們在發(fā)布過程中都會預(yù)計到一些可能的影響,如更改交換機配置可能導(dǎo)致部分終端無法使用網(wǎng)絡(luò);修改某一個數(shù)據(jù)庫字段可能導(dǎo)致數(shù)據(jù)混亂;修改某段代碼可能導(dǎo)致整個程序陷入死循環(huán)等。因此實施管理必須能有效并切實的分析大部分存在或者隱含的風(fēng)險。試想我們在更改交換機配置前經(jīng)歷過充分測試,將中斷網(wǎng)絡(luò)時間縮短為五分鐘并且通知到全部/大部分可能受影響的客戶;修改數(shù)據(jù)庫字段或代碼前在虛擬測試平臺或訪真數(shù)據(jù)庫中反復(fù)測試,而后予以發(fā)布;將發(fā)布的時間定在非使用高峰期。這樣,可以規(guī)避大量風(fēng)險,保證問題解決的安全可靠。越維風(fēng)險控制模型凡涉及到解決問題,必然關(guān)聯(lián)到變更。變
25、更管理的作用,是保證每一步的配置更改,都有跡可查,有人可尋。在工作中是否遇到過有人修改了系統(tǒng)代碼,您卻不知道是誰改動了哪些地方?驗收后提供的系統(tǒng)原代碼不知道是否與在線系統(tǒng)原代碼相符?有哪些地方不同?是哪些人修改的?您的設(shè)備是否與剛采購的時候配置情況相同?保修情況始終保持不變?變更后的資產(chǎn)是否已經(jīng)更新配置庫?變更管理將為您解答上述問題。第一階段的服務(wù),就涵蓋上述五個方面的服務(wù)內(nèi)容,總結(jié)描述:將無序的突發(fā)事件有序化,將紙制的配置管理信息化,問題管理科學(xué)化,實施管理風(fēng)險可控制化,以及變更管理記錄化。1.3.2 第二階段:主動服務(wù)階段重點是在改良前一階段的服務(wù)基礎(chǔ)上,將前一階段的大量響應(yīng)式服務(wù),部分主
26、動式服務(wù),轉(zhuǎn)換為主動服務(wù)為主導(dǎo),科學(xué)的規(guī)避故障發(fā)生,做到故障可控制化。因此,第二階段的服務(wù)內(nèi)容,主要包括:實施&測試、安全管理、IT服務(wù)規(guī)劃,以及規(guī)模管理、可用性管理、服務(wù)級別管理和成本管理。實施&測試:前面我們講實施管理,包含有上線前的充分測試等工作,那這一個實施&測試是否重復(fù)呢?此處的實施&測試,是與業(yè)務(wù)信息系統(tǒng)開發(fā)質(zhì)量管理相關(guān)的實施管理和測試管理工作。隨著業(yè)務(wù)信息化需求的不斷提高,業(yè)務(wù)系統(tǒng)的升級也隨之產(chǎn)生。是Down掉原有系統(tǒng)建設(shè)新的,還是在原有系統(tǒng)基礎(chǔ)上進行修改?是用新的服務(wù)器替換掉原有服務(wù)器,還是在原有服務(wù)器上升級?這些處理,都面臨一個必不可少的階段:切換。客戶往往不愿意更換已經(jīng)使用
27、習(xí)慣了的系統(tǒng),除非系統(tǒng)已經(jīng)不能滿足他的實際工作需求,但老系統(tǒng)總是存在大量缺陷,且運行效率低下,導(dǎo)致業(yè)務(wù)部門的工作效率也隨之下降。那么,為什么客戶不愿意更換系統(tǒng)?原因是不熟悉。已經(jīng)開順手的車不會容易出事故,已經(jīng)用順手的手機可以方便的找到每一個聯(lián)系電話,而新系統(tǒng)的培訓(xùn),是否進行得完善?新的業(yè)務(wù)流程講解,是否讓每一個業(yè)務(wù)部門人員熟悉了?新系統(tǒng)是否有這樣那樣的缺陷而導(dǎo)致更低下的效率?新系統(tǒng)是否能夠承載足夠多的用戶訪問?新采購的硬件是否能夠保證質(zhì)量?業(yè)務(wù)系統(tǒng)可以通過分析代碼來找尋缺陷,但是需要的時間過長,可以在測試平臺上對每一個功能進行測試,但是無法滿足壓力測試,只有將多種測試手段有機結(jié)合起來,才能保障
28、新系統(tǒng)的質(zhì)量,如使用Winruner予以界面測試,使用Loadruner進行壓力測試,并管理好開發(fā)商的培訓(xùn)工作,將給實施與測試工作帶來實質(zhì)性效果。另外,選擇合適的發(fā)布時間,做好發(fā)布計劃,也是實施管理工作的重點。安全管理,指服務(wù)過程的安全類服務(wù)、風(fēng)險控制以及與客戶的數(shù)據(jù)安全協(xié)議。安全類服務(wù)如網(wǎng)絡(luò)病毒防治,網(wǎng)絡(luò)反黑,入侵檢測等技術(shù)類服務(wù),風(fēng)險控制如服務(wù)過程中各種風(fēng)險的分析、規(guī)避等管理。技術(shù)類工作可以通過軟件等工具來實現(xiàn),如系統(tǒng)補丁分發(fā),防病毒軟件升級及策略優(yōu)化,網(wǎng)絡(luò)安全性優(yōu)化,增加入侵檢測系統(tǒng)(IDS)等,這些服務(wù)也能夠在第一階段中開始,而風(fēng)險控制和客戶數(shù)據(jù)安全性協(xié)議,則完全通過人員管理、流程管理
29、來實現(xiàn)。標準的ITSM流程是能夠做到0風(fēng)險的,但在實際處理過程中卻往往不可能做到0風(fēng)險。畢竟流程是靠人來運轉(zhuǎn),而人員是否能夠完全遵照流程的指導(dǎo)來執(zhí)行,就是管理方法的問題了。運維被稱為People Business,就證明人員管理猶在流程管理之上。因此,運維人員素質(zhì)是一個至關(guān)重要的條件。越維人員穩(wěn)定,且大都經(jīng)歷過保密培訓(xùn),這些都是實現(xiàn)安全管理的必要條件。另外,我們在項目啟動前將與客戶簽定保密協(xié)議,確??蛻魯?shù)據(jù)的安全。IT服務(wù)規(guī)劃:此時我們對客戶的情況已經(jīng)有所了解,且積累的部分維護服務(wù)數(shù)據(jù),如果進行了業(yè)務(wù)系統(tǒng)維護,更應(yīng)該對客戶的業(yè)務(wù)流程有了一定了解,此時可以針對客戶目前使用的信息系統(tǒng)或設(shè)備提出服務(wù)
30、規(guī)劃,包括如何建立與推廣運維服務(wù)系統(tǒng)平臺,如何與多方監(jiān)控軟件整合形成集中管理,如何將運維部門由產(chǎn)出部門轉(zhuǎn)換為產(chǎn)入部門等。規(guī)模管理:客戶除本部外,還設(shè)有系列分部,分布地理位置比較接近,在第一期項目中即可以組成2級服務(wù)結(jié)構(gòu),使用集中式服務(wù)臺(Service Desk)統(tǒng)一報障以及任務(wù)分發(fā),這在資源的充分利用上有很大意義。如越維的某客戶單位正在策劃將越維設(shè)立在總部的統(tǒng)一故障受理平臺(Service Desk)服務(wù)范圍擴充到涵蓋全市范圍內(nèi)全市各區(qū)分局及所轄下屬單位的集中式運維服務(wù)管理平臺。同樣,規(guī)模的擴充將不限于服務(wù)臺,整體的運維服務(wù)也可以在全市服務(wù)環(huán)境的建立基礎(chǔ)上發(fā)揮其集中管理覆蓋面廣的特色??捎眯?/p>
31、管理:通過對客戶系統(tǒng)環(huán)境的了解與熟悉,以及在磨合階段的系統(tǒng)改良,我們此時充分根據(jù)客戶實際需求,做出符合客戶成本,盡可能高的可用性管理承諾??捎眯怨芾淼哪繕耸呛侠碚{(diào)配有限的資源,采用應(yīng)急預(yù)案等手段保障核心系統(tǒng)的正常運行,可用性承諾是服務(wù)方對客戶方系統(tǒng)情況的熟悉度結(jié)合自身技術(shù)承載能力所做出的質(zhì)量保證。目前,越維對某客戶做出的系統(tǒng)可用性承諾高達98%。服務(wù)級別管理:同可用性管理,服務(wù)級別管理的目標是保證服務(wù)的提供按照服務(wù)級別協(xié)議(SLA)約定執(zhí)行,如2小時響應(yīng)4小時解決。通常在項目初始階段會有一個初始服務(wù)級別(SLA)這是對服務(wù)商自身技術(shù)承載能力,服務(wù)初始資源安排以及客戶基本需求的約定,不可能完全符
32、合客戶實際情況,那么在第二階段,已有充分的時間分析客戶實際需求,審視自身技術(shù)承載能力,兩者相結(jié)合做出真正符合客戶實際的服務(wù)級別承諾,并由服務(wù)級別調(diào)配相關(guān)資源。如越維與某客戶的一期項目服務(wù)級別為所有故障2小時響應(yīng)4小時解決,而在二期的2005年7至9月中,越維的平均故障恢復(fù)時間,僅為18分鐘!成本管理:前面提到了很多“資源”的調(diào)配問題,隨著對客戶系統(tǒng)環(huán)境的熟悉,我們能夠分析出客戶更為實際的需求。如核心業(yè)務(wù)不能發(fā)生故障,而某臺不常被使用的普通終端也許兩天內(nèi)修復(fù)也不會影響工作,因此不需要提供過多的資源進行緊急維護,成本管理的目標是在客戶能夠接受的預(yù)算內(nèi)盡可能高的提高系統(tǒng)可用性。運維不是多做突發(fā)事件處
33、理,而是降低突發(fā)事件的發(fā)生率,因此善用工具,減少緊急事件,也能夠有效控制成本;做好規(guī)模管理,有效合理使用整體資源,更是控制成本的好方案。綜上,成本管理的意義,就在于資源的合理,充分使用。1.3.3 第三階段:戰(zhàn)略規(guī)劃階段 第三階段,客戶已經(jīng)與服務(wù)商緊密結(jié)合為戰(zhàn)略合作伙伴關(guān)系,能夠為客戶制定IT戰(zhàn)略規(guī)劃,能夠?qū)蛻魳I(yè)務(wù)投資建設(shè)的信息系統(tǒng)使用所創(chuàng)造的業(yè)務(wù)價值予以計算與評估,并能夠協(xié)助業(yè)務(wù)部門對最終客戶予以管理。1.4 運維服務(wù)質(zhì)量管理與 “產(chǎn)品”不同,“服務(wù)”的提供貫穿于和客戶的互動中。 只有當(dāng)服務(wù)被提供時,才能體現(xiàn)其存在和價值。 服務(wù)的質(zhì)量取決于服務(wù)提供者與其客戶間互動過程中某些協(xié)議的實現(xiàn)程度。
34、 客戶如何感知服務(wù)的優(yōu)劣, 服務(wù)提供者如何考慮所提供的服務(wù),兩者都很大程度上取決于他們的經(jīng)驗和期望。提供服務(wù)的流程是生產(chǎn)和使用的一種組合方式,通過流程使服務(wù)提供者和客戶同時參與服務(wù)的過程??蛻魧Ψ?wù)的感知主要來自于服務(wù)供應(yīng)的過程。客戶通常用以下問題評價服務(wù)的質(zhì)量:l 所提供的服務(wù)是否達到期望?(質(zhì)量可衡量性)l 能否在多次服務(wù)中得到同樣的質(zhì)量?(質(zhì)量穩(wěn)定性)l 服務(wù)所需成本是否合理?(質(zhì)量與成本)服務(wù)是否達到客戶期望主要取決于客戶在多大程度上贊同所交付的服務(wù)內(nèi)容, 而不是服務(wù)提供者提供了多“好”的服務(wù)。 因此開展有效的和持續(xù)的客戶對話機制極為重要。服務(wù)質(zhì)量取決于服務(wù)完成客戶需求和期望的程度。為
35、了能夠提供所需的質(zhì)量, 服務(wù)提供者應(yīng)該持續(xù)評估服務(wù)經(jīng)驗, 了解客戶對未來的期望。不同客戶考慮的內(nèi)容和方式都不盡相同。因此優(yōu)質(zhì)服務(wù)都是為客“戶量身定做”的,這也是服務(wù)區(qū)別于產(chǎn)品的主要特點。ISO-8402對質(zhì)量的定義是:“質(zhì)量是一個產(chǎn)品或服務(wù)就其具有的能力滿足確定的或暗示的需求的總體特性?!辟|(zhì)量“高”往往意味著產(chǎn)品或服務(wù)在某種程度上超過了客戶的期望。在質(zhì)量得以保證的同時,成本也是客戶同時考慮的因素。或者說在就其對服務(wù)的期望達成協(xié)議之后緊接著的步驟就是對成本達成協(xié)議。服務(wù)成本必須是合理的 - 對于服務(wù)提供者來說體現(xiàn)其實施成本與合理利潤,對于客戶來說是建立在對服務(wù)市場的合理理解與選擇之上??蛻魧Ψ?wù)
36、質(zhì)量評估的另一重要依據(jù)是服務(wù)的一貫性。如果服務(wù)提供者偶然能夠提供超出客戶期望的服務(wù), 但在其它時間卻常常讓客戶失望, 則顯然不能稱之為質(zhì)量合格者。 “持續(xù)的質(zhì)量”是最為重要的, 也常常是服務(wù)業(yè)最難以實現(xiàn)的目標。服務(wù)(或產(chǎn)品)的提供是通過交付行為實現(xiàn)的。 而其質(zhì)量很大程度上取決于組織這些行為的方式。 Deming質(zhì)量輪提供了一個簡單有效的質(zhì)量控制模型:這一模型假設(shè)要實現(xiàn)有效的質(zhì)量控制, 必須重復(fù)履行以下步驟:l 計劃(Plan): 應(yīng)該做什么?什么時候做?誰去做?如何做?借助什么去做?l 執(zhí)行(Do): 實施計劃的行為。l 檢查(Check): 確定執(zhí)行行為是否提供了預(yù)期的結(jié)果。l 效果(Act
37、): 基于檢查得到的信息修正計劃。有效和適時地推動此輪旋轉(zhuǎn), 意味著服務(wù)行為被按照各自的計劃和檢查機制分為各子流程。 必須清楚誰在組織中負有責(zé)任, 他們被授權(quán)修改哪些計劃和程序, 不僅為某一個行為, 而且為每一個流程。質(zhì)量管理(Quality Management)是在提供服務(wù)的組織中工作的每一個人的責(zé)任。 每一個員工必須明白他對組織作出的成果如何影響工作質(zhì)量, 影響其他同事作出的工作質(zhì)量, 并且最終如何影響整個組織提供的服務(wù)質(zhì)量。 質(zhì)量管理同時意味著持續(xù)地尋找改進組織的機會,實施能夠改進質(zhì)量的行為。質(zhì)量保證(Quality Assurance)是組織內(nèi)部的重要政策,用來保證質(zhì)量管理的實施。
38、它集中體現(xiàn)了一整套質(zhì)量衡量標準和履行程序,保證組織能夠提供持久滿足客戶期望及相關(guān)協(xié)議的服務(wù)。質(zhì)量保證確保質(zhì)量管理所實施的成果處于可維護的狀態(tài)。綜上所述,本次越秀工商運維項目的服務(wù)質(zhì)量管理,圍繞質(zhì)量系統(tǒng)的服務(wù)流程是保證服務(wù)質(zhì)量持久延續(xù)的有效方法。1.5 建立運維管理規(guī)范1.5.1 運維管理規(guī)范概要我門與XX企業(yè)共同學(xué)習(xí)ITIL、ITSM、BS15000、ISO20000與ISO9000等國內(nèi)外先進標準,運維管理規(guī)范采用ISO9000模式編寫,涵蓋服務(wù)管理體系、服務(wù)級別管理、服務(wù)臺管理流程、突發(fā)事件管理、問題管理、變更管理、發(fā)布管理、配置管理等方面,如下圖所示:如上圖所示,是一個金字塔結(jié)構(gòu)。處于最高層的,是客戶滿意度指引,一切服務(wù)均以“保證客戶最大滿意度”為前提展開。與之同級的還有服務(wù)管理體系文件與總體文件,用以與服務(wù)管理體系相結(jié)合,并且維持服務(wù)管理規(guī)范的改良性原則。處于中層的,是ITIL核心的11個標準流程,均根據(jù)XX企業(yè)實際情況進行了修訂和優(yōu)化,以確保在XX企業(yè)實際工作中能夠得到實際應(yīng)用,運維管理規(guī)范是各種操作指南與巡檢制度,包括日常管理制度等,確保提供給客戶的服務(wù),是統(tǒng)一形象的規(guī)范化標準服務(wù)。巡檢制度的建立,為XX企業(yè)信息系統(tǒng)“提高系統(tǒng)可用性、提高系統(tǒng)健壯性、提高各級人員技能素質(zhì)”的“三提高”目標奠定了堅實的基礎(chǔ)。
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 火力發(fā)電廠各設(shè)備的主要作用大全
- 3.高壓電工考試判斷練習(xí)題含答案
- 企業(yè)電氣防爆知識
- 13 低壓電工電工作業(yè)模擬考試題庫試卷含答案
- 電氣設(shè)備維修的十項原則
- 2.電氣電纜與直流模擬考試復(fù)習(xí)題含答案
- 電氣節(jié)能措施總結(jié)
- 2.電氣電機(一)模擬考試復(fù)習(xí)題含答案
- 接地電阻測量原理與測量方法
- 3.高壓電工作業(yè)模擬考試題庫試卷含答案
- 礦山維修電工安全技術(shù)操作規(guī)程
- 電工基礎(chǔ)口訣總結(jié)
- 3.某電廠值長面試題含答案解析
- 電工基礎(chǔ)知識順口溜
- 配電系統(tǒng)詳解