《運維管理系統(tǒng)方案》由會員分享,可在線閱讀,更多相關《運維管理系統(tǒng)方案(9頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、精品文檔
運維管理系統(tǒng)方案
概述
伴隨著企事業(yè)網(wǎng)絡規(guī)模的不斷擴大,企事業(yè)服務器的增多,企事業(yè)管理的信息化,企事業(yè)網(wǎng)絡管理也變的越來越重要。一旦網(wǎng)絡、服務器、數(shù)據(jù)庫、各種應用出現(xiàn)問題,常常會給企事業(yè)造成很大的損
失。怎樣能 7x24 小時檢測網(wǎng)絡系統(tǒng)的運行情況,避免各種故障的發(fā)生,改進傳統(tǒng)的網(wǎng)絡管理方式來適企事業(yè)信息化發(fā)展的需要?
因此,運維管理系統(tǒng)就有他的必要性。一個完備的運維管理系統(tǒng)能夠提供 7x24 小時檢測網(wǎng)絡、服務
器、數(shù)據(jù)庫、各種應用系統(tǒng),及時發(fā)現(xiàn)將要出現(xiàn)的問題,并通過短信、 Email 、聲音報告給運維
2、管理人
員。運維管理人員就可以及時排除故障,避免造成重大損失。
運維管理系統(tǒng)的功能:
? 故障發(fā)現(xiàn)與警報;
? 記錄日常運維日志信息;
? 服務器故障統(tǒng)計;
? 服務器軟硬件信息統(tǒng)計;
? 服務進程管理;
? 將數(shù)據(jù)信息存儲到數(shù)據(jù)庫,并使用圖形方式直觀的展示出來;
? 權限、密碼管理;
? 將數(shù)據(jù)生成報表。
運維管理系統(tǒng)的特點:
? 郵件和短信實時故障報警;
? B/S 結構,能夠通過 web對遠程服務器下達指令;
? 監(jiān)控服務器和被監(jiān)控服務器之間通過 python socket 來發(fā)送信息;
3、
? 統(tǒng)計日常故障處理,以便下次出現(xiàn)同樣故障時能夠更快的解決問題;
? 實現(xiàn)自動化管理和自動化監(jiān)控;
? 安全管理服務器性能;
? 操作流程統(tǒng)計與管理。
。
1歡迎下載
精品文檔
系統(tǒng)結構
運維管理系統(tǒng)采用 B/S 構架,運維管理人員隨時隨地可以對服務器進行管理、配置及故障處理。它是將部署在同一個局域網(wǎng)內的所有服務器統(tǒng)一管理,服務器之間的信息通訊、指令發(fā)送、運維管理都通
4、
過 python 來實現(xiàn)。監(jiān)控服務器端負責采集、統(tǒng)計和分析數(shù)據(jù),在數(shù)據(jù)出現(xiàn)異常時發(fā)送報警信息到管理員的 email 、手機中,并將錯誤日志存儲到數(shù)據(jù)庫中。
運維管理系統(tǒng)主要通過 LAMP服務器、 python 編程、 snmp 和 shell 編程來實現(xiàn)。在被監(jiān)控端安裝
python 服務,并在被監(jiān)控服務器上部署 python 程序和 shell 腳本用于接受監(jiān)控服務器端指令、信息采集
并發(fā)送會監(jiān)控服務器端。監(jiān)控服務器端部署 python 程序和 LAMP服務器,用于發(fā)送指令、接受數(shù)據(jù)信息、存儲數(shù)據(jù)、統(tǒng)計數(shù)據(jù)以及異常報警。
5、
運維管理人員日常通過 web瀏覽器遠程登錄監(jiān)控管理系統(tǒng),檢測各被監(jiān)控服務器的運行狀態(tài)、服務狀態(tài)、防火墻配置、進程信息、操作日志等信息。在出現(xiàn)異常時,通過運維系統(tǒng)可以查看到具體的異常服務器、進程等信息,并根據(jù)這些信息來處理異常。
。
2歡迎下載
精品文檔
6、
服務器狀態(tài)信息界面
運維管理系統(tǒng)具備后臺管理功能,針對不同的用戶設置不同的權限,通過后臺管理可以添加刪除被監(jiān)控主機、修改用戶權限。
操作日志
運維監(jiān)控系統(tǒng)具備遠程控制功能,通過遠程重啟業(yè)務、檢查業(yè)務狀態(tài)、查看
7、關鍵服務的配置文件、獲取服務器狀態(tài)信息、查看服務日志、執(zhí)行備份、添加刪除定時計劃任務、添加刪除開機機啟動業(yè)務、在線業(yè)務數(shù)據(jù)統(tǒng)計。并且可以實現(xiàn)在線業(yè)務版本更新,批量業(yè)務處理。
。
3歡迎下載
精品文檔
服務管理
運維監(jiān)控系統(tǒng)設備監(jiān)控主要還是采用 snmp,結合 nagios 與運維管理平臺整合。
8、
。
4歡迎下載
精品文檔
功能模塊
運維管理系統(tǒng)根據(jù)不同的需求和智能劃分為以下幾個模塊:
9、
智能管理模塊
智能管理通過程序遠程查看被監(jiān)控服務器實時信息,對服務器進行在線管理,對一些業(yè)務執(zhí)行在線操作,并記錄下遠程操作日志。減少遠程登錄服務器操作,減少故障風險。同時將服務信息儲存在數(shù)據(jù)庫中,便于形成報表,為企業(yè)運維累計寶貴的運維經(jīng)驗。智能管理主要包括:
? 用戶管理:指遠程服務器的用戶添加、刪除,監(jiān)控管理系統(tǒng)的用戶添加、刪除;
? 密碼管理:指遠程服務器的用戶密碼更新(或動態(tài)密碼),監(jiān)控管理系統(tǒng)的用戶密碼更新;
? 權限管理:指遠程服務器用戶權限分配,監(jiān)控管理系統(tǒng)權限分配;
? 服務器信息管理:記錄服務器的cpu、內存、硬
10、盤、網(wǎng)卡等硬件信息,業(yè)務信息,在線時間;
? 服務管理:對服務器中運行的進程、業(yè)務驚醒管理;
? 業(yè)務數(shù)據(jù)統(tǒng)計:在線業(yè)務數(shù)據(jù)統(tǒng)計,如:注冊、登錄、充值、消費等信息;
? 系統(tǒng)操作管理:記錄用戶登錄系統(tǒng)操作的日志;
? 運維日志管理:將出現(xiàn)的故障原因和解決方法以運維日志的形式保存下來;
? 服務器日志管理:通過遠程查看系統(tǒng)日志信息,并實現(xiàn)系統(tǒng)日志保存到監(jiān)控服務器端。智能監(jiān)控模塊
智能監(jiān)控是在原 cacti 監(jiān)控的基礎上將 nagois 、 cacti 和運維管理系統(tǒng)整合,實現(xiàn)同一平臺下的監(jiān)
。
5歡迎下載
精品文檔
11、
控管理。并對一些特定的需求進行定制,使監(jiān)控系統(tǒng)能夠更加高效、準確、及時的發(fā)現(xiàn)和報告故障信息,提升故障處理質量。智能監(jiān)控主要包括:
? 服務器網(wǎng)絡:對服務器的網(wǎng)絡狀態(tài)、網(wǎng)絡流量進行監(jiān)控;
? 服務器硬件:對服務器的硬盤、cpu、內存進行檢測;
? 服務進程:對服務器上的關鍵服務進行監(jiān)控,并對進程的的總數(shù)進行監(jiān)控;
? 系統(tǒng)性能:對服務的負載進行監(jiān)控;
? 業(yè)務狀態(tài):對在線的業(yè)務進行檢測,如端口、 web 頁面檢測。安全管理模塊
安全管理是通過運維管理系統(tǒng)執(zhí)行需要執(zhí)行的操作可以減少不必要的誤操作,如刪除不該刪除的文件導致業(yè)務、系統(tǒng)不能正常工作。對
12、服務器設置一些規(guī)則,當服務器出現(xiàn)異常時能夠預警。安全管理主要包括三大塊:
? 應用安全:指系統(tǒng)關鍵進程和業(yè)務服務;
? 系統(tǒng)安全:指遠程登錄、帳號密碼管理、服務器的端口狀況;
? 網(wǎng)絡安全:指服務器連接數(shù)、流量信息等。流程管理模塊
規(guī)范的流程可以提高工作效率,流程管理可以累積工作經(jīng)驗。許多故障并不是因為程序本身和被入侵導致的,常常由于疏忽而導致遺漏了一些重要的信息,因此按照流程操作可以減少故障出現(xiàn)的頻率,并且隨著時間的累計流程就成為一種良好的習慣。流程管理是一個企業(yè)規(guī)范的體現(xiàn),并且為運維累積經(jīng)驗。主要功能包括:
? 服務器部署:指新服務器上架和業(yè)務部署;
13、
? 新業(yè)務部署:新增在線業(yè)務部署;
? 版本發(fā)布:指在線業(yè)務版本更新;
? 定時執(zhí)行:添加、刪除一些定時執(zhí)行的功能;
? 數(shù)據(jù)備份:手動執(zhí)行和定時執(zhí)行在線業(yè)務系統(tǒng)、數(shù)據(jù)庫的備份。
。
6歡迎下載
精品文檔
技術簡介
運維管理系統(tǒng)使用的開發(fā)語言為: php、 python 和 linux shell 。 Php 用
14、于實現(xiàn)數(shù)據(jù)展示、數(shù)據(jù)存儲、獲取指令; python soclet 編程實現(xiàn)監(jiān)控主機與遠程服務器之間的數(shù)據(jù)通訊、數(shù)據(jù)加密、發(fā)送報警和
web 頁面檢測; shell 腳本負責執(zhí)行監(jiān)控端發(fā)送過來的指令,并將執(zhí)行結果返還給 python 程序。以下流
程展示了從指令下達到獲取執(zhí)行結果,并將結果展示到 web頁面的一個過程。
主機之間的通訊通過 python socket 編程來實現(xiàn),在下達指令時能夠實時獲取所需要的結果,對于一些關鍵性服務報警也可以采取這種模式來實現(xiàn)。同時
15、對服務器之間傳遞的信息進行自定義加密,提高
安全性。監(jiān)控服務服務方面將加入 nagios ,結合 cacti 和 nagois 的優(yōu)點,將監(jiān)控系統(tǒng)與運維系統(tǒng)整合到
一個統(tǒng)一的平臺。監(jiān)控系統(tǒng)的數(shù)據(jù)主要還是采用 snmp來采集數(shù)據(jù),圖形展示方面需要根據(jù)實際情況進行調整。支持遠程查看服務器日志功能,加入運維日志管理功能,類似于谷歌日歷,將每天的運維操作日志記錄到日歷中,并具有備忘提醒功能。
安全管理主要是減少外網(wǎng)遠程登錄服務器帶來的風
16、險,所有的外網(wǎng)服務器的遠程登錄將通過運維管理服務器來做跳轉,業(yè)務服務器只接受內網(wǎng)服務器的遠程接入。服務器密碼方面實現(xiàn)動態(tài)密碼管理,根據(jù)各個服務器的實際狀況和一些參數(shù)生成動態(tài)密碼。修改防火墻配置,對于外網(wǎng)非必需端口一律關閉。
將日常運維日志、服務器部署、業(yè)務部署、故障發(fā)現(xiàn)及處理通過 web記錄數(shù)據(jù)庫中。
。
7歡迎下載
精品文檔
SSH遠程登錄
流程管理類似于 BBS發(fā)帖功能,將經(jīng)常涉及到的版本更新、服務器部署、業(yè)務部署以文檔
17、的形式存儲到運維平臺中。新版本發(fā)布采用流程圖的形式,詳細標注發(fā)布的具體步驟和發(fā)布的進程,發(fā)布完畢可以保存本次發(fā)布的具體流程信息。
新版本發(fā)布流程定義:由開發(fā)在運維平臺中提交發(fā)布申請,測試人員根據(jù)發(fā)布申請對內網(wǎng)環(huán)境進行測試。測試完畢以后在運維平臺中提交測試結果報告,并有系統(tǒng)自動發(fā)送測試結果郵件,運維人員根據(jù)郵件結果將新版本發(fā)布到預發(fā)布服務器并發(fā)送預發(fā)布服務器發(fā)布完畢郵件。測試人員根據(jù)郵件對預發(fā)布環(huán)境進行測試,測試完畢再次在運維系統(tǒng)提交測試報告,運維人員根據(jù)測試結果將業(yè)務發(fā)布到正式業(yè)務系統(tǒng)中。
18、
。
8歡迎下載
精品文檔
歡迎您的下載,
資料僅供參考!
致力為企業(yè)和個人提供合同協(xié)議,策劃案計劃書,學習資料等等打造全網(wǎng)一站式需求
。
9歡迎下載