運維應急預案
在平凡的學習、工作、生活中,有時會有一些突發事件出現,為降低事故造成的損失,時常需要預先制定應急預案。優秀的應急預案都具備一些什麼特點呢?以下是小編幫大家整理的運維應急預案,希望對大家有所幫助。
運維應急預案隨著網路資訊化建設的不斷深入,加強機房各類裝置、系統以及資訊與網路安全等方面應對突發事件的處理能力將是我們目前面臨的一項重要任務。為確保系統安全與穩定,以保證正常執行為宗旨,按照“預防為主,積極處置”的原則,本著建立一個有效處置突發事件,反應迅速、處置有力的安全體系的目標,將正在發生或已發生事故的損害程度減輕到最低,特制定本應急處置預案。
一、系統故障流程說明
1.故障發生獲取途徑
1.1監控系統告警發現故障
1.2使用者發現故障
1.3維護中心發現故障
2.故障受理
系統故障發生後,運維人員立即響應,並向相關人員瞭解系統故障情況。
3.資訊研判處理
運維人員根據瞭解到的系統故障情況進行分析判斷,以確定採用哪種處理方式。
4.故障解除
故障解除時間由運維人員及現場技術人員根據現場的'實際進展情況,在與使用者協調後確認故障解決。
5.結果處理
故障解決後,書寫詳細的故障報告提交給相關人員。
二、日常維護
1.正常工作日內,對裝置及系統的執行情況做監控,發生異常情況及時處理。
2.節假日期間,保持通訊暢通,遇有問題,儘快及時解決。
3.認真做好資料備份工作,定期做好資料庫的備份,每週檢查伺服器的執行和備份情況。
三、故障處理
1.故障流程
故障發生
判定
硬體故障
軟體故障
伺服器提示的硬體錯誤資訊
檢視系統、應用日誌、其它異常等
綜合判斷,快速查詢原因
解決故障
編寫故障文件
2.故障預案
2.1發生通訊線路中斷、路由故障、流量異常等,經初步判斷後及時聯絡IDC機房或者其它相關人員,配合他們及時解決網路故障。
2.2發生伺服器軟體系統故障,如有備份伺服器,立即切換到備機上;如果沒有備機,以快速解決為首要目標,故障出現的原因後續去排查;總之優先保證伺服器能正常執行。
2.3發生大流量網路攻擊時,立即聯絡IDC機房及時處理。
2.4發生伺服器硬體故障後,聯絡硬體裝置廠商,要求其快速上門處理。
2.5發生業務資料損壞時,檢查和備份當前業務系統資料,再呼叫備份資料來恢復。