天天干天天操天天碰-天天干天天操天天摸-天天干天天操天天干-天天干天天操天天插-欧美一级久久久久久久久大-欧美一区二区VA毛片视频

推廣 熱搜: 集成  系統集成  弱電  軟件  kvm  服務器  思科  視頻會議  拼接  SFP 

數據中心里的應急關機技術

   日期:2015-11-23     來源:企業網D1Net    瀏覽:221    評論:0    
核心提示:數據中心需要全年不休地運轉,無時無刻都在對外提供各種應用服務。數據中心里有大量的電子設備,也和人一樣是需要休息的,不然遲早都會出現這樣那樣的問題,其中應急關機就是數據中心自我保護的一種方式。

數據中心需要全年不休地運轉,無時無刻都在對外提供各種應用服務。數據中心里有大量的電子設備,也和人一樣是需要休息的,不然遲早都會出現這樣那樣的問題,其中應急關機就是數據中心自我保護的一種方式。顯然在關機的前面增加了一個修飾詞“應急”和關機的意義就完全不同了,應急關機必然不是關機那樣關閉一下按鈕或者拔掉電源那么簡單。前面也說了數據中心是全年不休地工作,對數據中心內的設備進行關機,需要考慮這樣的操作對整個數據中心的業務影響,是否在關機之前做足了準備工作、是否制定了詳細的關機預案、是否有回退機制等等,這絕非是開關一下電源那么簡單。下面就來詳細說一說數據中心里的應急關機。

應急關機是提前有周密計劃來關閉部分運行設備的方案。應急關機作為應急響應過程的處置之一,是每個數據中心都必須考慮的問題,在很多特定的場合下,數據中心就需要應急關機。比如:由于數據中心自身存在的缺陷被暴露,或者數據中心所在地區出現了地震、火災等災害,使得數據中心可能受到外界的嚴重威脅,使得數據中心數據受損或者被破壞,在不得已的情況下就需要啟動應急關機,臨時關閉部分甚至全部的對外業務,保護數據中心不受到損壞;數據中心里的電子設備特別多,這些設備或多或少都存在一些問題,這世界上沒有一點BUG都沒有的軟件,認為自己使用的設備沒有問題,只不過是還沒有碰到BUG 而已,所以一旦數據中心遇到這些設備BUG,很多時候就要對設備進行軟件升級,補丁搞不定就需要升級軟件版本,可很多設備還無法做到不重啟升級軟件,這就需要應急關機,對設備進行關機重啟;還有數據中心里的服務器、存儲等設備運行久了,長時間運行不重啟會累積大量的內存垃圾,周期性地對這些設備進行主動重啟,可以提升設備的運行效率,而且主動重啟設備還可以規避一些BUG暴露出來,避免BUG導致設備運行異常而對數據中心業務造成影響。如此看來,應急關機是數據中心運行過程中不可缺少的重要一環,每個數據中心都要經歷的一個方案,是對數據中心運行的一種主動保護。

應急關機需要做好三方面的準備工作,才能通過關機達到預期效果。在一些緊急情況下,有應急關機方案,往往可以使數據中心免遭一劫。首先,關機前要做好關機的流程。在數據中心里,應用與應用、應用與設備、設備與設備之間普遍存在著依賴關系,一定要按照固定的關機順序來執行,避免應急關機給數據中心帶來傷害。比如:在計劃關閉網絡設備之前,應該先將各種數據庫服務、存儲服務、支付系統等重要應用切走或者關閉,然后關閉外部訪問入口、關閉計算節點、管理節點等,避免直接關機網絡設備對正在提供服務的系統紊亂或者數據丟失,做好這些步驟后再去關閉網絡設備,一般步驟應該是先關閉應用層服務、然后底層數據傳輸設備,最后是物理鏈路,越上層的服務越應該先關機,在應急關機前要將操作的步驟固化下來,然后按照步驟依次執行。與此同時,對于每個操作步驟的耗時要進行預估,確定各個環節花費的時間,控制好應急關機的各環節,一旦與預期不符,還要啟動相應的回退或者規避方案。既然叫應急關機,更多的時候關機是突發、臨時執行的,難免會出現執行異常的現象,與原有的預計結果不符,這時就需要根據實際情況靈活應對。在應急關機之前應該準備好備件,對關鍵設備進行備份,將部分配置提前做好,一旦出現異常情況時直接用備件進行替換。在無法避免損失的情況下,一切以關鍵數據的劃分結果為依據進行取舍,這種情況下考驗著數據中心人員的智慧。還有關機的時長也是一項必須要考慮的重要因素。很多時候在關機步驟執行完畢之后,往往需要密切關注數據中心外部情況,確定再次開機的時機,也有的時候應急關機是很快又進行開機了,這個關機的時間長短要根據出現緊急情況的具體情況,經過評估來確認關機時長。其次,在關機執行過程中,每一個步驟執行完畢后,都需要對執行結果進行確認,同時與原有預期進行對比,看是否達到預期結果。當發現與設定的情況不符,或者已經出現了失控局面,需要即刻啟用回退方案,恢復原有運行狀態。最后,應急關機后,根據設定的關機時長,還需要進行開機。開機后,需要對數據中心運行情況進行密切關注,不是設備都啟動起來就完事兒了,很多時候評估數據中心是否運行正常、穩定,往往需要觀察數天,一旦發現依然存在問題或者風險,還可能需要二次應急關機。

從應急關機的三大部分,在關機前要做的工作最多,也最為重要,這也正是應急關機的重要體現。當應急關機策略制定完成后,應該定期組織應急演練,發現缺陷馬上進行修復,確保最終應急關機方案沒有漏洞,應急關機的方案也不是一成不變的,隨著時間的推移和人員的變更,還需要不斷進行修改。這樣周期性地組織應急關機的演練非常重要,只有這樣才能發現方案中的不足。

任何一個數據中心都不愿意出現需要應急關機的情況,但是一旦必須要做出關機決定時,就一定要提前做好充足準備,有詳細的應急關機預案,以免在應急關機時,人員都手忙腳亂,毫無組織,亂作一團,這樣的應急關機往往會給數據中心帶來嚴重損失,起不到保護數據中心的目的。

 
標簽: 數據中心
打賞
 
更多>同類資訊
0相關評論

 
推薦資訊
點擊排行
?
網站首頁  |  付款方式  |  版權隱私  |  使用協議  |  聯系方式  |  關于我們  |  網站地圖  |  排名推廣  |  廣告服務  |  RSS訂閱  |  違規舉報  |  京ICP備11008917號-2  |