如何消除信息孤島,實現數據中心信息共享,可能各有各的招。以某大型央企為例,為建立信息共享服務中心,企業建立了自運營的大型數據中心,預計全部建設完畢后,白地板面積將達到8000平米,容納機柜4000個,設備60000臺。而該數據中心將承載大量關鍵企業信息化系統,譬如人力資源管理系統、財務核算管理系統、資金管理系統、預算管理系統數以及各戰略利潤單元的ERP系統及其他業務信息系統近百套,運營部門面臨極大的挑戰,如何能耳聰目明,管理好這么多基礎設施乃至于應用系統,依靠監控工具是一條必經之路。
讓我們來看一下企業的現狀,從信息管理部成立到現在不足5年,在工具上的投入呈現出條塊化,已經基本實現了網絡、存儲、基礎系統、虛擬化等領域的簡單監控,但是工具之間既有交疊的部分,交疊的部分的數據在不同工具中存在不一致現象;同時又存在不少盲區,尚未納入管理;各技術團隊自己管理和使用自己的工具,告警信息也無法分享給其他技術團隊,而且即便是分享了,其他團隊也無法判斷其重要程度及影響面,而監控告警信息作為事件流程的主要輸入,其現狀顯然極大制約了運維的質量及效率,什么是理想的狀態?又如何實現這一目標,成為運營團隊的所需要解決的兩大問題。
我們用幾個問題來梳理我們的思路:
1、我們期望監控解決我們什么問題,達到什么目的?
首先,監控是運維的基礎,要解決問題首先要發現問題,確定問題的嚴重程度和多個報警之間的關聯關系,這樣運維響應才有目的和效率,處置才能精準得當。當數據中心關聯的子系統之間同時報警,那么該如何定位、判斷故障呢?
其次,運營團隊中不同的層級對監控的關注點和所需要的信息是不同的,如何獲取高一致性的基礎監控數據,并能通過DIKW(Data-Information-Knowledge-Wisdom)模式提煉出不同的信息切片,打造立體運營的管控信息平臺。我們簡單梳理歸納了一下不同層級的關注重點。
2、目標、原則及架構
顯然,如果有一個工具能囊括動環、IT基礎設施、虛擬化平臺、操作系統、數據庫、中間件以及各類企業應用,那是最理想的,但是現實往往是骨感的,這類大跨度、高集成的產品從前沒有過,估計以后也難以問世。
我們希望引入BI和大數據分析的一些思路,利用數據集成清洗展現等技術來實現這一技術目標,形成統一監控平臺。
擬定的以下建設目標和原則:
系統建設目標
1) 全資源監控覆蓋
2) 關鍵領域深度監控
3) 系統具備高擴展性,應用業務的發展變化
4) 具備高精度和聯動能力
5) 具備面向服務的應用監控能力
1) 使用盡量少的監控工具結合,覆蓋全資源監控
2) 投資保護原則,盡量利用原有的監控工具
3) 監控系統的技術架構具備靈活性和集成能力
4) 監控系統的技術架構成熟,盡量減少二次開發的工作量
將統一監控平臺的功能主要概括為三個層次,7大項功能:
系統層次:
信息展示層
1) ECC大屏監控信息展示、統一的運維Protal門戶、移動終端展示
2) 基于角色的運維視圖、3D可視化關聯的告警視圖、性能數據展現
ü 可根據集團/BU的不同角色定制展現視圖,
ü 包括:ECC大屏,PCPortal和移動終端等不同形式;
數據分析層
3) 統一數據倉庫集成性能、告警、配置等綜合數據,進行數據分析,生成性能、告警及日常巡檢報表。
4) 告警管理接收來自各種監控子系統的數據,對這些數據進行跨技術域的關聯分析,并判斷對應用的影響關系。
5) 同時,告警管理還通過數據的過濾、壓縮、分類、豐富等技術手段,將真正需要關注和處理的故障事件從眾多的信息中提煉出來,幫助提高運維質量和運維效率
6) 通過歷史性能數據的保存與分析,可以查看被管資源的歷史運行情況,判斷其可用性與健康狀況,定位故障
能夠對匯聚上來的各類原始數據、性能數據、告警數據、日志數據等進行關聯分析,形成各類分析報告和報表;
信息采集層
提供數據接口,采集各專業領域的監控數據,覆蓋數據中心全資源。
可以直接采集各類納管IT/非IT組件的數據,同時也可以靈活對接已有的各專業管理系統如網絡管理、安全管理、機房管理、應用管理等;
3、建設路線規劃及分步目標
由于統一監控系統是一項耗資巨大且非常復雜的長期工程,為減輕項目難度及風險,在建設時我們考慮采取分階段實施的策略。階段的目標及主要工作見下:
第一階段建設重點:搭建設系統框架,覆蓋全資源監控,夯實監控基礎
第二階段建設重點:整合應用監控,以數據分析、跨平臺聯動為核心
第三階段建設重點:面向業務的監控,實現綜合應用數據分析,掌控業務影響管理
根據經驗估算,第一二階段相對用時較短,在完善監控管理流程的前提下,前兩階段可通過運動式進行首次數據整理,后期仍需嚴格按照監控管理流程去進行運維,確保CMDB中CI項的完整性和一致性。而第三階段則難度會較大,需要應用項目組的支持與配合,在應用系統中設置“探針”,進行個性化訂制,建議采用逐個擊破的方式來推進,耗時往往會較長。
以上對數據中心監控工具的經驗談,僅供參考。