




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
IT運維一體化管理平臺解決方案 第9-頁 XXX單位IT運維一體化管理平臺解決方案2015.01北京美承互聯數碼科技發展有限公司
總體設計建設思路IT運維管理從無序、混沌的管理,經過簡單的對資源的監控,直至發展為統一的IT運維管理。隨著IT基礎架構越來越復雜,單純憑某個工具或某個人,已經不能勝任如此大的工作量和滿足業務緊迫性的要求,必須有一整套借助先進方法論的IT運維管理解決方案。北京美承互聯數碼科技發展有限公司依據多年的IT運維建設經驗,通過分析本次項目需求,建議注重以下三個角度的建設:統籌化:遵循IT服務管理理論、方法和實踐,立足未來的信息化發展趨勢,在充分調研掌握用戶實際運維情況的基礎上,進行統籌規劃、整體設計,確保IT運維建設的協調性、有效性和一致性;體系化:按照規劃目標,逐步建立一套融合組織、制度、流程、人員、技術的IT服務管理體系,健全組織機構,明確職責分工,制定規章制度,規范管理流程,建立高效、統一、標準、持續改進的IT運維管理體系;平臺化:依據體系建設落地內容,強化技術支撐,構建耦合性強、具有良好開放性和擴展性的技術支撐平臺,結束以往獨立的、分散的系統管理,實現統一的、集中的平臺化管理。同時也應該認識到,在運維管理的持續改進過程中,存在各種風險和難點,應該遵循立足需求、統一規劃、保障重點、分步實施、務求實效的原則:立足需求:IT運維服務管理的建設需要考慮用戶的實際IT環境和管理需求,應以解決問題、促進IT運維管理水平不斷提升為抓點,根據需求決定項目的建設重點;統一規劃:IT運維管理包含多個管理系統的建設,并涉及到現有IT環境和業務系統,需要做好系統規劃,認真分析現狀,了解已有信息狀況,規劃未來系統建設步驟;保障重點:IT運維管理項目的建設涉及到監控、資產配置、流程、操作審計以及多個系統的整合建設,既要立足需求、統一規劃,同時也需要明確重點、分步推進;分步實施:根據規劃結果和建設重點,明確近、中、長期目標和建設內容,按照計劃分階段、分步驟推進和建設IT運維管理項目,既能夠快速解決當前工作中迫切需要解決的問題,也能夠考慮到長遠規劃。務求實效:IT服務管理建設要有一定的前瞻性,但不能脫離實際,考慮到投資的效益,要確保解決問題的有效性,保證做一期項目,見一期效益。同時需要根據業務發展需求和管理成熟度持續優化和完善IT服務管理體系。設計依據和原則整體系統的架構設計應該從用戶需求出發,以用戶的現有基礎架構環境和業務管理發展方向為依托,以ITSM行業和軟件設計相關標準、實踐為設計依據,遵循開放性、健壯性、安全性等設計原則,合理的設計架構。平臺架構設計的主要遵循以下依據:前期用戶需求溝通資料提交給用戶的相關介紹材料用戶現場需求調研資料類似行業或相關項目的建設參考國際、國家有關標準文件《中華人民共和國計算機信息系統安全保護條例》中華人民共和國國家標準GB/T9387.21995,《信息處理系統開放系統互聯基本參考模型第2部分安全體系結構》ISO9000-3:1997質量管理和質量保證標準第三部分ISO9001-1994:在計算機軟件開發、供應、安裝和維護中的應用指南ISO20000:IT服務管理國際標準ITIL標準:IT服務管理標準庫(ITInfrastructureLibrary信息技術基礎架構庫)平臺架構設計的主要遵循以下原則:集成性原則提供一個集成統一的運維服務平臺,能夠將各類監控系統和相關互聯系統的信息進行良好整合集成。開放性原則軟件架構設計應遵循業界標準,并提供開放、靈活的信息交互及管理接口,實現靈活的數據交換功能。安全性原則軟件架構設計應該遵循安全性特點,架構應該支持相應的管理權限分立、傳輸安全、存儲安全等原則。健壯性原則軟件具有較強的免維護能力,能夠長時間穩定運行,自身維護要求簡單,具有快速恢復功能。擴展性原則軟件具有較強的擴展性,能夠在包括展現范圍、展現功能、展現對象數量等方面提供靈活、多樣的擴展能力。可定制原則提供靈活的部署方式,在客戶化、管理策略、事件關聯、報警方式、報表生成、信息展示、管理流程等方面可以按實際需求進行定制。總體技術架構總體上來說,運行維護管理系統的架構設計既從現有的應用需求出發,又要面對未來業務和技術發展的要求,在技術方案的先進性、實用性、擴展性、穩定性等方面保持一個良好的平衡。平臺確保為用戶的信息化建設提供長期的支撐,保證用戶運行運維管理的不斷發展需要。根據運行維護管理系統的建設目標與內容的分析,我方提供功能完整、架構合理的系統功能架構如下:平臺總體技術架構如上圖所示,運行維護管理系統在架構上分為:綜合展現管理子系統、運維服務管理子系統、統一事件管理子系統、資產配置管理子系統以及系統對外集成接口。圖中不同的顏色代表了將在不同階段進行建設。1、綜合展現管理子系統:綜合管理子系統包括了服務門戶管理、自助服務臺、服務目錄、統計分析、權限管理等主要模塊,目的是保證平臺不同角色的運維人員可以通過瀏覽器訪問到跟自身職責對應的功能和視圖,是信息的集中呈現窗口和日常工作的平臺。同時系統將在未來規劃建設運維門戶網站及可視化展示模塊。2、服務流程管理子系統:流程管理子系統的目的是通過規范服務流程和技術服務工作,建立一套標準的運維服務流程,圍繞服務臺建立事件管理、問題管理、變更管理、配置管理、服務級別管理、服務請求管理等ITIL最佳實踐,進行IT運維服務的流程化、規范化管理。通過完善知識庫建設,實現知識庫共享,從而提高信息服務效率,提高用戶的滿意度。除了ITSM流程外,系統還提供了面向資產和日常運維工作的資產管理和常規運維管理功能,從而實現對資產和日常運維工作的規范化管理。3、配置管理子系統:配置管理子系統旨在幫助用戶建立統一的IT基礎設施臺帳。通過一系列業務建模、自動采集、調和、變更控制等手段,保證IT生產環境中配置項的完整性和精準性,為上層服務流程提供數據支撐。4、集中監控管理:統一事件管理子系統包括統一事件平臺,具備開放的事件匯聚接口,實現與EM12C和FLOGLIGHT的事件對接,進而觸發運維服務流程及工單處理狀態回傳。同時系統將實現對金稅三期網管項目的集成,從而實現應用監控工具及監控展示可視化。此外,平臺還預留多種標準接口及開放的接口體系,實現和第三方系統的功能或數據集成對接,包括短信系統、郵件系統等。功能介紹結合項目的實際情況及客戶的需求,我們在功能設計上主要體現在集中監控管理、智能機房管理、綜合展示管理三個方面。集中監控管理系統可監測并管理常見的網絡設備、服務器、數據庫、中間件、虛擬化資源、通用服務等IT資源,支持SNMP、CLI(Telnet、SSH)、WMI、JMX、CORBA等遠程非代理監測和Agent代理監測兩種手段,還支持分布式采集、集中管理模式,為業務網絡提供7X24不間斷監測服務。集中監控系統架構網絡系統監控系統主要通過SNMP(V1、V2/V2C、V3)、ICMP、NetBIOS、ARP、Traceroute、RemotePing、CDP、NDP、LLDP等協議來實現對網絡、安全設備和鏈路的自動發現和監控,能夠實現對網絡、安全設備的基本狀態信息、實時運行性能進行監控和數據采集。網絡拓撲監控管理系統其能夠持續、自動地發現、正確識別和跟蹤被管范圍內的網絡設備、信息安全設備(含防火墻、入侵監測系統、日志審計系統、防病毒系統等安全設備或系統)、服務器等支持SNMP協議的設備,支持廣泛的網絡設備廠商及類型,包括對Cisco、Huawei、Juniper、H3C、F5BIG-IP、Netscreen、SonicWALL、HDS、NetApp、北電、中興、博達、邁普、神州數碼、銳捷、天融信、綠盟、飛塔、EMC-CX系列、IBM磁帶庫、CiscoASA防火墻、天融信防火墻、ArrayNetworks等廠商設備的監控。支持IPv4、IPv6雙協議的設備發現和管理,并結合設備的交換表、ARP表、路由表等,自動計算出網絡拓撲,采集網絡設備的運行狀態和性能參數,全面、直觀地反映出網絡設備和線路的整體狀態。系統可自動發現以下信息:第二層、第三層網絡設備;網絡協議,包括:TCP/IP、Ethernet、FDDI、ATM、幀中繼、令牌環等;設備狀態信息(如:板卡、端口、接口、IP、MAC);設備之間的物理和邏輯關系;設備連接信息(如:電纜、中繼、網絡連接和VLAN)。網絡拓撲網絡拓撲監控能夠自動發現網絡設備間的拓撲連接,展現設備節點和鏈路的實時運行信息,能夠自動生成廣域網、局域網(二、三層設備)、主機的網絡拓撲;并實時跟蹤和更新網絡拓撲變更信息,將網絡拓撲重大變更,以告警事件方式發送給統一的運維監控系統予以展現。物理拓撲物理拓撲圖支持手工添加、刪除自定義鏈路和設備,支持全屏展示、支持鷹眼定位,還可以對網絡進行展開和收縮、自動布局、打印、導出圖片等,幫助管理人員快速管理。拓撲圖編輯同時,系統還支持拓撲自定義功能,用戶能夠根據需要定制子網絡,能夠為單個子網制定拓撲圖,也可以根據行政管理劃分定制不同的子網拓撲,方便管理。系統支持使用ctrl鍵或者框選同時選中多個設備,可僅對選中的設備進行分組拓撲構建。分組拓撲構建子網拓撲網絡拓撲圖生成后,管理人員可以直接在拓撲上查看設備和鏈路詳細信息,鼠標懸停在需要查看的設備上,即可查看設備的詳細信息,包括設備名、設備型號、IP地址、CPU利用率、網絡接口連接,鏈路的速率、丟包率、錯包率情況等;支持顏色變化表示設備不同的運行狀態,支持線路粗細表示帶寬的不同,幫助管理人員快速了解網絡運行情況。設備信息查看此外,系統還支持對設備的自定義描述,并能根據IP或者mac地址等對設備進行搜索。在日常管理中,機房中設備的物理位置監控往往與網絡拓撲脫節。針對這一問題,綜合監控管理平臺將機柜物理位置的監控與網絡拓撲圖進行整合,當鼠標懸浮在圖標上,顯示當前機房物理位置信息,可以在監控報警后輔助管理員在第一時間知道機器或設備的物理位置,方便處理。位置顯示系統支持對主流廠商全系列網絡設備的背板圖,實現設備的真實面板管理,并可直接在背板圖上查看各模塊和端口的工作狀態,并能夠進行相關操作和管理,例如端口的開啟及關閉操作,對與暫不支持的設備,也可以很方便的通過定制來實現真實面板管理。設備真實面板網絡連通狀態監控系統能夠針對每個網絡節點的連通性進行自動監控,通過系統自動發現的設備列表,根據管理需要批量或單個對網絡節點進行連通性檢測,管理人員可以根據實際需要設置監測頻率和周期,能夠根據網絡節點所處位置(核心、匯聚、邊緣)設置不同的監測策略,自動對網絡節點進行連通性檢測,并將檢測結果保存至監控管理數據庫。當系統監測到節點不通后立刻產生告警信息,并通過圖形、聲音、短信、郵件等多種方式將告警信息發送給相應的管理人員,同時在網絡拓撲中通過顏色變化來標志出現連通性中斷(故障)的設備,幫助管理人員快速了解網絡中連通性情況,并及時、準確定位故障源,以達到快速恢復故障的目的。網絡端口狀態監控系統能夠對每個網絡設備的端口狀態進行監控,主要監測端口是否正常工作,和連通性監測一樣,管理人員可以根據系統自動發現的設備基本狀態信息,對每個設備的端口進行批量或單個監控,能夠根據不同設備、不同端口分別進行監測頻率、監測周期的設置,能夠靈活設定相應的監測策略,自動對網絡端口進行狀態檢測,并將檢測結果保存至監控管理數據庫。當系統監測到網絡端口不正常工作后立刻產生告警信息,并通過圖形、聲音、短信、郵件等多種方式將告警信息發送給相應的管理人員,同時在網絡拓撲中通過顏色變化來標志出現端口故障的設備,幫助管理人員快速了解網絡端口運行情況,并及時、準確定位故障源,以達到快速恢復故障的目的。網絡性能監控系統遵循網管FACPS管理指導思想,可以自動、準確、及時地發現各類大型網絡的拓撲結構,持續地監視、報告網絡的運行情況;提供對網絡運行歷史性能參數進行分析與統計,為網絡擴容及優化提供科學依據;并通過IP/MAC地址綁定等功能,實現人機綁定,保障網絡系統安全可靠地運行。系統可以很好支持多廠商的網絡設備,能夠對支持SNMP協議的設備進行廣泛支持,包括Cisco、華為和H3C等主流廠商設備的監控管理,并且和各設備廠商有長期的合作關系,確保對各類設備的兼容性。在強大的廣/城域網、局域網拓撲發現基礎上,系統自動呈現網絡的真實拓撲圖,支持三層、物理、VLAN等網絡拓撲的呈現,自動跟蹤拓撲的變化。通過對交換機、路由器、防火墻等設備的運行進行監控,自動采集網絡設備各類運行配置參數,監控和分析網絡設備的健康度,同時提供設備信息瀏覽、IP地址管理,協助用戶對網絡設備的配置進行集中備份等眾多系統級網管具備的配置功能。系統支持網絡性能實時監測、快照監測,并能在拓撲圖上根據用戶定義閾值以醒目顏色顯示,系統同時支持各類性能指標進行采集并長期保存,通過數據存儲、歸并、分析,為用戶提供網絡性能的統計分析報表,為優化網絡性能提供數據參考。系統內置基于網絡拓撲推導的故障發現和定位引擎,系統通過主動SNMP輪詢、被動TRAP、Syslog接收,收集各種故障和預警信息,并在通過先進的拓撲鏈路關聯、故障配對分析等技術準確定位故障源,使得用戶在網絡故障風暴中可以快速查找原因,還著眼于綜合管理角度,支持告警的進一步傳遞,為上層的事件匯總平臺提供原始數據,通過數據的進一步歸總,實現集中化的IT整體監控。還十分注重網絡邊界的安全,系統依托強大實時的拓撲發現算法,跟蹤終端的變化情況,通過IP/MAC綁定、MAC/交換機端口綁定等規則,實時發現并攔截非法設備接入網絡。系統提供設備性能監控功能,實現對網絡基礎設施環境性能的監控,定時采集網絡性能信息,及時發現那些可能會導致網絡服務質量出現明顯下降的情況及故障隱患,并通過告警閾值設置、實時顯示告警等,主動預警網絡隱患;同時能夠在拓撲圖上直觀呈現網絡設備的性能、端口利用率、端口輸入及輸出雙向的使用情況、端口流量、錯誤率和線路利用率等信息;可以根據策略靈活定制重點關注的網絡設備性能指標,以及性能指標的時間采集頻率、各個指標的告警閾值,并提供性能統計分析報告,使用不同顏色、粗細、圖標表示被管理對象的狀態信息。針對網絡設備,系統能夠監控以下內容:CPU利用率;內存利用率;設備各接口的I/O流量;對網絡設備的性能、運行狀況及環境狀態進行監控;端口監測:對設備端口利用率、端口錯誤率、端口丟包率、端口總流量、端口上下線、數據包大小進行監測;設備各接口的I/O流量:按照bit/s、byte/s、Packs/s進行統計,需區分入流量、出流量;設備運行環境:對設備的電源狀態、電壓情況、環境溫度、風扇狀態、設備連續運行時間等設備運行環境信息進行監測;鏈路聯通性:包括核心層設備、匯聚層設備、交換層設備之間的聯通性,核心層設備與重要網絡服務器、服務器之間鏈路的聯通性,網絡設備鏈接重要網絡線路端口狀態等。網絡CPU、內存、端口等指標性能監控多鏈路實時監控設備配置管理系統具備網絡配置功能,可監控和采集設備型號、固件版本、設備名稱、IP\MAC、端口信息、CPU、內存、網絡配置、板卡信息等等,并提供以下實用功能:支持通過SNMP、ICMP采集方式,支持通過自定義的SNMPOID指標進行設備監控;能夠以列表、拓撲等形式直觀展現設備端口類型、端口號、IP地址、MAC地址及本、對端端口號等;支持自動或手工備份網絡設備配置信息,并支持比對與預警;提供設備面板庫和擴展面板的編輯能力,通過豐富的面板庫和設備面板的編輯能力,實現設備管理的可視化監控(查看設備和端口狀態)和操作(關閉端口等);提供所有設備資源信息及狀態的列表界面,并統計出監控的設備總數,包括正常和故障的設備數量,設備列表應能看到所有設備的實時通斷狀態,CPU及內存使用率信息,監控狀態,告警信息等,并能導出為文件。提供設備網管信息工具箱,方便查詢端口列表、設備部件表、ARP表、TCP/UDP表、轉發表、CDP表、STP、VPN、VRF、OSPF表,內置MIB瀏覽器、NetStat、ICMP、TraceRoute、Telnet、SSH、Remoteping等常用工具;支持其他網絡節點狀態監測,如:TCP、DNS、FTP等基本服務的探測,還可以基于SNMP獲取主機信息并監測管理。網絡資源管理設備配置備份和查看對比網絡事件日志管理系統提供各類網絡事件日志記錄,根據事件類型進行分類管理,日志記錄內容完整,便于進行事件跟蹤和事后分析。通過系統配置,可設定事件級別或信息類別,并根據事件等級或信息別類進行日志過渡。支持接收設備廠商自定義的TRAP、Syslog故障事件;Syslog分析——當設備出生故障、遭到攻擊或被病毒感染時網絡設備會發出異常日志,及時接收、發現異常日志。網絡事件日志查詢展現網絡故障管理系統能夠根據預先設定的運行監測參數持續地監測網絡系統的各項運行參數,能夠對關鍵性能指標進行監測,跟蹤網絡拓撲的變化,一旦網絡發生故障或者拓撲發生變化就可以迅速的通過拓撲圖反映出來,在網絡拓撲圖上通過節點顏色或者一些小圖標表現給用戶,并通過告警閾值設置、實時告警顯示等,詳細的將告警信息傳送給用戶,通過聲音、短信等特征提示及時告警,準確預警和定位網絡中的故障,為用戶發現和處理事件提供一定的信息支持。故障監測使用SNMP、PING、RPING等協議自動采集網絡設備的狀態,發現設備的運行情況和隱患;骨干網鏈路中斷情況;骨干網路由器端口異常狀態;其他告警事件。故障告警實時告警,主動告警時間小于10s;對事件的嚴重級別加以分類,并分別通知相關人員;故障管理能夠實時監視網絡運行過程中所出現的故障,確定故障位置,以聲音、電子郵件、短消息等多媒體方式通知網絡管理員;系統應用監控服務硬件監控系統支持包括HP、DELL、IBM、浪潮等國內外主流品牌的服務器硬件的監控。對于服務器的監控通過IPMI協議實現,IPMI是智能型平臺管理接口(IntelligentPlatformManagementInterface)的縮寫,是管理基于Intel結構的企業系統中所使用的外圍設備采用的一種工業標準,該標準由英特爾、惠普、NEC、美國戴爾電腦和SuperMicro等公司制定。用戶可以利用IPMI監視服務器的物理健康特征,如溫度、電壓、風扇工作狀態、電源狀態等。而且更為重要的是IPMI是一個開放的免費標準。系統對服務器硬件監控支持包括:服務器電流、傳感器風扇、傳感器狀態、傳感器溫度、服務器電流、服務器電源功率等。服務器溫度監控傳感器狀態、溫度傳感器風扇服務器電壓服務器功率服務器操作系統監控管理和監測主流操作系統的服務器或集群的運行狀態和性能數據,包括服務器的基本信息、CPU負載、內存利用率、應用進程、文件系統、磁盤空間和吞吐、事件與錯誤日志等信息的分析與監視。幫助用戶及早發現服務器系統的性能瓶頸與故障隱患。針對UNIX和LINUX系統,能夠實現但不限于以下功能:UNIX/LINUX磁盤監控:監控文件系統當前Inode總數,當前使用數量、剩余數量、使用百分比、可用百分比等;監控文件系統占用磁盤空間大小、文件系統剩余空間、剩余空間百分比等;繁忙百分比、磁盤讀、寫速率、傳輸率。卷監控:監控系統物理卷大小,卷組名,當前狀態,分區數量,可用空間大小等。配置信息:硬件類型、系統名、處理器數量、處理器速度等。內存監控:監控當前可用物理內存容量,剩余空間百分比,虛擬存儲容量監控可用SWAP容量,空間使用百分比;監控每秒平均換入/換出率,平均頁掃描率,出錯率、回收率。網卡監控:監控網絡接口IP地址、接口狀態,傳輸率;監控每分鐘平均發送,接收包率,包平均錯誤率,平均沖突率等;監控網卡上傳輸包的最大尺寸,統計值包括平均、最大、最小及總計使用率等。進程監控:監控進程CPU時間,CPU使用率,內存百分比,占用內存Heap大小,占用虛擬內存大小;進程名,進程ID,進程用戶ID,Nice值,父進程ID,進程指令行,開始時間,開始客戶端名;進程讀/寫字符數,進程規模監控,占用堆棧大小,等待CPU時間,等待鎖時間;監控處于不存在、活動、正在運行、停止、睡眠、等待狀態的進程等。處理器監控:每分鐘CPU平均繁忙百分比,IdleCPU百分比;CPU狀態包括CPUID、Online、Offline狀態空閑百分比,系統百分比,用戶百分比,等待百分比。用戶監控:用戶狀態監控:監控登錄名,Idle時間。日志監控:日志監控:監控系統日志,過濾其中關鍵錯誤信息,并告警。……HP-UX監控視圖Windows監控管理針對Windows2000\2003\2008\2012系統,能夠實現包括但不限于以下功能:主機基本信息采集:主機的基本信息,包括:CPU數目、機器型號、系統名稱、系統版本、IP地址、內存大小、總線程數目、磁盤名稱等。磁盤監控:監控文件系統占用磁盤空間大小,文件系統剩余空間,剩余空間百分比;監控磁盤分區信息,分區映射等。內存監控:監控系統當前物理和虛擬內存容量,可用內存數量,可用百分比PagingFile監控:監控當前可用NT換頁文件,每秒換入/換出率,頁讀/頁寫每秒;如監控Cache字節峰值,Cache使用率等,監控緩存活動,如緩存頁的讀取頻率,緩存拷貝請求的成功率,以及緩存快速寫入磁盤的頁面數量。網卡監控:監控網絡接口IP地址、接口狀態、DNS名、系統名,監控IPv4/IPv6地址,以及IPv6地址鏈接本地地址;監控每分鐘平均發送,接收包率,平均錯誤率,平均沖突率等,網段監控:監控一個網段上的數據利用率和傳輸狀態3、監控使用IP協議的數據流量和碎片統計信息,控一個TCP/IP連接上的字節和信息包的發送和接收速率。進程監控:監控進程CPU時間,CPU使用率,內存百分比等;監控特定進程信息,如進程運行的總時間,線程數量,該進程對實際或者虛擬內存的使用情況等;進程讀/寫字符數,進程規模監控,占用堆棧大小,等待CPU時間,等待鎖時間;監控處于不存在、活動、正在運行、停止、睡眠、等待狀態的進程等。處理器監控每分鐘監控處理器的I/O狀態。包括I/O讀寫每秒;包括處理器ID信息,處理器設備ID信息,處理器名,制造商,版本信息等;包括空閑時間百分比,系統時間百分比,用戶時間百分比等。服務監控:監控系統常見服務可用性及性能:DHCP,FTP,IIS,WINS,NTTP等。日志監控:監控寫入應用日志,DNS服務器日志,安全日志和系統日志的信息,過濾其中關鍵字段并告警;監控當前日志空間使用率,最大日志空間,老舊日志刪除時間等。主機當前登陸用戶信息:當前登錄用戶登陸的時間、終端IP、終端名稱主機端口速率監測:監測主機系統中指定端口的入速率、出速率、入丟幀速、出丟幀速、單播入幀速、單播出幀速、非單播入幀速、非單播出幀速、入錯誤幀速、出錯誤幀速等。主機重要文件監測:監測主機系統中指定的文件大小。……Windows監控存儲監控支持通過存儲設備廠商相關管理軟件對接,以及直接對存儲設備監控兩種方式實現對可管理存儲備份設備的監控與管理。實現對主流存儲設備(磁盤陣列、磁帶庫)的監控,例如:EMC、HDS、浪潮、IBM、HP等存儲設備。監控存儲設備的性能,包括共享內存狀態、電池狀態、環境狀態、風扇狀態、電源狀態、控制器狀態(包括控制器IP地址);監控存儲器的磁盤,包括磁盤驅動器狀態、物理硬盤個數、單個硬盤容量、RAID級別、RAID組個數、總使用空間、剩余空間等情況。存儲監控界面存儲監控的方式主要有以下幾種:CLI方式:命令行接口(CommandLineInterface,簡稱CLI)方式是指通過Telnet/SSH等協議訪問遠程設備或者調用本地程序執行命令行,通過命令行請求獲取遠程設備的信息,分析系統反饋結果來獲取需要的監測信息。SMI-S方式:SMI-S(StorageManagementInitiativespecification)由全球網絡存儲工業協會(SNIA)領導起草和推廣,目前已經得到了包括EMC、惠普(HP)、日立數據(HDS)、Sun和賽門鐵克等眾多廠商的支持,SMI-S的目標是建立管理轉換器、主機和磁盤陣列的標準,同時為開發存儲管理系統提供一通用的語言,成為存儲領域的產業標準。SNMP方式:由被管理設備/軟件提供SnmpAgent服務,由其對存儲設備的工作狀態和性能進行監測和管理,存儲監測系統通過Snmp協議向SnmpAgent發送請求,Agent會根據請求的信息標號(OID)返回請求數據項的內容。通過對存儲設備的監控,能夠實現包括但不限于以下功能:可用性:通過對接或直接監控的方式對存儲設備進行管理后,存儲管理軟件界面統一,所有模塊和功能均通過統一界面進行展現,便于管理和使用;權限控制,通過系統完善的權限管理,實現對登陸用戶進行認證和授權,系統設置兩類不同的用戶,一類用戶只能進行查看操作,另一類用戶則具備完全操作權限,包括查看、配置等操作;支持數據的導出功能,管理平臺能夠將收集和生成的數據導出成Excel、PDF、HTML等格式;通過對接或直接監控的方式,對存儲管理平臺進行管理,管理界面為中文,并提供在線使用幫助,便于管理員使用與查詢。可擴展性:存儲管理平臺軟件支持多種主要操作系統平臺的存儲資源監控和分析,支持AIX、Linux、Windows、HP-UX、Solaris操作系統平臺,并能夠支持文件系統文件粒度的分析。支持數據庫一級的存儲空間監控和分析,支持Oracle、DB2、Sybase、SQLServer等主要數據庫系統;系統支持并采用業界開放的存儲管理標準SMI-S,保證存儲管理平臺能夠最大限度的支持主流的存儲設備,并保證平臺的可擴展性。通過Snmp和Trap機制對SANSwitch/Director、磁盤存儲陣列設備、文件系統空間、數據庫空間、磁帶庫進行綜合管理。網絡(SAN)監控及管理,通過SMI-S協議對網絡(SAN)進行監控,自動發現拓撲結構,自動發現SAN資源服務器HBA、SAN端口、SAN交換機、磁盤設備、帶庫設備等;通過SMI-S協議,提供端到端的數據通路管理,在拓撲中展現從服務器,到光纖交換機,到存儲設備的數據通路,并直觀的展示數據通路上的狀態、事件和性能等信息;通過SMI-S,實時監控和報告有關SAN的狀態;系統支持性能參數設置閾值,當性能超過閾值時進行自動告警;通過SMI-S協議,系統能夠采集Zone的信息,實現Zone的劃分與改變等管理操作。磁盤陣列監控及管理系統主要通過SNMP、SMI-S協議對磁盤陣列進行監控和管理,支持對IBM、HP、EMC、HDS等廠家具有SMI-S規范的磁盤陣列進行集中監控和管理;NETAPP存儲陣列具備SNMP訪問接口,存儲監控模塊通過SNMP協議請求存儲設備的SNMPAgent,實現數據采集,獲取被管理的存儲設備中的各種信息。系統支持將磁盤陣列納入到資源管理,通過資源的可視化,能夠生成包含磁盤陣列物理磁盤與邏輯卷對應關系的拓撲圖;被監控系統關聯關系圖樣例系統通過SMI-S協議,能夠對磁盤陣列的性能進行管理,幫助管理員了解歷史和實時的磁盤性能狀況;對性能數據的采集支持自動化調度的方式,性能參數包括但不限于以下幾個方面:WriteI/ORate、ReadI/ORate、ReadCacheHits、WriteCacheHits、ReadDataRate、WriteDataRate、ReadTransferSizeRate、WriteTransferSizeRate;通過SNMP、SMI-S協議對存儲設備進行管理時,支持對受監控的性能參數設置閾值,當發現異常性能數據超過設定閾值時,能夠進行主動報警。文件系統及數據庫存儲資源監控對IT環境中的業務系統和存儲系統進行容量統計與規劃,跨平臺監視并報告容量和利用率;能夠識別服務器上的存儲子系統,為主機卷、邏輯卷、文件系統和文件提供存儲子系統LUN的映射;支持服務器上數據庫環境的存儲空間管理,包括:表、表空間、數據庫用戶資源利用率等;針對文件系統或數據庫空間進行告警,當可用空間的百分比低于設定的閾值時發出告警信息,告警信息可以通過SNMP或者Email等方式通知管理員,也根據告警進行自動響應;對于存儲資產能夠生成包含服務器、存儲子系統監控狀態更改、可用性、容量、使用情況、用戶配額(軟)以及資產(配置)信息等報表。同時針對存儲設備監控管理還支持以下能力:存儲管理軟件界面統一,簡潔,易于使用。能夠生成包含磁盤陣列物理磁盤與邏輯卷對應關系的拓撲圖。對IT環境中的業務系統和存儲系統進行容量統計與規劃,跨平臺監視并報告容量和利用率。對于存儲資產能夠生成包含主機、存儲子系統監控狀態更改、可用性、容量、使用情況、用戶配額(軟)以及資產(配置)信息等報表。支持存儲配額,可以對個別用戶級別或用戶組級別所使用的存儲空間設置閾值,如果受監控的資源超出設定的閾值,則主動報警數據庫監控能夠根據監控策略實現對Oracle、MicrosoftSQLServer、MySQL、DB2、Informix等主流數據庫的監控,按照屬性相關性分為數據庫工作狀態、數據庫表空間的利用情況、數據文件和數據設備的讀寫命中率、數據碎片的情況、數據庫的進程狀態、數據庫內存利用狀態等屬性監測組,分組監測數據庫系統的性能、事務、連接等性能數據。針對數據庫,能實現包括但不限于以下功能:Oracle數據庫監測支持對Oracle9i/10g/11g等版本;監控當前ServerParameter參數內容,如SGA、PGA、Processe、Sessions等關鍵指標;基礎監測:表空間使用率、連接會話數;高級隊列監測:ready消息數、錯誤的消息數、消息平均訪問時間、消息總數;歸檔目的地監測:歷史歸檔信息,包括歸檔目的地類型、歸檔目的地狀況、歸檔目的地可用空間、歸檔目的地可用空間百分比、歸檔目的地位置,歸檔文件的備份狀態;基本信息采集:使用spfile啟動、只讀模式、歸檔路徑、例程開始時間、限制模式、歸檔模式、例程名、并行狀態、位長、DB版本、DB名稱、主機名、實例狀態;檢查點監測:發生檢查點數、完成檢查點數;數據文件監測:文件名稱、狀態等,包括文件大小、讀次數、寫次數、讀時間、寫文件塊數、讀文件塊數、讀寫文件塊數、寫時間,監控數據文件的缺省參數,監控數據文件空間使用信息,超過閾值后進行預警;全表掃描配置:RSRATIO值、LTSCANRATIO值;資源鎖定監測:監控鎖信息,鎖定時長;監控UNDO空間信息:監控UNDO表空間及其缺省參數,監控UNDO表空間及其相關的數據文件,UNDO表空間空間使用信息,超過閥值后進行預警;碎片監測:FSFI值;監控用戶狀態:監控單個用戶的安全狀況,連接時間、數據流量;監控當前活動進程信息,當前會話列表信息,每一會話的I/O流量,監控跟蹤文件及ALERT文件錯誤信息;進程資源消耗監測:可用PGA百分比、可用PGA、已分配PGA、已使用PGA;命中率監測:共享區字典緩存區命中率、多次解析(重裝)的條目比率、高速緩存區命中率、共享區庫緩存區命中率、磁盤排序與內存排序比率、回退段等待次數與獲取次數比率;遞歸調用信息監測:遞歸調用百分比、時間間隔的遞歸調用百分比、用戶調用數、遞歸調用數、遞歸-用戶調用比率、遞歸調用速率;Redo日志配置:監控在線重做日志信息,重做日志文件組及成員信息;重做條目的平臺大小、多種請求成功/失敗比率、錯誤次數等;Rman備份監測:增量備份大小、全備份大小;回滾段:大小命中率、等待率、等待次數、活動事務數、翻轉次數、擴展次數、一致更改率、收縮次數、用戶回滾率;會話監測:會話ID、用戶名、CPU時間、排序次數、緩沖區命中率、讀次數、寫次數、提交次數、占用游標數、掃描次數;SGA配置:共享庫緩存大小、SQL緩存大小、數據字典緩存大小、共享池大小、重做日志緩沖區大小、高速緩沖區大小;SQL監測:使用內存、執行時間、TopNSQL語句、用戶;轉存空間監測:轉儲空間使用率;表空間監測:未使用Extent數量讀時間、最大Extent數量、已使用率、已使用量、未使用量、未使用百分率、允許最大空間、是否自動擴展、寫時間、Segment管理方式、表空間類型、當前Extent數量、下一個Extent大小;表狀態監測:增長速度、索引大小、數據大小、表空間、用戶,對于單表超過10M(可進行設置)的表進行監控;撤銷空間監測狀態監測:快照太舊錯誤計數、無空間計數;作業隊列監測:監控數據作業中的所有作業及當前的作業狀態,包括破損作業數量、過期作業數量、失敗作業數量。Oracle監控SQLServer支持對SQLServer2000/2005/2008/2012等版本;基礎監測:連接會話數、CPU使用率、數據文件大小、日志文件大小,可用性;基本信息:阻塞進程數、處理器名稱、Windows版本、處理器數目、主機名、內存(MB)、數據庫數目、會話數目、啟動時間;緩沖區監控:緩存區管理統計,緩存明細;鎖的監控:閉鎖明細、連接統計、鎖明細;數據庫明細:數據大小、數據庫大小、未分配大小、未使用大小、索引大小、保留大小;文件監測:路徑、增長方式、容量、文件組、數據庫、大小;會話監測:最后處理時間、命令、數據庫、CPU時間(ms)、內存(KB)、程序、建立時間、用戶、狀態、主機、SQL統計、訪問方法明細。SQLServer監控MySQL數據庫監測系統支持監測MySQL5.x的可用性、連接時間、請求統計、連接統計、線程明細、緩存大小、數據庫明細、事務處理、查詢緩存命中率、查詢統計、請求緩存命中、表鎖統計等詳細數據。基礎監測:數據庫名稱、版本、數據庫狀態;負載監測:緩存查詢數;數據庫大小監測:數據庫大小;數據庫的會話情況,連接數。DB2數據庫監測系統支持監測IBMDB28.x/9.x等版本的可用性、連接時間、活動代理數、數據庫狀態、死鎖率、日志使用率、事務統計、緩沖區性能、緩沖統計、表空間狀態等詳細數據。基礎監測:最后一次備份時間、數據庫狀態、數據庫激活時間、當前連接數、連接總次數;緩沖池信息監測:各緩沖讀寫次數、命中率;鎖監測:死鎖數、鎖等待率、鎖升級率;鎖表信息:鎖狀態、鎖模式、表空間、Schema;排序信息監測:應用排序數、排序溢出百分比;表空間監測:已使用頁、表空間類型、頁長、總頁數、表空間狀態、空閑率、空閑頁、使用率、預取大小、擴展數據塊大小;表空間容器監測:使用率、總頁數、已使用頁、容器類型、表空間名稱。DB2監控Informix數據庫監測系統支持監測Informix9.x/10.x/11.x等版本的數據空間、進程、磁盤IO、chunk、會話、告警、日志、鎖信息等詳細數據。基礎監測:回滾數、死鎖數、寫緩存命中率、讀緩存命中率、數據庫連接數;檢查點監測:檢查點速率、檢查點等待速率;DbSpace監測:數據空間使用率;磁盤讀寫監測:頁寫速率、頁讀速率、物理磁盤寫速率、物理磁盤讀速率鎖監測:鎖請求速率、鎖超時率、鎖等待率、死鎖率;日志讀寫監測:物理日志頁面寫速率、物理日志寫速率、邏輯日志頁面寫速率、邏輯日志寫速率、邏輯日志記錄寫速率;共享內存監測:塊寫速率、緩沖區寫命中率、緩沖刷新到磁盤速率、Foreground寫速、緩沖區等待速率、LRU寫速率、順序掃描速率、Latch等待速率、緩沖區讀命中率;排序監測:內存排序速率、磁盤排序速率;事務監測:事務提交速率、事務回滾速率。中間件監控系統支持對各類不同中間件的運行監控,提供包括配置信息、連接池、線程隊列、負載監測、通道情況監測等多類監測組,分析與監測中間件的各項運行狀態參數。產品還支持對Websphere、WebLogic、MQSeries、Tomcat、Tuxedo、Resin、TongWeb、等各類不同中間件,提供包括配置信息、連接池、線程隊列、負載監測、通道情況監測等多類監測組,分析與監測中間件的各項運行狀態參數。支持對Tomcat、WebLogic、Websphere、Resin、MQ等主流中間件的監控和分析。支持監測Tomcat5.0.x/5.5.x/6.0.x等多個版本監測,監測項包括可用性、響應時間、CPU內存使用率、并發連接、Web應用、類裝載、連接器狀態、活動線程等詳細數據。支持監測WebLogic7/8/9/10等多個版本的可用性、CPU內存使用率、線程池、EJB、數據庫連接池、Web應用等詳細數據。支持監測Websphere6/7等版本的可用性、事務明細、活動時間、服務響應時間、Web應用、線程池等詳細數據。支持監測Resin3.0.x/4.0.x等版本的可用性、CPU內存使用率、會話數、響應時間、JVM線程、數據庫連接池、內存使用情況、Web應用、類裝入趨勢等詳細數據。系統支持監測消息中間件MQ的隊列管理器(名稱、狀態等)、隊列名、隊列路徑、隊列深度、隊列長度、隊列類型、隊列狀態、通道(名稱、類型、狀態)、監聽隊列狀態等詳細數據。其中具體的監測項包括:系統信息采集:監測中間件基本信息,包括:操作系統、操作系統版本、當前可用堆棧及大小、當前目錄、重啟次數、開啟線程數。Weblogic監控:服務器狀態、服務器實例、磁盤空間、CPU、內存、I/O、網絡吞吐情況、Error等級等。JVM使用監測:監測JVM的堆棧大小和使用率。JDBC鏈接池監測:監測指定JDBC連接池資源連接情況。JTA事務監測:監測中間件中數據處理事務的活動情況。線程池監測:監測指定線程類的線程平均數、空閑線程平均數以及線程吞吐量。Servlet監測:監測指定Servlet執行和調用情況。EJB監測:監測指定EJB激活次數、鈍化次數、緩存個數、事務提交次數、事務回滾次數、事務超時次數、訪問次數。WEB應用監測:監測指定Web應用中Session的當前個數、最大值以及累積個數。JMS隊列深度監測:監測中間件中JMS消息隊列活動情況。MQ通道情況監測:監測MQ的通道情況,包括:每秒接收字節、每秒發送字節、通道狀態、發送間隔、事務數。MQ隊列深度監測:監測MQ服務的消息隊列的隊列深度。Tuxedo負荷監測:監測Tuxedo的機器狀態是否被激活、每秒處理的隊列服務數每秒入隊的隊列服務數、當前客戶端數、當前WorkStation客戶端數。TongWeb數據連接池監控:監測國產中間件Tongweb數據庫連接信息,如最大、最小連接數,可用、創建、關閉、等待連接數等。TongWeb應用性能監控:主要監測系統線程情況、請求隊列情況、吞吐量、發送接收字節數等信息。……Weblogic監控Websphere監控虛擬化監控系統能夠對主流虛擬機的運行狀態進行監控,監測虛擬主機以及每個虛擬機是否運行正常(即是否死機),管理人員能夠根據具體的虛擬主機及主機下每個虛擬機情況,設置相應的監測頻率和監測周期,自動對虛擬主機及主機下每個虛擬機是否正常運行的狀態進行監測,并將檢測結果保存至監控管理數據庫。系統廣泛支持國內外主流廠家的虛擬機,能夠對這些虛擬機進行集中監控管理,實時展現虛擬主機和虛擬主機下各虛擬機的運行性能,幫助管理人員了解和評估虛擬機當前運行狀態。系統支持定義監控策略設置,能夠針對不同的虛擬主機以及主機下各虛擬機靈活設置或調整監控頻率、周期、方式和監控指標等。針對虛擬機系統,系統能夠實現以下方面的深度監測:基本信息采集:虛擬機的操作系統類型、虛擬機的總體狀態、vCenter中的物理機、虛擬機、Cluster、Datastore等物理/邏輯對象、虛擬機的電源狀態、虛擬機的配置文件路徑、虛擬機名稱、主機的基本信息或狀態等;虛擬機CPU監測:虛擬機可使用的CPU數量、虛擬機的CPU頻率、虛擬機的CPU使用率;集群信息采集:通過vCenter/SystemCenter等獲取虛擬機和虛擬化集群的基本配置信息;虛擬機關系發現:在操作系統上安裝虛擬化管理工具的基礎上,自動發現虛擬機和操作系統、虛擬機和集群之間的配置關系;虛擬機內存監測:虛擬機的內存使用率、虛擬機可已使用的內存量;虛擬機磁盤監測:存儲置備大小、已分配使用率、未共享大小、已分配大小、虛擬機名稱;獲取虛擬機相關的告警信息,并發送給事件匯總平臺進行集中處理。虛擬機監控一覽虛擬機配置信息監控應用平臺及通用服務管理系統提供對基礎應用平臺的基礎信息、連接測試、基本負載等重要信息的監測。能夠有效實時地分析HTTP/HTTPS、DNS、FTP、DHCP、LDAP、IIS、.net等常見通用服務的運行狀態和參數,深入分析服務響應速度變化的技術原因和規律,從根本上解決服務響應性能的問題:支持對常見的WEB應用、郵件服務、DNS、FTP等應用服務運行情況的監控;Apache監測:監測服務狀態、響應時間、CPU負載、每秒請求數以及累計訪問數、數據處理量、運行時間、作業數等;HTTP監測:監測服務狀態、校驗頁面內容;IIS監測:監測運行時間、連接信息、傳輸字節數、登陸和連接用戶信息、每秒web請求數;HTTPS監測:監測服務狀態、校驗頁面內容;Domino監測:監測版本、文件路徑、交易數、用戶數、緩沖池信息、郵件大小、郵件數、mail速率、文檔信息、CPU信息、內存占用、數據庫占用等;POP3監測:監測服務運行狀態、登陸情況、郵箱郵件數、郵箱空間使用情況等;SMTP監測:監測服務運行狀態、響應時間等;DNS監測:監測服務運行狀態、域名解析成功與否等;FTP監測 :監測服務運行狀態、響應時間、登陸用戶信息、文件是否存在等。標準郵件服務詳細監控視圖DNS服務詳細監控視圖FTP服務詳細監控視圖統一事件平臺事件匯總平臺提供了清晰的、集中的事件管理,運維管理平臺的核心功能之一。它將IT系統中各種設備或管理系統產生的事件作為原始事件,按照預定義的事件規則,經過過濾、分類、分級、轉換等處理環節,形成有效的預警或故障告警信息,按預定的方式通知管理人員或自動響應,對生成的告警提供升級、自動或手工消除等管理手段,支持用戶自定義故障類型升級策略。監控系統能夠將告警傳遞到告警視圖、拓撲圖、業務影響度視圖中。通過事件匯總平臺,實現運維事件的集中管理。建立統一的事件匯總服務,將應用系統、數據庫中間件、主機存儲系統、網絡安全系統和機房環境的運維事件信息,通過標準通訊接口(API、JMS、SOAP、Syslog、郵件)進行事件匯集。系統可針對重復事件進行實時壓縮,結合系統定義的規則(時間窗口、頻率、次序等)進行符合關聯分析,能夠根據資源影響關系和監控要素關聯性減少誤報、漏報、多報的情況,通過實現盡可能少的事件關聯規則,處理事件類的故障相關性分析。事件匯總平臺具有極強的針對事件的處理能力,提供了多種開箱即用的事件處理規則,當一個事件到達時,它會經歷以下幾個環節:事件接收:按照數據匯聚接口設計,接入Syslog、SNMPTrap、標準定義的WebService接口的原始事件;事件標準化:對事件的內容進行標準化翻譯,采用基于規則的標準化識別,根據原始事件內容的不同,轉換成標準的事件分類和格式,一個事件包含多個字段,事件的字段定義可根據實際需求調整,使事件描述的更豐富;事件過濾:對于部分無需關注的事件,通過事件分類、級別、描述等信息進行匹配和拋棄,避免影響后續事件的分析;事件壓縮:對于標準化后的事件,設置事件的壓縮規則,可以將事件的各類字段信息綜合,形成重復事件的壓縮標識,事件平臺自動對重復事件進行壓縮,只形成一條告警,并標識告警對應的第一次發生時間、最后一次發生時間、壓縮事件的梳理;告警消除:設置告警消除規則,如果接收到消除事件,便可將原有告警進行自動消除,例如:端口Up事件自動歸并消除端口Down告警。告警升級:支持告警的時間窗規則,對于未處理完成關閉的告警,如果發現告警長時間未處理完成或消除,系統按規則自動升級告警級別,并進一步通知用戶;告警豐富:支持告警的豐富規則,通過告警的相關信息來匹配配置庫里的配置項,從而形成告警資源定位,并支持將定位資源的信息作為補充信息賦予告警,實現告警豐富和關聯業務信息,如告警設備所在的物理位置、責任人、所屬部門等;告警根源分析:根據告警源(發出告警事件的配置項)之間的依賴關系,結合配置管理庫和告警信息庫,分析出告警的根源事件,快速定位告警源頭,排除故障;告警聯動通知:處理后的告警支持多種策略,可以按照告警類別、告警對象,告警屬性、告警時間等信息,定義告警的動作,告警的動作主要包含通知和處理兩種情況;告警通知可以按照規則預警相關責任人,從而進一步催辦人工處理;告警處理可以按照規則觸發自動派單等接口、腳本或程序,作為輔助人工處理的一種自動化手段。事件匯總平臺事件處理過程事件統一采集格式化事件進入事件匯總平臺的第一步,便是事件統一格式化,將從各接口接收到的各種格式的事件格式化為標準格式的事件,以便進行后續統一處理。事件匯總平臺支持多種原始事件的接入,包括:原始的告警日志事件,例如SNMPTrap、Syslog等;智能閥值事件,基于運行基線設置閥值,每個監控元可以根據不同時間段設置不同的閥值,當超出閾值后產生的事件。事件統一格式化采用基于規則的標準化識別方法,根據原始事件內容的不同,通過轉換規則轉化為統一格式,格式化規則配置如下圖所示:統一格式化規則配置事件過濾匯聚事件標準化之后會根據過濾規則設定進行過濾匯聚,將部分無需關注的事件過濾掉,避免過多無關事件的干擾,延誤重要事件的處理。事件的過濾基于過濾規則進行,可根據事件的各種信息進行過濾,規則配置如下圖所示:事件過濾規則配置事件壓縮分析根據設置的壓縮規則,可以將事件的各類字段信息綜合,形成重復事件的壓縮標識,事件平臺自動對重復事件進行壓縮,只形成一條告警,并標識告警對應的第一次發生時間、最后一次發生時間、壓縮事件的梳理。事件壓縮(事件轉告警)規則配置如下所示:事件壓縮規則配置能夠定制壓縮策略,對某段時間內同一報警進行壓縮。壓縮方式可以按照計時或計次進行累計。例如:在personapp1服務器cpu使用率高連續報警5次,在綜合事件展現平臺上不會顯示5條personapp1cpu報警而是只顯示一條,但在累計次數或時間字段顯示為5次。事件告警自動消除平臺能根據設定的告警消除規則判斷告警事件是否為消除事件,如果為消除事件則自動消除相應的告警,進行聯動通知處理,結束告警的處理。告警消除(關閉)規則的配置界面如下所示:告警消除規則配置告警定位與豐富告警豐富主要指將告警源或其他外部信息豐富告警信息的過程,告警豐富包括告警源定位和告警屬性豐富兩個步驟,支持豐富規則,通過告警的相關信息來匹配配置庫里的配置項,從而形成告警資源定位,并支持將定位資源的信息作為補充信息賦予告警,實現告警豐富和關聯業務信息,如告警設備所在的物理位置、責任人、所屬部門等。告警源定位規則配置告警信息豐富告警影響分析同時在告警臺上通過右鍵菜單,可以點擊打開業務影響分析視圖,系統可自動或者手動定義CMDB中業務之間的邏輯、物理關系,進行可視化拓撲建模,實現IT事件出現時,能夠迅速評估監控要素影響那些業務,以及影響規模,直接查看該告警對其他配置項產生的影響。告警業務影響分析告警動作與通知告警影響分析完成后,根據處理結果和預先配置的策略,平臺可以進行告警聯動通知處理,包括顏色、聲音、郵件、短信等。告警動作策略包括觸發動作的條件和執行的動作,觸發條件包括告警類型、告警發生時間和告警業務屬性判斷條件等;告警的動作主要包含通知和處理兩種情況,默認提供發送短信、發送郵件、播放聲音和創建工單幾種動作,平臺以插件的方式構建,支持快速擴展動作方式。系統提供對告警動作的擴展定義和定制,以實現對事件管理功能的自動化,自動進行派單和聯動,提高監控管理系統的運行效率。動作策略告警類型配置動作策略時間策略配置動作策略通知方式選擇告警派發工單事件匯總平臺界面-告警臺集中告警臺是統一事件處理子系統的前端交互界面,為用戶提供了簡潔、集中的告警驅動處理機制,通過告警臺可以讓管理人員對整個IT基礎架構的實時事件信息收集,對各類事件信息進行過濾、相關性分析與處理,實時呈現出完整的事件信息,并將這些信息分發給負責服務水平監視的操作管理員。有效地提高事件管理的效率,減少事件的定位及解決時間,保證提供高質量的服務。集中告警臺主要包括:告警導航、告警查看、告警處理、規則定義等幾方面功能。同時可根據用戶的實際需求定制事件的顯示格式。整體界面如下圖:集中化的告警臺工作界面集中告警可視化運行展現可視化設計工具靈動可視化平臺為運維管理員提供了靈動在線可視化建模設計器,以統一的資源配置庫CMDB庫為基礎,聯邦運行監控指標庫,基于FLEX展現技術,顯示了動態的、變化的數據和圖形,提高了技術人員在WEB平臺上的交互式操作能力。靈動可視化設計器提供了超過600個基礎模具庫,涵蓋了普通圖形、各種廠商設備圖標、設備面板等各類圖形組件,還支持資源展現組件,即使用資產配置或基礎監控數據定義后的組件,應用于資源展現模板、儀表板、拓撲圖、機柜圖;。通過將這些圖形組件組合在一起,并為其關聯恰當的業務數據源,按需表現多種邏輯物理環境。可視化設計平臺運行可視化展示可視化展現系統的提供了從網絡系統、主機服務器、數據庫、應用、安全等幾方面的運行狀況的集中展示管理平臺,平臺提供當前運行一覽視圖、業務一覽視圖、業務監測視圖、網絡監測視圖、機房展現視圖等多種監測視圖來查看當前系統的整體運行情況。大屏綜合可視化展示實時方便查看企業信息平臺運行狀態。例如,可將網絡、服務器、業務應用、機房等信息,在同一界面全屏顯示,投放到大屏幕上。大屏可視化展示(某省級金融單位)系統監控可視化展示基于業務系統架構的系統運行可視化展示,可以直觀展示業務系統的運行狀態與水平。業務系統運行可視化展示(某省級金融單位)網絡監控可視化展示基于網絡拓樸結構的網絡運行可視化展示,可以直觀展示網絡的運行狀態與水平。網絡運行可視化展示(某國家部委)機房監控可視化展示從機房的物理位置出發實現相關資源(網絡、業務系統、業務、機房監控)信息的綜合展示。機房立體可視化展示(某省級企業集團)智能機房管理我公司提供智能機房管理包括3D可視化建模、3D引擎、3D模型庫管理、3D可視化管理以及系統用戶管理。3D引擎與建模3D可視化建模系統支持對機房、機柜、機房所在樓層、樓宇,甚至園區進行建模,通過簡單的拖拽手段,滿足機房資源管理和呈現功能。可以實現建立導航樹、構建設備模型、設備位置定義、調整機架準確的高度等功能,模型文件通過3D引擎的渲染,能夠實現逼真的3D效果;而針對IT設備、動環設備、其他辦公設備的模型存儲在模型庫中,最大程度實現復用。監控可視化平臺的建模能力包括整體建模、機房建模、IT設備建模、動環設備建模、其他設備建模等。整體建模實現園區、樓宇、樓層、周邊環境等模型的建立,從大局整體呈現機房的的位置和環境。機房整體建模機房建模根據實際機房結構,通過拍攝、勘測等方式實現機房結構、內部裝修、墻、門、窗、機柜等模型的建立,建立高精度的仿真機房模型。機房環境建模設備建模實現機房各種設備設施(如:交換機、路由器、服務器、存儲設備等)的模型建立,包括廠商、型號、相關參數等,建立好的模型將存儲到模型庫中,本系統的IT設備模型庫中已經存儲了多達幾百種各廠商/型號的IT設備模型,因此能夠大大縮減建模的成本和時間。設備建模動環設備建模實現各種動環設備(如:UPS、空調等)的模型建立,包括廠商、型號、相關參數等,建立好的模型將存儲到模型庫中。動力環境設備建模其他設備建模實現對機房內其他辦公設備的模型建立,包括廠商、型號、相關參數等,建立好的模型將存儲到模型庫中。機柜建模環境與設備設施建模應用與數據要求機房內部結構的三維建模設計1.1所需信息:機房建筑結構及設備總體布局數據要求:CAD平面布局圖(DWG文件)VISIO文件說明:根據CAD圖需得到以下基本信息:=1\*GB3①各房間的詳細建筑尺寸。(如房間的長,寬等)=2\*GB3②房間附屬物體的位置及大小信息。(如門窗的位置和大小,房柱的位置和大小等)=3\*GB3③房間內設備的布局示意,如機柜,小型機等(如左下圖所示)=4\*GB3④如CAD圖可反應出房間內磚塊的真實布局(如右下圖藍線所示),則更有利于三維場景逼真再現實際機房布局,使如機柜或小型機等設備可按實際磚塊位置擺放。另外,如果有設備布局的其他文件如VISIO或PDF也可使用示例:此類CAD圖可提供以下信息:=1\*GB3①房間的建筑尺寸=2\*GB3②設備的大致布局無法從此類CAD圖得到如下信息:=1\*GB3①設備的精確位置=2\*GB3②設備的具體型號=3\*GB3③機柜的朝向無法辨別此CAD圖可提供以下信息:=1\*GB3①房間的建筑尺寸=2\*GB3②設備在房間中的準確位置(可以通過數地板塊來確定)=3\*GB3③可以看出機柜的正面朝向(如紅圈所示)=4\*GB3④可以看出設備的型號(如綠圈所示,NW表示網絡機柜)VISIO文件也可以詳細的看出設備的布局及精確位置和朝向及型號等信息三維場景實現1.2所需信息:機房高度信息數據要求:層高信息:地板以下高度、地板到天花板高度、天花板以上高度。示例:地板下高度:0.8M地板到天花板高度:3M天花板以上高度:1.5M1.3所需信息:機房裝修風格;設備布局;機柜/獨立設備外形數據要求:機房內部照片示例:照片不低于500w像素,清晰,盡量正視拍攝;機房布局照片:按照通道順序拍攝,便于了解機房布局情況。(如下圖中的=1\*GB3①~=3\*GB3③所示的拍攝順序為逆時針圍繞機房進行拍攝)需要重點表現的細節:盡量正視照片,清晰照片。實景圖片三維場景實現=1\*GB3①=2\*GB3②=3\*GB3③對于建筑物特殊的細節也需要拍照機房的邊緣也需要拍攝,可看到磚塊在邊緣的實際情況對于機房內的典型設施需特寫拍照(如煙感,門禁等設備)細節盡量以正視角度拍,如對這個門的特寫照片專用設備三維展現建模設計2.1所需信息:設備外形數據要求:設備外形照片說明:照片不低于500W像素典型標志:正面照片實景圖片三維場景實現正面特寫背面特寫側面特寫設備細節特寫,最好能拍到設備的型號,這樣有助于我們能夠查到更詳盡的設備信息2.2所需信息:設備參數數據要求:長、寬、高外形尺寸說明:三維模型設備制作需要準確的外形尺寸信息。=1\*GB3①設備的具體型號=2\*GB3②設備的外形尺寸如可以對設備進行特寫拍照,可按以下方式進行:從正面拍攝設備的底部,可看出該設備寬度和所占磚塊的比例關系。從側面拍攝設備的底部,可看出該設備深度和所占磚塊的比例關系。3D引擎我公司的提供三維仿真展示系統采用Treasure3D引擎,他是一款三維瀏覽器插件,綜合了游戲技術、虛擬現實技術和WebGL的特點,以Javascript為接口,提供簡單高效的框架和豐富的模型庫,設計目標是快速開發三維Web應用。該3D引擎系統包括內存管理、場景節點、空間變換、可渲染對象、渲染隊列、GUI、網格、材質、公告板、粒子、天空、數學庫、動畫、特效、資源管理、LOD、高級渲染、光影、提供可擴展接口(腳本)Input、Audio、Physic、Pathfinding等功能;具有出色的渲染畫面能力,渲染多棟建筑或1000個機柜規模下的場景,3D幀速率可達到>30幀。同時,通過該3D引擎體的可擴展接口,可以實現靈活的定制開發。3D可視化功能我公司提供的數據中心三維仿真展示系統能通過多維度(環境、資產、管線、容量、監控、演示等)、多層級(園區級、樓層級、房間級、機柜級、設備級等)、多視角(任意角度、任意大小、任意位置)對數據中心進行3D展示。具體功能如下:環境可視化我公司提供的三維仿真展現系統的環境可視化主要用于構建數據中心所在的園區環境,包括園區中的建筑樓宇與景觀,它提供一種直觀方式來管理、介紹數據中心園區,借助園區的各個區域的功能介紹信息,可實現數據中心園區的虛擬仿真瀏覽,主要功能介紹如下:地理園區的虛擬仿真系統支持按照真實園區的景觀(山體、樹木、道路、車位、河道、標識等)進行仿真。可多園區進行組織對接,多個數據中心、樓宇在同一個平面上展示。園區環境可視化展現數據中心大樓虛擬仿真系統支持按照數據中心大樓的真實情況進行3D建模,包括數據中心大樓、(機房部分)的內部結構、標語、掛圖等。建筑外觀的虛擬仿真:根據建筑物的真實外觀完成3D建模。可展示建筑的基本規格信息。樓宇內部結構的虛擬仿真:根據樓宇的實際建筑結構完成3D建模。可模擬真實墻面的標語或掛圖信息。可橫向縱向拆分展示每一個樓層的結構情況。數據中心大樓的可視化展現同時,系統支持對任意環境的對象可點擊加載查看環境部件的說明信息,包括大樓、機房等,數據信息至少包含:大樓所在地址、建造時間、功能說明、包含的數據中心信息描述等;機房所在位置描述、機房建設標準(等級)、機房面積、最近改造時間、用途、包含機柜數、包含服務器數等。資產可視化資產可視化主要幫助數據中心提升資產管理水平,減少在資產查找、盤點、統計方面的無效投入,通過資產信息與配置信息相結合,實現“賬”“物”合一的管理模式,同時利用資產可視化的靈活查詢,運維人員可以方便獲取所需信息,從而有效支撐IT運維的過程。我公司提供的三維仿真展現系統的資產可視化能夠對數據中心的各類設備設施,根據真實的物理情況進行三維仿真。根據仿真的設備設施類型,可視化的資產設備類型可以分為以下幾類:獨立設備可視化:包括空調、機柜、發電機、配電柜、PDU設備等獨立設備;架式設備可視化:包括交換機、路由器、網絡安全設備、負載均衡設備、IBM小型機、存儲設備(EMC存儲、HDS存儲、曙光存儲)、PC服務器(IBM_PC服務器、曙光PC服務器)、刀片服務器、加密機;機架式設備可視化建模展現板卡級可視化:包括刀片服務器,板卡、電源模塊等;端口級可視化:包括設備外連端口級建模,真實反映設備的端口使用情況。端口可視化建模展現系統支持任意點擊仿真設備的3D模型,即可獲取查看其資產配置信息和運行監控信息。其中資產配置數據包含但不局限于以下內容。同時,系統支持通過配置添加或調整仿真模型顯示的資產配置數據。設備的屬性信息:供應廠商、類型、型號、尺寸等;設備的硬件參數信息:設備的CPU、內存、磁盤空間、網卡性能、端口速率等;設備搭載的軟件信息:包括操作系統,中間件,應用系統等;設備的運行維護信息:設備的SCN號、管理員、維保廠商、維保人員、服務目錄及維保年限等;設備的安全信息:包括病毒信息、攻擊信息和安全信息等。系統具有資產的快速查詢檢索功能,為用戶快速查找設備和定位設備提供技術幫助,系統的設備信息搜索查詢功能包括模糊搜索和高級搜索兩種方式。模糊搜索方式支持以關鍵字進行全局信息檢索,檢索結果以層次化的方式列出所屬機柜、機房、建筑和園區的樹形對象索引,點擊查詢結果三維場景將自動切換到該設備位置視角,進一步獲取明細信息。高級搜索功能支持用戶自定義復雜的搜索條件組合,系統中的資產配置屬性如設備類型、負責人、供應商、地址段等均可成為搜索條件,通過搜索關鍵字,可自由組合匹配條件,支撐復雜的信息查詢需求。可按根據設備的任何屬性進行組合查詢或模糊查詢。搜索結果會以氣泡的形式在3D場景中標注出來,實現設備的快速定位。雙擊氣泡,可立即跳轉到對應的設備頁面。設備設施信息檢索與定位當上架設備物理位置等信息發生變化時,系統支持用戶拖拽式操作完成設備上架或下架作業。即設備物理位置的變更、上下架都可以在數據中心三維仿真界面上采用拖拽該設備的3D模型的方式進行維護。基于仿真視圖的設備拖拽設操作與維護管線可視化我公司提供的三維仿真展現系統的管線可視化幫助數據中心梳理日益密集的供電電路與網絡線路,讓管理與技術人員從平面的圖紙及網絡跳線表中解脫出來,更加直觀的了解數據中心的管線分布及走線情況,應對管線類故障將更加快速排查及修復。系統的管線可視化支持供電電路的3D可視化和網絡配線的3D可視化建設,系統功能主要包括如下:按設備連接查看:查看一個設備的所有對外的網絡連接,包括經過的每一個中間設備的每一個端口信息。按線路連接查看:查看一條網絡鏈路的所有跳線信息,包括經過的每一個中間設備的每一個端口信息。線路維護可視化:支持在3D可視化環境中手工拖拽進行網絡配線的維護操作。網絡鏈路3D可視化展現容量可視化容量可視化幫助數據中心在更加有效管理機房的容量資源,讓機房的各類資源的負荷更加均衡,使運維人員可以實現以機柜為單位的數據中心容量管理。通過機位、U位、承重、功耗等各種可視化視圖,機房管理者將更加清晰的掌握當前的容量情況。容量可視化管理功能還支持通過空間搜索功能,DCV可視化管理系統可以樹形數據呈現和三維場景展現兩種方式同時表現機房和機柜整體使用情況,對于已用空間和可用空間進行精確統計和展現。更為實用的是,空間可視化管理功能幫助運維人員快速直觀地為新增設備尋找合適的上架空間,運維人員可以根據設備型號,或者直接定義上架設備的U高、承重要求和電力要求等多個組合條件進行適配空間搜索,DCV可以在機房實景中直觀呈現符合條件的空間檢索結果,使運維人員得以精確的定位所需空間,制定實施方案。主要功能介紹如下:可視化機位系統支持透視目前機房環境中,已經使用的機位與剩余機位的情況。機房機位可視化展示可視化U位系統支持透視每一個機柜的U位使用情況,如已經使用的U位與剩余U位。機柜U位可視化展示可視化承重系統支持透視每一個機柜的承重負荷情況,同時了解地板的承重分布情況。承重可視化展示可視化功耗系統支持透視每一個機柜的總功耗情況,以了解機房的能耗分布情況。設備設施功耗可視化展示空量查詢系統可在數據中心、機房、機房區域不同級別根據設備的U數、承重和電量需求自動查詢可用空間,并以3D可視化方式呈現。機位、機柜空量可視化展示監控可視化監控可視化將幫助數據中心整合分散的監控工具,實現監控工具、監控數據的價值最大化,真正改變監控數據孤島現象,建立統一監控信息界面,同時扭轉由于二維信息密度不足而導致的數據與報表泛濫狀況,以3D形式將數據中心各方面的情況直觀表達,切實提升監控管理水平。當機房環境或設備發生故障告警時,可視化視圖通過紅色、黃色等不同的色彩進行故障告警提醒。主要功能介紹如下:多圖層管理可以根據多種監控對象、多種監控指標進行圖層疊加操作,以展示當前的監控情況。基于機房空間視圖的層次化監控展現效果門禁監控可視化可集成門禁系統,在可視化環境中了解哪一些人員進出情況。通過門禁系統的集成,遠程控制來門禁開關的操作。視頻監控可視化可集成視頻系統,在可視化環境中實時查看、調取視頻監控畫面。機房監控攝像頭的展現調用環境監控可視化可集成環境監控系統,對接告警等數據。可掌握目前的環境控制信息(溫濕度等),以云圖方式展現。可掌握目前的漏水檢測信息。可掌握目前的供電狀況(輸出、輸出、電壓電流信息)。機房環境監控的展現冷熱通道氣流可視化機房通道氣流的可視化展現主機監控可視化可集成主機監控系統,在可視化環境中查看主機的性能情況與告警信息。機房IT設備運行狀態的可視化展現點擊設備后展現設備系統資源的運行信息網絡監控可視化可集成網絡監控系統,在可視化環境中查看網絡設備的性能情況與告警信息。多設備告警效果圖:機房網絡設備的可視化展現機房綜合展現視圖實現機房設備設施的全局展示,內容包括UPS、配電箱、空調、溫濕度探頭、冷熱通道、存儲、服務器、網絡設備等各類設備設施。多設備監控數據展示示意圖演示可視化我公司的三維仿真數據中心可視化管理系統因其形象可視的展現、直觀互動的操控、多系統信息的融合等獨特優勢,在提升管理水平的同時,也成為數據中心絕佳的展現手段。演示可視化的匯報功能幫助數據中心更好的展示、匯報工作成果,動畫管理功能可輔助用戶進行日常的巡檢工作,視圖管理功能將幫助作業人員以最快速度切入與自己相關的對象或監控視角。主要功能介紹如下:匯報可視化PPT演示文檔是目前介紹和匯報中最通用的手段,演示匯報可視化功能支持用戶將多段動畫嵌入PPT演示文檔中,并可在系統中雙屏顯示PPT與數據中心三維仿真場景,實現PPT與三維仿真場景的雙向互動,從而以豐富生動的手段實現最佳演示匯報效果。自定義動畫系統提供強大易用的動畫制作功能,用戶可以在三維仿真場景中定義多個看點,設定看點停留時間和切換時間,并可定義動畫的字幕、播放速度、視角和路線,從而輕松生成流暢生動的演示動畫。系統支持多段動畫的管理和存儲,不僅可用于數據中心介紹,更可用于巡檢路線示意和應急預案展示等日常運維工作。整個操作簡單易學,讓用戶可在1-2分鐘內學習制作3D動畫,大大提高了此功能的實用性和可用性。可自定義動畫播放時的字幕。可視化播放定義自定義視圖用戶保存虛擬仿真環境中的任意視角,然后進行點擊后即可馬上進行視角切換(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教育熱點問題課件
- 教育政策宣講課件
- 【廣安】2025年四川廣安市考試招聘事業單位工作人員235人筆試歷年典型考題及考點剖析附帶答案詳解
- 語音音標教學課件
- 題型4 函數圖像型計算-備戰2020年中考化學計算題型特訓(原卷版)
- 早教親子活動策劃方案
- 教育活動與教學活動方案
- 明星合影活動方案
- 日常搞笑活動方案
- 春節云活動策劃方案
- 直流屏原理-課件
- 油氣藏類型、典型的相圖特征和識別實例
- COMSOL 4.4 模擬螺線管線圈產生的磁場分布
- 氣相催化加氫法生產1.5萬噸年苯胺車間工藝設計
- 三位數顯示計時器定時器數電課程設計報告書
- 凹凸棒石(千土之王、萬用之土)
- 大氣污染控制工程課程設計_某工廠布袋除塵器的設計
- 三基-學校兒童少年衛生學(200題)練習
- 張家界船舶工業項目建議書【模板范本】
- 國家種畜禽生產經營許可證管理系統操作指南
- 石油化工管道施工方案
評論
0/150
提交評論