




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1企業IT監控與流程管理解決方案目 錄背景介紹監控管理解決方案監控管理內容12監控管理實現方式監控管理功能服務流程解決方案3統一報表管理4案例介紹5根據IBA三層理念劃分3網絡層業務層網元層服務狀態(可用度)業務量響應時間錯誤率網絡進程端口隊列日志主機網絡設備數據庫中間件監控管理技術架構4多種數據采集方式Ultra-NMS Probe(針對網絡管理和業務管理數據)系統監控模塊(針對操作系統、數據庫、中間件等)針對各種不同業務系統的二次定制開發,接口方式包括日志、WebService等管理數據的統一整合與處理監控管理數據結構的一致化統一配置管理數據庫統一故障、性能和配置管理指標體系統一數據呈現統
2、一的運維管理門戶統一數據報表系統統一用戶認證鑒權網元層監控管理5網絡服務器數據庫中間件存儲交換機UnixOracleTomcatSun StorEdge T3路由器LinuxSybaseWebsphereEMC Symmetrix安全設備Win-NTSQL ServerWeblogicHP SureStore Disk Array XPWin-2000InformixTuxedoIBM Enterprise Storage ServerWin-2008DB2 UDBMcDATA Directors監控管理專題介紹網絡設備監控:由Ultra-NMS Probe采集模塊通過SNMP方式采集。支持H
3、uawei、中興、Alcatel、Cisco、Juniper、Nortel、F5、Radware、3COM廠商的網絡設備和防火墻的監控;監控內容:對網絡設備、網絡接口、網絡服務等的監控與管理;監控手段:狀態輪詢、SNMP Trap、Syslog、SNMP MIB數據采集、響應測試等。存儲設備監控:支持對主流的IBM、HP、EMC、SUN、HDS、DELL等存儲設備的監控;監控手段:如設備帶有存儲管理軟件,則Ultra-NMS通過與存儲軟件集成實現監控;如設備不帶存儲管理軟件的話,則一般通過SNMP集成實現接口。監控管理專題介紹-網絡拓撲監控管理專題介紹-網絡告警預警Syslog解析內存利用率配
4、置文件改變Title in hereCPU利用率Title in here接口狀態Title in here帶寬使用情況監控管理專題介紹-配置管理Probe遠程登錄遠程配置操作配置文件上傳下載、歸檔和比對監控管理專題介紹鏈路管理針對網絡鏈路、鏈路集、鏈路組的管理維護系統,提供資源管理、告警管理和性能管理六個功能模塊:鏈路資源、當前告警、歷史告警、性能趨勢、性能統計、統計排名監控管理專題介紹鏈路管理監控管理專題介紹 主機監控:開放式系統:采用BMC BPM For Server監控代理;采用Ultra-Monitor for OS無代理方式監控對象AIX、HP-UX、Solaris、SCO UN
5、IX、Windows、Linux操作系統等監控方式通過BMC BPM For Server監控代理實現采集;BMC BPM For Server再與Ultra-NMS集成進行數據處理與配置/性能/告警展現。監控內容服務器配置信息:對服務器的配置信息進行采集,且這些信息是按照KBP+KBPID+KPI的方式組織的。資源占用情況(性能指標):CPU、內存、Kernel、SWAP、文件系統、IPC、網卡等,占用率、空閑率等指標。進程監控:進程CPU時間占用情況、進程內存占用情況、同名進程數、進程狀態等,對采用了IPC技術的進程還需要監控其共享內存、信號量和消息隊列。日志文件監控:監控主機的系統/應用
6、日志,通過日志監控KM定義匹配方式生成告警。功能實現監控預警提示-系統級預警文件系統 狀態邏輯磁盤利用率系統錯誤事件Title in here文件系統利用率Title in here應 用錯誤事件Title in here內 存利用率功能實現監控預警提示-系統級預警雙機狀態日志監控Title in here進程狀態模擬登錄監控管理專題介紹 數據庫軟件:采用BMC BPM For Database監控代理。采用Ultra-Monitor for DB無代理方監控對象可實現對Oracle、DB2、MySql、Sql Server、Sybase、Informix等數據庫的監控監控方式通過BMC BP
7、M For DataBase監控代理實現Oracle、DB2、Sql Server、Sybase、Informix采集;BMC BPM For DataBase再與Ultra-NMS集成進行數據處理與配置/性能/告警展現;Ultra-NMS通過JDBC方式實現對MySql數據庫的監控。監控內容對各類數據庫的可用性、容量、性能、磁盤IO、數據量、表空間進行全面監控。 監控管理專題介紹 中間件:采用BMC BPM For Middleware監控代理。采用Ultra-Monitor for Middleware無代理方式監控對象中間件監控:J2EE中間件:WebLogic和Websphere等;交
8、易中間件:Tuxedo等;傳輸中間件:Websphere MQ等;其他中間件:WebMethods、TongLink等。商用平臺軟件監控:Lotus Domino;Web服務器:MS IIS、Apache、JBoss、Tomcat等;SAP管理;Oracle E-Business Suite管理功能實現監控預警提示-應用級預警InformixSqlServerDB2OracleWebLogicWebSphere監控管理專題介紹-經驗指標主機window/Unix數據庫中間件網絡設備CPU內存文件系統雙機狀態WebsphereTuxedoWeblogicOracleInformixDb2Syba
9、seSqlServer CPU、內在 接口輸入、輸出帶寬利用率接口輸入、輸出丟包率接口輸入、輸出錯包率初始值:其他金融機構項目經驗值本地化:貼近實際運行狀態及IT資源現狀進行調整個性化:在通用指標基礎上進行個性調整及指標擴展預警目 錄背景介紹監控管理解決方案監控管理內容12監控管理實現方式監控管理功能服務流程解決方案3統一報表管理4案例介紹5部署方式20部署方式單一中心、單一采集單一中心、分布采集混合部署方式分布式數據采集的優勢監控管理數據采集負載的分擔,提升解決方案的擴展能力跨防火墻的數據交換,減少對于現網安全策略的影響采集模塊數據預處理,減少對網絡帶寬的占用根據上證通的網絡及管理現狀,建議
10、采用第二種“單一中心、分布采集”的部署方式。一方面 節省成本,保障系統的安全性,另一方面符合“兩地三中心”的管理需求,同時也滿足未來的發展。本期項目部署架構21 采用分布式部署方式 采用一個管理中心集中管理 兩地三中心的方式,建議采用三臺采集機 建議監控服務器與數據庫服務器互為備份提升監控管理高度22我們將充分考慮對網元層、網絡層、業務層的關鍵指標進行監控,對業務應用監控采用簡單的二次開發,包括第三方開發接口、日志接口、監控代理等方式,從業務應用獲取體現業務運行狀況的關鍵KPI指標, 并進行后續的數據處理和展現。業務監控系統監控監控對象包括了上證通主機、網絡設備、數據庫、中間件、存儲等 繪制主
11、機、網絡設備的物理連接拓撲實時上送硬件設備的告警、性能信息監控業務的可用性(進程)、業務性能、系統運行狀況等展現業務綜合分析報表。項目建設團隊建議23實施工程師研發工程師運維產品安裝部署監控代理產品安裝配置告警策略配置拓撲視圖定制基礎數據配置技術培訓系統測試及上線報表定制開發業務監控定制開發第三方系統集成接口定制開發項目經理需求調研項目整體管控目 錄背景介紹監控管理解決方案監控管理內容12監控管理實現方式監控管理功能服務流程解決方案3統一報表管理4案例介紹5集中監控范圍約定25監控管理功能要點26 拓撲管理資源管理采用類的方式對資源進行管理,可通過自動發現建立資源信息,并可自由添加資源屬性和維
12、度。設備自動發現可實現對設備的自動識別,自動分類,減少配置時間,并提高準確性監控展現的最佳方式,可展現出不同的拓撲圖。 配置管理性能管理核心功能,采用KBP+KBPID+KPI的體系,實時展現所關注的關鍵性能指標。故障管理核心功能,可對各類故障進行處理,并以豐富的通知方式告知管理員。可實現對設備的遠程操作,對配置修改進行跟蹤,對比。邏輯架構27網絡主機SNMP節點服務自動設別設備廠商建立設備物理拓撲向導式發現界面快速采集資源基本信息幫助網絡管理員完成大部分的配置初始數據 28設備自動發現配置資源數據庫IP地址設備名稱Mac地址CPU配置內存配置設備連接關系資源管理29建立針對IT資源的資源管理
13、,包括資源對象、資源維度管理等能力。用戶可以擴展新的資源類別,可以擴展資源的屬性。提升資源管理能力提升設備維護能力在設備維護期間,屏蔽因工程維護造成的告警,減輕監控工作壓力。對于設備保修期即將到期的設備,將發出續保告警,避免了過保造成的損失。提升資源數據服務能力能根據資源實體間關系,將告警信息進行關聯,準確定位到故障根源。能為性能管理、拓撲展現等功能提供相關資源數據服務。對獲取的資源數據進行集中的處理,提供給集中監控平臺、運維管理門戶和數據報表系統,并提供監控管理相關的資源類建模功能。該模塊是整個監控管理平臺的基礎模塊,告警、性能和配置操作管理都基于資源類及其掛接的指標體系進行構架。 拓撲管理
14、30拓撲展示是監控系統展現IT系統情況的最佳方式。Ultra-NMS拓撲視圖能夠以直觀、統一、真實的方式展現整個IT系統的運行狀況,包括物理拓撲圖和業務邏輯拓撲圖。系統支持多視圖導航、查看拓撲對象的故障、性能、配置信息、拓撲圖編輯與修改、查找/定位/拓撲縮放/鳥瞰。監控管理平臺功能拓撲管理-金融行業案例圖監控管理平臺功能拓撲管理-運營商案例圖- 32 - 功能實現拓撲功能應用性能拓撲Ultra-NMS提供性能工作區功能,即將多個被管理對象的多個性能指標按照一定的業務邏輯進行組織和呈現。從而使用戶能夠在同一個管理界面中一目了然的查看所有與其管理職責相關的性能指標。在性能工作區的圖形界面中,能夠為
15、不同的業務創建不同的工作區,在其中組織和定義與之相關的不同的管理對象的各個性能指標,并且以不同的形式展示,例如儀表盤、溫度計、紅綠燈、水平柱狀圖、垂直柱狀圖等等。性能工作區不僅能夠以直觀的圖形方式實時展現性能狀態,而且能夠以紅、黃、綠不同的顏色顯示性能告警,并且可以直接查看實時性能和歷史性能。功能實現拓撲功能性能動態拓撲功能實現拓撲功能業務影響拓撲功能實現拓撲功能業務影響拓撲故障管理37故障管理是監控系統的管理核心功能。它將IT系統中各種設備或管理系統產生的事件作為原始事件,按照預定義的事件規則,經過過濾、分類、分級、轉換等處理環節,形成有效的預警或故障告警信息,按預定的方式通知管理人員或自動
16、響應,對生成的告警提供升級、自動或手工消除等管理手段。38故障管理39故障管理警告告警:需要關注的事件 次要告警:沒有影響生產,沒有網絡中斷,沒有造成宕機,但是需要快速處理的問題等重要告警:造成網絡設備中斷或者宕機,但沒有 影響重要的生產系統;設備、服務等的達到臨界警界等一般事故嚴重告警:發生生產事故,導致重要的生產系統不可用;或網絡中斷導致某一重要區域不可用;設備、服務等的使用達到極限警界等采取中文聲音通報的方式,通知系統管理員進行處理和恢復。采取聲音報警的方式,通知系統管理員及各處室相關的負責人進行處理和恢復采取聲音和郵件的方式通知系統管理員及各處室負責人進行處理和恢復采取聲音、郵件、短信
17、的方式通知系統管理員、各處室負責人、相關領導生成工單,提供與流程平臺的接口,對重要告警和嚴重告警生成工單。故障管理40性能管理41對獲取的性能數據進行集中的處理,提供給集中監控控制臺、運維管理門戶和數據報表系統。提供的功能包括:性能門限告警、性能數據匯總、性能指標計算、網絡流量管理、實時性能查詢和性能門限管理等。 網管系統能力 設備是否超負荷運轉對于設備性能數據將首先判斷是否超過性能閥值,如果滿足告警生成條件,則生成性能超門限類的告警信息,轉入告警處理流程,并通過各種方式提示用戶。 當前時刻關鍵設備狀況重要時刻、重大場景下,提供各種展現方式,密切關注當前時刻關鍵設備的運行狀態。 歷史性能 可以
18、通過報表的方式,分析某段歷史時間內各個設備的運行狀況, 對設備未來運行的趨勢做出清晰的判斷。 關鍵KPI查看當前周期關鍵設備的關鍵性能指標,通過圖形方式進行展示,如曲線圖、儀表盤等。性能管理42性能管理43配置管理44遠程配置操作配置命令模板配置文件上傳下載、歸檔和比對報表展現45能夠轉化成Excel、XML、PDF等格式提供靈活的報表訂閱功能報表采用門戶技術,并且默認支持把報 表內容發布到統一的門戶界面報表將面向所監控系統的管理數據,包括性能數據、告警數據、資源數據等,提供查詢、統計和考核等功能,對數據進行深入分析和符合上證通需求的個性化展現。通過Web方式進行訪問統一采用Flash風格支持
19、多種維度的組合查詢具備報表靈活定制功能能將報表結果以列表、圖形方式直方圖、曲線圖、餅圖等輸出能夠轉化成Excel、XML、PDF等格式業務監控46全面監控業務的狀態信息,并提供豐富的接口,實現業務告警關聯分析,以最快的速度準確定位引起業務故障的網元層、網絡層設備,同時能實現業務數據流的監控和模擬。目 錄背景介紹監控管理解決方案監控管理內容12監控管理實現方式監控管理功能服務流程解決方案3統一報表管理4案例介紹5IT服務管理(ITSM)的含義文化 組織結構工具進行有效而合理的整合,以提供高質量的IT服務。12流程 34IT服務管理是一種以流程為導向、以客戶為中心的方法。它通過整合IT服務與企業業
20、務,提高了企業的IT服務提供和服務支持的能力和水平。ITSM的解決理念傳統的IT管理轉 變ITSM技術導向流程導向 “救火隊”預防為主被動主動用戶客戶集中式,企業自己完成分布式,外包孤立的,分散的集成的,企業范圍內的“一次性的”,混亂的可重復的, 職責明確的非正式的流程正式的最佳實踐從IT部門內部考慮從業務的角度考慮具體的運營面向服務的IT組織,不管是企業內部的還是外部的,都是IT服務提供者,其主要工作就是提供低成本、高質量的IT服務。IT服務的質量和成本則需從IT服務的客戶(購買IT服務的)和用戶(使用IT服務的)方加以判斷。ITSM也是一種IT管理,但與傳統的IT管理不同,它是一種以服務為
21、中心的IT管理。ITSM的“三大目標”:以客戶為中心1高質量、低成本的服務3服務可計量2標準的IT運維日常處理流程建立一套標準、規范的運維管理體系 監控管理平臺 流程管理平臺51監控工具問題,詢問溝通,變通方法服務臺告警事件配置數據庫變更計劃會議紀要變更統計變更回顧審計報告配置項問題變更配置統計/報告審計報告問題統計趨勢分析問題報告問題回顧已知錯誤審計報告問題管理流程服務報告事件統計審計報告業務部門或用戶變更請求事件管理流程變更管理流程事件配置管理流程日常運作管理使用故障,請求Ultra-ITSM遵循ITIL核心思想發布管理流程配置項版本計劃移交登記版本發布升級反饋質量審批幾個核心流程帶來的價
22、值 ITIL最佳實踐 問題管理 建立有效的問題管理流程,規范流程相關活動,豐富知識庫內容配置管理 通過配置管理流程,建立跨處室的基礎數據共享機制,為工作運轉效率的提高和管理能力的提升提供基礎事件管理 系統建立服務臺和權責明確的服務目錄規范日常事件、故障處理流程,加強事件流程的執行效率 變更管理 為建立有效的變更管理流程,達到控制的目的,滿足SOX審查效 率 控 制 規 范 共 享 考核管理提升運維管理水平組織結構(Organization)崗位(Position)人員(Person) 工作項(WorkEntry)崗位KPI由多個工作項KPI組成考核KPI每個崗位都必須有對應考核KPI設定一個崗
23、位是為了完成某些相關聯的工作項每個人總是在特定的崗位上組織是由各種崗位構成的考核的四個方面: 對服務水平考核,面向企業戰略 對服務過程考核,面向效率 對崗位考核,面向部門戰略 對人員考核,面向演進優化定崗定責Ultra-ITSM 技術架構展現層:面對相應部門的值班人員、維護人員、管理人員、支持人員等的功能平臺,展現的方式包括:web、郵件、短信等。業務層:基于ITIL標準的服務流程,為用戶提供相關業務應用功能,系統以ITIL的服務支持及日常管理流程為主。解析層:“流程平臺+流程設計器”的組合,Ultra-BPMS和流程引擎Ultra-Process Designer的結合。Ultra-BPMS
24、流程引擎提供流程流轉平臺支持,Ultra-Process Designer使得用戶對運維流程的深度擴展成為可能。數據層:為整個系統提供對各類數據的存儲管理功能,存儲的數據信息包括與網管系統的統一配置管理數據庫、運維工單數據、系統管理信息等。多種動作多種狀態符合中國用戶操作習慣十七種動作:“建、派、抄、協、交、審、領、退、駁、追、轉、辦、催、知、復、閉、廢”十一個狀態:“開始、草稿、待審批、審批中、待處理、處理中、已完成、作廢、歸檔神州泰岳流程平臺亮點介紹多樣化的業務規則良好的擴展性人性化設計理念豐富的通知手段便捷的設計界面,所見即所得的設計風格本地化程度高,純中文的操作界面,非常適合中國用戶的
25、操作習慣面向對象的設計,松散的耦合性,良好的開放性,能和各種系統方便的對接工單信息查看、流程設計配置等方面方便用戶使用,支持熱部署,提高工作效率內置豐富的流程規則、環節規則、界面規則,快速設計新的流程提供短信、郵件等通知方式界面設計流程設計友好的操作界面流程平臺產品符合工作流管理聯盟的WFMC規范。 產品特性符合不同規模企業用戶的要求系統是B/S架構,開發人員和用戶都可方便的在瀏覽器中進行配置和二次開發,而且修改的結果可以直接部署、直接升效,無需重啟服務。真正實現了0編碼開發。 能夠靈活的定義流程,符合國內的特殊流程需求;能夠靈活的定義表單,支持各種表單元素的定制。 系統除具有方便的配置功能外
26、,預留了大量的二次開發接口,可以方便的進行功能擴展。比如各種規則解析、條件、業務功能等。 監控和流程之間雙向自動接口流程咨詢和梳理是關鍵 業務咨詢和流程梳理是服務流程平臺建設的一個重要環節,工作量往往占了總體工作量的40%-50%,同時需要用戶的大力支持和全員配合。運維服務管理簡潔的表單設計提供表單項的配置功能,通過表單項配置,按照系統內置的模板,以特定的排版方式生成表單頁面,支持的表單項類型有:普通輸入文本框、下拉選擇框、單選、多選、時間日期、大文本框、聯動選擇框等。 流程自定義目 錄背景介紹監控管理解決方案監控管理內容12監控管理實現方式監控管理功能服務流程解決方案3統一報表管理4案例介紹
27、5提供靈活的報表訂閱功能支持把報表內容發布到統一的門戶界面中集中展示統計分析報表我們在本項目中推薦的神州泰岳自主開發的報表產品面向所監控系統的管理數據,包括性能數據、告警數據、資源數據等,分別提供了查詢、統計和考核等功能,對數據進行深入分析和符合用戶需求的個性化展現。通過Web方式進行訪問統一采用Flash風格支持多種維度的組合查詢提供豐富的報表模板,具備報表靈活定制功能能將報表結果以列表、圖形方式直方圖、曲線圖、餅圖等輸出能夠轉化成Excel、XML、PDF等格式報表簡介-性能報表報表簡介-告警報表報表簡介-容量規劃報表報表簡介-考核類報表目 錄背景介紹監控管理解決方案監控管理內容12監控管
28、理實現方式監控管理功能服務流程解決方案3統一報表管理4案例介紹570 監控及維護管理體系監控范圍涵蓋總部及36個分公司IT設備,設備類型包括:網絡設備類型:CISCO、華為、銳捷;1100臺各類服務器的監控管理,包含SCO Unix、AIX、HP-UX、Windows、Linux操作系統368套數據庫Informix、DB2 、SQL Server、Oracle200套Tuxedo、50套Weblogic、10套Domino等商業通用軟件的管理 服務管理體系 基于ITIL標準建立全國統一服務臺,建立服務支持流程,包括事件管理、問題管理、配置管理、變更管理四大流程;根據人壽實際業務需求,基于流程
29、引擎定制開發業務管理流程,包括上報審批、日常運營、保單轉移、代服務管理四大類流程。 運維門戶體系 基于泰岳公共產品套件(Ultra-UIP、Ultra-PASM)實現監控管理平臺、服務管理平臺系統的統一登錄、界面集成、綜合報表呈現。中國人壽IT運維服務管理平臺1統一的展示門戶2業務邏輯拓撲視圖3業務應用告警4應用性能基線5性能集中展示6應用數據分析統計監控效果展示(部分)72上海分公司深圳分公司北京總部上海分公司自2007年開始建設集中監控系統,2009年2月下旬啟動監控系統改造工程,至2009年8月投入試運行。項目建設過程包括對項目需求的分析和確認,項目實施方案及計劃的評審,各個功能點的測試
30、及上線,以及投入試運行之后對一些日常運維中遇到問題的跟蹤解決。至12月4日程序變更上線之后,集中監控系統需求中涉及的功能點都已實現,相關的測試也已經得到各個系統管理員及值班工程師的認可和確認監控范圍包括“生產網”、“辦公網”、“Prop外聯網”、“公網”、“管控網”、”開發測試網“六個組成部分,監控的功能點涵蓋主機(AS400、AIX等)、網絡、AWS、EMC、環境、應用類監控(AS400_DB2應用監控、每日交易量等)主機類監控完成54臺Windows主機的監控完成18臺AIX主機的監控完成6臺AS400主機的監控(2臺為三地OA服務器/4臺開發測試/1臺生產)管控網兩臺虛擬機及24臺環境設備及3584磁帶庫的監控辦公網9臺監控通斷性的設備開發測試網11臺監控通斷性的設備外聯網9臺監控通斷性的設備公網17臺監控通斷性的設備生產網對AWS及ECC、加密機等的監控網絡類監控共90臺,管控網7臺網絡設備;外聯網17臺網絡設備;公網共18臺網絡設備接入監控系統;生
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 綏化智能小區管理辦法
- 繼續教育學院管理辦法
- 育嬰師職業道德培訓課件
- 肩周炎中醫講座課件
- 機房安全管理培訓課件
- 復印五年級數學試卷
- 阜陽一模高三數學試卷
- 東營三模高考數學試卷
- 高三五調數學試卷
- 高起本高等數學試卷
- 2025年廣西中考語文試題卷(含答案)
- 2025年南京市中考數學真題試卷
- 2024年深圳市中考歷史試卷真題(含答案解析)
- 湖北省 公路工程試驗檢測設備期間核查規范DB42∕T 1544-2020
- 基礎會計教材電子版
- 四川省地質災害治理工程常用資料表格
- 患者隱私保護課件
- RFJ0132010人民防空工程防化設計規范
- CA6140車床杠桿工藝設計說明書完全版
- T_CHES 17-2018 水井報廢與處理技術導則
- 酒店住宿賬單模板
評論
0/150
提交評論