IT運維管理流程介紹備課講稿_第1頁
IT運維管理流程介紹備課講稿_第2頁
IT運維管理流程介紹備課講稿_第3頁
IT運維管理流程介紹備課講稿_第4頁
IT運維管理流程介紹備課講稿_第5頁
已閱讀5頁,還剩28頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、Good is good, but better carries it.精益求精,善益求善。IT運維管理流程介紹-IT運維管理流程介紹ITIL框架流程分類流程名稱流程描述及分類服務支持事故管理故障處理事故發生后,第一時間及時的恢復服務、上報各級主管及相關人員,有些在規定時間不能解決或沒有解決方案時,就需要將事故的處理任務交給更有經驗和有權限的支持人員。并協調資源快速的解決。性能事故處理對系統性能問題的事故進行及時處理。事故自動恢復當事故發生后,自動重起進行恢復。事故手工申報事故發生后,第一時間及時的恢復服務、上報各級主管及相關人員,并協調資源快速的解決。事故解決升級由于現場技術能力有限無法解決

2、的事故或在規定時間無法提出行之有效的解決方案時,需將事故進行升級處理,交給更有經驗和有權限的支持人員,請求協助。事故跟蹤升級若事故不能在指定時間內完成,可以馬上升級。事故報告當事故發生時,在分析和調查后,提出相應的報告。事故緊急啟動方案事故發生了一段時間,緊急聯系廠家或者相關合作伙伴來解決問題。故障處理預演對故障進行模擬式的處理。問題管理問題記錄建立問題記錄流程,將自己已解決或未解決的問題及故障登記出來,供大家參考或分析解決。問題關閉關閉問題問題跟蹤協調各方資源,對問題進行詳細的跟蹤分析,并確保問題解決。配置管理配置審計對所有配置項進行賬目式的核對。配置信息登記記錄和維護IT系統配置情況,包括

3、配置,配置項,版本、規格、數量等等。配置報告定期報告所有受控配置項的當前狀態及其變更更軌跡。變更管理主機與操作系統配置變更發現主機系統、網絡、軟件、配套環境等方面的操作或變更。網絡配置變更發現應用配置變更發現口令變更發現自動發現口令被修改,通知IT服務經理。口令手工變更系統口令需要定期維護更改、VPN口令申請。用戶信息變更人員信息維護-人員注冊注銷、調動。系統需求變更牽涉到能力管理。發布管理Delta上線流程補丁,升級。FullRelease上線全新應用經過開發,測試、上線。系統版本管理對版本進行增,刪,改。系統推廣系統上線后進行推廣培訓。服務交付可用性管理可用性改進對系統、服務或資源進行可用

4、性的提出改進方案。可用性報告形成系統或資源可用性的報告。能力管理能力預測報告對系統、服務或資源進行評估預測。能力評估報告對系統、服務或資源進行評估預測。能力改進與優化對系統進行調優、程序修改等。服務水平管理服務滿意度調查針對服務水平,對客戶進行滿意度調查。服務水平改進根據調查和評估的結果對服務水進行改進。服務水平評估報告對服務水平進行評估。自動化例常報告維護周報自動觸發維護周報。維護月報自動觸發維護月報。維護年度總結自動觸發維護年度總結報告。例常檢查每日檢查自動觸發每天檢查的提醒。每周檢查每周一觸發檢查提醒。系統健康檢查系統健康檢查報告、系統全面檢查。重大節日前檢查在重大節日到來前作提醒檢查。

5、提醒重要事件提醒及時對系統中存在的隱患進行提醒。口令過期提醒對系統口令過期進行提醒。斷電提醒在斷電前作提醒工作。例常殺毒提醒對每周或定期進行殺毒工作進行提醒。維護工作維護例常會議通知對例常會議的維護工作發放通知。維護例常培訓通知對例常培訓的維護工作發放通知。維護任務指派定期定時的分發指派任務。節假日值班安排對節假日的值班情況進行安排。維護例常值班計劃對日常的值班計劃進行維護。HYPERLINK/index.php?option=com_content&view=article&id=333&Itemid=301t_blank運維自動化自動殺毒定期定時地進行殺毒工作。殺毒跟蹤對殺毒的情況進行跟蹤

6、,檢測并記錄殺毒的信息,及可以時之有效跟蹤病毒情況。自動數據備份對系統數據進行自動備份。自動數據管理fileserver,數據增,刪,改。FTP服務維護對FTP服務進行維護支持。WebServer維護對WebServer服務進行維護支持。J2EE應用服務器維護對J2EE應用服務器進行維護支持。數據庫維護對數據庫進行維護。LotusDomino維護對LotusDomino進行維護。DNS維護對DNS進行維護支持。代理服務器維護對代理服務器進行維護支持。域管理器維護對域管理器進行維護支持。定義了網站可用性指標,如何獲取網站的可用值?監控工具該粉墨登場了。多數網站都會傾向于利用開源軟件自行搭建監控平

7、臺。筆者一向認為,即使網站有一臺服務器,也應該搭建監控工具,這是保障網站能持續改進的基石。常見的開源監控工具有HYPERLINK/link.php?url=%2FNagios()、HYPERLINK/link.php?url=%2Fmonitmonit(/monit)等。Nagios也可能是當前國內最被廣泛采用的監控軟件了,根據官方描述,Nagios是開源的主機、網絡、服務監控程序,從這個描述能看出,Nagios的設計目標是很龐大的。依賴其強大的擴展性,通過分布式監控模式,管理上千臺甚至更多的服務器也不在話下。而對于大型集群環境,HYPERLINK/link.php?url=%2FGangli

8、a(/)是個不錯的選擇。另外商業化運作的比較好的開源監控工具或框架還有HYPERLINK/link.php?url=%2FZenoss(/)、HYPERLINK/link.php?url=%2FZabbix(/)、HYPERLINK/link.php?url=%2FHyperic(/)、HYPERLINK/link.php?url=%2FOpenNMS(/)等。這幾個的定位都是企業級監控平臺。當然,功能的確不比Nagios差,也有的彌補了Nagios的一些不足之處(比如Zenoss增強了對Windows服務器的監控能力)。但出于種種原因,在國內的流行程度并不廣泛。(圖2:Nagios分布監控示

9、意圖圖片來源:/docs/3_0/images/distributed.png)如果要滿足日趨靈活的Web監控需要就不得不提Nagios靈活的插件機制,最簡單只需要幾行Shell代碼就能實現基本的插件功能。多數情況下,腳本捕獲系統日志中的特定事件,通過NSCAClient發送給中心監控服務器即可。靈活性是衡量監控軟件的一個重要標準,從這一點說,多數傳統的商業網管軟件怕是都不如Nagios這樣勝任現在日趨復雜的網站環境。提到網管監控,必然要談到SNMP。跨平臺或者針對專有設備的監控離不開SNMP,但有的時候SNMP的安全性也的確會帶來嚴重問題。這就需要運維團隊中的安全專家對監控系統機制的安全性做

10、整體評估,或是提升運維團隊的安全意識以避免在監控過程中引入更多的安全問題。有些公司的運維團隊喜歡自己寫監控工具而不是利用已有的第三方開源工具。這種重復發明輪子的做法筆者認為是不可取的。這樣做最明顯的一個缺點是軟件本身的維護成本可能會更高,而且團隊人員變動的時候后續代碼維護也是個潛在的問題。至于商業工具的選擇,這里不作評價。報警機制光有監控而報警機制跟不上,不能及時把緊急情況下的信息傳遞給運維技術人員,那么監控形同虛設。現在報警信息發送途徑主要有郵件、IM、SMS三種(過去書籍中提到的傳呼方式已是明日黃花)。這幾個途徑中,郵件告警可能是最簡單的,實現起來容易,一行命令即可做到,但因為郵件本身的異

11、步屬性和郵件服務器的延時問題,很難讓運維人員及時得知信息。所以,如果比較嚴重的告警信息必須考慮其它實時性比較高的方法。至于發送到IM,如果IM是支持Jabber的,實現起來并不難,可靠性也會有一定保障,而如果IM比較封閉,那么可行性就不大了,除非IM公司對你開放API,否則任何取巧的技巧來發送消息的方法其可信賴性都不強、SMS是大家都比較傾向的一種方式,只是有很多人不知道具體如何實現,說白了也就是一層窗戶紙。如果有電信服務提供商(SP)能夠提供基于Web的調用接口給你,那么直接利用Wget或是cURL工具模擬瀏覽器處理表單信息即可,幾行命令即可搞定。如果不具備這樣的條件,不妨考慮一下短信Mod

12、em,現在市場上這樣的短信Modem很多,價格不貴,大多都提供二次開發的功能,簡單的寫點腳本即可實現目的。至于網上有人推薦的免費短信服務,因為實時性比較差,筆者是不推薦的。天下沒有免費的午餐,這樣的服務往往信息發送優先級很低,而且,短信到達率很難保障。值得一提的是,報警服務器本身也需要監控的。建議定期發送測試郵件、測試短信來驗證告警功能處于正常狀態。尤其是在節假日來臨前更要反復確保該功能是正常可用的。一個成熟的運維管理環境包括機房環境的管理,網絡設備的管理,鏈路的管理,端口的管理,流量的管理,業務仿真端口的管理,各種系統服務器的管理,數據庫,中間件,應用系統等軟管理等等。l運維系統應該能夠提供

13、統一的運維平臺,管理人員可以在同一頁面進行作業計劃、工單等方面的處理,為用戶提供一個集中處理的平臺而不需要到各個功能模塊中去分別處理。l作業任務是整個運維體系中非常重要的一環,維護人員需要通過作業任務的執行對現有系統運行情況進行了解,以便為網絡優化和問題處理提供更好的分析數據。同時系統提供自動化的任務功能,能夠使作業中日常的工作能夠自動執行,減輕運維人員的日常工作量。居然能夠讓作業自動化配置與布署。控制好作業的時間周期的-通過MochaITIL最佳實踐方式的4個循環階段(Plan-Do-Check-Improve),循序漸進的實現IT運維流程;-通過MochaITOM提供的CMDB為核心,將各

14、配置項相互關聯,通過拓撲方式展現,一目了然;-通過MochaITOM提供的流程與表單的結合,通過可視化修改與配置,更好地實施ITIL式運維計劃;-通過不同KPI指標,規范IT運維工作量分配和績效考核;-持續改進循環是所有ITIL流程的基礎,通過計劃-實施-檢查-改進后,不斷完善IT運維流程,提升IT運維效率。由于環境十分復雜,企業會指派不同的人員維護數據中心中不同的數據。需要了解所有不同角色與數據中心設備之間的交互過程,角色之間責任重疊。企業的高層決策者需要參與整個計劃的過程并做出決策。數據中心的完整資產信息數據中心中包括大量的服務器和設備,首先需要收集這些硬件資產的信息,以及這些資產之間的關

15、系。資產之間的關系對于計劃非常重要。這里舉例來看一個服務器和網絡之間的關系:通過一個邏輯定義的IP地址訪問服務器必須在操作系統中定義一個網絡接口才能定義IP地址服務器中必須有一個物理網卡來支持操作系統中定義的網絡接口網卡具有特定的屬性,例如MAC地址,用來通過物理鏈路和數據中心內的其他設備連接網卡必須連接到交換機的一個端口上交換機也擁有自己的關系,例如端口屬于哪一個模塊,交換機之間的連接關系上述的資產信息需要被收集起來。圖5-9展示了一個數據中心的例子:繪制業務數據流在將設備邏輯關系文檔化后,為了確定可以實現自動化部署的部分,正確理解配置這些設備的流程非常重要。另外了解設備在業務功能上的用途也

16、很重要。根據這些信息,我們基本可以確定數據中心的基礎構架,例如路由器、交換機、數據庫服務器和負載均衡器這些設備的變動比較少,而且配置方式比較特殊,因此不適合使用自動化部署。而應用服務器通常使用相同的硬件并且經常發生變動,根據我們收集的信息分析來看比較適合使用自動化部署。下圖是一個業務數據流的例子:圖5-10數據中心范例的數據流自動化部署完成后,可以在沒有人工干預的情況下將一臺服務器從裸機開始到操作系統部署到應用部署完成,而后還能夠將這臺新的應用服務器加入應用服務器群集,并開始對外提供服務。了解手工部署流程將數據中心設備當前的結構和使用情況文檔化后,還要將管理數據中心的IT流程文檔化。這樣就可以

17、將設備從抵達到進入數據中心需要進行的工作整理為一個步驟列表。這個列表包括上架和接電等手工步驟以及可以融入自動化管理平臺的自動化步驟。部署流程通常是跨組織角色的,并且應該和現有的自動化技術結合組成完整的解決方案。通過這種文檔化之后,你就可以理解一個數據中心的那些部分可以使用自動化管理。每個組織在實施自動化管理時有一套獨特的步驟,并且每個步驟都有不同的需求,因此這樣的自動化管理平臺并不是一成不變就可以解決所有問題的。針對每個用戶不同的環境、不同的流程,我們都需要對這個云計算平臺進行定制化。這樣才能滿足不同用戶的需求。組織結構自動化部署涉及到很多復雜的步驟,包括物理基礎架構、操作系統、網絡基礎架構、

18、應用程序部署、監控、項目管理以及和其他部門的協調。一般日常的服務器部署不需要和其他部門協調就可以完成,除非存在組織上的、安全上的或其他方面的原因。在很多組織中,架構中很多部分被認為對業務是非常關鍵的。例如,網絡架構部門需要滿足網絡可用性以及變更管理和安全性問題的服務級別協議。而云計算平臺通常需要改變IT文化,要更好的使用這個平臺,就需要將組織中的每個部門都融入到其中。標準化很多組織的IT環境都是異構的,這使云計算平臺的實施變得更加復雜。因此最好的方法就是數據中心的設備都使用標準的硬件配置,使硬件類型最少化。例如針對應用程序服務器層,使用統一的硬件平臺可以減少對每臺服務器的手動配置的工作量。和當

19、前的自動化流程整合很多組織都已經在IT基礎構架的不同層次使用了自動化部署,例如啟動服務器、軟件分發包、系統管理軟件和用來運行日常任務的定制化腳本等技術。但是這些自動化技術都是針對于某一個子系統或者局部的,在部署整個系統的過程中還是需要很多的人工介入來完成。云計算平臺并不會完全替代現有的這些技術,而是依賴于這些自動化技術和流程來實現更高層次的、全局性的自動化管理。結束語在本文中,我們從當前IT的發展現狀出發,結合IBM2008全球CEO調查結果,分析了全球企業所面臨和急待解決的問題,討論了相應的應對方法-建設全新企業級數據中心(NEDC)的必要性,并介紹了NEDC的概念,特征及其發展階段。在明確

20、了IT優化在NEDC建設過程中所起到的作用之后,我們分別針對進行IT優化需要采用的四個架構模式-“物理整合”、“虛擬化”、“靈活的IT”和“將IT作為服務”,從技術上進行了深入淺出的探討。我們介紹這些概念和方法之目的在于幫助讀者了解如何通過對IT資源的優化,邁進全新企業級數據中心的發展歷程。這些通用的方法適用于不同的企業環境,但是由于每個企業的環境和起點不同,企業需要根據自身的情況,設計和規劃各自的發展計劃,制定符合企業現狀和發展方向的藍圖,通過IT優化實現高效、環保、堅實可靠、迅速響應業務需求并推動業務發展的全新的數據中心HYPERLINKjavascript:;轉載MochaBSM基礎架構

21、管理靈活的網絡拓撲展現(2010-05-2720:48)分類:HYPERLINK/space.php?uid=16480950&do=blog&frmd=8042&classid=8045&view=me網上眼界原文地址:HYPERLINK/u2/73098/showart_1077873t_blank/u2/73098/showart_1077873業務需求與挑戰企業的網絡拓撲結構與設備時常變化,人工往往難以維護網絡拓撲。尤其對于上千臺設備的大型網絡來說情況更為復雜。當用戶網絡設備大量增加后,網絡結構異常復雜,用戶的網絡拓撲很難在一個屏幕上展現或者很難找到要查閱的網絡拓撲。由于有些網絡存在某

22、些租用的線路,拓撲生成發現不到這些節點之前的實際鏈路。除此之外,企業的外部設備,或與企業網絡關聯的第三方網絡由于防火墻等因素影響,也可能無法發現。網絡管理成本隨網絡設備的更替與增多而過快增長。關鍵功能與亮點自動發現與生成拓撲自動發現第二層和第三層網絡設備,網絡協議(TCP/IP、Ethernet、FDDI、ATM、幀中繼、令牌環等),設備包含信息(如網卡、接口、IP和MAC),設備之間的物理和邏輯關系、設備連接信息(如電纜、中繼、網絡連接和VLAN)。網絡設備狀態、鏈路狀態、接口狀態監控與報警支持創建資源組編輯拓撲自定義拓撲簡單而強大的繪圖工具使用基本的線、圖形、文本、插圖、背景色、背景圖(地

23、圖)等簡單工具,就能夠繪制出當前各種類型的拓撲與設備的監控圖。以下圖形都可快速的畫出:與實際資源關聯自定義拓撲不僅可以是靜態圖,也可以是具有實際設備狀態、鏈路狀態、接口狀態的動態圖。圖庫管理考慮到編輯拓撲時需要用到各種圖標、背景,除了系統提供的默認圖庫外,用戶也可以上傳圖片。導入、導出拓撲可將自動拓撲、自定義拓撲導出為XML文件,在需要時導入XML文件,恢復拓撲。權限控制網絡拓撲管理員可分配用戶對自動拓撲和自定義拓撲的編輯權限、瀏覽權限。網絡設備管理在對網絡設備的可用性監控以紅、黃、綠、灰狀態燈展示的同時,也對網絡設備的接口信息,包括操作狀態、管理狀態、接口發送/接收速率等具體指標也進行實時的

24、監測。管理員可以一目了然地看到發生故障的接口及當前接口的性能。網絡維護工具系統中還提供了MIB、Telnet、搜索、設備定位、導航等專業的網絡維護手段。我們給客戶帶來什么提高維護工作效率在網絡拓撲可視化管理中,用戶只需輸入核心交換機的IP地址,系統將自動發現企業的整個網絡拓撲,以生動的圖形展現出來,并能夠立刻開始監控所有已發現網絡資源的狀態和鏈路的狀態,并定時自動更新。使網絡管理員能夠快速的掌握企業最新的、客觀的網絡結構與資源狀況。一人即可輕松管理大量網絡資源為使網絡的展現和管理更適用,支持網絡資源組功能。管理員可以對拓撲圖的節點進行分區域,組或網段的管理,比如按照不同地區,組或網段將設備劃分

25、到不同資源組中。同時,對不同資源組可控制瀏覽權限。協助網絡管理員監控各種特性的網絡網絡管理員能夠根據實際情況對自動拓撲進行編輯,也可以完全脫離自動拓撲,隨心所欲的繪制各種類型的拓撲監控圖,并與實際設備、鏈路、接口關聯。可視化監控,一目了然的監控可視化監控提供一目了然的監控,降低對管理員的要求,并且降低了管理員的學習門檻。無需掌握復雜的路由器、交換機等設備的維護命令,只需點擊鼠標與查看,即可獲取設備信息。開源IT資產管理ITAssetManagement縮寫為ITAM,它是IT管理和IT治理的重要內容。IT資產主要指組織所擁有的,能為其發揮價值的硬件、軟件和信息資產等。通常企業在采購IT軟硬件后

26、,要建立資產臺賬,也有IT資產采購、維修、報廢的流程。這是IT管理的基礎信息。高效地管理IT資產的全生命周期已經不是可有可無的了,而是至關重要的。它能優化IT資產成本,降低安全和法規遵從風險。通常IT資產管理包括:硬件資產清單管理、軟件資產管理、采購管理、財務管理、結算、合同管理,線纜管理等方面。資產清單數據往往是IT服務管理流程的基礎數據。資產管理系統的缺失所伴隨的問題可能是:資產閑置:資產重復購買,缺乏對IT資產綜合管理的意識和方法,也缺乏相應的分析和手段大宗資產報廢:IT系統沒有用起來就被當廢品買到了垃圾站,IT資產的采購、利用率、維護、報廢等會接都缺乏對IT資產的價值意識,IT資產的報

27、廢造成的浪費巨大Excel手工管理:資產與實際環境不一致,數據無法真實,靠手工盤點確保正確,更新不及時那么如何才能讓你隨時掌握企業環境中都有哪些資產?正被那些用戶使用?如何對資產維護和收費?如何在資產生命周期過程中對其進行合理地變更?每臺機器是什么時候采購的?是什么處理器?誰在什么時間裝了什么軟件?機器將要(或已經)在何時報廢?當企業無法掌握現有的各類資產時,要想在企業內進行資產的維護和分配,并確保每個員工都擁有開展工作所需要的工具,就變成的非常困難。要使資產在正確的時間處于正確的位置,所需要的成本也是很高的。問題在于:財務部門的資產數據只能管理到資產的流入情況,它不適合與IT部門的共享和維護

28、,在資產投產之后財務部門無法對這些信息作更新,隨著時間的變遷,原始的資產信息和實際的IT環境也變的沒有了相關性和參考性。IT部門往往手工收集和維護一部分的資產配置信息。但是根據這些有限的資產數據,很難準確掌握所有IT資產的現狀,很難提前安排維護和支持計劃,很難進行批量維護和變更處理。從而使IT部門承擔了大量的重復勞動,被迫處理大量的突發事件,并工作在較低生產力的狀態,IT員工的績效及其他部門對IT部門的滿意度都很那達成。企業往往也沒有專門制定一名員工來從事IT資產管理工作,IT人員工作忙而忽略了ITAM,導致ITAM有效性下降,招致代價高昂的法規遵從問題,同時還會由于資產冗余和不必要的開支導致

29、企業浪費資金。這里所推薦的IT資產管理方案是:OCSNG和GLPI的組合。它們各自介紹請參考其網站和HYPERLINKt_blankMartinLiu的博客。無疑:能對大量的資產信息進行跟蹤無核是很有誘惑力的,但是并不是所有可知數據都值得跟蹤。而這些IT資產的信息應該主要服務于:規劃IT更新換代、進行預算、安裝、移動、增加、變更和采購等活動上。一個有效的IT資產管理系統能為IT部門能帶來如下好處:掌控現狀降低風險降低成本明確責任提高績效IT資產管理是ITILv3中的新增部分,它擴展了V2中的單純的配置管理。需要通過穩定的資產和配置管理,來驅動IT服務管理流程和業務管理流程,從而來控制IT成本,

30、降低風險,并進行高效的變更,使業務價值最大化。ITAM可以幫助企業控制IT采購和部署流程。將實際需求與合同條款和維護記錄進行對比。將供應商的表現記錄下來,以便以后在談判中發揮作用。ITAM可以杜絕不必要的采購,對即將報廢的設備,確定最佳淘汰日期。ITAM如果被很好執行,將提高技術投資的回報率,提高運營效率和員工工作效率ITDelivery+ITSupport在IT管理領域里,商業軟件廠商中有自稱Big4的集團:CA,HP,BMC,IBM;在開源軟件項目中也好像有自稱“開源Big4”的集團,他們是HYPERLINK/net-manage/soft/x103091.htmlt_blankGroun

31、dwork、Hyperic、Qlusters和Zenoss公司。商業廠商向用戶推出自己的產品的時候,往往都會打著一些比較大的概念和幌子,說“我們是IT管理的TotalSolution”;潛臺詞是我們的產品非常多,可以滿足您所有的需求,而且只要您選擇了我們,我們能保證所有的產品模塊之間是無縫集成的。事實上的確如此,商業廠商憑著后臺開發團隊的強大,還有本地服務商的支持,在解決方案的集成性上的確沒有什么問題。對于開源軟件來說,由于每個軟件都在各自為政的狀態下獨立發展,即使是彼此之間的功能有著某種銜接和集成性,在多數的情況下也往往是各自獨立發展;沒有考慮到彼此的組合和集成。不過換一個角度看,既然是開源

32、軟件,人家把源代碼都全開放出來了,如果你想做兩個開源軟件的集成的話,從技術的角度上說,沒有任何障礙;對比商業的閉源軟件產品來說,似乎他們又在這方面有著與生俱來的優勢。開源的IT管理軟件中有非常多的種類,就拿網管軟件來說吧。我的blog上介紹了很多,其中很多的軟件都是功能非常重復,而各有千秋的。要想組合一個純開源的整體IT管理解決方案不是不可能的,需要的是對一些比較精華的軟件系統有所了解,并且了解他們之間集成的方式和實現功能。在此基礎上做出合理的組合,方能搭建出一個整體的方案。由于現在ITIL已經成為了大家耳熟能詳的“GOODPRACTICE”,這是08年V3之后的一個轉變,V3提出之后,它就以

33、一種親民的身份,自稱自己不再是“BESTPRACTICE”了。既然是要攢一個“開源IT管理整體解決方案”,同時為了保持本方案具有一定的理論高度選擇ITIL作為理論依據當然是不會錯了呵呵不好意思今天心情比較好,廢話實在太多,抱歉,下面將開始方案書寫了。本方案將兼顧ITIL中的兩大塊:IT交付和IT支持。我所選取的是OpenNMS,HypericHQ和OTRS來分別支撐IT交付和IT支持者兩個部分。OpenNMS和HypericHQ組合來完成網絡和系統監控,它們為可用性管理、性能(容量)管理和服務水平管理提供支持和實現,注意這里說的是為這幾個流程提供支持的工具,這些工具本身并不是流程工具。OTRS

34、完成事件管理、問題管理、配置管理和服務水平管理等流程,OTRS本身是一個工單跟蹤管理系統,他現在的ITSM模塊以及發展到1.1的版本了,同時自稱是ITIL兼容的軟件。HYPERLINK/wp-content/uploads/2008/08/opeople-over-process.jpgt_blankITDeliveryOpenNMS和HypericHQ的功能定位有所不同,在這里選擇他們倆來作為監控網絡和系統的平臺由一下的一些理由。OpenNMS是agentless的監控軟件,它的網絡自動發現功能非常好使,而且現在能支持越來越多的網絡設備,對于國內的華為等廠商的設備需要做一些定制后才能監控,否

35、則只能看到標準的mib2的信息。最新的版本也能支持分布式的管理功能,也就是remotemonitor的模塊。我沒有讓Zenoss入選網絡監控的一個重要原因是,OpenNMS是純開源軟件項目,它的所有功能都是可用的,而且它是Java程序,配置文件大多是xml文件。對支持非常大量的網絡設備和端口,你需要有的是對Tomcat和Java應用的調優能力,和通過OpenNMS的郵件組來解決bug的能力。OpenNMS里面有非常好的告警事件管理功能,它本身是一個非常好的事件平臺,事件升級、報警、過濾等功能都有。而且現在OpenNMS已經能和HypericHQ做事件集成,HypericHQ的報警事件能傳遞到O

36、penNMS中,這就意味著OpenNMS可以作為一個統一集成的事件管理平臺,在這里對集中管理所有類型的告警事件。HQ是一種Agentbased的監控軟件,對于系統監控而言,很多商業廠商的軟件功能都無法很好的做到單一代理的技術,當然我認為BMC的Patrol是例外,它的單一代理技術是我見到最好的。HQ的單一代理技術意味著,通過在一臺服務器上部署一次代理程序后,其他的工作就都轉到webconsole上了,在那里,你可以配置代理對各種資源的管理,它的代理能發現非常廣泛的基礎架構應用:Web,midtier,DB等。由于HQ是一個商業開源的軟件,所以它對商業基礎架構軟件的平臺支持的非常好,能支持目前流

37、行的所有基礎架構軟件包括各種商業的操作系統、數據庫、中間件;當然它對開源的軟件也能夠監控。監控參數很多,配置容易,有開放的接口提供功能擴展開發。從OpenNMS和HQ的各種圖形上可以很好的評價和監控和各種IT服務的質量。OpenNMS中的界面中最多的就是對某個節點或者上面的某個服務可用性的計算。OpenNMS和HQ實現和完成的功能能為IT交付中的:可用性管理、性能管理和服務水平管理提供實時的數據支持,OpenNMS作為總的事件平臺,同時它還監控所有的網絡設備。HQ用來監控所有重要業務服務器,那些邊緣的非重要的業務服務器或者是客戶端設備也可以交給OpenNMS來管理,它的無代理監控,對這些設備也能管理的不錯。ITSupportOTRS本身是一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論