




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第5章 網格監控第II部分 基本服務本章內容的安排5.1 引言5.2網格監控體系結構 5.3評價準則 5.4網格監控系統概覽 5.5其他監控系統5.6 小結5.7 本章小結8/8/202215.1 引言網格環境是一個復雜的、全球分布式系統,它可能涉及到數量巨大的、千差萬別的、地域上分布的應用所使用的部件。這里所指的部件包括了應用所需要的所有軟、硬件服務和資源。這些部件的差異性以及大量的用戶數極易導致故障、失敗和超載的發生。因此,需要采用一些合理的機制對這些部件和它們的使用情況進行監控,希望能檢測到導致瓶頸、故障或失敗的原因。網格監控最關鍵的是提供健壯的、可靠的、有效的環境。8/8/202225
2、.2 網格監控體系結構 網格監控體系結構GMA2由三種類型的部件組成:目錄服務(Directory Service):用于生產者、消費者以及監控數據(事件)的發布和發現;生產者(Producer):由產生性能數據的傳感器組成;消費者(Consumer):對性能數據訪問和使用。8/8/20223消費者 消費者可能是接收來自生產者的監控數據(事件)的任何程序。消費者經歷的步驟:定位事件:消費者根據新的事件類型來檢索一種摘要知識庫。這種摘要知識庫可能是GMA目錄服務的一個組成成分。定位生產者:消費者檢索目錄服務去尋找一個合適的生產者。查詢初始化:消費者向生產者請求事件,并作為響應的一部分被傳遞。訂閱
3、初始化:消費者能為它們感興趣的某些確定類型的事件向生產者訂閱。終止訂閱: 消費者向一個生產者終止訂閱。注冊:消費者能增加/移除/更新一個或多個在目錄服務中的條目,這些條目描述了消費者可接受生產者事件。接受查詢:消費者也能接受來自某一生產者的查詢請求。當然這里的“查詢”也包含了響應。接受訂閱:消費者接受來自一個生產者的訂閱請求。一旦有來自消費者的請求,生產者將被自動通知。取消訂閱:消費者接受來自生產者的取消訂閱請求。一旦成功,對應于此訂閱的任何事件不再被接受。 8/8/20224目錄服務 GMA目錄服務提供關于生產者或接受請求的消費者的信息。 目錄服務提供的功能概括如下:查詢授權:對想要進行查詢
4、的消費者建立標識(通過授權)。修改授權:對想要修改條目的消費者建立標識。添加:在目錄中添加一條記錄。更新:更改目錄中記錄的狀態。移除:移除目錄中的一條記錄。查詢:執行來自生產者或特定類型的消費者的查詢,可能附帶一些事件元素的確定值。消費者可指出是否僅有一種結果返回還是多個結果返回。一種可選的擴展允許消費者獲得多個結果,每次在子查詢中使用“獲取下一個”來獲得一個元素。8/8/202258/8/20226生產者 一個生產者是向消費者發送監控數據(事件)的軟件組件。 生產者經歷的步驟:定位事件:檢索事件目錄服務以獲得一個事件的描述。定位消費者:檢索事件目錄服務以獲得一個消費者。注冊:在事件目錄服務中
5、增加、移除、更新一個或多個事件描述條目,這些事件是生產者將要接受的來自消費者的事件。接受查詢:接受來自消費者的查詢請求。在回復中返回一個或多個事件。接受訂閱:接受來自消費者的訂閱請求。在回復中返回事件流信息的進一步細節。取消訂閱:接受來自消費者的取消訂閱請求。一旦成功,與此訂閱相關的事件不再發送。查詢初始化:向消費者發送事件的單一的集合,作為“請求”查詢的一部分。訂閱初始化:請求向消費者發送事件,它們以流的形式傳遞。在回復中返回事件流信息的進一步細節。取消訂閱初始化:中斷消費者訂閱。一旦成功,與此訂閱相關的數據不再發送。 8/8/20227監控數據1.時間相關的數據帶時間戳的動態數據來源于伴隨
6、有幾個規則消息和間隔信息(由與采樣頻率相關的計數器提供)的流。這種數據包含了性能事件和狀態監控。帶時間戳的異步數據通常指示一個事件何時發生。這種數據用來表示警報和檢查點通知。時間無關數據包括靜態信息,例如操作系統類型和版本號、硬件特性或監控信息的更新時間。這里的所說的“靜態”是指數據幾乎是不變的,并且通常是由操作員更新的。而“動態”指的是類似狀態或性能的信息,它們隨著時間的變化而改變。2.信息流數據生產者消費者之間的直接流,在數據的傳遞中不涉及中間部件。監控是主動的還是被動的,取決于通信是由生產者還是消費者發起的。GMA文檔描述了三種類型的交互:發布/訂閱;查詢/響應通知間接數據分布在中央倉庫
7、中。這也許對靜態信息是有用的,因為數據量相對較少并且很少更新,而信息發布或發現的成本和信息歸集的成本相當。在這種情形下,交互是通過將生產者的發起通知交給目錄服務,然后消費者再從目錄服務獲得數據。沿著一個工作流路徑,產生監控信息并在本地存儲。這些數據被添加了標記使得能與工作流的特定部分相對應。在作業結束時,監控信息、標記以及工作流的輸出也許會返回給消費者或丟棄。通過跟蹤作業路徑,消費者可以收集標記和監控數據,這些數據混合起來可提供概括性的視圖或獨立地發送給消費者。3.監控種類靜態監控,以使用的時間和帶寬來計算,信息歸集的成本小于或等于資源發現的成本,例如向中央目錄服務發出查詢以尋找信息生產者。這
8、些信息幾乎不變并且中央倉庫能直接提供所需要的信息。這類信息包括系統配置和描述信息。動態監控,一般信息歸集的成本較高并且通常涉及到時間序列,如提供連續數據流或需要大量的數據。這類的典型例子是網絡和系統的性能監控。工作流監控,隨著作業或任務的處理過程產生了大量的可變數據,并且消費者對這些數據的全部或部分感興趣。例如作業或任務處理的靜態信息、錯誤報告以及作業或任務的追蹤。8/8/202285.3 評價準則可擴展的廣域監控資源監控交叉API監控同類數據表示信息檢索運行可延長性數據的篩選和融合開放和標準協議安全性 軟件可用性和獨立性項目的活動性和支持性;許可8/8/202295.4 網格監控系統概覽Au
9、topilot1.概述Autopilot5,6是一種對并行和分布式計算資源進行實時適應控制的基礎結構。Autopilot的目標是創建一種提供帶有實時適應控制的分布式應用環境,這樣能基于請求模式和觀測到的系統性能來自動選擇和配置資源管理特性。 2.一般體系結構 Autopilot監控部件包括:傳感器(Sensor):對應于GMA中的生產者;在監控的主機上安裝傳感器來捕獲應用和系統性能信息。傳感器經配置可完成數據緩存、本地數據簡化(傳遞之前)、頻率改變(與遠程用戶之間信息通信的頻率)。在啟動之前,傳感器通過Autopilot管理器AM(Autopilot Manager)進行注冊。激勵器(Actu
10、ators):對應于GMA的生產者并提供指導遠程應用行為和控制傳感器操作的機制。在啟動之前,激勵器通過Autopilot管理器AM進行注冊。Autopilot管理器AM:履行GMA的注冊義務;它對遠程傳感器和激勵器的注冊請求提供支持,并且為用戶提供了定位資源信息的機制。8/8/2022108/8/2022113.體系結構:可擴展性和故障容錯4.監控和可延長性5.數據請求和表示6.檢索和標準化7.安全性8.軟件實現8/8/202212分布式環境的控制和觀測(CODE) 1概述 CODE13,14是一種類GMA體系結構的系統,它試圖提供一種可擴展的方法來監控和管理網格。CODE允許管理員監控分布式
11、資源、服務和應用,并對遠程主機遠程執行預先定義好的系統任務而引起的狀態變化做出反應。CODE是由國家航空和宇宙航行局NASA(National Aeronautics and Space Administration)的Ames研究中心15開發的,并在NASA信息能源網格IPG(Information Power Grid)16中加以使用來保證資源的正常運作。2一般體系結構它的核心結構由觀測器、控制器、管理器以及注冊器組成:在監控的主機上安裝傳感器來收集監控數據。每個傳感器產生一種或多種監控事件,這些事件包含了由傳感器命名計劃所描述的監控信息。可通過查詢傳感器來判斷它們產生的信息類型。傳感器僅
12、對來自傳感器管理器SM(Sensors Manager)的直接請求作出響應并收集資源信息。傳感器管理器SM對本地的傳感器進行管理并決定執行哪個傳感器以滿足用戶的請求。傳感器管理器接受來自觀測器(Observer)的查詢請求和訂閱。為了對特定的查詢做出響應,傳感器管理器向適當的傳感器發送請求并通過觀測器的生產者接口向請求的客戶返回結果。觀測器將傳感器管理器和傳感器機制嵌入到監控的主機上,并提供生產者接口PI(Producer Interface),消費者可通過此接口對收到的監控信息進行查詢。PI支持查詢響應和基于訂閱的請求這兩種方式。觀測器根據用戶的標識、客戶位置以及信息類型來實施訪問控制機制。
13、控制器(Controller)位于監控的主機上并提供一些機制允許消費者在此臺主機上執行一些動作。控制器由一個激勵器(AM)組成,它與安裝在本地的許多執行特定功能的激勵器部件相互作用。例如,啟動操作系統daemon。類似傳感器,激勵器是被動部件,僅當它們的管理者請求時才執行動作。管理器(Manager或消費者)與觀測器相連接來查詢它所提供的監控數據、事件訂閱或修改事件訂閱。管理器與控制器相連接來修改遠程主機上的Daemons或應用的執行。用戶可在管理器內實現管理邏輯,這樣,通過控制遠程主機自動對監控環境的變化做出響應。例如,當管理器檢測到某一個遠程作業管理器不響應時,其自動命令遠程控制器殺死所有
14、的與此作業有關的進程并啟動一個新的實例。管理邏輯能用Java代碼來實現或通過采用適當管理規則的專家系統來實現。注冊器(Registry)存儲觀測器和控制器的位置信息,并對它們提供的傳感器和激勵器進行描述。管理器使用注冊器定位遠程部件。8/8/2022138/8/2022143體系結構:可擴展性和故障容錯4監控和可擴展性5數據請求和表示 6檢索和標準化7安全性8軟件實現8/8/202215GridICE1.概述GridICE18-20以監控網格資源為目標,目的是為了分析資源的使用、行為和性能。該項目是為了為用戶提供故障檢測報告、服務級協議違規以及用戶定義事件的機制。GridICE傾向于把網格信息
15、服務GIS(Grid Information Services)和目前的使用的Globus MDS221,22集成起來發現新的資源。 2.一般體系結構GridICE的分層結構在圖5.5中給出,它由下列層次構成:度量服務MS(Measurement Service):使用EDG Lemon 監控基礎結構23對資源查詢并在內部的中央倉庫中緩存信息。要在每一個監控的資源上安裝Lemon代理,從而對個性化的傳感器部件的操作進行控制。傳感器執行本地腳本或應用找回資源信息,這些信息是要在GLUE的擴展版本中輸出的。GLUE的擴展版本使用角色來對計算機提供的服務進行描述,例如作業提交或代理服務。必須對傳感器
16、進行個性化的配置,從而對主機產生的資源信息進行廣告、收集和格式化。基于資源的角色,發布服務Pub(Publisher Services )為用戶分類資源。發布服務Pub(Publisher Services)通過在網格信息服務(GIS)中插入最新的資源值把捕獲到的資源信息提供給客戶。附帶地要求GIS向用戶發布GLUE命名計劃的定義。GIS的使用傾向于給用戶提供一個獲取GridICE監控信息的公共接口。目前,GridICE使用Globus MDS2。數據收集服務DCS(Data Collector Services)收集并永久保存歷史監控數據。資源檢測部件周期地掃描本地MDS2,從而自動檢測到適
17、于監控的新的資源。新資源的聯系信息傳遞給調度部件,調度部件周期地查詢資源去發現它們提供的信息。收集到的資源信息永久存儲在GridICE服務器上。檢測和通知服務DNS(Detection and Notification Services)提供了事件檢測和通知等配置機制(采用Nagios28服務提供的事件機制和主機監控程序)。DNS允許對預先定義的事件集進行檢查并發送通知給用戶。數據分析器DA(Data Analyser)提供性能和效用分析并產生統計輸出。表現服務PS(Presentation Service):為了滿足不同級別用戶的需要,提供了一種基于角色的Web接口的資源視圖。例如,對一個虛
18、擬結構的管理者來說,它呈現所有可用的資源以及正在執行的作業的視圖。對一個網格站點管理者來說,該視圖指出了本地資源的狀態,而這種用戶視圖也許包含了如可訪問的處理機級別等細節信息。8/8/2022168/8/2022173體系結構:可擴展性和故障容錯4監控和可延長性5數據請求和表示 6檢索和標準化7安全性8軟件實現8/8/202218網格門戶信息倉庫 1.概述 網格門戶信息倉庫GPIR(Grid Portals Information Repository)的目標是對來自網格資源的信息進行事先獲取、歸集并緩存到一個中心場所,從而提供對網格門戶的開發支持。 2.一般體系結構GPIR信息提供器GIP(
19、GPIR Information Provider)在監控的資源上運行,獲取本地信息并輸出XML文檔(采用某一種命名計劃)。用戶把XML文檔提交給GPIR攝取器(GPIRIngester);如果這些XML文檔采用一種注冊過的命名計劃,那么存儲到GPIR數據庫中。提供了示例的客戶端來自動完成這些步驟。GPIR查詢(GPIRQuery)服務為用戶提供了一種接口來查詢緩存在數據庫中的信息。可通過資源或虛擬結構名來查詢資源。查詢請求用事先定義好的一種命名計劃的名字進行公式化,例如“load”表示機器裝載,“services”表示在系統上執行的可用服務。GPIR查詢服務從數據庫中找回信息并把這些信息以X
20、ML文檔的形式返回給用戶。GPIR管理用戶GAC(GPIR Admin Client)是基于Web的管理級用戶,它定義虛擬結構并管理資源信息。GAC能以手工方式提供資源相關的附加信息,例如一種資源的物理位置以及系統管理員的聯系方式等細節信息。 目前,GPIR定義了9種命名計劃,描述如下:靜態主機細節,包括主機名、它的結構、位置以及管理員的聯系細節。主機裝載細節,包括CPU和內存的平均數。主機狀態:上線、下線以及不可達。資源的停工期。作業信息,包括隊列、作業狀態以及約束條件。主機MOTD報文。一簇計算節點的節點狀態信息。一系列預先定義的網格服務的狀態(通過、失敗、超時):Globus Gatek
21、eeper、GRAM 、GIIS、GRIS、GridFTP、NWS以及批作業提交。網絡氣象服務NWS(Net Weather Service)的帶寬和延遲的度量。8/8/2022198/8/2022203體系結構:可擴展性和故障容錯4監控和可延長性5數據請求和表示 6檢索和標準化7安全性8軟件實現8/8/202221GridRM1.概述 GridRM36,37是一種通用的開放源代碼網格資源監控框架,設計用來獲取各種網絡設備和服務的資源數據,并向各種用戶以他們需要的形式提供信息。 2.一般體系結構GridRM采用層次的體系架構,擁有一個全局層和多個的本地層,每一個本地層擁有一個網關來訪問本地站點
22、的資源信息(見圖5.7):命名方案NS(Naming Schema)定義資源的語義。默認情況下,GridRM采用GLUE來定義基于計算的資源的屬性和數值。驅動程序采用命名方案把來自異類資源的原始數據轉換成一種標準形式。驅動程序(Driver)是模塊化的插件程序,用來從本地監控代理找回所選擇的信息。本地層(Local Layer)提供對本地資源的實時信息和歷史信息的訪問。管理員與本地層交互來配置驅動程序、命名方案以及資源接口。全局層(Global Layer)提供網格站點或VO與GridRM網關之間的交互,采用GMA著名的輕量級實現jGMA40,41。GridRM網關就是GMA生產者,通過GMA
23、目錄注冊并對消費者的資源信息請求做出響應。接受SQL格式的請求并將請求轉交給本地層加以處理。來自本地層的結果被加工成XML格式并返回給消費者。全局層給消費者提供了訪問控制機制并負責控制信息發布。大的網格站點或VO也許擁有多個網關,在這種情形下,構造網關的分層結構來提供資源信息。消費者與網關在全局層交互。使用GMA注冊器定位網關,采用SQL語法查詢它們的資源。消費者可使用注冊器發現當前網格站點上可用的資源,然后直接查詢這些資源。8/8/2022228/8/2022233體系結構:可擴展性和故障容錯4監控和可延長性5數據請求和表示 6檢索和標準化7安全性8軟件實現8/8/202224Hawkeye
24、1 概述Hawkeye43是一種監控工具,由威斯康星大學開發,提供了監控分布式計算機集合的機制來獲取基于計算機的資源信息。Hawkeye的設計目標包括:以一種統一的、可擴展的方式找回主機資源信息以及在監控的主機上自動執行與觀測條件相應的任務的能力。盡管Hawkeye基于Condor項目44的技術以及采用分類廣告技術ClassADS(Classified Advertisement)45來收集和發布資源信息,但是它打包成了一個獨立的系統。Hawkeye收集到的數據對應用以及管理監控資源的用戶來說是可用的。配置Hawkeye主要用來監控威斯康星大學的Condor池。8/8/2022252 一般體系
25、結構8/8/2022263體系結構:可擴展性和故障容錯4監控和可延長性5數據請求和表示 6檢索和標準化7安全性8軟件實現8/8/202227監控和管理的Java代理(JAMM)1 概述JAMM46,47是廣域的GMA類系統,使用傳感器收集和發布計算機主機監控數據。用戶可控制遠程傳感器的執行并以帶時間戳的事件形式接收監控數據。 8/8/2022282 一般體系結構傳感器(生產者)在主機系統上執行并收集來自本地執行進程的監控數據。數據收集來源于一旦執行就一直存在的進程或連續執行的進程。啟動時,傳感器通過目錄服務進行注冊。傳感器是產生帶時間戳監控事件的任何應用,在整個系統中這些事件用作傳播數據的手段
26、。傳感器管理器SM(Sensor Manager)控制傳感器的執行以及傳感器目錄的注冊。SM提供一種GUI,用戶通過它可配置傳感器的執行。能指令傳感器連續或動態地執行,來響應SM GUI或端口管理器代理PMA(Port Manager Agent)的用戶請求。基于目前在主機上執行的應用,PMA判定執行哪一個傳感器。PMA假定應用是由位于一個已知端口上的SM GUI遠程啟動的。例如,當遠程用戶請求啟動了處理器加強應用時,PMA能啟動CPU監控傳感器。事件網關EG(Event Gateway)為用戶提供了控制和訂閱傳感器的機制。單一的網關可用作與多臺主機之間的接觸點并提供請求處理和事件篩選責任。一
27、個EG對監控資源的事件進行緩存并為用戶提供一些API來查詢特殊的監控數據。EG支持源自消費者的查詢-響應和流請求。消費者可請求所有的事件數據或僅請求某種確定類型的事件。傳感器目錄SD(Sensor Directory)用于發布本地傳感器的位置以及它們對應的網關信息。消費者使用這個目錄來判斷哪個傳感器是可用的以及它們必須訂閱的EG,從而接收一個傳感器的輸出。事件消費者EC(Event Consumer)使用SD對傳感器定位并訂閱來自適當EG的事件。消費者處理事件數據并把它轉換成定制的資源信息,這些信息能被可視化或進一步加工處理。8/8/2022298/8/2022303體系結構:可擴展性和故障容
28、錯4監控和可延長性5數據請求和表示 6檢索和標準化7安全性8軟件實現8/8/202231MapCenter1 概述MapCenter5356通過在用戶Web瀏覽器中使用圖形地圖、邏輯視窗和計算資源樹來監控和顯示整個網格中可用的服務。MapCenter使用一種可擴展的模型來可視化不同級別的資源(基于部門、組織和虛擬結構視圖)。 8/8/2022322一般體系結構MapCenter體系結構(見圖5.10)是由一個中央監控服務器組成,該服務器由數據存儲、監控層和表示層組成。8/8/2022333體系結構:可擴展性和故障容錯4監控和可延長性5數據請求和表示 6檢索和標準化7安全性8軟件實現8/8/20
29、2234監控和發現服務 1 概述 監控和發現服務MDS3(Monitoring and Discovery Service)是為Globus聯盟63開發的Globus工具箱3.x(GT3)提供的信息服務。 GT3基于開放網格服務體系結構OGSA64,部件的實現遵循開放網格服務基礎結構OGSI(Open Grid Services Infrastructure)65。 8/8/2022352一般體系結構MDS3是一個分布式信息系統,由網格服務的資源層和聚集層組成.8/8/2022363體系結構:可擴展性和故障容錯4監控和可延長性5交叉API監控6數據請求和表示7檢索和標準化8安全性9軟件實現8/
30、8/202237Mercury 1 概述Mercury67-69是一種監控系統,其目的是提供應用導航和自我調整,性能分析以及預測。Mercury對 GMA體系結構進行了擴展,提供了一種通用網格監控基礎結構,使用激勵器和激勵器控制器來影響監控系統的操作。 8/8/2022382 一般體系結構Mercury由本地監控器、主監控器以及監控服務組成。 8/8/2022393體系結構:可擴展性和故障容錯4監控和可延長性5數據請求和表示 6檢索和標準化7安全性8軟件實現8/8/202240網絡氣象服務 1概述網絡氣象服務NWS38,73(Network Weather Service)的目標是在分布式系統
31、內提供最近的歷史信息以及計算機和網絡性能的短期預報。 8/8/2022412一般體系結構NWS的結構由許多分布式部件組成,包括名字服務器、內存、預報器和傳感器。8/8/202242名字服務器NS(Name Server)是一個中央注冊機構,包含了NWS部件的地址綁定。NS是系統的惟一的要求部件擁有其地址預先知識的成分。所有的其他NWS部件通過NS來定位并向NS周期性注冊。傳感器安裝在監控主機上并周期地把帶有時間戳的本地主機信息和網絡性能傳遞給內存部件。內存,也稱為持久狀態,提供對度量信息的存儲并為傳感器和用戶提供找回服務。內存存儲來自個體傳感器的帶時間戳的資源觀測數據。這些信息保存到本地磁盤,
32、采用了循環緩存技術,因此只能獲得最新的資源信息。如果內存部件失敗,當內存重啟后,最近信息的歷史數據對用戶來說是可用的。為用戶提供了一種簡單的請求機制來讀取信息。預報器對來自內存的資源觀測數據進行處理并根據給定的事件幀執行預報。8/8/2022433體系結構:可擴展性和故障容錯4監控和可延長性5數據請求和表示 6檢索和標準化7安全性8軟件實現8/8/202244關系型網格監控體系結構1概述關系型網格監控體系結構R-GMA76-79(Relational Grid Monitoring Architecture)是在歐洲數據網格項目57中開發的,是一種網格信息和監控系統。 8/8/2022452一
33、般體系結構R-GMA擁有一個分布式體系結構,由代理、生產者、消費者、生產-消費器,注冊器(仲裁器)以及命名方案組成。 8/8/2022463體系結構:可擴展性和故障容錯4監控和可延伸性5數據請求和表示 6檢索和標準化7安全性8軟件實現8/8/202247 visPerf1概述visPerf81是一種可視化網格監控系統,它采用遠程傳感器從日志文件中提取信息,也可與已存在的網格中間件交互以達到遠程觀測性能的目的。 8/8/2022482一般體系結構visPerf NetSolve 監控系統(體系結構見圖5.15)是一種由Java applet監控器和遠程傳感器組成的分布式應用。8/8/202249
34、3體系結構:可擴展性和故障容錯4監控和可延長性5數據請求和表示 6檢索和標準化7安全性8軟件實現8/8/2022505.5其他監控系統 Ganglia Ganglia29是一種分布式監控系統,用于高性能計算系統的監控,例如簇和網格。 Ganglia監控Daemon(gmond)是一個多線程daemon,它在每一個被監控的簇節點上運行;它有4個主要的職責:監控主機狀態變化;多播相關變化;通過一個多播頻道偵聽所有其他的Ganglia節點狀態信息;并且以XML格式描述簇的狀態以答復請求。8/8/2022518/8/202252GridMonGridMon86是網絡性能監控工具箱,用來定位故障和無效性
35、。該工具箱由一系列的工具集合而成,這些工具提供了關于網絡性能不同方面的度量:連接性、包內抖動、包丟失、封包來回時間RTP(Round Trip Time)、TCP和UDP吞吐量。 8/8/202253GRM/PROVE GRM88是一種在線監控工具,用來監控網格上運行的并行應用報文的傳遞性能。 8/8/202254Nagios Nagios28是一種系統和網絡監控應用,它通過外部的“插件”來操作,這些“插件”向Nagios發布狀態信息。Nagios的一些特性如下:監控網絡服務(SMTP、POP3、HTTP、NNTP以及ICMP)。監控主機資源(處理器負載、磁盤使用情況等)。當服務或主機出現問題
36、或問題得以解決時給出聯系通知(通過電子郵件、頁面或用戶定義的方法)。可選Web接口用來瀏覽當前網絡狀態、通知、歷史問題和日志文件。8/8/202255NetLogger NetLogger(Networked Application Logger)48是一個工具集,用來監控應用對應用通信路徑、應用、操作系統、主機和網絡的所有元素的行為。 NetLogger由四部分組成:一個API和用于簡化應用級事件日志產生的函數庫;收集和存儲日志文件的工具集;主機和網絡監控工具集;日志文件可視化和分析工具 。 8/8/202256SCALEA-G SCALEA-G90是一個網格監控和性能分析系統。SCALEA
37、-G基于GMA體系結構,它作為OGSA19服務的子集來實現,這些服務在線管理各種各樣的計算和網絡資源以及應用的監控和性能分析。已經開發了一些源代碼和動態指令來執行應用的profiling和跟蹤。 8/8/202257SCALEA-G由以下部分組成:目錄服務用于發布和檢索生產者和消費者的相關信息以及它們所產生的數據的類型和特性的信息。歸檔服務是一個數據倉庫,用來存放監控數據以及其他部件收集的和分析的性能結論。傳感器管理服務控制和管理傳感器倉庫中的傳感器活動,注冊給它發送目錄服務數據的傳感器信息,接收并緩存傳感器產生的數據,支持數據訂閱和查詢并向指令服務發送指令請求。指令服務用于指令應用,在源代碼
38、級采用源代碼指令服務或在運行時通過增變器服務動態地指令。用戶服務提供了管理其他SCALEA-G服務和在這些服務中訪問數據的接口。此外,它提供了方便性能數據分析的功能。系統傳感器監控計算服務和網絡服務,如網絡連接、硬盤、內存使用以及CPU的可用率。應用傳感器用于測量代碼區的執行行為并監控應用中的事件。傳感器實例向傳感器管理服務遞交它們收集到的數據。所有的傳感器擁有一些共同的特性,如傳感器定位符、數據方案和參數。消費者服務控制傳感器管理服務的活動,例如傳感器何時訂閱、取消訂閱或查詢目錄服務。指令中介器用作用戶間或使用源代碼指令服務的工具間通信的一種中介代理(基于SCALEA指令服務)。性能分析器用
39、來分析消費者服務收集到的數據并把這些結果返回給用戶。注冊器服務用來注冊關于服務實例的信息。8/8/2022585.6 小結資源類別 所評價的項目(CODE、GPIR、GridRM、JAMM、MDS、Mercury、R-GMA以及visPerf)中的大多數都提供對主機、服務以及網絡資源信息訪問的功能。余下的項目,象GridICE和MapCenter提供計算機和服務監控功能,Hawkeye和NWS提供了計算機和網絡監控功能,而Autopilot關注計算機主機監控。本地代理 除了GridRM、MapCenter、MDS3和R-GMA外,所有的系統要求在監控發生之前安裝它們自己的代理。GridRM和M
40、apCenter采用一系列本地協議與資源之間進行交互。例如, GridRM驅動程序提供與SNMP、Ganglia和NWS代理之間交互。MapCenter采用安裝在其服務器上的傳感器來探知遠程MDS2、Tomcat和ICMP主機的可用性。MDS3一般與安裝在監控資源上的網格服務交互;如,MDS3索引服務包含了一些機制,允許本地執行代碼插入GLUE格式的信息,這些信息可用來與Ganglia交互。R-GMA提供一種通用傳輸機制來發布、定位和使用監控信息;開發人員自由實現生產者,因此潛在地需要與監控資源上的本地代理連接以找回信息,例如,從遠程資源找回Ganglia數據的規范生產者。8/8/202259
41、體系結構 從體系結構的角度來看,所評價的這些項目可分為GMA類系統和非GMA類系統。有9個項目(Autopilot、CODE、GridRM、JAMM、MDS3、Mercury、NWS、R-GMA和visPerf)提供GMA類體系結構,故它們應當是可擴展的和故障容錯的,并且理想上是可互操作的。盡管是這種情形,但事實上這些系統的所有實現并未達到這些目標。非GMA類系統包括GPIR、GridICE、Hawkeye以及MapCenter。互操作性 盡管大多數系統具有GMA類體系結構,但不經過相當大的努力互操作性是不可能的得到的。GMA沒有提供標準的無線協議或注冊API的足夠細節。因此,項目僅以一種粗糙的方式來遵循GMA,它們各自定義自己的特殊協議格式和注冊功能。相似數據表示 系統也許直接支持把原始資源數據轉換成標準格式,或簡單地要求系統中使用的數據必須由資源生產者首次明確地加以轉換。所評價的項目分為直接提供規范化手段獲得標準信息的系統、要求輸入標準信息的系統、對原始數據操作
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 系統集成考試經驗分享試題及答案
- 初中筆試試題分析及答案
- 復習成果中級社會工作者試題及答案
- 生產分包商管理制度
- 光伏采購管理制度
- 殺蟲公司客服管理制度
- 醫藥公司配送員管理制度
- 產品準入管理制度
- 監理公司總工辦管理制度
- 護理服務安全管理制度
- 2025屆河南省青桐鳴5月全真模擬卷·高考考前適應性考試-生物試題(含答案)
- 辦公軟件MS Office應用試題及答案
- 人員結構分析總結模版
- 農村三資管理
- 2025年“鑄牢中華民族共同體意識”知識競賽題庫及答案
- 2024年湖南出版中南傳媒招聘筆試真題
- 合肥市2025屆高三年級5月教學質量檢測(合肥三模)生物試題+答案
- 建筑節能材料試題及答案
- 7 什么比獵豹的速度更快 第二課時 課件
- 青馬工程筆試試題及答案
- 重大活動保供電工作流程
評論
0/150
提交評論