ITSMS-B-14問題管理程序(ISO20000)_第1頁
ITSMS-B-14問題管理程序(ISO20000)_第2頁
ITSMS-B-14問題管理程序(ISO20000)_第3頁
ITSMS-B-14問題管理程序(ISO20000)_第4頁
ITSMS-B-14問題管理程序(ISO20000)_第5頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

問題管理程序文件編號:ITSMS-B-14版本:A/0頁碼:第7頁共11頁版本更改履歷制訂/修訂審批生效日期A/0新版編制審核批準日期20XX-01-02日期20XX-01-02日期20XX-01-02分發欄:⑴市場中心⑵項目中心⑶模具中心⑷采購部⑸品質中心⑹貨倉課⑺財務部⑻總經辦⑼人力資源中心⑽設備課⑾計劃部⑾生產中心目的本程序的目的是消除或減少系統開發和IT服務過程中事件發生的數量和嚴重程度,防止相同事件的再次發生,從而為企業建立一個穩定的IT環境,提高IT服務的可用性。問題管理包括主動性問題管理和被動問題管理兩類活動。前者的目標是通過找出基礎設施中的薄弱環節來阻止事件再次發生,以及提出消除這些薄弱環節的建議;后者的目標是找出導致以前發生事件的根本原因,以及提出解決措施或糾正建議。范圍本程序適用于ITSMS覆蓋的所有部門。本程序調查基礎設施的配置信息、可用信息、能力信息,來確定引起事件發生的真正潛在原因以及提供的服務中可能存在的故障。問題管理的歸口管理部門是體系中心。術語一.問題:引發一個或多個事件的未知因素。問題通常具有如下特征:一組具有一定關系的已結束的事件一個重大事件問題的根本原因找出后即成為已知錯誤;許多事件往往是有一個問題引起的。問題管理流程的輸出有:變更請求變通方法預防性措施二.已知錯誤:查明事件原因并且已有臨時、應急處理措施的問題。三.主動問題管理:通過改進基礎設施以及提出變更請求來阻止可避免事件的發生。通過找出基礎設施中的薄弱環節來阻止事件的再次發生,以及提出消除這些薄弱環節的建議。分析基礎設施的運行趨勢并找出那些潛在事件以防止其發生。角色與職責信息管理部經理根據服務臺提供的信息找出問題,與開發部部長組織技術工程師一起探討發現IT系統基礎平臺中存在的技術問題。確定并協調必要資源來處理所有(潛在)影響服務級別的所有類型問題,最小化問題的負面影響。領導信息管理部,制定清晰有效的工作流程和準則,確保員工的積極性、技能水平和績效表現。發現造成問題的可能原因,將問題分派給有能力將其解決的IT職能部門。跟蹤問題解決的過程,必要時進行升級以及問題升級后的協調工作。將關鍵問題的解決狀態及時地通報給事業部管理層。提出變更請求來消除事件和問題的根本原因。確保使事件發生時把它的影響降到最小,同時確保根除事件的根本原因從而防止事件的再次發生。與內部和外部支持部門就問題的解決方案和防范進行討論,并確保與他們的良好關系。通過對歷史和現有環境的有效分析以確保IT服務的主動性。提供關于IT服務和客戶支持的正確有效的管理信息,生成有效的管理報表。確保所有相關人員都足夠程度地引入到問題管理的流程中。技術支持工程師通過在某一方面的專業知識和技能(網絡或應用)來支持事件管理的一線工程師和技術組主管,確保事件的快速解決和IT服務的快速恢復。接受來自問題管理經理分派的問題。基于影響度/優先級和分類代碼執行問題分析,在規定的時間范圍內調查可能的事件根本原因,測試解決方案,同時確保問題得以解決。在需要時請其它技術專家介入,以確保問題得以及時解決。協調變更管理功能,實施解決方案.。不但使事件發生時把它的影響降到最小,也使用根除事件的根本原因從而防止事件的再次發生。利用現有IT環境分析歷史數據來改善IT系統和工作方法從而避免潛在問題的發生。在必要時修正事件或問題的影響度和分類編碼。在需要時與外部供應商作接口。參與升級流程。在服務中斷時,盡快提供臨時解決方案,幫助客戶盡快恢復正常工作狀態。提供問題的正確狀態、進展和歷史信息。活動6.1流程圖

6.2主要活動問題管理流程著重于消除事件或減少事件發生,確定事件的根本原因。主要活動包括分析事件、找出問題、分派問題、確定根本原因以及找出解決方案、回顧及關閉,以消除事件或在其發生時降低對用戶或業務的影響。其主要內容如下:6.2.1問題確認與記錄問題確認通常由問題管理負責人指派問題管理小組的成員來完成,其他人員,如能力管理人員也可幫助對問題進行確認,并填寫《問題記錄表》。任何一個由未知原因導致的事件都與某個問題有關,問題的確認需要考慮以下方面的因素:某一事件再次發生,并且有大量發生和加重的趨勢。對基礎設施進行分析可能找出事件發生的薄弱環節一個嚴重事件發生后應納入問題管理尋求永久性的解決。服務級別受到威脅(能力、性能等)已記錄的事件不能與現有問題或已知錯誤發生關聯問題也可在運維過程中提出,例如巡檢過程中發現問題。趨勢分析能夠發現基礎設施需要進一步關注的環節,如通過對歷史數據、報表等進行分析來創建問題。6.2.2問題分類確定問題的性質,按照問題所處區域和類別進行分類,主要有系統、硬件、網絡、其他四大類。其他指的是為由于人員誤操作、文檔錯誤等導致的問題。對問題的分類不是固定的,在問題的生命周期可能發生變化,所以應及時更新關于問題類別的信息。分類問題的分類,原則上與事件的分類相一致。編號一級分類二級分類描述1合同服務應用系統包括視頻會議、視頻監控系統線路及外圍設備及應用系統網絡PC終端PC服務器存儲系統應用軟件公司開發軟件或由公司提供服務的第三方軟件基礎設施電源、空調、門禁、監控2公司設備應用管理系統網絡PC終端PC服務器存儲系統應用軟件基礎設施3公司資產維護硬件送修PC機網絡應用系統公司協同辦公、系統服務分級給問題分配優先級,以保證支持組對問題必要的重視。分級應基于是問題的緊急程度和影響面。問題的嚴重程度定義如下。問題的分級,原則上與事件的分級相一致。事件級別級別定義影響業務范圍影響業務程度業務修復緊急程度一級事件客戶業務中斷,無法工作80%以上客戶業務受影響非常緊急二級事件客戶業務性能嚴重下降50%以上客戶業務受影響緊急三級事件客戶業務性能下降20%以上客戶業務受影響普通四級事件問題請求,業務性能無下降客戶業務可能有潛在影響與客戶協商確定6.2.3問題狀態分類問題管理負責人應綜合考慮問題的緊急度、影響度、風險以及資源、人員技能等因素,將問題進行分派,并對分派后的問題狀態進行跟蹤。為方便問題狀態的跟蹤和查詢,問題狀態分為五種:問題、已知錯誤、已解決、已評審、已關閉五種。問題調研與診斷由問題分析人員進行問題調查和診斷,該過程是個反復的過程,要重復進行多次,而每重復一次都更接近我們想要的解決方案。通常需要在測試環境中重現某一事件,必要時需要技術支持工程師協助分析和診斷。導致問題的原因是多樣的,可能是由硬件和軟件或是網絡引起的,或是文件錯誤、人員誤操作、版本發布不當等導致問題。因此要將問題處理歸入配置管理數據庫進行版本控制。一般情況而言,大部分錯誤與基礎設施的組件相關。一旦找到問題的根源以及與此問題相關的一個或多個配置項,就可建立配置項和事件之間的關聯。之后如果找到了解此問題的應急措施,此問題就轉變為已知錯誤。臨時措施在解決問題的過程中,如果問題導致了嚴重的事件,需提供臨時修復措施。如果臨時措施需要對基礎設施進行改動,必須首先提交變更請求(主要指在找到問題的最終原因之前)。如果特別嚴重或不容耽擱,就必須啟動緊急變更處理程序。錯誤確認與記錄一旦找到問題的根源和與此問題相關聯的配置項,以及處理它的應急措施,問題分析人員可將其狀態轉變為“已知錯誤”,或與某個已知錯誤相關聯。如仍有未解決的事件,問題分析人員可將問題解決情況告知事件管理以便解決事件。錯誤評估問題管理小組應評估以下信息:問題或已知錯誤所需資源處理已知錯誤所需的成本處理已知錯誤可能獲得的收益變更請求的影響度、緊急度綜合以上因素比較不同的解決方案。解決問題的所有活動都應加以記錄以便對其進行監控和確定它們不同時期的狀態。確定解決方案確定對問題而言最合適的解決方案,包括確定是臨時性修復措施還是永久性解決方案,或者二者皆需要。甚至,它可能決定不修復此問題,比如公司自行開發的運維系統出現故障,但是由于公司已決定月底采用新系統,此類情況,修復成本將超出所能獲得的利益,因此可能不會對現有系統進行修改。不管決定何種方案,與已知錯誤有關的信息應該進行記錄并可供事件管理流程使用。實施變更根據確定的最終解決方案,如需變更則提交變更請求,然后通過變更管理流程實施。問題評審用于解決問題、已知錯誤及相關事件的變更實施后,在終止有關記錄工作之前問題管理負責人組織對變更進行實施后評審。對于重大問題,還要另外執行重大問題評審。評審內容包括:驗證與該問題相關的所有事件是否得到最終解決流程中需要改進的事項預防措施問題歸檔將問題管理流程中產生的所有記錄納入問題知識庫,并在問題關閉前更新問題知識庫的相關信息,從而保證配置項之間的一致性、準確性、完整性。監控與跟蹤問題管理負責人負責在問題和已知錯誤的整個生命周期內對其發展情況進行監控,確定并監控其影響度和優先級,必要時調整優先級;監控問題和已知錯誤的分析診斷情況和方案實施情況,同時監控變更請求的執行情況。問題關閉問題成功解決后,問題狀態被標識為“已解決”,問題關閉。6.3.關于主動問題管理問題管理負責人負責主動問題管理,關注服務和基礎設施的質量,識別基礎設施中的薄弱環節或超負荷工作的組件,并分析基礎設施的運行趨勢,找出潛在事件以防止其發生。如果查找的范圍包括若干領域,那么某一領域內防止問題發生而做的努力也必須在其他領域內實施。6.4.度量和報告問題報告與問題管理的范圍密切相關,問題管理報告可包括廣泛的主題,其報告的內容基于一系列的度量指標來實現的,主要有:度量指標:已關閉的問題數量問題管理提出的RFC數量解決問題的時間問題報告的主要內容有:時間報告:問題控制、錯誤控制和主動問題管理三階段分別耗費的時間,以及支持小組和供應商分別耗費的時間。組件質量:有關事件、問題和已知錯誤的詳細情況可用于確定經常發生故障的組件,用以判斷供應商是否履行了合同規定的義務。問題管理流程的有效性:問題解決前后發生的事件數量記錄下來的問題、已知錯誤數量提出并成功執行的變更請求的數量未解決的問題狀態解決方案:對已解決的和下一步將要解決的問題進行總結分析,尋求解決方案以降低問題對業務的影響。改進計劃:和服務質量計劃中規定的問題管理流程目標作比較,識別差距,提出改進措施。可通過常規性流程審計改進該流程。7相關文件事件管理程序變更管理程序配置管理程序8引用文件《ISO/IEC20000-1:2011》《信息技術服務管理手冊》9,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論