銀行數據中心運維轉型.docx_第1頁
銀行數據中心運維轉型.docx_第2頁
銀行數據中心運維轉型.docx_第3頁
銀行數據中心運維轉型.docx_第4頁
銀行數據中心運維轉型.docx_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、銀行數據中心運維轉型銀行數據中心運維轉型1一、銀行數據中心運維的發展和演進21.1單一數據存儲階段21.2數據集成管理階段21.3智慧運營階段2二、城商行運維的痛點分析32.1運維制度不規范32. 2運維流程不合理32. 3運維技術水平低42. 4應急管理不高效42.4. 1風險防范意識不高4災備體系不清晰4系統應急預案不完善5三、城商行運維轉型的思考和對策53.1戰略層面一一管理層關注53. 2戰術層面一一做合規的事63. 3實操層面一一正確地做事63. 1運維人員62.3. 2運維流程6運維技術7四、小結7一、銀行數據中心運維的發展和演進近年來,隨著移動互聯網、大數據、云計算、AI技術等金

2、融科技業態 逐步向傳統金融領域滲透,銀行業務系統越來越龐大,系統之間的關聯越來 越復雜,金融科技的不斷發展一方面為傳統銀行業的跨越升級插上了騰飛 的翅膀,另一方面也給數據中心運維帶來了極大挑戰。業務的高速增長始終 離不開運維的強有力支撐,銀行數據中心經歷了從部件級運維到一體化發 展的各個階段,數據中心的內涵也從單一數據存儲場所向智慧運營不斷演 進。1.1單一數據存儲階段在單一數據存儲階段,數據中心的運維重點是服務器、存儲和網絡,主 要承擔的功能是數據存儲和管理,集中存儲了銀行的業務數據。處于此階段 的數據中心功能比較單一,整體可用性低,業務連續性要求不高,僅僅便于 數據的集中存放和管理,面向單

3、套業務系統的存儲和應用,運維管理粗放, 資源臺帳不清,運維人員時刻處于“火線”邊緣。1.2數據集成管理階段數據集成管理階段是數據中心運維管理的轉型階段,此時數據中心組 織專門的人員進行集中維護,注重運維效率,為業務系統提供有效支撐。有 些做得比較好的數據中心己經開始集成CMDB,自動化集成ITSM流程,通過 云服務實現自動化的服務交付,對系統維護上升到了管理的高度,從事中干 預、事后處理慢慢過渡到事前預防。業務連續性要求較高,IT系統的可用 性己經作為部門KPI列入年度考核,數據中心要求有較高的穩定性和可靠 性。1.3智慧運營階段處于智慧運營階段的數據中心,從注重運維效率轉變為更加注重運維 質

4、量,業務與科技深度融合,業務系統對數據中心的運維要求己不僅僅是支 撐,而是提供安全、持續、穩定、有效的科技服務,此階段的數據中心己經 演進成了金融服務提供中心,服務流程趨于規范化、標準化、統一化,并通 過信息技術實現自動化管理。數據中心集成、管理和維護了各種資源,從技 術運維轉向了技術運營,實現基礎設施和服務實時交付,保證計算資源價值 最大化。數據中心高可用性和業務連續性要求高,重要信息系統應用級災備 覆蓋率達到100%,且具備有效的異地數據級災備,災備接管時間為分鐘級。二、城商行運維的痛點分析中小型城商行受制于資產規模、科技投入、科技人才匱乏等因素,在科 技人員配置和資金投入時一般都是重開發

5、輕運維,運維管理粗放,這就不可 避免地暴露了很多運維的問題和痛點。2. 1運維制度不規范中小型城商行處于運維發展的初級階段,運維制度、操作流程、應急預 案、災難恢復計劃書等制度性文件制定之后就束之高閣,沒有及時根據實際 情況進行修訂更新,使得運維工作無章可循,運維操作做不到規范化、標準 化。運維制度不規范的數據中心,人人都有一套運維標準,同樣的事情不同 人處理都存在差異,各崗位職責邊界界定不清,崗位之間協同性差,做事互 相推諉,甚至怕擔責任少做少錯,緊急問題得不到有效處置,從而運維事故 頻發,帶來極大的安全隱患。2. 2運維流程不合理如果制度是“心臟”,那流程就是“血液”,它貫穿整個工作范疇,

6、引 導運維工作,界定具體的管理職責,運維流程的有效性和可操作性直接影響 了運維質量和運維效率。數據中心需要制定切合自身的、實用的流程,缺乏 有效流程管理的數據中心,故障響應時間慢,故障定界定位難,故障處理缺 乏統一有序步調,問題跟蹤方式自成一派。缺乏流程指引就擺脫不了 “煙囪 式”運維,或“救火式”運維,每位運維人員都是無頭蒼蠅一般的“救火隊 員”,增加了人為操作風險。如今大多數中小型城商行的數據中心都部署了各類運維支撐工具或平 臺,比如ITSM、自動監控平臺、堡壘機、口志管理平臺、災備切換平臺等, 但大多數運維場景下,這些工具平臺各自為政,沒有串聯形成體系,相互之 間缺乏有效的流程誑行編排和

7、管理,流程和工具的銜接存在斷層,協同調用 依賴人工進行,增加了運維投入但卻沒有簡化運維。2. 3運維技術水平低在實際操作層,技術是運維的骨骼,強硬的技術實力是運維體系的底座 支撐。近年來,中小型城商行業務迅猛發展,基礎設施快速膨脹增加了運維 管理的復雜度,業務系統對IT基礎設施提出了更高的運維服務要求。多設 備、多廠家、多產品導致運維復雜度攀升,為達到高效運維,就必須利用技 術手段為不同技術路線的系統環境提供統一的服務接口,整合事件處理、變 更管理、服務請求、配置管理等多項流程,將流程和操作一體化,同時還需 要熟悉多平臺、多業務、多工具的復合型運維人才。但現實情況是,中小型城商行在運維投入上捉

8、襟見肘,大多數運維手段 還停留在人工階段,自動化運維平臺沒有充分發揮應有的效能,還需過多的 人工干預;在人才聘用方面,低于行業平均水平的薪資無法留住高技能人才, 人員管理不規范、晉升通道不清晰、行業地位低,造成運維人員變動大,維 護人員技能較低。2. 4應急管理不高效銀行業務具有較高的實時性和穩定性要求,一些面向客戶、涉及賬務處 理且時效性要求較高的業務處理類、渠道類和涉及客戶風險等業務的管理 類信息系統己長期處于嚴格的監管之下,若這些重要系統發生非計劃內中 斷,高效的應急管理顯得尤為重要。受限于自身原因,中小型城商行的應急 管理體系建設還不夠全面,沒有形成自上而下的合力,產生了許多突出的問

9、題。2.4. 1風險防范意識不高中小型城商行主要關注主營業務發展,普遍缺乏信息系統風險防范意 識,從上到下對信息系統的應急管理都不夠重視,容易滋生信息系統重大安 全事件,嚴重威脅銀行的正常生產經營,造成聲譽風險。災備體系不清晰應急管理的一個重要組成部分就是災備管理,中小型城商行災備建設 的主要目的,是為了進行災備演練從而應對監管檢查,缺乏對災備體系的統 籌思考和總體架構設計,這將導致災備系統架構不清晰,延展性差,災備資 源只能在演練時使用,正常生產時間段得不到合理利用。系統應急預案不完善應急預案可用性不強,是中小型城商行的通病。大多數應急預案流于形 式,組織架構不清晰,職責分工不明確,可執行性

10、不強;有些應急預案只專 注與操作細節,缺乏總體規劃和統籌安排;經過了數次真實環境下的應急演 練之后,沒有及時總結經驗教訓,同步更新應急預案。三、城商行運維轉型的思考和對策鑒于以上痛點分析,中小型城商行要實現運維轉型,必須要從根本上打 破困局。首先從思想上統一認識,從管理層開始自上而下認可運維工作的重 要性;然后制定并及時維護相關規章制度和操作流程,規范運維操作人員行 為,降低操作風險;最后才是最近提得比較多的,利用技術手段建設集中整 合運維平臺,實現運行、監控、變更、應急等流程一體化、自動化、智能化, 達到智慧運營的目的。具體的思考和對策如下:3.1戰略層面一一管理層關注大部分中小型城商行均沒

11、有配備專職CIO,信息科技部在銀行高級管理 層眼里僅僅是一個巨大的“成本中心”,不會產生實際效益,科技的重要性 并沒有滲透至管理層。隨著銀行業務的快速發展,信息科技風險以及由此帶 來的衍生風險并不亞于系統性金融風險,監管部門對銀行信息科技的監管 也日趨嚴格。若高級管理層可以從戰略層面重視信息科技,將業務與科技深 度融合,關注科技體制健康有序發展,科技賦能業務,組建訓練有素的科技 團隊,就能有效規避各類生產運行風險,助力業務系統持續穩定運行。數據 中心是業務系統的總后方,科技部領導也應重視數據中心運維管理,為數據 中心運維提供動能和驅動力。除了要重視運維,管理層也應該為數據中心運維提供切實可行的

12、指導 思想,主要表現在以下五個方面:一是標準化,要求完善制度制定和修訂, 一切工作按制度執行,有章可循,在操作上嚴格要求規范化、標準化。二是 自動化,進一步提高監控、配置、作業調度等工具使用,提升運維自動化水 平,降低人員操作失誤率和風險。三是集約化,深入推進“大運行”,并統 籌考慮數據中心運維一體化管理工作。四是自主化,加強人員培養和崗位技 能考核,對關鍵系統、關鍵崗位逐步實現自主運維。五是精細化,在運維工 作的各個方面,不斷量化,力求用數字說話,加大量化考核力度。3. 2戰術層面一一做合規的事以戰略規劃為指導思想,戰術層面需做到數據中心即應用,在轉型過程 中逐步將數據中心運維流程合理合規化

13、,實行運維的“全生命周期”管理, 實現運維體系自身的價值。主要表現為:一是提質,數據中心制定服務化, 標準化的運維流程,主動性預測預防,最小化的應用中斷,減少系統故障率, 提升業務系統的用戶體驗度。二是增收,構建應用差異化計費體系,體現運 維體系管道能力,加快商業變現增加收益。三是增效,通過自動化設計提升 運維效率、集約化設計提升數據中心整體資源利用率和復用率,增加CPU算 力負載和網絡負載效率。四是降本,機器不是來取代人,而是將寶貴的人力 成本投入到高價值領域,通過自主化運維提升人員素質,加速人才轉型,降 低綜合成本。3. 3實操層面一一正確地做事運維過程中出現的問題中,人為操作問題和流程設

14、計問題各占40%,技 術問題占20%。因此,在實操層面,如何正確地做事,需要從運維人員、運 維流程和運維技術三方面進行討論。3. 3.1運維人員運維人員包括行內運維人員和運維外包人員,人員組織架構是核心,并 且不斷動態調整。從依賴廠商到自主可控,從標準化到腳本化,從半自動化 到自動化,不管如何調整,最終方向都是要培養自己的運維力量,做到自主 運維。具體需要做到分工明確、權責分明、及時響應。運維人員要有責任, 有擔當,提高自身技術能力,不過分依賴外包,不惹事,也不怕事。3. 3.2運維流程首先,運維工作中的每一個步驟都要有流程、有審批、可監控、可追溯, 與工作相關的流程和規定,一定要經常地,反復

15、地修訂、調整,牢記于心; 其次,充分利用流程,理清崗位職責的邊界,完善標準化流程,對部門能提 供的變更能力做嚴格的梳理;最后,一定要嚴格遵守流程,流程正確+結果 正確才是正確,流程錯誤+結果正確仍然是錯誤,是態度問題;流程正確+結 果錯誤是可以原諒的,最多算能力問題。要建立流程來應對“沒有流程”的 場景,并且嚴格遵守。3. 3.3運維技術運維技術就是運維工具,是各個廠家最熱衷于討論的主題,正如筆者前 面所提,運維技術稍遜于運維人員和運維流程,在運維管理中處于比較重要 的地位。良好的技術手段可以集成現有的分散流程,使得人員工作更加高效、 更易于培訓和控制,還可以減少手工重復性操作的成本,提升對操作的控制 性。各廠家五花八門的運維技術歸結到一點,就是通過統一管理實現數據 中心工具(技術)、流程和制度間創新性融合,構建統一的運維管理技術平 臺,完成設備選型、規劃、上架、故障處置、變更、調優、回

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論