




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、云平臺下的運維體系建設工作內容一、 系統運維系統運維負責IDC、網絡、CDN和基礎服務的建設(LVS、NTP、DNS);負責資產管理,服務器選型、交付和維修。詳細的工作職責如下:IDC數據中心建設收集業務需求,預估未來數據中心的發展規模,從骨干網的分布,數據中心建筑,以及Internet接入、網絡攻擊防御能力、擴容能力、空間預留、外接專線能力、現場服務支撐能力等方面評估選型數據中心。負責數據中心的建設、現場維護工作。網絡建設設計及規劃生產網絡架構,這里面包括:數據中心網絡架構、傳輸網架構、CDN網絡架構等,以及網絡調優等日常運維工作。LVS負載均衡和SNAT建設LVS是整個站點架構中的流量入口
2、,根據網絡規模和業務需求,構建負載均衡集群;完成網絡與業務服務器的銜接,提供高性能、高可用的負載調度能力,以及統一的網絡層防攻擊能力;SNAT集中提供數據中心的公網訪問服務,通過集群化部署,保證出網服務的高性能與高可用。CDN規劃和建設CDN工作劃分為第三方和自建兩部分。建立第三方CDN的選型和調度控制;根據業務發展趨勢,規劃CDN新節點建設布局;完善CDN業務及監控,保障CDN系統穩定、高效運行;分析業務加速頻道的文件特性和數量,制定最優的加速策略和資源匹配;負責用戶劫持等CDN日常故障排查工作。服務器選型、交付和維護負責服務器的測試選型,包含服務器整機、部件的基礎性測試和業務測試,降低整機
3、功率,提升機架部署密度等。結合對公司業務的了解,推廣新硬件、新方案減少業務的服務器投入規模。負責服務器硬件故障的診斷定位,服務器硬件監控、健康檢查工具的開發和維護。OS、內核選型和OS相關維護工作責整體平臺的OS選型、定制和內核優化,以及Patch的更新和內部版本發布;建立基礎的YUM包管理和分發中心,提供常用包版本庫;跟進日常各類OS相關故障;針對不同的業務類型,提供定向的優化支持。資產管理記錄和管理運維相關的基礎物理信息,包括數據中心、網絡、機柜、服務器、ACL、IP等各種資源信息,制定有效的流程,確保信息的準確性;開放API接口,為自動化運維提供數據支持。基礎服務建設業務對DNS、NTP
4、、SYSLOG等基礎服務的依賴非常高,需要設計高可用架構避免單點,提供穩定的基礎服務。二、 應用運維應用運維負責線上服務的變更、服務狀態監控、服務容災和數據備份等工作,對服務進行例行排查、故障應急處理等工作。詳細的工作職責如下所述。設計評審在產品研發階段,參與產品設計評審,從運維的角度提出評審意見,使服務滿足運維準入的高可用要求。服務管理負責制定線上業務升級變更及回滾方案,并進行變更實施。掌握所負責的服務及服務間關聯關系、服務依賴的各種資源。能夠發現服務上的缺陷,及時通報并推進解決。制定服務穩定性指標及準入標準,同時不斷完善和優化程序和系統的功能、效率,提高運行質量。完善監控內容,提高報警準確
5、度。在線上服務出現故障時,第一時間響應,對已知線上故障能按流程進行通報并按預案執行,未知故障組織相關人員聯合排障。資源管理對各服務的服務器資產進行管理,梳理服務器資源狀況、數據中心分布情況、網絡專線及帶寬情況,能夠合理使用服務器資源,根據不同服務的需求,分配不同配置的服務器,確保服務器資源的充分利用。例行檢查制定服務例行排查點,并不斷完善。根據制定的服務排查點,對服務進行定期檢查。對排查過程中發現的問題,及時進行追查,排除可能存在的隱患。預案管理確定服務所需的各項監控、系統指標的閾值或臨界點,以及出現該情況后的處理預案。建立和更新服務預案文檔,并根據日常故障情況不斷補充完善,提高預案完備性。能
6、夠制定和評審各類預案,周期性進行預案演練,確保預案的可執行性。數據備份制定數據備份策略,按規范進行數據備份工作。保證數據備份的可用性和完整性,定期開展數據恢復性測試。三、 數據庫運維數據庫運維負責數據存儲方案設計、數據庫表設計、索引設計和SQL優化,對數據庫進行變更、監控、備份、高可用設計等工作。詳細的工作職責如下所述。設計評審在產品研發初始階段,參與設計方案評審,從DBA的角度提出數據存儲方案、庫表設計方案、SQL開發標準、索引設計方案等,使服務滿足數據庫使用的高可用、高性能要求。容量規劃掌握所負責服務的數據庫的容量上限,清楚地了解當前瓶頸點,當服務還未到達容量上限時,及時進行優化、分拆或者
7、擴容。數據備份與災備制定數據備份與災備策略,定期完成數據恢復性測試,保證數據備份的可用性和完整性。數據庫監控完善數據庫存活和性能監控,及時了解數據庫運行狀態及故障。數據庫安全建設數據庫賬號體系,嚴格控制賬號權限與開放范圍,降低誤操作和數據泄露的風險;加強離線備份數據的管理,降低數據泄露的風險。數據庫高可用和性能優化對數據庫單點風險和故障設計相應的切換方案,降低故障對數據庫服務的影響;不斷對數據庫整體性能進行優化,包括新存儲方案引進、硬件優化、文件系統優化、數據庫優化、SQL優化等,在保障成本不增加或者少量增加的情況下,數據庫可以支撐更多的業務請求。自動化系統建設設計開發數據庫自動化運維系統,包
8、括數據庫部署、自動擴容、分庫分表、權限管理、備份恢復、SQL審核和上線、故障切換等功能。四、 運維研發運維研發負責通用的運維平臺設計和研發工作,如:資產管理、監控系統、運維平臺、數據權限管理系統等。提供各種API供運維或研發人員使用,封裝更高層的自動化運維系統。詳細的工作職責如下所述。運維平臺記錄和管理服務及其關聯關系,協助運維人員自動化、流程化地完成日常運維操作,包括機器管理、重啟、改名、初始化、域名管理、流量切換和故障預案實施等。監控系統負責監控系統的設計、開發工作,完成公司服務器和各種網絡設備的資源指標、線上業務運行指標的收集、告警、存儲、分析、展示和數據挖掘等工作,持續提高告警的及時性
9、、準確性和智能性,促進公司服務器資源的合理化調配。自動化部署系統參與部署自動化系統的開發,負責自動化部署系統所需要的基礎數據和信息,負責權限管理、API開發、Web端開發。結合云計算,研發和提供PaaS相關高可用平臺,進一步提高服務的部署速度和用戶體驗,提升資源利用率。五、 運維安全運維安全負責網絡、系統和業務等方面的安全加固工作,進行常規的安全掃描、滲透測試,進行安全工具和系統研發以及安全事件應急處理。詳細的工作職責如下所述。安全制度建立根據公司內部的具體流程,制定切實可行,且行之有效的安全制度。安全培訓定期向員工提供具有針對性的安全培訓和考核,在全公司內建立安全負責人制度。風險評估通過黑白盒測試和檢查機制,定期產生對物理網絡、服務器、業務應用、用戶數據等方面的總體風險評估結果。安全建設根據風險評估結果,加固最薄弱的環節,包括設計安全防線、部署安全設備、及時更新補丁、防御病毒、源代碼自動掃描和業務產品安全咨詢等。為了降低可能泄露數據的價值,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國虹膜識別機系統項目創業計劃書
- 中國基因檢測項目創業計劃書
- 中國肉制品(熟食)加工項目創業計劃書
- 中國靜脈觀察儀項目創業計劃書
- 中國楠竹苗項目創業計劃書
- 中國高性能計算(HPC)項目創業計劃書
- 中國動力電池管理系統(BMS)項目創業計劃書
- 中國杜泊綿羊項目創業計劃書
- 新疆飼料項目創業計劃書
- 2025年安徽省銅陵市銅官山區事業單位招聘考前自測高頻考點模擬試題及答案詳解1套
- 井下變電所檢修高爆開關施工安全技術措施
- 2022-2023學年樂山市市中區四年級數學第二學期期末教學質量檢測試題含解析
- 岳麓山風景名勝區總體規劃成果說明書
- 2023北京西城初二二模生物(試題含答案)
- ZZ028 中職法律實務賽項賽題-2023年全國職業院校技能大賽擬設賽項賽題完整版(10套)
- 巨力索具(河南)有限公司年生產10萬噸鋼絲及5萬噸鋼絲繩項目環境影響報告
- 三段式電流保護的整定與接線課件
- GB/T 18920-2002城市污水再生利用城市雜用水水質
- GB 10055-2007施工升降機安全規程
- 經濟周期理論精編版課件
- OECD稅收協定范本中英對照文本
評論
0/150
提交評論