基于Flink的海量數據涌傳輸系統課件_第1頁
基于Flink的海量數據涌傳輸系統課件_第2頁
基于Flink的海量數據涌傳輸系統課件_第3頁
基于Flink的海量數據涌傳輸系統課件_第4頁
基于Flink的海量數據涌傳輸系統課件_第5頁
已閱讀5頁,還剩19頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于Flink的異構海量數據涌傳輸系統技術創新 變革未來Agenda異構數據涌傳輸的挑戰基于Flink的解決方案 未來規劃挑戰MySQLH.ve/HSQLHDFSTableauRed.s/ AbaseKaf/a ?數據源種類多傳輸方式多全量增量流式頻繁有新數據源出現對架構的可擴展性要求高挑戰對于單/務,數據L大,實現細節繁多。SLA(性能穩定性等)要A高。MySQL上萬分庫單庫干億行PK極端不均勻HDFS10w+文件Protobuf/Parqu et/JSON/CSV/ Binary Hive500TB+Parquet/ORC/ SequeceFile 傳統架構etc.技術棧零散,M * N模

2、式缺乏統的數據*理和功能支持框架開發和運維成本高,性能和穩定性保證難度大現有開源方案DataX (開源版本)類型系統完善,數據源類型支持較完整單機模式,橫向擴展性不足不支持流式傳輸Sqoop關系型DB到Hadoop導入較為成熟新增數據源較為困難基于MR,性能非最優缺乏性能和架構可擴展性強,支持流批統一傳輸的框架。Agenda異構數據涌傳輸的挑戰基于Flink的解決方案 未來規劃基于Flink的統一傳輸架構線上業務支撐曰均任務數 2w,曰均傳輸數據萬億級別Flink OverviewExactly &nceScalabilityLayered APIHigh PerformanceStream

3、& Batch&peration FocusPlugin Framework技術棧統所有數據對應獨立的Input/Output插件,M+N模式框架層面提供統基礎功能分布式計笢Flink類型系統自動并行度流量控制臟F據處理小流量N試Type System所有輸入源數據類型先轉換為DTS類型,再統一轉換為輸出源數據類型。對于每種類型,分別有對應的序列化/反序列化器,用于分布式數據傳輸。基礎類型BoolColumnBytesColumnDateColumnDoubleColumnLongColumnStringColumn復合類型ListColumnTMapColumnK, VAuto Parall

4、elismAuto Parallelism對Flink架增加了Job預處理后處理流程,根據以下指標計算輸入輸出最佳并發度輸入原/片數輸入原總行數輸入原總大小輸入原可承壓輸出原可承壓用戶配置并發Messenger Framework在框架層面解決 Flink多節點間 數據收集的問題。任務運行指標收集臟數據收集支持多種目標數據灑Messenger - MetricsMessenger - Dirty Data用于收集和處理臟數據,寫入中間數據庫/Kafka等臟數據收集少量任務運行日志預覽增量臟數據寫入全量Log日志查詢等任務質量控制控制任務失敗的臟數據閾值支持絕對行數閾值支持相對百分比閾值實現優化Flink相關改進Monitor & Alarm單Job監控看板 總讀取寫入進/總分片數當前-成分片數當前讀取寫入行數當前讀取寫入大小失敗讀取寫入行數Monitor & Alarm系統整-監控看板 已啟動Job數量正在運行Job數量已成功Job數量已失敗Job數量Job運行時間

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論