大語言模型通識微課課件:什么是分布式處理_第1頁
大語言模型通識微課課件:什么是分布式處理_第2頁
大語言模型通識微課課件:什么是分布式處理_第3頁
大語言模型通識微課課件:什么是分布式處理_第4頁
大語言模型通識微課課件:什么是分布式處理_第5頁
已閱讀5頁,還剩8頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

大語言模型通識微課

什么是分布式處理大語言模型的模型參數量和所需訓練數據量的規模持續急速增長,更大的模型可以進一步提升效果,同時也展現出解決多種不同類型任務等能力。但是,訓練巨大的模型必然需要底層基礎軟件和芯片支撐。這時,單個機器有限的資源已無法滿足訓練要求,GPU在過去幾年中增長在10倍數量級,顯然跟不上模型10000倍的規模增長。硬件不夠,軟件來湊。深度學習框架的分布式訓練技術強勢地支撐起了模型的快速增長。分布式訓練系統被設計來解決海量計算和內存資源需求問題,其中涉及集群架構、并行策略、模型架構、內存優化、計算優化等技術。微課7.1什么是分布式處理為滿足大數據處理需求,將一組計算機組織到一起形成集群,利用集群來處理大數據的工程實踐逐漸成為主流,這種使用集群進行計算的方式被稱為分布式計算,當前幾乎所有的大數據系統都是在集群進行分布式計算的。分布式計算概念背后的思想十分樸素,即分而治之,它是將一個原始問題分解為子問題,多個子問題分別在多臺機器上求解,借助必要的數據交換和合并策略,將子結果匯總即可求出最終結果。

圖7-1分而治之的算法思想7.1.1分而治之分布式計算有很多成熟的方案,其中比較有名的有消息傳遞接口(MPI)和MapReduce。MPI是一個老牌的分布式計算框架,主要解決節點間的數據通信問題。在前MapReduce時代,MPI是分布式計算的業界標準,現在依然廣泛運行在全球各大超級計算中心、大學、政府和軍隊下屬研究機構中,許多物理、生物、化學、能源、航空航天等基礎學科的大規模分布式計算都依賴MPI。7.1.1消息傳遞接口MPI圖7-2展示了MPI架構在4臺服務器上進行并行計算。在實際的代碼開發過程中,用戶需要自行設計分治算法,將復雜問題切分為子問題,手動調用MPI庫,將數據發送給指定的進程。

圖7-2MPI并行計算示意圖7.1.1消息傳遞接口MPI為了解決分布式計算學習和使用成本高的問題,研究人員提出了更簡單易用的MapReduce編程模型。MapReduce編程模型只需要程序員定義兩個操作:map(映射)和reduce(減少)。比起MPI,MapReduce編程模型將更多的中間過程做了封裝,程序員只需要將原始問題轉化為更高層次的API,至于原始問題如何切分為更小的子問題、中間數據如何傳輸和交換、如何將計算伸縮擴展到多個節點等一系列細節問題可以交給大數據框架來解決。因此,MapReduce相對來說學習門檻更低,使用更方便,編程開發速度更快。7.1.2MapReduce數據與數據流。在現代通信技術中,數據的容量大且產生速度快。從時間維度上講,數據源源不斷地產生,形成一個無界的數據流(見圖7-4)。

圖7-4有界與無界數據流7.1.3批處理和流處理例如每時每刻的運動數據都會累積到手機傳感器上,金融交易隨時隨地發生著,傳感器會持續監控并生成數據。數據流中的某段有界數據流可以組成一個數據集。我們通常所說的對某份數據進行分析,指的是對某個數據集進行分析。隨著數據的產生速度越來越快,數據源越來越多,人們對時效性的重視程度越來越高,如何處理數據流成了大家更為關注的問題。7.1.3批處理和流處理批處理。這是對一批數據進行處理。批量計算比比皆是,最簡單的批量計算例子有:微信運動把用戶好友一天所走的步數統計一遍,生成排序結果后推送給用戶;銀行信用卡中心每月賬單日有一個批量任務,把一個月的消費總額統計一次,生成用戶月度賬單;國家統計局每季度對經濟數據做一次統計,公布季度GDP增速。可見,批量任務是對一段時間的數據聚合后進行處理。對于數據量龐大的應用,一段時間內積累的數據總量非常大,計算非常耗時。批量計算應用最為廣泛的是數據倉庫的ETL(提取-轉換-加載)數據轉化。7.1.3批處理和流處理流處理。數據其實是以流方式持續不斷地產生著,流處理就是對數據流進行分析和處理,時間對流處理獲取實時數據價值越發重要。例如電商大促銷中管理者要以秒級的響應時間查看實時銷售業績、庫存信息以及與競品的對比結果,以爭取更多的決策時間;股票交易要以毫秒級的速度來對新信息做出響應;風險控制要對每一份欺詐交易迅速做出處理,以減少不必要的損失;網絡運營商要以極快速度發現網絡和數據中心的故障等等。以上這些場景,一旦出現故障,造成服務延遲,損失都難以估量,因此,響應速度越快,越能減少損失,增加收入。7.1.3批處理和流處理分布式處理和并行處理是為了提高并行處理速度采用的兩種不同的體系架構。并行處理是利用多個功能部件或多個處理機同時工作來提高系統性能或可靠性的計算機系統,這種系統至少包含指令級或指令級以上的并行。分布式處理則是將不同地點的,具有不同功能的,或擁有不同數據的多臺計算機通過通信網絡連接起來,在控制系統的統一管理控制下,協調地完成大規模信息處理任務的計算機系統。并行處理系統與分布式處理系統有密切的關系,隨著通信技術的發展,兩者的界限越來越模糊。廣義上說,分布式處理也可以認為是一種并行處理形式。7.1.4分布式處理和并行處理分布式處理系統包含硬件、控制系統、接口、數據、應用程序和人等六個要素??刂葡到y中包含了分布式操作系統,分布式數據庫以及通信協議等。分布式計算環境是在具有多地址空間的多計算機系統上進行計算和信息處理的軟件環境。而分布式軟件系統是支持分布式處理的軟件系統,它包括分布式操作系統,分布式程序設計語言及其

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論