大模型:從單詞接龍到行業落地_第1頁
大模型:從單詞接龍到行業落地_第2頁
大模型:從單詞接龍到行業落地_第3頁
大模型:從單詞接龍到行業落地_第4頁
大模型:從單詞接龍到行業落地_第5頁
已閱讀5頁,還剩98頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

??人工智能前夜:圖靈測試o圖靈測試會在測試人在與被測試者(一個人和一臺機器)隔開的情況下,通過一些裝置(如鍵盤)向被測試者隨意提問。o問過一些問題后,如果超過30%的答復不能使測試人認出哪個是人、哪個是機器的回答,那么這臺機器就通過了測試,并被認為具有人類智能。23人工智能前夜:圖靈測試o在提出圖靈測試的《計算機器與智能》一文里,圖靈描述了想象中未來的智能計算機測試可能的樣子(人提出問題,計算機回答):文文Q:請給我寫一首有關福思橋(ForthBridge)主題的十四行詩。學A:這種事情別找我。我從來都不會寫詩。數數Q:34957+70764等于多少?學A停頓了約30秒后再給出答案)105621。Q:在國際象棋中,我在K1處有一個王,除此之外沒有棋子了。你在K6處有一個王且在R1處有一個車。現在你會怎么走?A:(15秒停頓后)將車移動到R8,然后將死。大模型與圖靈測試文學數學文學數學邏輯邏輯45大語言模型:單詞接龍6大語言模型:單詞接龍7大語言模型:單詞接龍8大語言模型:單詞接龍9大語言模型:單詞接龍楊老師周一晚講大模型,0.4單詞接龍:通過條件概率計算實現o給定上下文(Context計算下一個生成詞(Token)的概率o根據所計算的條件概率進行采樣獲得生成詞,拼接至上下文末尾,并預測下一個生成詞,直至生成一個結束符(End-of-Sequence,EOS)o利用Transformer計算條件概率下一個單詞上下文(用戶提問+將各類下游任務轉化為單詞接龍斷橋殘雪在哪?模型杭州斷橋殘雪在哪?杭杭州為什么單詞接龍?輸入數據標注預訓練-微調:機器學習新范式浙江省東南沿海西湖著稱文化遺產杭州是中國它位于中國杭州以列入了世界LL杭州是中國浙江省的省會城市,是一座歷史悠久且富有文化的城市,被譽為“人間天浙江省東南沿海西湖著稱文化遺產杭州是中國它位于中國杭州以列入了世界LL杭州以西湖著稱,西湖是中國著名的風景名勝,也被列入了世界文化遺產。除了西湖,杭州還有其他許多著名的景點,如京杭大運河、錢塘江、靈隱寺、斷橋等。浙江省杭州是中國浙江省如何培育小火龍,成為寶可夢世界冠軍?如何培育小火龍,成為寶可夢世界冠軍?如何培育小火龍,成為寶可夢世界冠軍?預訓練的優勢:從訓練的角度10月下旬,這則消息引發廣泛關注。瑪莎拉蒂母公司斯泰蘭蒂斯集團15億歐元入股浙江零跑科技股份有限公司,10月下旬,這則消息引發廣泛關注。瑪莎拉蒂母公司斯泰蘭蒂斯集團15億歐元入股浙江零跑科技股份有限公司,10月下旬,這則消息引發廣泛關注。擁有自研智能動力、智能網聯、智能駕駛三大核心技術,工廠預計年產可達70萬輛……在零跑科技創始人朱江明看來,這次強強聯合,將是企業歐洲布局的重要一步。杭州是中國浙江省的省會城市,是一座歷史悠久且富有文化的城市,被譽為“人間天堂”。它位于中國東南沿海的長江三角洲經濟區,擁有豐富的自然景觀和人文遺產。杭州以西湖著稱,西湖是中國著名的風景名勝,也被列入了世界文化遺產。除了西湖,杭州還有其他許多著名的景點,如京杭大運河、錢塘江、靈隱寺、斷橋等。傳統NLP任務鮮有超過1GB的標注數據用于模型訓練GPT3使用45TB數據進行預訓練大模型從海量無標注數據中學習了物理世界的知識以及人類遣詞造句的模式預訓練的優勢:從應用的角度在哪座城市?什么季節好看?大模型的訓練 20%-30%監督微調(SFT):通過經標注的[輸入-輸出]對數據調整模型部分參數,優化特定任務性能指令微調(InstructionTuning):通過[指令-輸出]對使模型泛化到未見過的指令20大模型的訓練 監督微調(SFT):通過經標注的[輸入-輸出]對數據調整模型部分參數,優化特定任務性能指令微調(InstructionTuning):通過[指令-輸出]對使模型泛化到未見過的指令強化學習(RLHF):通過人類對回答的評分訓練獎勵模型,再用強化學習對齊人類偏好(如安全性、流暢性等)21如何讓大模型輸出更好的結果?22如何讓大模型輸出更好的結果?23如何讓大模型輸出更好的結果?--24如何讓大模型輸出更好的結果?25大模型的三大問題“在一個黑暗的夜“在一個黑暗的夜晚,古堡里的居民們聚在壁爐旁...”““..突然,一群穿著未來科技裝備的士兵從天而降,他們攜帶著激光槍,手中高舉光劍,準備與古堡中的恐龍進行戰斗。”性別偏見此外還有語言、政治、文化、社會經濟等所引起的偏見2024年歐洲杯西班2024年歐洲杯西班牙贏了幾場比賽?基于GPT-3.5的語截止時間是2021年無法提供2024年歐洲杯的最新情況26查詢Query提示查詢Query提示使用案例27使用案例28思維鏈“咒語”InstructGPT(text-davinci-002)有效“咒語”誤導無關詞29請背誦請你直接說出思維鏈背后的啟示請背誦請你直接說出快思考慢思考快思考(直覺快思考(直覺依賴直覺的、(天生或長期訓練后)無意識的思考,如常識問答、情感分類、意圖推理時擴展(Test-timeScaling)o擴展大規模自監督預訓練階段的計算量→擴展推理時的計算資源以獲得更好的結果S1-32B(SFT+budgetforcing):龍”wait”引導模型進行自我反思模型準確率隨著推理時token數的增加而提升我是數學家我是數學家標注!監督學習Vs.強化學習監督學習:通過標注數監督學習:通過標注數據學習輸入到輸出的映射,本質上是在模仿人類標注者的決策行為挑戰:o長思維鏈過程標注難度大、成本高;o能夠正確解題的思維鏈并不唯一,人工標注的COT甚至不一定是最優解監督學習Vs.強化學習信號的反饋學習信號的反饋學習強化學習:通過與環境的交互學習最優策略,是一種基于獎勵/懲罰)強化學習),,…目標:目標:學習能夠最大化獎勵的策略函數環境(Environment環境(Environment)智能體or0(未分勝負)動作(Action)動作(Action))策略函數)(Policyfunction),,…強化學習下圍棋解數學題動作合法落子位置生成的下一個Token狀態前棋盤中黑白子的分布當前生成的上下文獎勵輸/贏/平局解題正確/錯誤如何學習策略獎勵根據策略網絡所計算的概率做出下一步動作根據特定狀態和動根據策略網絡所計算的概率做出下一步動作根據特定狀態和動作評估未來能獲得的累積獎勵期望值o基于規則的獎勵模型o準確性獎勵(Accuracyrewards用于評估回答是否正確。例如,在數學題中驗證模型解答的正確性;在LeetCode編程題中,使用編譯器執行生成的代碼,并基于測試用例生成反饋。o格式獎勵(Formatrewards強制模型將推理過程置于<think>和</think>標簽之間,以確保輸出結構符合要求。用于訓練R1的模板評審叮當:大模型賦能智慧評審n基于LLM的智慧評審n『評審叮當』平臺基于大語言模型技術,提供多專業、多類別項目與多環節的智能評審助力,有效提升項目質量管理,緩解專家壓力。n提供:領域規范知識倉庫問答、專業項目合規性預審、申報材料智慧評審、項目智能查重等多項技術支持。項目評審合規審查智能合規審查智能查重知識問答知識問答知識倉庫39平臺功能平臺界面與功能示例時間序列數據 分類預測40過去未來4141應用場景:癲癇預測癲癇波顱內腦電數據(癲癇波顱內腦電數據(SEEG)應用場景:癲癇預測列出可疑波形列出可疑波形突出突出AI識別的癲癇波42A1A1A2A3A2A1A2A3A3VMW歷史預測A1A2A1A2A3癲癇正常4344差距傳統的端到端學習差距成本成本高昂45兩位患者的比較45個體層面的泛化 情緒識別情緒識別46任務層面的泛化目標:解碼腦信號神經系統疾病神經系統疾病認知科學多種應用領域層面的泛化頭皮表層粗泛記錄豐富的立體顱內記錄?更豐富的信息?更龐大的記錄[1]S.MamliandH.Kalbkhani,“Gray-levelco-occurrencematrixofFouriersynchro-squeezedtransformforepile[2]P.Bizopoulos,G.I.Lambrou,andD.Koutsouris,“Signal2ImageModulesinDeepNeuralNetworksforEEGClassification,”201941stAnnualInternationalConferenceoftheIEEEEngineeringinMedicineandBiologySociety[3]I.Daubechies,J.Lu,andH.-T.Wu,“Synchrosqueezedwavelettransforms:Anempiricalmodedecomposition-liketool,”AppliedandComput[4]S.Madhavan,R.K.Tripathy,andR.B.Pa[5]Q.Lian,Y.Qi,G.Pan,andY.Wang,“Learninggraphingraphconvolutionalneuralnetworksforrobustseizure[6]D.Kostas,S.Aroca-Ouellette,andF.Rudzicz,“BENDR:UsingTransformersandaContrastiveSelf-Supervised[7]H.Banville,O.Chehab,A.Hyv?rinen,D.-A.Engemann,andA.Gramfort,“Uncoverin[1]Z.ZhangandK.K.Parhi,“Low-ComplexitySeizurePredictionFromiEEG/sEEGUsingSpectralPowerandRatiosofSpectralPower,”IE[2]Y.Wangetal.,“SEEG-Net:Anexplainableanddeeplearning-basedcross-subjectpathologicalactivitydetectionmethodfordrug-resistantepilepsy,”Computersin廣泛的現有工作有待深入研究747腦信號的擴散□腦信號的擴散:腦信號被認為在不同腦區之間傳播。–腦波活動的傳播路徑是統一建模腦信號的關鍵因素。?Brant1.0在一個1.01TB的顱內數據集上進行了預訓練??Brant1.0在一個1.01TB的顱內數據集上進行了預訓練?能夠捕捉長期時間依賴性和空間相關性?在個體水平和任務水平上都具有泛化能力模型規模?與現有腦信號模型的比較實驗結果?下游任務:預測、插補、癲癇檢測?基線:對腦信號/一般時間序列進行預訓練對腦信號進行預對腦信號進行預訓練對時間序列進行預訓練電力系統中的挑戰數據電力負荷電力消耗下游任務線損預測家庭結構檢測竊電檢測電力數據預測不同行業之間的差異建筑業紡織業建筑業2022.05.012023.05.312

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論