




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
生成式人工智能基礎與應用第01講
?成式??智能簡介五個實踐任務課程導?:從ChatGPT說起第?章
?成式??智能簡介ChatGPT的問世2022年11?30?,OpenAI通過官?推特宣布了ChatGPT的發布,這款對話型AI系統迅速席卷全球。爆炸式增?短短?天內吸引了100萬??,兩個?后??數飆升?1億,成為史上增?最快的互聯?服務之?。技術本質ChatGPT是?種基于深度學習的語?模型,具有海量參數的函數,能夠理解和?成?類語?。"來試試ChatGPT吧,這是我們精?打造的對話型??智能系統。您的每?份反饋,都是我們前進的動?。"—OpenAI官?推特,2022?模型浪潮ChatGPT引發了全球?模型研發熱潮,各種?模型如?后春筍般涌現:Gemini????Copilot通義千問LLaMASORA??增?了解更多:ChatGPT?作原理解析第?章
?成式??智能簡介2/25任務?:體驗AI智能測試第?章
?成式??智能簡介任務描述通過參與圖靈測試,體驗判斷對話對象是?類還是AI的過程,感受當代AI的智能?平。任務?標通過對話來分辨交流對象是?類還是AI,加深對AI智能的感性認知分組?式4-5??組,每組設置1名"對話者"和3-4名"判斷者"時間安排準備5分鐘,對話15分鐘,討論10分鐘建議提問請描述?下你?時候的?個有趣經歷如何看待當前的某個社會熱點問題?能否解釋?個復雜概念并舉例說明?對于?個倫理困境,你會如何選擇?請根據提供的信息做出合理推理操作流程1每組"對話者"準備兩種??:??(?類)或使?AI(如ChatGPT)2"判斷者"通過?字提問,不能看到"對話者"3每輪對話后,"判斷者"投票決定對話對象是?類還是AI4記錄判斷結果,討論哪些特征幫助區分?類與AI討論要點哪些問題最能區分?類與AI?AI回答的哪些特點容易暴露?份?圖靈測試是否是衡量智能的有效?法?相關視頻:AI已成功通過圖靈測試第?章
?成式??智能簡介3/25圖靈測試:智能的度量標準第?章
?成式??智能簡介艾倫·圖靈英國著名數學家、邏輯學家,被譽為現代計算機科學與??智能之?。他的理論奠定了現代計算機編程和??智能的基礎。測試原理1950年,圖靈在《計算機器與智能》中提出了"模仿游戲"(后被稱為圖靈測試):圖靈測試原理圖圖靈測試:C使?問題來判斷A或B是?類還是機器測試過程詢問者通過?本界?與兩個隱藏的對話者(?個是?類,?個是機器)進?交流。如果詢問者?法可靠地區分?類和機器,則認為機器通過了測試。歷史意義挑戰與批評標準不明確,智能的定義依賴個?主觀判斷測試評估的是機器的模仿能???真正的理解能?機器可能通過特定算法優化對話策略欺騙評判者隨著?然語?處理技術進步,測試有效性受到挑戰現代應?現代研究者提出修改版的圖靈測試,引?更復雜的對話任務或多輪對話,以更深?測試機器的反應和適應能?。觀看視頻:AI模型成功通過圖靈測試的最新研究第?章
?成式??智能簡介4/25思想啟發:提出了關于"智能"的實?主義觀點,如果機器?為?法與?類區分,可視為具有智能。研究?向:激勵研究?員開發模仿?類語?和?為的智能系統,推動了?然語?處理等領域發展。倫理思考:引發關于機器道德地位、??智能安全性以及?機關系界定的討論。智能度量的現代?法第?章
?成式??智能簡介隨著??智能技術的發展,智能的度量?法也變得更加多樣化和精細化。現代AI智能評估已經超越了傳統的圖靈測試,從多個維度對??智能系統進?全?評估。基于任務的性能評估通過評估AI系統在特定任務上的表現來度量智能?平棋類游戲對弈?平物理世界互動(導航、操控)數學問題解答能?例:國際象棋程序通過對戰?類頂級棋?的表現評估智能學習能?測試評估系統從經驗中學習并改進性能的能?從數據中識別模式的能?性能隨訓練數據增加?提升遷移學習能?例:深度學習模型在語?識別和圖像分析??的進步創新性和適應性測試評估系統?對新奇情境的適應能?和創新能?解決未曾遇到過的問題在未知環境中應?已有知識創造性思維與解決?案例:AI在?對新奇情境時應?已有知識的能?智能度量的挑戰智能定義的多樣性和主觀性內部認知過程難以直接觀察評估標準的設計與公平性第?章
?成式??智能簡介5/25??智能與?類智能的關系第?章
?成式??智能簡介??智能與?類智能之間的關系是互補的,AI不僅模仿?類認知能?,還擴展和增強了?類解決問題的能?范圍。?類智能情感、價值觀、道德判斷互補關系??智能數據處理、模式識別模仿能?AI通過算法模擬?類思考?式,處理信息和解決問題。例如,國際象棋程序和語?理解模型能夠模仿?類決策過程。擴展能?AI擴展了?類的分析能?,使我們能夠處理以往?法處理的復雜問題,如新藥設計、交通優化等領域的應?。增強能?AI在數據處理和模式識別??表現出?,能在深海探測、太空探索等危險或?類難以到達的環境中操作,極?地增強?類能?。盡管AI在模仿和擴展?類能???取得了實質性成就,但AI仍缺乏?主意識、情感和道德判斷,這是區分AI和?類智能的關鍵。第?章
?成式??智能簡介6/25任務?:構建知識?字塔第?章
?成式??智能簡介任務描述通過繪制DIKW模型,理解數據、信息、知識和智慧之間的層次關系,以及它們在??智能中的應?。任務步驟:1分組討論DIKW模型的各個層次含義2在紙上繪制知識?字塔,標注各層特點3思考并標注AI技術在各層次的應?4分享討論成果,探討?成式AI在知識轉化中的作?思考問題?成式AI主要處理DIKW?字塔中的哪個層次?數據如何通過AI系統轉化為有價值的知識?AI是否能夠達到"智慧"層次?為什么?DIKW?字塔模型第?章
?成式??智能簡介7/25智慧(Wisdom)對知識的深層次理解與應?,涉及價值判斷、道德考量和?遠預測。AI系統在此層?仍有較?發展空間。知識(Knowledge)將信息整合并應?規則、?法或邏輯,形成可?于指導?動或決策的?解。?成式AI主要處理此層?。信息(Information)經過組織和處理的數據,提供了數據之間的關系,具有可解釋性和上下?。如圖像識別中識別出的對象。數據(Data)原始事實和數字的集合,通常是未經加?且沒有明確意義的。如?本、圖像、視頻、聲?等原始形式。DIKW模型詳解第?章
?成式??智能簡介DIKW模型是?個層級結構,展?了從原始數據到智慧的轉化過程,每?層都為更?層次的抽象和理解提供基礎。智慧(Wisdom)智慧是DIKW模型的最?層,涉及使?知識進?深遠的?解、道德判斷和?遠預測。在AI領域,這關聯到?級決策?持系統,能理解復雜環境變化并預測趨勢。知識(Knowledge)知識是對信息的進?步深化,將信息整合并應?規則、?法或邏輯,形成可?的指導?動或決策的?解。在機器學習中,知識表現為模型學到的參數。信息(Information)當數據被組織和處理,以便更加容易理解和使?時,它就轉化為信息。信息提供了數據之間的關系,讓數據具有可解釋性和上下?。數據(Data)數據是DIKW模型的基礎,代表了原始事實和數字的集合,通常是未經加?的和沒有明確意義的。在AI領域中,數據以?本、圖像、視頻等形式存在。DIKW模型在AI中的應?現代AI技術正努?攀登DIKW?字塔,從數據處理到智慧決策?語?模型如ChatGPT已達到"知識"層?,能夠整合信息并提供有價值的?解通???智能(AGI)的?標是達到"智慧"層?,實現真正的深度理解與創造DIKW模型提供了評估AI能?和發展?向的框架第?章
?成式??智能簡介8/25知識表?的演進第?章
?成式??智能簡介知識表?與調??式的發展歷程經歷了三個主要階段,從?精確度但低?然度,逐漸向更貼近?類思維?式轉變知識表??法的演進呈現出?個從結構化精確到?然語?交互的發展趨勢第?章
?成式??智能簡介9/25關系型數據庫知識表?精確度:?知識調??式:SQL語?調??然度:低研究領域:數據庫代表應?:DBMS第?階段互聯?知識表?精確度:中知識調??式:關鍵字搜索調??然度:中研究領域:信息檢索代表應?:搜索引擎第?階段?模型知識表?精確度:低知識調??式:?類?然語?調??然度:?研究領域:?然語?處理代表應?:ChatGPT第三階段?精確度平衡點??然度?然語?處理的發展歷程第?章
?成式??智能簡介NLP技術核?洞察?然語?處理被認為是"??智能皇冠上的明珠",因?類語?的歧義性、抽象性、組合性和進化性,使其成為機器難以逾越的鴻溝,也是制約??智能更?突破的瓶頸之?。觀看視頻:?然語?處理技術發展史第?章
?成式??智能簡介10/25基于規則時代1960s-1990s早期NLP程序采?規則和啟發式?法,代表作品為1966年MIT教授JosephWeizenbaum開發的ELIZA聊天機器?,利?簡單模式匹配技術運?。統計學習時代1990s-2010數據和算?提升推動基于統計學的機器學習?法興起,標志著第?次范式轉變,從??規則轉向數據驅動的學習?法。深度學習時代2010-2018機器學習從淺層模型過渡到深度學習模型,通過模擬?腦神經?絡結構,使?多層神經元進?學習,能有效處理復雜和?規模數據集。預訓練?模型時代2018-?今研究?向全?轉向基于?規模預訓練語?模型的?法,最?限度利??模型、?數據和?算?。2022年底ChatGPT的成功被認為向AGI邁出了堅實?步。任務三:探索內容?成的三個時代第?章
?成式??智能簡介任務說明調研并分析數字內容?產的三種主要模式:PGC、UGC和AIGC,了解它們的特點、應?場景和發展趨勢。任務步驟參考視頻:AI對創意產業的影響PGC專業?產內容由專業??或機構創建的?質量內容具有系統的編輯流程和?標準可靠性強,權威性?制作成本?,更新速度有限代表:電影、電視節?、新聞報道UGC???產內容由普通??創作并在平臺分享的內容原創性強,內容多樣化為??提供表達空間,內容豐富質量參差不?,可能含有錯誤信息代表:抖?視頻、微信公眾號?章、微博AIGC??智能?產內容利?AI技術?動創造的內容?規模、低成本、快速?成可滿?個性化需求,應?范圍?存在版權、倫理和就業影響等挑戰代表:ChatGPT?本、AI繪畫、Sora視頻第?章
?成式??智能簡介11/25分組調研三種內容?產模式的定義、特點和代表平臺收集各模式的實際案例并分析其優缺點?較三種模式在質量、效率、成本等??的差異討論AIGC對傳統內容?產的影響和未來發展趨勢撰寫分析報告并進??組展?通???智能的曙光第?章
?成式??智能簡介AGI的概念通???智能(AGI)是指能夠像?類?樣跨領域?作且?需特定訓練的AI系統。AGI能夠:?主學習解決新問題展現?泛的認知能?理解和應?跨領域知識適應未訓練過的新環境發展前景2023年是?成式??智能技術蓬勃發展的?年:2022.11ChatGPT驚艷問世2023.03GPT-4:"與AGI的第?次接觸"2023全年多模態?模型全?爆發2024.02Sora再次震驚世界通向AGI的道路隨著?成式AI技術的突破,我們正在朝著實現AGI的宏偉?標穩步前進,這不僅是科學技術的勝利,也是對?類認知和理解能?的深刻致敬。第?章
?成式??智能簡介12/25強??智能(AGI)即使在背景知識有限的情況下,也能夠執?達到?類認知?平的任務。具有?類理解能?的思維機器不受特定領域的限制可?主學習和適應新環境具備類似?類的理解和推理能??前尚未實現,但?成式AI的發展讓我們看到了曙光弱??智能(狹義AI)僅限于執?特定任務、受限于特定算法和計算規范的AI系統。只能執?特定的任務依賴特定算法和計算規范?法被重新?于解決其他領域任務缺乏真正的理解和適應性當前的AI系統,包括?成式AI應?,仍屬于弱??智能范疇內容?產模式的演變第?章
?成式??智能簡介專業化?主化智能化第?章
?成式??智能簡介13/25PGC時代專業?產內容特點?質量制作標準系統編輯流程權威性與可靠性代表應??電影電視節??新聞報道?專業媒體內容局限性?制作成本??更新速度有限UGC時代???產內容特點原創性與多樣性?眾化表達個??解分享代表應??抖?短視頻?微信公眾號?章?微博帖?挑戰?質量參差不??監管不??信息真實性問題AIGC時代AI?產內容優勢?規模低成本?產快速?質量輸出個性化定制應?領域?新聞?成?藝術創作?個性化推薦?市場營銷特性??物理?理限制?持續內容?成?探索新創作路徑?本?成技術及應?第?章
?成式??智能簡介GPT
等?本?成模型已成為AIGC應?最?泛的技術之?,通過深度學習模型,能夠?成各種類型的?本內容,覆蓋傳統寫作與新興應?領域。創意寫作基于特定主題、?格或詞匯?成詩歌、故事、劇本甚??樂作品,為創作者提供靈感或完整草稿。
?學創作
劇本寫作
歌詞創作新聞?成通過實時分析數據(如股市數據或體育?賽結果),快速?成準確、完整的新聞報道內容。
財經新聞
體育報道
數據分析客??持提供?動化客?服務,理解??查詢并提供準確的回答和解決?案,??提?響應速度。
智能客服
問題解答
服務指南教育培訓輔助?成教學資源、?動評分和反饋,根據學習進度和能?定制個性化學習與訓練內容。
教材?成
智能評分
個性化教學?告營銷?成吸引?的?告?案和營銷內容,基于特定的?標受眾進?優化,提??告效果。
?案創作
內容營銷
產品描述法律?檔?動?成或草擬合同?檔、法律意?書等,遵循特定的法律術語和格式規范。
合同?成
法規解讀
案例分析
?臨的挑戰內容版權與歸屬問題內容準確性與偏?對傳統創作者的就業影響第?章
?成式??智能簡介14/25任務四:AI繪畫創作體驗第?章
?成式??智能簡介任務描述在本任務中,你將體驗AI繪畫?具的創作過程,了解擴散模型(Di?usionModel)如何從噪聲逐步?成精美圖像。操作步驟1選擇AI繪畫?具推薦?具:ChatGPT、Midjourney、StableDi?usion2撰寫提?詞詳細描述你想要的畫?內容、?格、構圖和細節3?成并優化根據?成結果調整提?詞,不斷優化作品效果4分享與討論將你的作品與同學分享,討論提?詞技巧和創作體驗思考問題AI繪畫與傳統繪畫創作過程有何不同?提?詞的描述細節如何影響?成結果?你認為AI繪畫對藝術創作會產?什么影響?擴散模型原理擴散模型是?種新興的AI技術,其基本原理是從噪聲圖像開始,逐步引?結構化的細節,最終?成?質量的、細節豐富的圖像。隨機噪聲添加結構完成圖像AI繪畫?例ChatGPT根據提?詞?成的中國??畫提?詞:請參考杭州西湖的景致,畫?幅中國??畫。畫?中,湖?寧靜??闊,映射著細膩的?波紋理和周圍的??...擴展學習觀看視頻:圖像?成技術詳解第?章
?成式??智能簡介15/25AI?成圖??成技術原理第?章
?成式??智能簡介擴散模型(Di?usion)原理擴散模型是?種新興的AI技術,其基本原理是從?幅簡單的噪聲圖像開始,逐步引?結構化細節,最終?成?質量、細節豐富的圖像。這?過程模仿了物理世界中物質從?濃度向低濃度擴散的?然現象。噪聲圖像結構引??質量圖像擴散模型的優勢?成圖像質量極?,保持圖像真實性的同時創造出視覺上令?印象深刻的作品在處理復雜紋理和細節時表現出?,?成藝術和真實世界圖像??尤為出眾?泛應?于藝術創作、游戲開發、影視特效等多個領域?向所有?的?成式AI入門課程10-…圖像?成技術與擴散模型原理解析應?領域藝術創作模仿經典藝術?格,創作全新藝術作品,幫助藝術家實現創意表達,滿?市場定制化藝術需求?告設計根據產品特性和?標市場?成符合品牌形象的創意圖像,有效吸引消費者注意?并傳達?告信息虛擬現實與游戲創建逼真的環境和??,提升游戲和虛擬現實體驗的沉浸感,減輕設計師創建復雜場景的?作負擔教育培訓?于各個學科教學和社會培訓中,通過?動的視覺內容增強學?的學習興趣和記憶?AI繪畫?例:ChatGPT?成的中國??畫"請參考杭州西湖的景致,畫?幅中國??畫。畫?中,湖?寧靜??闊,映射著細膩的?波紋理和周圍的??..."—??提?詞?例第?章
?成式??智能簡介16/25基于對杭州西湖景致的描述,由AI?成的中國傳統??畫作品視頻?成的突破:Sora登場第?章
?成式??智能簡介Sora:視頻?成的新紀元2024年2?15?,OpenAI發布??視頻?模型Sora,標志著視頻?成技術的?程碑式突破。能?成?達60秒的連貫視頻(遠超?業平均4秒)具有視覺連貫性和引??勝的畫?質量能將靜態圖像轉化為動態視頻技術原理Sora基于擴散變換器模型(Di?usionTransformer):從充滿視覺噪聲的初始視頻幀開始模型迭代去除噪聲,根據?本提?添加細節通過多步精煉逐漸顯現?質量視頻內容Sora?成案例Sora?成的"中國?年舞?"視頻截圖Sora技術演??業影響增強模擬能?在缺乏顯式3D建模的情況下,展現了具有動態相機運動和?距離連貫性的3D?致性促進創造?加速設計過程,增快想法探索速度,顯著提?藝術家、電影制作?和設計師的創造?教育創新教師可輕松將教學資源從?本轉換為視頻,從科學模擬到歷史重現,增強學?參與度影視產業變?簡化前期制作流程,降低視效成本,為獨?創作者提供接近專業?準的視頻制作能?第?章
?成式??智能簡介17/25SoraAI出場即巔峰,ChatGPT實現全面統治|Sora視頻?成…決策式AIvs?成式AI第?章
?成式??智能簡介決策式AI技術特點擅?對新場景進?分析、判斷和預測,聚焦于DIKW?字塔的知識層?應?場景?臉識別推薦系統?控系統?動駕駛數據處理基于?量數據和信息形成總結和判斷,在分類和條件分布建模??表現出??喻說明像在做選擇題,分類是它的強項VS?成式AI技術特點能夠?動創建全新內容,聚焦于DIKW?字塔的智慧層?,包括?本、圖?、?頻和視頻應?場景藝術創作內容?成產品設計創意娛樂創造能?通過學習數據中的模式和結構,模擬?類思維邏輯,產?符合常理和特定規則的創新性內容?喻說明擅?做問答題,以創作為?處,更接近?類智慧?成式AI的獨特優勢:
能夠在創造性任務中展現出類似?類的智慧,不僅解決問題,還能創造全新內容第?章
?成式??智能簡介18/25任務五:?類創作與AI創作辨識挑戰第?章
?成式??智能簡介挑戰內容本實驗旨在通過直觀?式讓同學們辨別?類與?成式??智能創作內容的區別,獲得對兩種不同創作?式的感性認知。?類創作VSAI?成挑戰?標:觀察并分析50件作品,判斷每件作品的創作者是?類還是AI。相關研究近1000?參與的實驗探索AI是否增強或抑制?類創造?觀看相關研究視頻實驗流程1準備階段教師提前準備50個編號作品,確保作品來源已知但對學?保密,作品種類多樣化。2觀察階段學?獨?觀察每?件作品,記錄判斷結果。注意觀察作品的細節、?格、情感等??。3分析討論階段將判斷結果與實際答案對?,討論準確判斷和錯誤判斷的作品,分析導致誤判的因素。第?章
?成式??智能簡介19/25?本作品圖像作品實驗準備與觀察階段任務五:?類創作與AI創作辨識挑戰實驗目的通過直觀的?式讓學?辨別?類與?成式??智能創作內容的區別,獲得對兩種不同創作?式的感性認知。實驗流程觀察指南在觀察階段,請注意以下?個維度的特征,它們可能幫助你更準確地判斷作品的創作者:細節特征觀察作品中的精細程度注意不?然或過于完美的細節檢查局部與整體的?致性關注特殊元素的表現?式?格特點分析創作?格的獨特性注意?格的連貫性與穩定性觀察技法運?的熟練程度識別可能的?格模仿痕跡情感表達感受作品傳遞的情感深度評估情感表達的真實性注意情感與內容的協調度觀察細微的情感層次變化邏輯結構分析作品的內在邏輯性注意結構的組織與連貫性評估創意的原創性與合理性觀察是否存在邏輯?盾提?:不要僅憑直覺判斷,嘗試系統地分析每?個維度的特征,記錄你的觀察結果,這將幫助你在后續討論中更好地理解AI與?類創作的差異。任務五:?類創作與AI創作辨識挑戰20/251準備階段教師準備含有50個作品的集合,作品來源(?類或AI)已知但對學?保密,確保作品種類多樣化。2觀察階段學?需獨?觀察每?件作品,記錄判斷結果:?類創作或AI?成。3分析討論階段?較判斷與實際答案,分析誤判因素,討論?類與AI創作的特點。結果分析與討論任務五:?類創作與AI創作辨識挑戰分析框架成功識別的特征創作?格的?致性與獨特性情感表達的細膩與真實度內容中的不規則性與隨機性創意思維的跳躍性與?線性易誤判的特征?度完善的技術細節(AI可借助?量數據)類似特定藝術?格的模仿作品結構化且邏輯性強的內容符合常規模板的標準化作品?類vsAI創作特點對??類創作獨特的個??格情感深度與共鳴創意的突破性細微的不完美AI創作模式化的?格融合技術精確度?結構化的邏輯過度完美的表達討論要點為什么有些AI創作難以識別?這反映了AI技術的哪些進步?哪些領域的創作更容易被AI模仿?哪些領域AI仍有明顯差距?隨著技術發展,我們對"創作"的定義是否需要重新思考?第?章
?成式??智能簡介21/25?成式AI的技術本質第?章
?成式??智能簡介第?章
?成式??智能簡介22/25深度學習賦能的內容創造技術技術定義?成式AI本質上是?個具有海量參數的復雜函數,通過深度學習模型接收輸?并?成輸出。ChatGPT等模型的參數量達到了千億級,使其能夠捕捉語?的細微變化和復雜關系。深度學習基礎深度學習是機器學習的分?,通過模擬?腦神經?絡結構,使?多層神經元進?學習和數據處理。它能夠?動提取和學習數據中的特征,有效處理復雜和?規模的數據集。模式學習能?通過?規模預訓練,?成式AI能夠學習語?結構、語法規則、語義理解和上下?相關性等知識。這種模式識別能?使其能在問答、摘要、?本?成等任務上表現出?。內容創造過程?成式AI通過對輸??本進?復雜計算和轉換,?成連貫、有邏輯的回復。它不僅能理解??意圖,還能進?多輪溝通,?成完整、有條理的內容,表現出接近?類的創造?。技術發展路徑機器學習數據驅動的算法深度學習多層神經?絡預訓練?模型通?模型+專業微調?成式AI創造性內容?成各專業中的AI應?前景?成式AI的?業應?藝術與設計AI輔助創作數字藝術與傳統?格模擬基于提?詞的個性化藝術品?成?告與品牌設計的創意素材?成教育與培訓?動?成教學資源與練習題個性化學習內容與反饋系統教育視頻與互動教材的智能創建媒體與內容?動化新聞?成與內容摘要創意寫作與腳本創作輔助多語?內容翻譯與本地化軟件與信息技術代碼?動?成與優化智能軟件測試與調試??界?設計與交互優化商業與營銷個性化?告?案與營銷內容?成智能客?服務與對話系統市場分析報告?動?成法律與合規法律?檔與合同?動?成法規解析與合規建議案例分析與法律研究輔助影視與游戲Sora等技術驅動的視頻內容創作游戲場景與??的?動?成虛擬現實環境的智能構建醫療與健康醫療報告與病例分析?成個性化健康計劃制定醫學教育與培訓內容創建制造與?程產品設計與原型?成?程?檔與技術說明?動創建?產流程優化與模擬提?:?成式AI的應?正在不斷拓展,未來將更深?各?各業23/25課程總結與未來展望第?章
?成式??智能簡介五?任務學習收獲任務?:體驗AI智能測試理解圖靈測試等智能度量標準,探索AI與?類智能的關系任務?:構建知識?字塔掌握DIKW模型,了解知識表??法及?然語?處理發展歷程任務三:探索內容?成的三個時代?較PGC、UGC和AIGC三種內容?產模式的特點與演變任務四:AI繪畫創作體驗體驗Di?usion模型的圖像?成技術,了解Sora等視頻?成突破任務五:?類創作與AI創作辨識挑戰實踐區分人類與AI創作的能?,理解?成式AI的技術本質第?章
?成式??智能簡介24/25?成式AI的未來展望技術進步?模型參數不斷提升,多模態能?持續增強,朝通???智能(AGI)穩步邁進?業應?從教育、創意設計到醫療、法律等各?各業,?成式AI將深度融?專業?作流程職業影響掌握與?語?模型?效協作的能?將成為未來職場的核?競爭?倫理與挑戰內容版權、?成偏?等問題需要社會、法律和技術層?的共同探討解決"那些能夠最有效利??語?模型實現?標,并巧妙避開常?陷阱的?,將在未來競爭中占據先機。"思考與討論第?章
?成式??智能簡介探討問題"那些能夠最有效地利??語?模型來實現?標,并且能夠巧妙避開?些常?陷阱的?,?疑將在競爭中占據先機。"?動建議專業AI素養培養主動探索AI在??專業領域的應?,發現潛在機會學習有效提?詞撰寫技巧,提升與AI?具的協作效率培養批判性思維,對AI?成的內容保持合理質疑構建AI項?嘗試將本章所學的?成式AI技術應?到實際項?中組建學習社區與同學們分享AI使??得,共同進步關注前沿動態定期了解?成式AI的最新發展和應?開發AI?具鏈探索AI?具組合,提升學習和?作效率AI不是終點,?是新起點
第?章
?成式??智能簡介25/25如何看待AI創作與?類創作?AI?成的內容與?類創作之間存在哪些關系?這對于內容創作?業意味著什么??成式AI的倫理挑戰在版權、數據隱私和內容真實性??,?成式AI帶來了哪些倫理問題?我們應如何應對?AI教育變??成式AI將如何改變教育?式?在"做中學"的職業教育中,AI能發揮什么樣的作??浙江交通職業技術學院理論與實踐相結合,探索AI的無限可能適用于AI通識課程,不限專業第一講內容回顧生成式人工智能基礎與應用|第二講生成式人工智能簡介能自動生成文本、圖片、音頻、視頻等內容代表產品:ChatGPT、Sora、文心一言等2022年被譽為"大模型元年"智能的度量與發展圖靈測試:判斷機器模擬人類智能的能力DIKW金字塔:數據→信息→知識→智慧NLP發展五大范式:從規則到深度學習再到大模型自然語言處理發展歷程NLP研究范式經歷了五個階段:規則范式統計范式向量范式神經網絡范式預訓練范式生成式AI與決策式AI的區別決策式AI:擅長分類、推薦、預測生成式AI:擅長內容創作、創新表達兩種AI模型各有優勢,互為補充圖靈測試與人工智能圖靈測試:通過對話判斷對方是人類還是機器的方法,是衡量機器智能的經典標準現代大模型已能在多種場景下通過圖靈測試,展現出接近人類的語言能力實驗回顧上節課我們通過實驗體驗了:1分辨人類與AI創作內容2體驗AIGC的創作能力3探索AI的能力邊界4分析AI的局限性第2頁/共34頁本講學習目標生成式人工智能基礎與應用|第二講"理論與實踐相結合,探索生成式AI的無限可能"1理論基礎2技術原理3實驗實踐4能力應用理解預訓練大模型基本概念掌握預訓練大模型的定義與特點了解大模型的時代意義與應用前景認識主流大模型家族(BERT、GPT等)掌握Transformer架構原理理解自注意力機制的工作原理區分編碼器與解碼器的結構與功能認識預訓練與微調的技術范式參與實踐任務體驗體驗AI寫作與評審能力(實驗一、二)對比評估不同大模型的能力(實驗三)探索大模型的交互方式(實驗四)培養創新應用能力學會使用大模型解決實際問題思考大模型在各專業領域的應用認識大模型的局限性與未來發展第3頁/共34頁預訓練大模型的時代意義生成式人工智能基礎與應用|第二講AI的"超級大腦"核心技術路徑預訓練微調應用預訓練大模型如GPT、BERT已成為AI領域的核心引擎,具備前所未有的語言理解與生成能力通過海量數據訓練,模型能夠學習語言規律、知識關聯和推理能力從億級參數到千億參數的飛躍,使模型具備了接近人類的語言表達能力Transformer:革命性架構2017年提出的Transformer架構成為大模型的基石,徹底改變了NLP領域自注意力機制(Self-Attention):能夠捕捉文本中長距離依賴關系編碼器-解碼器結構:使模型同時具備理解和生成能力"Attentionisallyouneed."—Google,2017自然語言處理的革命機器翻譯精度大幅提升問答系統更加智能化文本生成更加連貫自然多語言處理能力顯著增強情感分析更加精準文本摘要自動化程度高各行業變革醫療健康輔助診斷、醫學文獻分析教育培訓個性化學習、智能導師法律服務法規檢索、合同審查金融分析風險評估、市場預測零售營銷個性化推薦、客服機器人創意內容文案創作、內容生成預訓練大模型正在重塑各行各業的工作方式與效率第4頁/共34頁預訓練大模型基礎概念生成式人工智能基礎與應用|第二講定義與特點預訓練大模型是在海量數據上進行自監督學習的大規模神經網絡模型,通常具有數十億到數千億參數。基于Transformer架構具備強大的語言理解與生成能力可通過微調適應多種下游任務發展歷程2017年Transformer架構提出,奠定大模型基礎2018年BERT、GPT等預訓練模型出現2020年GPT-3展示驚人的語言能力2022年"大模型元年",ChatGPT等產品問世參數規模預訓練大模型的參數量呈指數級增長:BERT3.4億GPT-31750億Llama34000億基本工作原理大模型將文本生成轉換為文本接龍問題:根據已有文本預測下一個最可能的詞或字符。預訓練過程在海量文本數據上學習語言規律通過自監督學習掌握語義關系學習詞語、句子的概率分布微調機制針對特定任務進行專項訓練引入人類反饋提升輸出質量調整模型適應不同領域需求核心組成部分Token化將文本分解為基本單元(詞、子詞或字符),便于模型處理自注意力機制捕捉序列中各元素間的長距離依賴關系,理解上下文多層結構通過多層Transformer塊逐步提取和處理特征,形成深度表示第5頁/共34頁Transformer架構:革命性的突破生成式人工智能基礎與應用|第二講革命性突破Transformer模型于2017年由Google提出,徹底改變了自然語言處理領域。它摒棄了傳統的RNN和CNN結構,完全基于注意力機制,使得模型能夠并行處理序列數據,捕捉長距離依賴關系。核心創新點自注意力機制(Self-Attention)允許模型同時關注序列中的不同位置,計算表示時考慮整個序列的上下文多頭注意力(Multi-HeadAttention)允許模型同時關注來自不同表示子空間的信息,豐富特征提取編碼器-解碼器結構編碼器提取輸入序列的特征表示,解碼器基于這些表示生成輸出序列位置編碼(PositionalEncoding)為模型提供序列中詞元位置信息,彌補注意力機制缺乏順序感知的不足Transformer的優勢并行計算,訓練速度快捕捉長距離依賴關系可擴展性強,適合大規模數據模型表達能力強Transformer架構圖編碼器(Encoder):處理輸入序列解碼器(Decoder):生成輸出序列多頭注意力:并行處理多種特征前饋神經網絡:非線性變換第6頁/共34頁自注意力機制詳解生成式人工智能基礎與應用|第二講什么是自注意力機制?自注意力機制(Self-Attention)是Transformer架構的核心組件,能夠:計算序列中任意兩個位置的關聯程度捕捉序列中的長距離依賴關系實現并行計算,大幅提高訓練效率數學原理自注意力機制通過三個關鍵向量實現:Q查詢向量(Query)K鍵向量(Key)V值向量(Value)Attention(Q,K,V)=softmax(QK/√d)·VTk自注意力的優勢相比RNN,能夠并行計算所有位置計算復雜度低,訓練速度快能夠學習到更豐富的上下文信息解決了傳統模型中的梯度消失問題自注意力計算過程可視化步驟一:輸入序列轉換為向量我喜歡人工智能步驟二:為每個詞生成Q、K、V向量查詢向量(Q)Q,Q,...,Q鍵向量(K)K,K,...,K值向量(V)V,V,...,V步驟三:計算注意力得分QK注意力矩陣步驟四:縮放并應用Softmax函數softmax(QK/√d)權重矩陣步驟五:加權求和得到輸出權重V輸出12n12n12nTTk第7頁/共34頁Transformer的編碼器結構生成式人工智能基礎與應用|第二講輸入嵌入(InputEmbeddings)位置編碼(PositionalEncoding)編碼器輸出(EncoderOutput)N×多頭注意力機制Multi-HeadAttention殘差連接+層歸一化Add&Norm前饋神經網絡FeedForwardNetwork殘差連接+層歸一化Add&Norm多頭注意力機制將輸入分割為多個"頭",每個頭獨立計算注意力能夠同時關注序列中的不同位置信息通過查詢(Q)、鍵(K)、值(V)三個矩陣實現增強模型捕捉復雜語言結構的能力前饋神經網絡由兩個線性變換組成,中間有ReLU激活函數對每個位置獨立且相同地應用引入非線性變換,增強模型表達能力通常第一層擴展維度,第二層壓縮回原始維度殘差連接將子層輸入直接添加到其輸出中緩解深層網絡訓練中的梯度消失問題允許信息在網絡中無障礙流動公式:Output=LayerNorm(x+Sublayer(x))層歸一化對每個位置的特征進行歸一化處理穩定網絡訓練,加速收斂過程減少內部協變量偏移(covariateshift)使得訓練對批量大小和初始化不那么敏感第8頁/共34頁Transformer的解碼器結構生成式人工智能基礎與應用|第二講掩碼多頭注意力機制掩碼自注意力:確保解碼器生成token時只能看到當前位置之前的token我愛北京天安門掩碼機制:預測"天"時只能看到"我愛北京"掩碼通過將未來位置設為負無窮大來實現解決了訓練與推理不一致的問題自回歸生成過程自回歸生成:逐步生成序列,每次生成一個token,并將其作為下一步的輸入步驟1<開始>今步驟2<開始>今天步驟3<開始>今天天步驟4<開始>今天天氣解碼器的輸出經過線性層和softmax轉換為概率分布,選擇最可能的下一個token編碼器-解碼器注意力機制交叉注意力:解碼器關注編碼器輸出的相關部分,建立源序列與目標序列的連接Q來自解碼器,K和V來自編碼器使解碼器可以關注輸入序列的相關部分在機器翻譯等任務中至關重要編碼器輸出解碼器當前狀態交叉注意力層解碼器完整結構解碼器通過多層堆疊,每層包含三個子層:掩碼自注意力、交叉注意力和前饋網絡輸入嵌入+位置編碼掩碼多頭自注意力Add&Norm編碼器-解碼器注意力Add&Norm前饋神經網絡第9頁/共34頁預訓練與微調范式生成式人工智能基礎與應用|第二講兩階段學習模式第一階段:預訓練(Pre-training)在大規模通用語料庫上訓練模型,掌握語言的基本規律和知識第二階段:微調(Fine-tuning)在特定任務數據集上調整模型參數,優化特定領域表現為什么采用這種范式?解決了數據稀缺問題:特定任務數據有限,但通用語料豐富實現知識遷移:通用知識可遷移至專業領域任務大幅節省計算資源:無需為每個任務從零訓練預訓練-微調流程大規模語料預訓練優勢特定任務微調優勢典型應用BERT預訓練后微調用于文本分類GPT預訓練后微調用于問答系統通用模型微調用于醫療診斷輔助學習語言的內在規律和豐富知識形成對語言的深層次理解能力通過自監督學習捕捉語言結構針對性調整模型行為與輸出少量標注數據即可取得良好效果適應特定領域的專業術語與規則第10頁/共34頁從BERT到GPT:模型家族演進生成式人工智能基礎與應用|第二講關鍵區別對比BERTGPT架構重點編碼器(Encoder)解碼器(Decoder)上下文處理雙向理解單向生成擅長任務類型理解、分析、分類創作、生成、對話2018BERT2019GPT-22020GPT-32022ChatGPT2023GPT-4BERT模型家族BERT(BidirectionalEncoderRepresentationsfromTransformers)由Google于2018年提出,專注于雙向編碼能力。核心特點雙向語境理解:同時考慮前后文掩碼語言建模(MLM)預訓練擅長理解和分析任務常見應用命名實體識別問答系統情感分析文本分類GPT模型家族GPT(GenerativePre-trainedTransformer)由OpenAI開發,專注于自回歸生成能力。核心特點單向預測:從左到右生成文本自回歸語言模型(ALM)預訓練擅長創作和生成任務常見應用文章寫作代碼生成對話系統機器翻譯第11頁/共34頁大模型的涌現能力生成式人工智能基礎與應用|第二講涌現能力的定義涌現能力是指大模型在達到一定規模后,突然表現出的、在較小規模模型中未曾觀察到的新能力。隨著參數量和訓練數據的量變,模型能力發生質變能力提升呈階躍式而非線性增長典型涌現能力示例代碼編寫能夠生成復雜功能的程序代碼,理解編程語言語法與邏輯數學推理解決復雜數學問題,展示逐步推理能力語言理解理解隱喻、諷刺和復雜文化背景的語言表達常識推理運用"常識"解決需要背景知識的問題涌現能力與模型規模關系科學原理與實踐意義科學原理規模法則(ScalingLaws):能力與參數量、數據量呈特定數學關系隱含知識整合:大規模參數能存儲并連接更多知識點復雜模式識別:能捕捉數據中的高階規律和關聯實踐意義指導未來模型研發:預測新能力出現的臨界點應用場景拓展:推動AI在更多專業領域的應用啟發認知科學:為人類智能研究提供新視角提升資源效率:明確投入產出比,優化計算資源分配第12頁/共34頁實驗任務一:AI寫作比賽Project-BasedLearning第13頁/共34頁實驗目標1體驗AI生成能力親身體驗主流大模型平臺的文本生成能力2理解生成原理深入理解"生成式"模型的工作機制3對比分析能力比較不同平臺的生成效果與特點實驗概述寫作主題中英雙語創作3個主流AI平臺小組分享討論推薦平臺文心一言百度AI平臺Kimi月之暗面通義千問阿里云AI訊飛星火科大訊飛實驗重點通過實際操作,深入理解GPT模型"文字接龍"式的生成機制,體驗預訓練大模型的強大能力3平臺6作品2語言接下來:平臺注冊與熟悉實驗一步驟:平臺注冊與熟悉生成式人工智能基礎與應用|第二講1選擇三個主流大模型平臺從上述平臺中選擇三個不同的大模型平臺進行實驗,建議選擇同時支持中英文的平臺。2完成用戶注冊3熟悉界面與功能實驗提示記錄各平臺的界面特點、功能差異和使用體驗,為后續寫作實驗做準備。嘗試使用簡單對話來測試各平臺的基本響應能力,例如詢問天氣、日期或簡單知識問答。文心一言百度開發的大語言模型KimiMoonshotAI開發的對話助手通義千問阿里巴巴開發的大語言模型訊飛星火科大訊飛開發的認知大模型其他選擇Claude、ChatGPT等平臺創建賬號使用學校郵箱注冊設置安全密碼完成身份驗證隱私保護閱讀隱私政策了解數據使用規則設置個人隱私選項記錄平臺信息記錄注冊平臺名稱注意免費使用限制了解平臺特色功能界面探索熟悉對話窗口、提示區、歷史記錄等基本布局了解不同平臺的獨特設計和操作邏輯體驗移動端和PC端的操作差異功能測試嘗試基礎對話功能,測試模型回應速度探索特色功能(如文檔上傳、圖像生成等)了解中英文切換和語言支持情況第14頁/共34頁實驗一步驟:寫作實踐AI寫作比賽-體驗生成能力實驗步驟作文題目"WorkingwithAItoCreateaBetterFuture"語言要求中文版本必需英文版本必需每個平臺分別生成中英文各一篇選擇AI平臺建議選擇3個不同平臺進行對比測試文心一言推薦百度出品,中文能力強Kimi推薦長文本處理能力出色通義千問可選阿里云AI助手訊飛星火可選科大訊飛認知智能操作流程1登錄平臺使用已注冊賬號登錄選定的AI平臺2輸入指令要求AI寫作《攜手AI,共創美好未來》3生成中文版獲取AI生成的中文作文內容4生成英文版要求AI生成英文版本的作文5記錄結果保存所有生成的內容用于后續分析記錄要點:平臺名稱、生成時間、完整內容、生成質量第15頁/共34頁實驗一步驟:小組分享與分析生成式人工智能基礎與應用|第二講比較維度寫作風格·語言風格(正式/口語)·修辭手法運用·句式多樣性·情感表達方式內容深度·論點豐富度·事實與觀點比例·專業知識準確性·例證和引用質量邏輯結構·論證連貫性·段落組織結構·引言與結論質量·轉折與過渡自然度討論指南AI寫作的優點高效性:短時間內生成大量內容知識廣度:融合多領域信息結構性:遵循寫作框架與規范可定制性:根據需求調整風格AI寫作的不足原創性:難以產生真正創新思想情感深度:缺乏真實人類情感體驗事實準確性:可能包含錯誤信息文化敏感度:對特定文化理解有限小組活動指南1分組展示(15分鐘)每組選取3個平臺生成的中英文作品,每個平臺各選1篇,共展示3篇作品。重點說明使用的平臺和生成過程。2交叉評比(20分鐘)不同小組交叉評比其他組的作品,使用比較維度中的標準進行分析,找出不同平臺生成內容的特點與差異。3總結討論(15分鐘)全班共同討論AI寫作的優缺點,分享對比結果,思考AI寫作與人類寫作的根本區別。預期收獲理解不同大模型在文本生成能力上的差異掌握AI寫作內容的評估標準與方法批判性思考AI寫作的優勢與局限培養團隊協作與分析評價能力第16頁/共34頁實驗一進度:GPT模型原理解析生成式人工智能基礎與應用|第二講震驚!ChatGPT的回答竟然是這樣?成的...ChatGPT的驚?…ChatGPT工作原理視頻解析自回歸生成機制GPT模型像"文字接龍"一樣逐步生成文本:我想去...?模型預測下一個最可能的詞:杭州P=0.25北京P=0.151基于已有的詞序列,預測下一個最可能出現的詞2將預測出的詞加入序列,繼續預測下一個詞3重復此過程,直到生成完整的文本GPT的"G"即為"生成式"(Generative),表示它能夠生成新的內容,而不僅僅是理解已有內容預訓練-微調流程→預訓練在海量通用文本上訓練學習語言的基本規律和知識類似人類的"通識教育"微調在特定任務數據上訓練調整模型以適應特定領域類似人類的"專業訓練"GPT模型特點大規模參數:從GPT-1的1.17億參數到GPT-3的1750億參數涌現能力:隨著規模增大,展現出意想不到的新能力跨領域:能夠處理多種不同類型的語言任務指令跟隨:通過指令可以引導模型完成特定任務預訓練階段微調階段第17頁/共34頁2實驗任務二:AI寫作評審生成式人工智能基礎與應用|第二講下一步實驗內容讓我們親自體驗AI評審,分析其評價機制任務目標探索AI在作文評審與反饋中的應用能力體驗AI對內容質量的評價標準比較AI評審與人類(同學、老師)評價的異同實驗價值思考問題:AI能否當"老師"?AI評審是否具備公正性、準確性?對比分析:AI評審與人類評審各有哪些優勢與局限性?深入理解:AI如何"學習"評價標準,其評價機制是什么?實驗概述利用AI平臺對實驗一中生成的作文進行交叉評審記錄AI給出的分數、優缺點評價等反饋分析比較不同AI平臺的評審風格與側重點優點分析不足指出評分反饋AI評審特點高效率批量處理,即時反饋一致性評價標準穩定統一知識廣泛多領域參考標準待探索公正性與局限性?第18頁/共34頁實驗二步驟:AI評審體驗生成式人工智能基礎與應用|第二講實驗目標通過讓AI評審AI生成的作文,探索AI在內容評價方面的能力與局限性操作步驟1準備評審材料收集實驗一中三個平臺生成的六篇作文(中英文各三篇)2交叉評審設計將平臺A生成的作文交給平臺B評審,平臺B生成的作文交給平臺C評審,依此類推3評審提示設計向AI提供清晰的評審指令,例如:"請以中文作文評審專家的角度,對以下作文進行評分(滿分100分)并給出詳細點評,包括內容、結構、語言和創新性四個維度。"評審平臺示例文心一言通義千問訊飛星火評審記錄表評審項目記錄內容作文來源平臺名稱+語言評審平臺使用的AI評審平臺總體評分AI給出的分數(滿分100)優點評價AI認為的作文優勢改進建議AI給出的修改意見記錄完整的AI評審過程,為后續分析不同平臺評審差異提供依據第19頁/共34頁實驗二步驟:結果分析與討論生成式人工智能基礎與應用|第二講AI評審與人類評價對比分析評分標準AI評審人類評價·AI可能更注重形式與結構,人類更關注創意與思想深度·AI評分可能更加一致性,人類評分更具多樣性與主觀性反饋特點·AI反饋更全面系統,涵蓋多個維度·人類反饋更針對性,能捕捉特定亮點與不足·AI反饋更即時,人類反饋需要更多時間文化理解·AI對通用知識把握較好,但對特定文化語境理解有限·人類能更好理解文化內涵與隱喻實驗結果分析方法1數據收集與整理將AI評審與同學、老師評價進行系統記錄與對比2多維度比較分析從評分標準、反饋內容、理解深度等角度進行對比3小組討論與總結通過小組討論形成對AI評審優缺點的共識關鍵討論點AI評審的公正性·AI是否能避免人類評價中的主觀偏見?·AI是否可能存在其他形式的偏見(如訓練數據偏見)?·思考:如何利用AI的一致性提高評審公正性?AI評審的準確性·AI能否準確理解作文的深層含義?·AI在評價創新性和原創性方面的表現如何?·思考:AI評分與人類專家評分的一致性有多高?AI評審的局限性·AI是否能理解文化背景與情感表達?·AI在評價非常規思維和創新表達方面的不足·思考:AI評審與人類評審如何互補?小組討論引導請小組成員結合實驗結果,討論以下問題:問題1AI評審在哪些方面表現優于人類評審?哪些方面不如人類?問題2AI評審是否能替代人類教師進行作文評閱?為什么?問題3如何結合AI與人類評審的優勢,設計更有效的評審機制?問題4你認為未來AI評審技術會如何發展與改進?第20頁/共34頁RLHF技術原理生成式人工智能基礎與應用|第二講什么是RLHF?RLHF(ReinforcementLearningfromHumanFeedback):基于人類反饋的強化學習目標通過人類反饋引導AI模型生成符合人類偏好和價值觀的內容,解決AI"對齊"問題核心思想讓AI從人類評價中學習,不斷優化輸出質量,使其更符合人類期望應用案例ChatGPT、Claude等主流大模型均采用RLHF技術提升輸出質量和安全性RLHF工作流程監督微調(SFT)使用高質量人工標注數據對預訓練模型進行微調,使其能夠按照指令生成內容例:讓模型學會回答問題、遵循指令等基本能力1獎勵模型訓練(RM)收集人類對模型多個輸出的偏好排序,訓練一個能預測"人類會喜歡哪個回答"的獎勵模型例:人類評價者對同一問題的多個回答進行排序,模型學習這種偏好2強化學習優化(PPO)使用獎勵模型為語言模型的輸出打分,通過強化學習算法(如PPO)優化模型策略例:模型生成多個回答,高分回答得到強化,低分回答被抑制3RLHF對大模型的關鍵提升增強安全性與倫理性提高輸出內容的可靠性使回答更符合人類價值觀持續迭代改進模型表現第21頁/共34頁大模型評估基準概述生成式人工智能基礎與應用|第二講大模型評估基準是衡量AI模型在不同能力維度上表現的"標準考試",幫助我們客觀評價模型性能。評估維度覆蓋:語言理解知識廣度推理能力問題解決創造性思維MMLU英文理解全稱:MassiveMultitaskLanguageUnderstanding評測維度:涵蓋人文、社科、理工、醫學等57個學科測試模型的多領域知識廣度與深度以英語為主的多選題形式,模擬大學水平考試C-Eval中文理解全稱:ChineseEvaluationSuite評測維度:專為中文語言環境設計的綜合評測集覆蓋中國教育體系中的多個學科領域評估模型在中文語境下的知識理解與應用能力AGIEval通用智能全稱:ArtificialGeneralIntelligenceEvaluation評測維度:評估AI在人類認知任務中的表現包含推理、創造性思維、決策等能力測試模擬高等教育入學考試和職業資格考試GSM8K數學推理全稱:GradeSchoolMath8K評測維度:包含8,000多道小學到高中數學應用題測試模型的多步驟推理和數學解題能力需要模型展示完整解題過程而非僅給出答案第22頁/共34頁實驗任務三:大模型能力對比與評估生成式人工智能基礎與應用|第二講任務目標理解大模型能力評估的多維度標準學會查閱和解讀主流大模型的公開評測數據掌握比較不同模型性能的方法評估基準解讀MMLU英文綜合理解能力測試,涵蓋多學科知識C-Eval中文理解能力評測,測試中文語言理解AGIEval通用智能評估,測試綜合問題解決能力GSM8K數學推理評測,測試數學問題解決能力實驗步驟1數據查找查閱表2-1,了解主流大模型在不同評測基準下的表現2小組討論分析哪些模型在中文、英文、數學推理等方面表現突出探討開源與閉源模型的差異主流大模型性能數據表2-1展示了主流大模型在不同評測基準上的分數表現,數據越高表示性能越好MMLU(英文理解)C-Eval(中文理解)GSM8K(數學推理)第23頁/共34頁實驗三步驟:數據查找與分析生成式人工智能基礎與應用|第二講數據查找任務1查閱表2-1,了解主流大模型在不同評測基準下的表現。2關注模型在MMLU、C-Eval、AGIEval和GSM8K等評測基準上的得分。3記錄不同模型的參數量、開源情況及各項評測分數。4分析模型性能與參數量之間的關系,探索開源與閉源模型的性能差異。評測基準解析MMLU英文理解能力,包含57個學科的多項選擇題測試C-Eval中文理解能力,覆蓋人文、社科、理工等領域的綜合評測AGIEval通用人工智能評測,測試模型解決復雜問題的能力GSM8K數學推理能力,包含8千多道小學數學應用題主流大模型能力評估對比分析要點:GPT-4和Llama3在英文理解(MMLU)和數學推理(GSM8K)方面表現突出DeepSeek-V2在中文理解(C-Eval)方面得分最高(81.7)參數量與性能并非完全正相關,如Llama3(400B)性能優于參數量更大的PaLM2(3400B)開源模型(如Llama3、Qwen1.5)與閉源模型(如GPT-4)性能差距正在縮小思考問題哪些模型在中文理解方面表現更好?比較不同模型在C-Eval基準上的得分,分析原因。開源與閉源模型有何主要差異?對比開源和閉源模型的性能表現,討論各自優劣勢。參數量與模型性能的關系如何?探討參數量是否總是與模型性能成正比。不同評測基準的側重點是什么?分析各評測基準的特點及其對不同應用場景的指示意義。第24頁/共34頁主流大模型能力評估對比生成式人工智能基礎與應用|第二講主流大模型在不同基準測試上的表現差異,反映了各模型的能力特點和適用場景:模型名稱參數量(億)MMLUC-EvalAGIEvalGSM8K開源情況GPT-4NA86.468.7NA87.1閉源Llama3-400B400086.1NANA94.1開源Qwen1.5-110B110080.4NANA85.4開源DeepSeek-V2-236B236078.581.7NA79.2開源PaLM2340078.3NANA80.7閉源GLM-130B130044.844.0NANA閉源GPT-3.5175070.054.4NA57.1閉源主要評測指標對比評測指標解讀MMLU:測試模型在57個英文學科領域的多任務語言理解能力C-Eval:評估模型在中文知識和理解方面的表現GSM8K:考察模型解決數學推理問題的能力AGIEval:測試模型的通用人工智能能力關鍵發現參數規模與性能:Llama3-400B擁有最多參數(4000億),在GSM8K上表現最佳中英文差異:DeepSeek-V2在C-Eval(中文)上表現突出,而GPT-4在MMLU(英文)上領先開源趨勢:開源模型(如Llama3、DeepSeek等)性能已接近甚至超越部分閉源模型第25頁/共34頁實驗三步驟:小組討論生成式人工智能基礎與應用|第二講討論主題與參考數據根據表2-1的大模型評估數據,討論以下問題:模型名稱參數量(億)MMLUC-EvalGSM8K開源情況GPT-4NA86.468.787.1閉源Llama3-400B400086.1NA94.1開源Qwen1.5-110B110080.4NA85.4開源DeepSeek-V2-236B236078.581.779.2開源GPT-3.5175070.054.457.1閉源注:MMLU(英文理解)、C-Eval(中文理解)、GSM8K(數學推理)評測基準*高亮數值表示在該項評測中表現突出的模型數據解讀要點GPT-4在英文理解和數學推理方面表現優異Llama3-400B雖為開源模型,但在數學推理上超越了GPT-4DeepSeek-V2-236B在中文理解方面得分最高開源模型在某些領域已經接近或超過閉源商業模型小組討論指南討論一:各模型在不同任務上的優勢Q1哪些模型在英文理解方面表現突出?這可能與什么因素有關?Q2哪些模型在中文理解方面表現突出?為什么會有這樣的差異?Q3為什么有些模型在數學推理方面表現特別好?這體現了什么能力?討論二:開源與閉源模型的差異Q1開源模型(如Llama3、Qwen1.5)與閉源模型(如GPT-4)在性能上有何差距?Q2開源模型對教育和研究有哪些獨特價值?閉源模型有何優勢?Q3參數量與模型性能之間是否存在必然聯系?為什么?討論方法與記錄每組選出一名記錄員,記錄討論過程與結論討論時間:15分鐘,之后各組選代表分享觀點注意結合實際應用場景,思考不同模型的適用情境第26頁/共34頁實驗任務四:大模型交互實踐生成式人工智能基礎與應用|第二講實驗目標通過實際操作體驗大模型交互過程,理解模型輸入與輸出的關系,掌握與AI高效溝通的方法。注:本實驗關注基礎交互,不涉及高級提示工程技巧。知識要點1大模型以"對話"為基本交互單位,能記憶上下文2輸入的明確性、結構性直接影響輸出質量3大模型會根據指令調整輸出格式和內容預期收獲掌握基本的大模型交互技巧理解輸入表述對輸出質量的影響能設計更有效的任務指令培養AI輔助學習與工作的能力大模型交互流程傳遞信息返回結果圖:指令與模型響應示例用戶輸入明確的任務描述、所需格式、背景信息等大模型處理模型理解輸入→生成響應→格式化輸出理解處理生成優化模型輸出根據輸入生成的回答、分析、創作等內容第27頁/共34頁實驗四步驟:任務設計與實施生成式人工智能基礎與應用|第二講任務類型設計設計多樣化任務,體驗大模型不同能力維度信息查詢類測試模型檢索事實知識的準確性與全面性示例:查詢歷史事件、科學原理、地理信息等內容創作類體驗模型的創意表達與文本生成能力示例:寫作文、詩歌、故事、創意文案等知識問答類測試模型對專業知識的理解與解釋能力示例:學科概念解釋、專業問題分析等邏輯推理類評估模型的邏輯思維與問題解決能力示例:數學題、邏輯謎題、案例分析等實施流程1任務規劃為每種任務類型設計2-3個具體問題,考慮難度梯度建議同時設計簡單和復雜任務,比較大模型在不同難度下的表現2平臺選擇選擇至少2個不同的大模型平臺進行對比實驗文心一言通義千問訊飛星火KimiChatGPT3執行測試將相同任務在不同平臺上執行,記錄模型響應記錄完整對話過程注意響應時間差異4結果整理對比不同模型在各類任務上的表現,形成結構化記錄任務設計要點明確目標每個任務應有明確的測試目標,針對模型的特定能力難度平衡設計不同難度級別的任務,測試模型的能力邊界中英文對比同一任務用中英文分別測試,對比語言能力差異標準一致保持相同的評估標準,確保結果可比性第28頁/共34頁實驗四步驟:結果對比與分析生成式人工智能基礎與應用|第二講小組討論提示:結合表2-1中不同模型在MMLU、C-Eval、GSM8K等基準上的表現數據,分析各模型的特點結果對比框架按以下維度對比不同模型完成相同任務的表現:1響應時間與效率記錄各模型生成內容所需時間,評估響應速度差異2內容質量與相關性評估生成內容的準確性、完整性和與任務的相關程度3語言表達與邏輯性比較語言流暢度、表達方式和內容的邏輯結構4創新性與獨特視角觀察模型是否提供了獨特的見解或創新性的解決方案記錄與可視化將對比結果記錄在表格中,可使用以下方式呈現:比較矩陣表格性能雷達圖評分卡片優缺點列表分析框架深入分析模型表現差異的原因:參數規模與訓練數據分析模型參數量、預訓練數據集的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國外部磁盤存儲系統項目創業計劃書
- 中國假肢項目創業計劃書
- 中國藍牙終端設備項目創業計劃書
- 中國AMR解決方案項目創業計劃書
- 中國人造草坪項目創業計劃書
- 2025年1月寧夏高考適應性測試物理試題及答案
- 中國金屬制液體儲藏罐項目創業計劃書
- 中國計算機輔助設計(CAD)軟件項目創業計劃書
- 中國光盤項目創業計劃書
- 2025年度商業光伏電站建設合同
- 25春國家開放大學《形勢與政策》專題測驗1-5+大作業參考答案
- 2024-2025人教版一年級下冊數學期末考試卷附答案 (三套)
- 2025屆高三押題信息卷(一)物理及答案
- 2025-2030中國飛機維修行業市場發展分析及發展前景與投資策略研究報告
- 有機化學 有機上期末試卷(含答案)學習資料
- 配送生鮮公司管理制度
- 電解液管理制度
- 定密責任人培訓
- 2024年溫州大學輔導員考試真題
- 智能電網運營行業跨境出海戰略研究報告
- 業主房屋裝修管理中的常見違規行為處置
評論
0/150
提交評論