




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
生成式人工智能:發展演進及產業機遇徐思彥騰訊研究院高級研究員當OpenAI在2022年11月30日發布Ch一場眩暈式的變革。自2010年代初深度學習問世以來,人工智能進入到第三次高潮。而2017年Transformer算法將模型時代。OpenAI基于Transformer的Decoder部分建立起來了GPT家族。ChatGPT一經面世便風靡全球,人們驚訝于其能夠進行連貫、有深度對話的同時,也驚異地發現了它涌現了推理、思能力。伴隨AI預訓練大模型持續發展、人工智能生成內容(AIGC)算法不斷創新以及多模態AI日益主流化,以Chat技術加速成為AI領域的最新發展方向,推動AI迎來下一個大發展、大繁榮的時代,將對經濟社會發展產生重大的影響 AIGC技術的定義及背景AIGC(ArtificialInteligenceGeneratedContent),指的是通過人工智能技術自動生成內容的生產方式。通過訓練與訓練數據相似的內容。與傳統類型的AI主要關注識別和預測現有數據的模式不同,AIGC著重于創造新的、有創意理在于學習和理解數據的分布,進而生成具有相似特征的新數據,在圖像、文本、音頻、視頻等多種領域都有廣泛最引人注目的應用當屬ChatGPT。ChatGPT是基于OpenAI公司的大型語言模型GPT-3.5訓練、調試、優化的聊天機AI模型可以處理各種各樣的文字和推理任務。ChatGPT發布僅兩個月即獲得1億月活用戶,超越了歷史上所有互聯網用戶增長速度。以大型語言模型、圖像生成模型為代表的AIGC技術,成為新一代人工智能的平臺型技術,助力不AIGC大爆發的背后,普遍認為三個領域的AI技術的發展為其提供了肥沃的土壤,分別是生成算法、預訓練模型和多第一,隨著各種生成算法的不斷創新突破,AI現在已經可以生成文字、代碼、圖像、語音、視頻物體等各種類型的與過去最顯著的區別是從分析式AI(AnalyticalAI)發展為生成式AI(GenerativeAI)。分析式AI模型是根據已有斷、預測,最典型的應用之一是內容智能推薦;生成式AI模型則是學習已有數據后進行演繹、生成創造全新內容。第二,預訓練模型,也就是我們常說的大模型,引發了AIGC技術能力的質變。在過去,研究人員需要針對每一個類型I模型,訓練好的模型只能從事特定任務,不具有通用性。而預訓練的大模型技術顯著提升了AIGC模型的通用化能力AIGC模型成為自動化內容生產的“工廠”和“流水線”。生成式AI模型,包括ChatGPT、GPT-4等大語言模型(Ladels,LLM)和Midjourney、StableDiffusion等圖像生成模型,又被稱為基礎模型(FoundationModels其的海量數據預訓練的深度學習算法,展現出強大的、更加泛化的語言理解和內容生成能力。以大型語言模型(LLM)為例,經過海量的互聯網內容數據的訓練,語言模型的參數可以達到萬億甚至百萬億級別。模型的生成能力,同一個語言模型可以高質量地完成各種各樣的文字和推理任務,例如作詩、寫文章、講故事、寫代等等。因此,大模型已經成為了各大企業競相追逐的AI方向。第三,多模態AI技術的發展。多模態技術讓AIGC模型可以跨模態地去生成各種類型的內容,比如把文字轉化為圖片步增強了AIGC模型的通用能力。[1]1)生成對抗網絡(GAN,GenerativeAdversarialGAN是由IanGoodfellow等人于2014年提出的一種生成式模型。它由生成器(Generator)和判別器(Discrimina生成器負責生成新的數據,判別器負責判斷生成數據與真實數據的相似程度。通過不斷的訓練,生成器能夠生成越來2)變分自編碼器(VAE,VariationalAutoencoVAE是一種基于概率生成模型的生成式方法,它通過編碼器(Encoder)和解碼器(Decoder)兩部分來實現數據的將輸入數據映射到潛在空間中的一個分布,解碼器負責從潛在空間中的分布采樣數據并生成新的數據。RNN是一種用于處理序列數據的神經網絡結構。RNN具有記憶功能,能夠捕捉序列數據中的時序信息。在生成式人Transformer是一種基于自注意力(Self-Attention)機制的神經網絡結構,它在自然語言處理領域取得了顯著的成果型可以用于生成式任務,如文本生成、機器翻譯等。其他相關技術:除了上述技術外,還有一些其他的生成式模型和技術,如PixelRNN、PixelCNN、WaveNet等。這頻生成等領域也取得了一定的成果。大語言模型等生成式AI技術帶來了新的AI發展范式,其應用前景十分廣闊。。對于大眾而言,生成式AI意味著新的創大程度上解放個體的創造力和創意生產。除此之外,AIGC還將改變獲取信息的主要方式。ChatGPT在尋找答案、解經部分的超越了如今的搜索引擎,ChatGPT或許在未來會改變我們獲取信息、輸出內容的方式,AIGC有望成為數字比爾·蓋茨將人工智能的發展和微處理器、個人電腦、互聯網以及智能手機相提并論,認為其將重塑所有的行業。微軟atyaNadella認為,ChatGPT是知識工作者的“工業革命”,斷言人工智能將徹底改變所有類型的軟件服務。目前,會議等諸多軟件服務都已融入了生成式AI的能力。OpenAI公司首席執行官SamAltman稱,多模態的AI大模型有望之后的新的技術平臺。這意味著,開發人員基于預訓練的AI大模型,可以通過模型微調快速開發出垂直領域的模型用,人工智能的革命性正在于此。[2] AIGC的應用領域及案例自然語言生成是一種AIGC技術,可以生成逼真的自然語言文本。生成式AI可以編寫文章、故事、詩歌等,為作家和的創作方式。同時,它還可以用于智能對話系統,提高用戶與AI的交流體驗。ChatGPT(全名:ChatGenerativePre-trainedTransformer對話生成式預訓練變換模型)是由OpenAI開發的一器人程序,于2022年11月推出。該程序使用基于GPT-3.5架構的大型語言模型并通過強化學習進行訓練。ChatG式互動,可以解決包括自動文本生成、自動問答、自動摘要等在內的多種任務。Jasper已經開始為谷歌、臉書等知名公司提供文案AIGC的商業服務。2.圖像生成領域圖像生成是AIGC技術中最為普遍的應用之一。StabilityAI發布了穩定擴散(StableDiffusion)模型,通過開源快速I繪畫的技術使用門檻,消費者可以通過訂閱旗下產品DreamStudio來輸入文本提示詞生成繪畫作品,產品已經吸引3.音視頻創作與生成AIGC技術可以用于語音合成,即生成逼真的語音。例如,通過學習人類的語音特征,生成式模型可以生成逼真的語助手、語音翻譯等應用。AIGC技術可以用于生成音樂。生成式AI可以根據給定的風格和旋律創作新的音樂作品,為作靈感。這種技術還可以幫助音樂家更有效地探索音樂風格和元素的組合。這些曲目可以用于音樂創作、廣告音樂等生成式AI可以用于生成虛擬角色、場景和動畫,為電影和游戲制作帶來更多的創意可能。此外,AI還可以根據用戶的2023年3月,騰訊AILab在GDC上提出了3D虛擬場景自動生成解決方案,能夠幫助游戲開發者以更低成本創造風格虛擬城市,提升3D虛擬場景的生產效率。其中重點分享了城市布局生成、建筑外觀生成和室內映射生成三大能力。調過程僅需要不到30分鐘,相比手動設計效率提升近100倍;而單個獨特建筑的制作時間也降低至17.5分鐘,大大提生成式AI可以在化學、生物學、物理學等領域探索新的理論和實驗方法,幫助科學家發現新的知識。此外,生成式A計、材料科學等領域,加速技術創新和發展。6.代碼生成領域經過自然語言和數十億行代碼的訓練。部分生成式AI模型精通十幾種語言,包括Python、JavaScript、Go、Perl、能夠根據自然語言的指令生成相應的代碼。GitHubCopilot是一個GitHub和OpenAI合作產生的AI代碼生成工具,可根據命名或者正在編輯的代碼上下文為開發官方介紹其已經接受了來自GitHub上公開可用存儲庫的數十億行代碼的訓練,支持大多數編程語言。騰訊云新一代AI代碼助手CODINGWise:將大模型AI能力賦能給開發者,增強開發體驗,提升開發效率。CODI編程語言、主流開發框架和常用IDE。具備代碼補全、生成單元測試、代碼糾錯等能力,能輔助開發者加速開發過程,ODINGWise能力覆蓋溝通、編碼、評審等關鍵環節,包括:溝通環節:通過對話方式,進行上下文推理給出代碼理解代碼邏輯;研發環節:根據當前代碼類型、代碼上下文等信息進行代碼補全;能根據代碼反向生成注釋和單元節:進行代碼查錯、定位問題并輔助生成建議;隨后給出建議代碼、替換錯誤的代碼塊;評審環節:輔助開發者生成可以輔助評審者生成評審建議;調試環節:可通過自然語言指令實現快速的代碼修改和調優。騰訊會議·AI小助手:只需通過簡單自然的會議指令,基于對會議內容的理解,就可以完成信息提取、內容分析、會管務。會后可以自動生成智能總結摘要,還能基于智能錄制的能力,幫助用戶高效回顧,提升用戶開會和信息流轉效率彭博社于近期發布了為金融界打造的大語言模型(LLM)——BloombergGPT。它使用了類似于ChatGPT的技術原ormer模型和大規模預訓練技術來實現自然語言處理,擁有500億參數。BloombergGPT的預訓練數據集主要來自彭數據,構建了一個3630億個標簽的數據集,支持金融行業的各種任務。BloombergGPT的目標是幫助用戶更好地理解和分析金融數據和新聞。它可以根據用戶的輸入,生成與金融相關的自新聞摘要、市場分析、投資建議等。它的應用場景主要包括金融分析、投資咨詢、資產管理等領域。例如,在資產管據歷史數據和市場情況,預測未來的股票價格和交易量,為投資經理提供投資建議和決策支持。在財經新聞領域,B根據市場數據和事件,自動生成新聞摘要和分析報告,為讀者提供及時、準確的金融信息。AI智能體(AIAgent)被認為是OpenAI的下一個方向。從今年3月AutoGPT推出后,GenerativeAgent、GPTGI項目的爆發將LLM的敘事代入了新的階段,從“超級大腦”到真正有可能成為“全能助手”。2023年4月,一個名叫AutoGPT的開源項目在Github上發布了,截止至2023年4月16日,該項目已經獲得70K+星由GPT-4驅動的可以自主實現用戶設定的任何目標的開源應用程序。當用戶提出一個需求或任務時,AutoGPT會自主體的執行計劃并開始執行,直到完成用戶提出的要求。Auto-GPT的出現意味著AGI正逐漸向更加自主化和智能化的方向發展。首先,它可以使人工智能應用更加普及和便利夠自主分析和執行任務,大大降低了應用的門檻和成本,讓更多的人能夠輕松地使用人工智能技術來解決問題。其次提高人工智能應用的效率和精度。傳統的人工智能模型需要從頭到尾地執行整個任務,這會浪費很多時間和計算資源誤。AutoGPT可以自主分析任務,并且提出具體的執行計劃,這樣可以大大縮短執行時間,并且減少錯誤率。[3]盡管Auto-GPT還在非常早期的實驗階段,但其開創了一種全新的AI交互方式,即由機器主動提出任務和計劃,人類標。這種交互方式不僅提高了AI智能體的自主性和靈活性,同時也拓展了人與AI之間的交互方式,打破了人類對于人想象,使得人工智能技術能從“工具”走向人類的“伙伴”。除了獨立的AIAgent之外,未來還可能出現由多個AI智能體組成的“虛擬智能社會”。GenerativeAgents—在由斯合發表的一篇名叫《GenerativeAgents:InterativeSimulacraofHumanBehavior》論文中,研究者們成功地構鎮”,其中的25個智能體在小鎮上生存。借助AIGC,其中的NPC具備了可信人類行為,并對周圍環境變化做出適當國外商業咨詢機構預測,到2030年AIGC和生成式AI市場規模將達到1100億美元。正如“互聯網+”一樣,“AIGC各業,在教育、醫療、金融、政務、制造、機器人、數字人、元宇宙、廣告營銷、電子商務、市場和戰略咨詢等眾多形式,深度賦能千行百業,助力高質量發展。 AIGC的產業應用中的挑戰與問題1.可解釋性與可靠性生成式人工智能的可解釋性問題是指生成式人工智能(GenerativeArtificialIntelligence)所產生的結果難以解釋或智能是一種基于深度學習的人工智能技術,其通過學習大量數據來生成新的數據或圖像。但是,生成式人工智能所產理解和解釋,因為其內部的運作過程非常復雜,而且很難直觀地描述。這種可解釋性問題對于許多應用場景都非常重要,比如醫療診斷、金融風控、自動駕駛等領域。在這些領域中,人們工智能的內部運作過程,以便更好地理解其產生的結果,并且能夠對其進行調整和優化。解決生成式人工智能的可解釋性問題是當前人工智能研究的一個重要方向,研究人員正在探索各種方法來使生成式人可解釋和可理解。這些方法包括可視化技術、可解釋性模型、對抗性樣本等等。2.AI大模型的價值對齊問題所謂人工智能的價值對齊(AIAlignment就是讓人工智能系統的行為符合人類的目標、偏好或倫理原則。價值對一個核心議題。在理論上,如果一個強大的AI系統所追求的目標和人類的真實目的意圖和價值不一致,就有可能給果。就目前而言,大語言模型的價值對齊問題主要表現為,如何在模型層面讓人工智能理解人類的價值和倫理原則,的有害輸出,從而打造出更加有用同時更加符合人類價值觀的AI模型。在這方面,RLHF是一個有效的方法,通過小現比較好的效果。簡言之,RLHF要求人類專家對模型輸出內容的適當性進行評估,并基于人類提供的反饋對模型進減少模型在未來生產有害內容的可能性。實際上,RLHF算法不僅是確保AI模型具有正確價值觀的關鍵所在,而且對長期健康可持續發展也十分重要。[4]3.塑造負責任的AI創新生態大語言模型等生成式AI的進展,在讓人們看到AGI曙光的同時,也帶來更加復雜難控的風險,包括對人類未來生存的需要成為一個負責任創新的時代,而非另一個“快速行動、打破陳規”的時代。人們需要建立合理審慎的AI倫理和治任的AI生態,打造人機和諧共生的未來。生成式AI領域的創新主體則需要積極探索技術上和管理上的安全保障措施,在科技向善理念之下,人工智能時代不應成為另一個“快速行動、打破陳規”的時代(即先快速把產品做出來,事后等方式解決其社會問題而應成為一個負責任創新的時代,通過建立合理審慎的AI倫理和治理框架,塑造負責任的和諧共生的未來。[5] AIGC在產業應用中的未來趨勢1.多模態帶來創新應用藍海多模態AI是指能夠處理和理解多種類型信息的人工智能,如文本、圖像、音頻、視頻等。這種AI不僅能夠處理單一數且可以在不同數據類型間建立聯系和融合,從而實現一個綜合、全面的理解多模態。AI能夠對各種不同類型的數據進在多模態技術發展初期,不同模態的AI開始進行集成,比如圖像識別和自然語言處理技術的結合。除了ImageBind打數仍在探索文本與圖像的融合,但進展飛快。UniDiffuser:除了單向文生圖,還能實現圖生問、圖文聯合生產、無條OpenAI開發了許多多模態AI案例如DALL-E、CLIP等,可以識別圖像中的對象,同時生成與圖像相關的描述性文本隨著多模態技術的進展,多模態AI在理解和處理不同類型數據時能夠實現更高程度的融合。算法和模型可以在不同數系,提取跨模態的共享信息。這使得AI能夠深度理解和解決復雜問題。未來在諸多創新領域,多模態技術的發展將海。[6]2.生成式AI帶來更貼近人的交互方式從使用鍵盤-鼠標等方式跟電腦交互,到使用手指滑動屏幕跟手機交互,再到人們用喚醒詞跟智能音箱等交互,人機令,到識別人的動作,語音,不斷朝著更貼近人的習慣的交互方式演進。生成式AI的發展,讓人類有史以來第一次有方式,來跟機器對話,而機器也借由大模型擁有了極強的理解人類語言的能力,有望帶來一場全新的交互變革。正如從終端、到連接,到
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025醫療機構醫藥產品公正購銷合同
- 2025年經營承包協議合同范本:石油化工生產經營承包協議
- 2025年人造板類家具項目建議書
- 2025年金屬波紋管膨脹節(鋁)項目合作計劃書
- 圍墻彩繪施工方案
- 市政電網施工方案
- 貨車隔熱施工方案
- 圍堰維修施工方案
- 強電井施工方案
- 建筑授權代表委派3篇
- 【部編版】語文五年級下冊第五單元《交流平臺 初試身手》精美課件
- 枇杷文化知識講座
- 《小型局域網組建》課件
- 浙江偉鋒藥業有限公司年產100噸拉米夫定、50噸恩曲他濱、30噸卡培他濱技改項目環境影響報告
- 公路養護安全作業規程-四級公路養護作業控制區布置
- 了解生活中常見的乳化現象
- 八年級家長會領導講話4篇
- 美世國際職位評估體系IPE3.0使用手冊
- 焦慮抑郁患者護理課件
- 戶外招牌安全承諾書
- JGT471-2015 建筑門窗幕墻用中空玻璃彈性密封膠
評論
0/150
提交評論