【AI力覺醒】從“人工智障”到“人工智能”_第1頁
【AI力覺醒】從“人工智障”到“人工智能”_第2頁
【AI力覺醒】從“人工智障”到“人工智能”_第3頁
【AI力覺醒】從“人工智障”到“人工智能”_第4頁
【AI力覺醒】從“人工智障”到“人工智能”_第5頁
已閱讀5頁,還剩97頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

從人工“智障”到人工“智能”CONTENTS03DeepSeek人工智能發展歷程03DeepSeek人工智能發展歷程AI工具使用案例AI大模型在企業層面應用AI工具使用案例人工智能發展歷程人工智能發展歷程人工智能(AI)是一門研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的新技術科學人工智能發展歷程人工智能技術經過70年的發展已經進入成熟期,即將進入大規模應用落地階段人工智能技術架構演變第一階段AI主要以邏輯推理為主,聚焦決策和認知;第二階段注重概率統計建模、學習和計算,聚階段聚焦學習階段,注重大模型建設,AI能力覆蓋學習和執行;第四階段聚焦執行和社會協作環當下處于第四階段,這一階段從2020年開始,代表性事件為G言模型的進一步發展提供了強有力的基礎,也為人工智能三要素數據、算力和算法作為人工智能發展的核心三要素已具備基礎條件AI能力進化曲線大數據+大算力+通用大模型成為新的發展范式,將推動AI能力提升逼近通用人工智能大模型基本分類大模型按照功能可以分為NLP大模型、CV大模型、科學計算大模型和多模態大模型CV(ComputerVision,機器視覺)大模型:主要用于處理圖像和視頻數據,具備強大的圖像識別和視頻分析能力科學計算大模型:主要應用于解決科學領域的計算問題,需要處理大規模數值數據,例如多模態大模型:可以同時處理多種類型的模態數據,如文本、圖像、語音,實現跨模態搜索和生成任務,例如谷歌的大模型主要特征以Transformer架構為基礎的大模型不斷取得新突破,進一步確認了人工智能技術發展走向新范式AI大模型AI大模型是人工智能預訓練大模型的簡稱,包含了“預訓練”和“大模型”兩層含義,二者結合產生了新的人工智能模式,即模型在大規模數據集上完成預訓練后,僅需要少量的數據微調甚至無需微調,就能直接支撐各類應用腦力效率飛躍人工智能將推動人類文明生產力的躍遷,標志著人類生存效率出現了第二次腦力效率飛躍元宇宙全球AI大模型PK全球AI大模型突破與快速發展2017年,Google提出Transformer架構,引入自注意力機制,極大地提升了序列建模的能力,能夠更好地處理文本等序列數據,成為后續大模型的基礎,如GPT系列。Transformer架構的出現是深度學習領域的一個重要里程碑,它改變了人們對序列數據處理的理解和方法,為大模型的發展提供了強大的技術支持。2018年,OpenAI發布GPT-1模型,初步展示了基于Transformer架構的語言模型的強大能力。2019年,GPT-2發布,進一步提升了模型性能,在自然語言處理領域取得了顯著的進步,能夠生成更加自然和連貫的文本。2022年11月,GPT-3.5發布,其強大的語言理解和生成能力引發廣泛關注,標志著大模型在性能和應用方面達到了一個新的高度。2023年3月,OpenAI發布多模態模型G新增圖像功能,標志著大模型從單一模態向多模態的重要轉變,能夠同時處理文本和圖像等多種模態的數據。同年,百度的“文心一言”、阿里巴巴的“通義千問”等多模態大模型相繼亮相,推動了多模態大模型的發展和應用,為人工智能技術的進一步發展開辟了新的方向。當前格局與趨勢截至2024年7月,全球AI大模型數量約1328個,美國占比44%,中國占比36%。國際主流DeepSeek通過稀疏注意力機制、混合專家模型等創新,實現了輕量級參數與卓越性能的平衡,為大模型的高效訓練和推理提供了新的思路。Qwen采用兩階段強化學習等技術,提升了模型在多模態任務中的表現,進一步拓展了大模型的應用范圍和能力。國外大模型及其合作伙伴生成式AI里程碑——ChatGPTChatGPT產品迭代圖ChatGPT能力實現解析國內外主要大預言模型研發路徑與技術對比圍繞新興生產力的國家博弈AI大模型應用場景AI大模型掀起多模態和多場景革命。多模態融合模型通過充分利用大模型的泛化能力,構建多模態數據集,解決融合和對齊問題,以及提供強大的計算資源支持,可以將不同類型的數據通過預處理轉化為統一的表現形式,結合多個模態的信息進行聯合建模和分析,從而提升其在多個感知任務上的性能和表現國內大模型玩家科技型企業包括人工智能企業、垂直大模型企業和數據智能服務商相繼進場,如商湯科技、度小滿等。除科技型企業入局外,以百度、騰訊和阿里為代表的互聯網云廠商占據中國通用大模型行業多數市場份額,他們在布局時間、基礎設施建設和應用場景等方面具備明顯優勢國內頭部大模型玩家及其合作伙伴中國大語言模型產業價值鏈基于新一代人工智能開源技術架構的大模型開源生態系統DeepSeek幕后投資方DeepSeek公司是由私募公司幻方量化(寧波幻方量化投資管理合伙企業)孵化,是一家總部位于中國浙江省杭州市的對沖、量化基金和人工智能公司,成立于2016年,實際控制人為梁文峰梁文峰是一位在人工智能和金融領域具有深厚背景的專家。他通過創立量化對沖基金High-Flyer取得了顯著成就,管理著超過100億元人民幣的資金。他擁有清華大學、北京大學和斯坦福大學等頂尖高校的學術背景,并曾與谷歌、微軟、百度等科技公司的資深工程師合作幻方量化專注于開發多種量化投資策略,利用數學模型、計算機算法和人工智能技術對金融市場數據進行分析和預測,從而制定和執行量化交易策略。其主要業務涉及?量化投資策略研發:開發多種量化投資策略,涵蓋股票、債券等多種金融工具?人工智能應用:通過深度學習等人工智能技術優化傳統量化策略研究方法DeepSeek公司基本介紹DeepSeek(杭州深度求索人工智能基礎技術研究有限公司)是一家專注于通用人工智能(AGI)的中國科技公司,主攻大模型研發與應用,致力于推動人工智能技術的發展和應用。公司成立于2023年7月,團隊主要由國內高校畢業生和未畢業的博士生組成,擁有一支高素質、富有創新精神的研發團隊。DeepSeek的模型基于當前最先進的Transformer架構,融合了稀疏注意力機制、混合專家模型等創新技術,能夠實現高效的計算和推理。通過優化算法、硬件與軟件的協同優化、模型壓縮與量化技術等,實現了低算力下的高水準性能,為大模型的廣泛應用提供了技術支持。DeepSeek致力于推動人工智能技術的普及和應用,為人類社會帶來更多便利和價值,推動人工智能技術在各行業的廣泛應用。公司將繼續在跨語言理解、多模態智能交互、具身智能等方面取得更多突破和創新,為人工智能技術的發展貢獻更多力量。DeepSeek熱點事件回顧全球市場表現與用戶增長特性,迅速在全球范圍內獲得關注,短時間內用戶量激增,成為全球增速最快的AI應用一夜蒸發超1萬億美元,英偉達股價單日下跌16%,引發市場對AI技術變革的深度思考AI應用市場的競爭格局,促使其他企業加快技術研發和產品優化這一現象不僅反映了用戶對AI工具的需求,也顯示了DeepSeekR1在用戶體驗和功能上的強大競爭力這表明DeepSeekR1的出現不僅改變了用戶對AI的認知,也對傳統科技企業的市場地位產生了巨大沖擊傳統AI應用如ChatGPT等面臨新的挑戰,市場對AI工具的性能和用戶體驗要求進一步提高DeepSeek爆火原因DeepSeekR1的技術優勢與特點DeepSeek入門使用方法與技巧關于“深度思考R1”:?當你需要更簡單快速的回答時,不必打開“深度思考”,使用默認模?當你需要完成更復雜的任務,你希望AI輸出的內容更結構化,更深思熟慮時,你應該打開“深度思考R1”選項,這也是今天我這篇文章主要在討論的模型;關于“聯網搜索”:?當你的任務所涉及的知識在2023年12月之前,你無須打開“聯網搜索”功能,大模型本身就有此前被充分訓練過的語料知識;?當你的任務所涉及的知識在2023年12月及之后時,比如昨天NBA比賽的賽果,硅谷對DeepSeekR1的評價等,你必須打開“聯網搜索”功能,否則大模型在回答時會缺乏相應的知識內容token化與理解方式大語言模型在訓練時將文本切割成token單元,如“Strawberry”被拆分為“Str”“aw”“berry”,這與人類理解語言的方式不同這種機制導致模型在處理某些任務(如數字母數量)時存在困難,但并不影響其在其他領域的強大能力用戶需要了解token化對模型行為的影響,避免提出過于依賴精確字符處理的任務在使用DeepSeekR1時,應關注其對復雜任務的推理能力,而非糾結于token化帶來的細節問題任務設計應避免要求模型進行精確的字符操作或過于復雜的文本結構處理,而是發揮其在邏輯推理和內容生成方面的優勢例如,要求模型生成一篇有邏輯結構的文章,而不是精確控制文章的字數或字符數知識截止時間與局限DeepSeekR1的基礎模型訓練數據窗口期在數月前關閉,導致其對2023年12月之后的知識缺乏了解這種知識滯后性會引發一系列問題,如對新模型、新事件的無知,甚至可能出現幻覺回答激活聯網搜索功能,讓模型能夠實時獲取最新信息用戶可以通過上傳文檔或在提示詞中補充必要知識,幫助模型完成時效性任務用戶在使用DeepSeekR1時,應明確任務是否涉及最新知識,必要時主動提供相關信息,避免因知識滯后導致錯誤回答缺乏自我認知與意識DeepSeekR1缺乏“我是誰”的概念,甚至可能因訓練數據中的錯誤信息而產生幻覺,誤認為自己是其他模型這表明模型無法像人類一樣進行自我反思或自我定位用戶無法直接從模型獲取其自身特點、使用技巧等信息,需要通過實踐和經驗總結來掌握在與模型交互時,用戶應避免提問涉及自我認知的問題,以免得到錯誤或無意義的回答用戶應通過自己的學習和實踐,了解模型的特點和使用方法,而不是依賴模型自身的自我認知在使用過程中,關注模型的輸出結果,根據實際效果調整使用策略記憶與輸出長度限制上下文記憶限制輸出長度限制應對記憶與輸出限制的策略這限制了其處理超長文檔和多輪對話的能力當輸入文檔過長或對話輪次過多時,模型可能會遺忘初始信息或無法完整處理所有內容通常不超過4k或8ktoken,即2千~4千中文字符,無法一次性生成超長文本這要求用戶在設計任務時,合理規劃輸出內容的長度,避免超出模型的輸出能力對于長文檔處理任務,可采用分段處理或多次交互的方式,逐步完成任務在長文寫作任務中,先讓模型生成框架和提綱,再逐部分生成內容,以滿足用戶需求提出明確的要求在使用DeepSeekR1時,應清晰表達任務的具體要求,避免讓模型猜測意圖。例如,要求模型為跨境電商平臺設計用戶增長方案時,需明確目標市場、期望成果等關鍵信息避免使用模糊或不具體的指令,這可能導致模型無法準確理解用戶需求,從而給出不符合預期的結果明確的要求能夠幫助模型更高效地完成任務,提高用戶體驗錯誤示范:為跨境電商平臺寫個用戶增長方案優化方案:為服飾跨境電商平臺設計30天新用戶增長計劃,重點突破東南亞市場,包含社交媒體運營策略、KOL合作框架、ROI預估模型要求特點的風格提供充分的任務背景信息向DeepSeekR1提供充分的任務背景信息,能夠幫助模型更好地理解任務的背景和需求,從而生成更符合用戶期望的結果例如,在生成減肥計劃時,提供用戶的身高、體重、運動習慣等信息,能夠使計劃更具針對性缺乏背景信息可能導致模型生成的內容與用戶需求不符,甚至出現錯誤或不合理之處因此,用戶在提出任務時,應盡可能提供詳細的相關信息錯誤示范:幫我生成為期一個月的減肥計劃優化方案:我是男性,身高175厘米,體重160斤,每天步行1公里,希望1個月內瘦到150斤,請幫我制定運動及飲食減肥計劃主動標注自己的知識狀態定義目標,而非過程提供AI不具備的知識背景知識背景補充的必要性制,對于2023年12月之后的新信息,用戶需要主動提供相關知識背景這有助于模型更準確地處理涉及最新事件、行業趨勢或內部信息的任務如果不提供必要的知識背景,模型可能會因缺乏信息而給出錯誤或不完整的回答因此,用戶在提出涉及最新信息的任務時,應確保提供足夠的背景信息錯誤示范:分析2024年巴黎奧運會中國代表團的金牌分布優化方案:上傳《2024巴黎奧運會中國奪金項目統計表》,基于我提供的奧運會數據,請分析2024年巴黎奧運會中國代表團不同運動項目的金牌貢獻率從開放到收斂思維鏈提示要求DeepSeekR1一步步思考或提供思維思路的提示詞策略已失效,甚至可能起反作用模型通過強化學習已經能夠自主產生高效的思維鏈,無需用戶額外引導過多的思維鏈提示可能會干擾模型的自然推理過程,降低其效率和準確性用戶應相信模型的推理能力,避免過度干預其思考過程錯誤示范:請一步步思考如何解決這個問題優化方案:直接提出問題,讓模型自主思考解決方案結構化提示詞要求扮演專家角色假裝完成任務后給獎勵模型的運行基于算法和訓練數據,不受人類的情感或獎勵機制影響用戶應專注于提出清晰、明確的任務要求,而不是試圖通過獎勵激勵模型少示例提示01.DeepSeekR1團隊明確建議避免使用少示例提示詞,因為這可能會干擾模型的理解和推理過程模型更擅長根據清晰的任務描述生成答案,而不是依賴示例02.少示例提示可能會使模型過度依賴示例,而無法靈活處理其他類似任務用戶應直接描述任務要求,讓模型根據自身的推理能力生成答案03.錯誤示范:給出一個示例,然后讓模型根據示例回答問題優化方案:直接描述問題,讓模型根據任務要求生成答案角色扮演DeepSeekR1不太擅長情感化的角演,例如構建AI女友/男友等這是因為情感化的對話依賴直覺,而模型的推理過程是基于邏輯和數據的角色扮演可能會使模型的回答偏離實際需求,甚至產生不合理的回答用戶應專注于提出具體、實際的任務,而不是試圖通過角色扮演獲取情感化的內容錯誤示范:請扮演我的男朋友,安慰我。優化方案:直接提出問題,如“請給我一些建議,幫助我緩解壓力”對已知概念進行解釋模型已經具備對這些概念的理解和推理能力,用戶過多的概念解釋可能會干擾模型的理解,使求優化方案:直接要求“用李白的風格寫一首關于秋天的詩”DeepSeek培訓資料AI工具使用案例AI能力征服地圖PPT制作——KiMiKimi.ai-會推理解析,能深度思考的AI助手/知識整合,文獻、報告——秘塔AI搜索秘塔AI搜索/各類大模型整合——納米AI搜索納米AI搜索/文本分析語言處理、翻譯——通義千問通義tongyi.ai_你的全能AI助手-通義千問數據分析、表格——辦公小浣熊小浣熊家族Raccoon-AI智能助手-商湯科技Canva平面設計——可畫Canva可畫_在線設計協作平臺_平面設計作圖軟件_視覺辦公套件-Canva中文官網/圖像、視頻AI生成——即夢即夢AI-即刻造夢/AI大模型在企業層面應用及未來發展知識庫成為大模型在企業用戶落地主要輔助手段人工智能大模型助力企業向智能型企業演化人工智能賦能應用場景持續拓展方向開源模型激活眾多企業,應用于各種場景和領域使用場景——工業知識問答大模型可結合自身知識,回答不同工業領域問題,將用于員工培訓、故障診斷、客服咨詢、市場調研等交互場景,協助企業

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論