DeepSeek大模型概念、技術與應用實踐(讀懂大模型)_第1頁
DeepSeek大模型概念、技術與應用實踐(讀懂大模型)_第2頁
DeepSeek大模型概念、技術與應用實踐(讀懂大模型)_第3頁
DeepSeek大模型概念、技術與應用實踐(讀懂大模型)_第4頁
DeepSeek大模型概念、技術與應用實踐(讀懂大模型)_第5頁
已閱讀5頁,還剩165頁未讀 繼續免費閱讀

VIP免費下載

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

每個人都可以讀懂的大模型科普文章大模型概念、技術與應用實踐林子雨副教授廈門大學廈門大學大數據教學團隊作品2025年2月9日國內高校大數據教學的重要貢獻者團隊負責人:林子雨副教授年輕力量:核心成員全部46周歲以下結構合理:教學型、科研型、實驗工程師專注專業:從2013年至今,11年專注于大數據教學團隊特點:眼光前瞻、緊跟技術、創新實干、執行力強

影響力高:多項指標在國內高校大數據教學領域領先·

教材數量·

教材占有率·MOOC課程學習人數·

師資培養·

教學研討會·

教學網站訪問量·

在線講座觀看人數廈門大學大數據教學團隊賴永炫藜炳躍林子雨鄭宇輝鄭海山蘇淑文夏小云陶繼平謝怡張琦團隊負責人林子雨廈門大學計算機科學與技術系副教授以第一作者編著出版15本大數據系列教材被國內1000余所高校采用

榮獲"2022年福建省高等教育教學成果獎特等獎(個人排名第一)I入選"2021年高校計算機專業優秀教師獎勵計劃"2018年國家精品在線開放課程(獨立主講)2020年國家級線上一流本科課程(獨立主講)2021年國家級線上一流本科課程(獨立主講)入選“2023年教育部國家智慧教育公共服務平臺應用典型案例”

個人主頁:/post/linziyu/本PPT節選自林子雨編著《數字素養通識教程》林子雨編著《數字素養通識教程——大數據與人工智能時代

的計算機通識教育》人民郵電出版社,2025年1月ISBN:978-7-115-65946-0

定價:59.8元面向大一新生的全校大學計算機公共課教材教

:https://dblab.xmu.edu.cn/post/digital-literacy/教材官網提供講義PPT、MOOC

視頻、案例視頻、上機實驗、

教學大綱、課程思政案例、開學第一課講座PPT等豐富的教學

資源數字素養

通識教程大

工D府

+rns計身德識《數字素養通識教程》林子雨編著《數字素養通識教程——大數據與人工智能時代的計算機通識教育》

人民郵電出版社

ISBN:978-7-115-65946-02025

年1月第1版,定價:59.8元

教材官網:

https://dblab.xmu.edu.cn/post/digital-literacy/15年計算機教學生涯感悟升華,15本計算機暢銷教材知識凝練數字時代的大學計算機公共課教材,重構大學計算機公共課知識體系深刻變革傳統大學計算機通識教育,培養學生計算思維、數據思維和AI思維人工智能通識教育大數據通識教育計算機通識教育(計算機基礎知識+編程)數字素養

通識教程與人工論鏡制諧調續間rDKrEu.Al時代大數據時代計算機時代《數字素養通識教程》到B站觀看林子雨主講《數字素養通識教程》MOOC視頻(1359分鐘)視

:https://www./video/BV1XPf8YZE6M/

引言在數字化浪潮洶涌澎湃的當下,大模型如同一顆璀璨新星,強勢崛起并迅速成為科技領域的焦

點。從最初的理論探索到如今在各個行業的廣泛應用,大模型正以驚人的速度重塑著我們的生

活與工作模式。它不僅是人工智能技術發展的重大突破,更是推動經濟增長、提升社會治理效

能、促進科技創新的關鍵力量。本報告《大模型概念、技術與應用實踐》將深入剖析大模型的

核心概念、原理特點以及豐富多元的應用實踐案例,旨在讓大家全面了解大模型這一前沿技術,

明晰其在當下及未來發展中的重要地位與深遠影響,共同探索如何借助大模型的力量推動社會各項事業邁向新的高度。目錄●1.人工智能發展簡史●2.人工智能思維●3.大模型:人工智能的前沿●4.AIGC

應用與實踐1.人工智能發展簡史1.1圖靈測試1.2人工智能的誕生1.3人工智能的發展階段1.4未來人工智能發展的五個階段

1.1圖靈測試1950年,“計算機之父”和“人工智能之父”艾倫·

圖靈(Alan

M.Turing)發表了論文《計算機器與智能》,這篇論文被譽

為人工智能科學的開山之作。在論文的開篇,圖靈提出了一個引人深思的問題:“機器能思考嗎?”。這個問題激發了人們

無盡的想象,同時也奠定了人工智能的基本概念和雛形在這篇論文中,圖靈提出了鑒別機器是否具有智能的方法,這就是人

工智能領域著名的"圖靈測試"。

如圖所示,其基本思想是測試者在

與被測試者(一個人和一臺機器)

隔離的情況下,通過一些裝置(如

鍵盤)向被測試者隨意提問。進行

多次測試后,如果被測試者機器讓

平均每個測試者做出超過30%的誤

判,那么這臺機器就通過了測試,

并被認為具有人類智能人測試者計算機1.2人工智能的誕生人工智能的誕生可以追溯到20世紀50年代。當時,計算機科學剛剛起步,人們開始嘗試通過計算機程序來模擬人類的思維和行為。在這個背景下,一些杰出的科學家和工程師們開始研究如何使計算機具備更高級的功能1956年8月,在美國達特茅斯學院舉辦的人工智能夏季研討會,是人工智能領域具有里程碑意義的一次重要會議。這次會議匯聚了眾多杰出的科學家和工程師,他們共同探討和研究人工智能的發展和應用前景這次會議的主題圍繞著人工智能的定義、研究方法和應用場景展開。與會者們深入探討了人工智能的基本概念、算法和技術,

以及其在各個領域的應用潛力。他們共同認識到,人工智能的研究和發展將為人類帶來巨大的變革和進步1956

Dartmouth

Conference:

The

Founding

Fathers

ofAItertS

ArtharsuntcerSiiNatundldefredardMoreMarCrtbyMaryinMiaskydadsnaysaonaAlnMevell1.2人工智能的誕生在這次會議上,“人工智能”這個詞匯被約翰.麥卡錫(John

McCarthy)首次提出。與會者們不僅對人工智能的研究和應用

前景進行了深入探討,還提出了許多重要的觀點和思路,為人工智能的發展奠定了基礎。這次會議的召開標志著人工智能作

為一個獨立學科的正式誕生,因此,達特茅斯會議被稱為“人工智能的開端”,1956年也被稱為“人工智能元年”。這次會

議不僅為人工智能的研究和發展奠定了基礎,還為人類帶來了巨大的變革和進步

1.3人工智能的發展階段從1956年人工智能元年至今,人工智能的發展歷程經歷了漫長的歲月,大致可以劃分為以下6個階段穩

步發展期互聯網推動人工智

能不斷創新和實用深藍戰勝國際象棋冠軍

IBM提出智慧地球我國提出感知中國…復蘇2000

2010熱度起步發展期人工智能誕生機器定理證明智能跳棋程序反思

發展期任務失敗

目標落空機器翻譯

笑話百出定理證明

發展乏力……初春

初冬195619601970應用發展期專家系統遍地開花

人工智能轉向實用醫療專家系統MYCIN

化學專家系統DENDRAL地質專家系統PROSPECTOR低迷

發展期多項研究

發展緩慢專家系統

發展乏力神經網絡研究受阻

寒冬1990蓬勃發展期深度學習與

大數據興起

帶來了人工

智能的爆發物聯網云計算大數據爆發時

間初秋19801.4未來人工智能發展5個階段OpenAI的5級AGI

量表1-5級說明L5:

可以完成整個組織工作的人工智能。L4:

可以創造新事物的人工智能。L3:可以代表用戶采取行動

的人工智能代理。L2:

像博士一樣解決問題,

無需工具。L1:

當前AI,類似ChatGPT,

可以與人類對話的人工智能。AGI53212.人工智能思維2.人工智能思維擁有和人工智能協作的能力,懂得如何運用人工智能每個人都應了解人工智能的基礎運行模式具備區分人的能力和機器的能力協作了

解區分3.1大模型的概念3.7大模型分類3.2大模型的發展歷程3.8大模型應用領域(在各個行業的應用)3.3人工智能與大模型的關系3.9大模型對工作和生活的影響3.4大模型產品3.10本地部署大模型3.5大模型原理3.11基于大模型的智能體3.6大模型特點3.大模型:人工智能的前沿

3.1大模型的概念大模型通常指的是大規模的人工智能模型,是一種基于深度學習技術,具有海量參數、強大的學習能力和泛化能力,能夠處

理和生成多種類型數據的人工智能模型通常說的大模型的“大”的特點體現在:參數數量龐大、訓練數據量大、計算資源需求高2020年,OpenAl

公司推出了GPT-3,

模型參數規模達到了1750億,2023年3月發布的GPT-4的參數規模是GPT-3

的10倍以上,

達到1.8萬億,2021年11月阿里推出的M6模型的參數量達10萬億大模型的設計和訓練旨在提供更強大、更準確的模型性能,以應對更復雜、更龐大的數據集或任務。大模型通常能夠學習到更細微的模式和規律,具有更強的泛化能力和表達能力語言生成能力

學習能力強上下文理解能力大模型具有更強的上下文理解能

力,能夠理解更復雜的語意和語

境。這使得它們能夠產生更準確、更連貫的回答可遷移性高學習到的知識和能力可以在不同

的任務和領域中遷移和應用。這意味著一次訓練就可以將模型應

用于多種任務,無需重新訓練大模型可以從大量的數據中學習并利用學到的知識和模式來提供

更精準的答案和預測。這使得它

們在解決復雜問題和應對新的場

景時表現更加出色3.1大模型的概念大模型可以生成更自然、更流利

的語言,減少了生成輸出時呈現

的錯誤或令人困惑的問題性能(參數、層數等)阿里巴巴M6100000億GoogleSwitchtransformer華為16000億

盤古大模型10850億OpenAIGPT410000億(預估)GooglePalM-E5660億萌芽期文心大模型2600億DALLE2120億110億20233.2大模型的發展歷程大模型發展歷經三個階段,分別是萌芽期、沉淀期和爆發期OpenAIGPT31750億微欽Florence6.4億2021GAN百萬-干萬級2014OpenAIGPT215億2019Google

Bert3億2018微欽Turing-NLG基于規則的少量數據處理NVDIAMTNLG5300億170億GoogieT5LeNet-56萬探素沉淀期迅猛發展期OpenAl時間202220201950百度2005■萌芽期(1950-2005)這是一個以CNN(Convolutional

Neural

Networks,卷積神經網絡)為代表的傳統神經網絡模型階段■1956年,從計算機專家約翰·

麥卡錫提出“人工智能”概念開始,Al發展由最開始基于小規模專家知識逐步發展為基于機器學習■1980年,卷積神經網絡的雛形CNN

生■1998年,現代卷積神經網絡的基本結構LeNet-5

誕生,機器學習方

法由早期基于淺層機器學習的模型,變為了基于深度學習的模型,

為自然語言生成、計算機視覺等領域的深入研究奠定了基礎,對后

續深度學習框架的迭代及大模型發展具有開創性的意義浙勤函數地化層(極大油化)畫數浙函數全連接層3.2大模型的發展歷程■沉淀期(2006-2019)這是一個以Transformer為代表的全新神經網絡模型階段2013年,自然語言處理模型Word2Vec

誕生,首次提出將單詞轉換為

向量的"詞向量模型",以便計算機更好地理解和處理文本數據。2014年,被譽為21世紀最強大算法模型之一的GAN(GenerativeAdversarial

Networks,對抗式生成網絡)誕生,標志著深度學習進

入了生成模型研究的新階段2017年,Google

顛覆性地提出了基于自注意力機制的神經網絡結構一—Transformer

架構,奠定了大模型預訓練算法架構的基礎2018年,OpenAl

基于Transformer

架構發布了GPT-1大模型,意味著

預訓練大模型成為自然語言處理領域的主流,其中,GPT

的英文全稱

是Generative

Pre-Trained

Transformer,是一種基于互聯網的、可

用數據來訓練的、文本生成的深度學習模型2019年,OpenAl

發布了GPT-2

3.2大模型的發展歷程■爆發期(2020-至今)這是一個以GPT為代表的預訓練大模型階段2020年6月,OpenAl

公司推出了GPT-3,

模型參數規模達到了1750億,成

為當時最大的語言模型,并且在零樣本學習任務上實現了巨大性能提升。隨后,更多策略如基于人類反饋的強化學習(RLHF,ReinforcementLearning

from

Human

Feedback)、代碼預訓練、指令微調等開始出現,

被用于進一步提高推理能力和任務泛化2022年11月,搭載了GPT3.5的ChatGPT(Chat

Generative

Pre-trained

Transformer)

橫空出世,憑借逼真的自然語言交互與多場景內容生成能

力,迅速引爆互聯網,在全球范圍內引起轟動,使得大模型的概念迅速進

入普通大眾的視野。

ChatGPT

是人工智能技術驅動的自然語言處理工具,

它能夠通過理解和學習人類的語言來進行對話,還能根據聊天的上下文進

行互動,真正像人類一樣來聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼,寫論文等任務3.2大模型的發展歷程TRANSCRIPTIONOUTSOURCINC,LLCGPT-3Is

this

the

technology

tht

will

ransfomAtificid

meligenceprog

ams?3.2大模型的發展歷程■爆發期(2020-至今)OpenAl在2023年3月發布了GPT-4,

它是一個多模態大模型(接受圖像和文本輸入,生成文本)。相比上一代的GPT-3,GPT-4可以更準確地解決難題,具有更廣泛的常識和解決問題的能力。2023年12月,谷歌發布大模型Gemini,

它可以同時

識別文本、圖像、音頻、視頻和代碼五種類型信息,還可以理解并生成主流編程語言(如Python、Java、C++)

的高質量

代碼,并擁有全面的安全性評估。2024年12月,DeepSeek

迅速崛起,震撼全球,使得人工智能進入“普惠”時代3.3人工智能與大模型的關系人工智能包含了機器學習,機器學習包含了深度學習,深度學習可以采用不同的模型,其中一種模型是預訓練模型,預訓

練模型包含了預訓練大模型(可以簡稱為“大模型”),預訓練大模型包含了預訓練大語言模型(可以簡稱為“大語言模型”

),預訓練大語言模型的典型代表包括OpenAl的GPT和百度的文心ERNIE,ChatGPT是基于GPT

開發的大模型產品,文心一言是基于文心ERNIE

開發的大模型產品預訓練大模型預訓練大語言模型預訓練大語言模型GPT文心ERNIE人工智能機器學習深度學習深度學習模型預訓練模型文心

言ChatGPT3.4大模型產品3.4.1國外的大模型產品3.4.2國內的大模型產品■ChatGPTChatGPT

一種由OpenAl

訓練的大語言模型。它是基于Transformer

架構,經過大量文本數據訓練而成,能夠生成自然

流暢的語言,并具備回答問題、生成文本、語言翻譯等多種功能ChatGPT

的應用范圍廣泛,可

以用于客服、問答系統、對話生成、文本生成等領域。它能夠理解人類語言,并能夠回答各

種問題,提供相關的知識和信息。與其他聊天機器人相比,ChatGPT

具備更強的語言理解和生成能力,能夠更自然地與人

類交流,并且能夠更好地適應不同的領域和場景。

ChatGPT

的訓練數據來自互聯網上的大量文本,因此,它能夠涵蓋多種3.4.1國外的大模型產品語言風格和文化背景

3.4.1國外的大模型產品■GeminiGemini是谷歌發布的大模型,它能夠同時處理多種類型的數據和任務,覆蓋文本、圖像、音頻、視頻等多個領域。Gemini采用了全新的架構,將多模態編碼器和多模態解碼器兩個主要組件結合在一起,以提供最佳結果Gemini

包括三種不同規模的模型:Gemini

Ultra、Gemini

Pro和Gemini

Nano,

適用于不同任務和設備。2023年12月6日,Gemini

的初始版本已在Bard

中提供,開發人員版本可通過Google

Cloud的API獲得。Gemini

可以應用于Bard

和Pixel8Pro智能手機。Gemini

的應用范圍廣泛,包括問題回答、摘要生成、翻譯、字幕生成、情感分析等任務。然而,由于其復雜

性和黑箱性質,Gemini

的可解釋性仍然是一個挑戰Sora2024年2月16日,OpenAl

再次震撼全球科技界,發布了名為Sora

的文本

生成視頻大模型,只需輸入文本就能自動生成視頻。這一技術的誕生,不僅標志著人工智能在視頻生成領域的重大突破,更引發了關于人工智能發展對人類未來影響的深刻思考。隨著Sora

的發布,人工智能似乎正式踏入了通用人工智能(AGl:ArtificialGeneral

Intelligence)的時代。AGI

是指能夠像人類一樣進行各種智能活動的機器智能,包括理解語言、

識別圖像、進行復雜推理等。Sora

大模型能夠直接輸出長達60秒的視頻,

并且視頻中包含了高度細致的背景、復雜的多角度鏡頭,以及富有情感

的多個角色。這種能力已經超越了簡單的圖像或文本生成,開始觸及到視頻這一更加復雜和動態的媒介。這意味著人工智能不僅在處理靜態信

息上越來越強大,而且在動態內容的創造上也展現出了驚人的潛力

3.4.1國外的大模型產品Sora右圖是Sora

根據文本自動生成的視頻畫面,

一位戴著

墨鏡、穿著皮衣的時尚女子走在雨后夜晚的東京市區

街道上,抹了鮮艷唇彩的唇角微微翹起,即便帶著墨

鏡也能看到她的微笑,地面的積水映出了她的身影和

燈紅酒綠的霓虹燈,熱鬧非凡的唐人街正在進行舞龍

表演,熙熙攘攘的人群目光都聚焦在躍動的彩龍身上,

整個環境的喜慶氛圍仿佛令人身臨其境

3.4.1國外的大模型產品一

位時尚女性走在布滿溫理霓紅燈和動畫城市標牌的東京街道上,她穿著黑色皮夾克、紅色長裙和屬色靴

子,拎著尿色錢包。她戴著太陽鏡,涂著紅色口紅。她走路自信又隨意。街道對濕且反光,在彩色燈光的

照射下形成鏡面效果

許多行人走來走去

。Sora

:提示詞評文

3.4.1國外的大模型產品■OpenAl

o32024年12月20日,OpenA

I

發布推理模型03,無論在軟件工程、編寫代碼,還是競賽數學、掌握人類博士級別的自然科學

知識能力方面,o3

都達到了很高的水平大模型圖標指標排名DeepSeek能力測評第一豆包用戶數量第一Kimi文本處理第一即夢AI作圖能力第一通義萬相視頻生成第一智譜清言文檔歸納第一3.4.2國內的大模型產品2025年1月國內大模型排行榜

3.4.2國內的大模型產品■DeepSeek

(深度求索)2024年12月26日,杭州一家名為“深度求索”(DeepSeek)的中國初創公司,

發布了全新一代大模型DeepSeek-V3

。在多個基準測試中,DeepSeek-V3

性能均超越了其他開源模型,甚至與頂尖的閉源大模型GPT-40不相上下,尤其在數學推理上,DeepSeek-V3更是遙遙領先。DeepSeek-V3以多項開創性技術,大幅提升了模型的性能和訓練效率。DeepSeek-V3

在性能比肩GPT-

4o的同時,研發卻只花了558萬美元,訓練成本不到后者的二十分之一。因為表現太過優越,DeepSeek

在硅谷被譽為“來自東方的神秘力量”。2025年1月20日,DeepSeek-R1

正式發布,擁有卓越的性能,在數學、代碼和推理任務上可與OpenAl01媲美。DeepSeek

創始人

梁文峰■通義干問通義干問是阿里云推出的一個超大規模的語言模型,它具備多輪對話、文案創作、邏輯推理、多模態理解、多語言支持的能力。通義干問這個名字有“通義"和“干問”兩層含義,“通義”表示這個模型能夠理解各種語言的含義,"干問"則表示這個模型能夠回答各種問題。通義干問基于深度學習技術,通過對大量文本數據進行訓練,從而具備了強大的語言理解和生成能力。它能夠理解自然語言,并能夠生成自然語言文本同時,通義干問還具備多模態理解能力,能夠處理圖像、音頻等多種類型

的數據。通義干問的應用范圍非常廣泛,可以應用于智能客服、智能家居、移動應用等多個領域。它可以與用戶進行自然語言交互,幫助用戶解決各種問題,提供相關的知識和信息。同時,通義干問還可以與各種設備和應用進行集成,為用戶提供更加便捷的服務

3.4.2國內的大模型產品阿里所有產品未來將接入大模型全面升級rwaubn?

n

krn聚通義千間■字節跳動豆包豆包是字節跳動基于云雀模型開發的Al,能理解你的需求并生成高質量回

應。它知識儲備豐富,涵蓋歷史、科學、技術等眾多領域,無論是日常問

題咨詢,還是深入學術探討,都能提供準確全面的信息。同時,具備出色

的文本創作能力,能撰寫故事、詩歌、文案等各類體裁。并且擅長語言交

互,交流自然流暢,就像身邊的知心伙伴,耐心傾聽并給予恰當反饋。

3.4.2國內的大模型產品

3.4.2國內的大模型產品■文心

言文心一言是由百度研發的知識增強大模型,能夠與人對話互動、回答問題、

協助創作,高效便捷地幫助人們獲取信息、知識和靈感文心一言基于飛槳深度學習平臺和文心知識增強大模型,持續從海量數據和

大規模知識中融合學習,具備知識增強、檢索增強和對話增強的技術特色。文心

言具有廣泛的應用場景,例如智能客服、智能家居、移動應用等領域。

它可以與用戶進行自然語言交互,幫助用戶解決各種問題,提供相關的知識

和信息3.5大模型的基本原理大模型是基于Transformer

架構的,這種架構是一種專門用于自然語言處理的“編碼-解碼器”架構。在訓練過程中,大模型將輸入的單詞以向量的形式傳遞給神經網絡,然后通過網絡的編碼解碼以及自注意力機制,建立起每個單詞之間聯系的權

重。大模型的核心能力在于將輸入的每句話中的每個單詞與已經編碼在模型中的單詞進行相關性的計算,并把相關性又編碼

疊加在每個單詞中。這樣,大模型能夠更好地理解和生成自然文本,同時還能夠表現出一定的邏輯思維和推理能力大模型

大量的數據和計算資源

具有大量參數的神經網絡模型訓練

不斷地調整模型參數模型能夠在各種任務中取得最佳表現警偉羊地基于深度學習利用3.5大模型的基本原理3.6大模型的特點3.6大模型的特點(1)巨大的規模大模型通常包含數十億個參數,模型大小可以達到數百GB

甚至更大。這種巨大的規模不僅提供了強大的表達能力和學習能

力,還使得大模型在處理復雜任務時具有更高的效率和準確性BERT

340M

m

Plato-XL

GPT-NeoX-20B208GPT-117M

mMacaw舊

T5

Cohere52.4BMegatron-11B●ruGPT-3GPT-31758

Jurassic-1178BMT-NLG530BXGLMPaLMPaLM-CoderMinerva540808OPT-175B

BB31758uL220BYaLM100BNOORHGLM-130BGAL120BSeeKeR

27

G708

Famingo

●Z-Code++70MB?8

Gato

128

20B

AlexaTM

WeLMFIM

·VIMA

200MCedlle

6Fairseq38GopherAnthropic-LM2808CM3138VLM-4108mGPTGPT-J60BlenderBot2.0AtlasNLLB54.58lhkLuminous2008AlableOcouedPmeten

Alab/groupBLOOM1768LaMDA137BGPT-21s852B··(2)涌現能力涌現能力是指模型在訓練過程中突然展現出之前小模型所沒有的、更深層次的復雜特性和能力。當模型的訓練數據突破一定規模時,模型能夠綜合分析和解決更深層次的問題,展現出類似人類的思維和智能。這種涌現能力是大模型最顯著

的特點之一,也是其超越傳統模型的關鍵所在3.6大模型的特點(3)更好的性能和泛化能力大模型因其巨大的規模和復雜的結構,展現出更出色的性能和泛化能力。它們在各種任務上都能表現出色,超越了傳統的小模型。

這主要歸功于大模型的參數規模和學習能力。大模型能夠更好地理解和模擬現實世界中的復雜現象,從而在各種任務中表現出更高的準確性和效率。它們能夠捕捉到數據中的微妙差異和復雜模式,使得在未見過的數據上也能表現優秀,即具有良好的泛化能力(4)多任務學習大模型的多任務學習特點使其能夠同時處理多種不同的任務,并從中學習到更廣泛和泛化的語言理解能力。通過多任務學習,大模型可以在不同的NLP(Natural

Language

Processing)任

務中進行訓練,例如機器翻譯、文本摘要、問答系統等。

這種多任務學習的方式有助于大模型更好地理解和應用語言的規則和模式3.6大模型的特點(5)大數據訓練大模型需要大規模的數據來訓練,通常在TB

級別甚至PB

級別。這是因為大模型擁有數億甚至數十億的參數,需要大量的數據來提供足夠的信息供模型學習和優化。只有大規模的數據才能讓大模型的參數規模發揮優勢,提高模型的泛化能力和性能。同時,大數據訓練也是保證大模型能夠處理復雜任務的關鍵。通過使用大規模數據,大模型能夠更好地理解數據中的復雜模式和關系,從而更好地模擬現實世界中的各種現象(6)強大的計算資源大模型需要強大的計算資源來訓練和運行。由于模型規模龐大,參數數量眾多,計算復雜度極高,因此需要高性能的硬件設備來支持。通常,訓練大模型需要使用GPU(Graphics

ProcessingUnit,圖形處理器)或TPU(Tensor

Processing

Unit,張量處理器)等專用加速器來提高計算

效率。這些加速器能夠并行處理大量的參數和數據,使得大模型的訓練和推斷速度更快。除了硬件設備,大模型的訓練還需要大量的時間。由于模型參數眾多,訓練過程中需要進行大量的迭代和優化,因此,訓練周期可能長達數周甚至數月3.6大模型的特點(7)遷移學習和預訓練通過在大規模數據上進行預訓練,大模型能夠學習到豐富的語言知識和模式,從而在各種任務上展現出卓越的性能。遷移學習和預訓練有

助于大模型更好地適應特定任務在特定任務的數據上進行微調

跨領域的應用能力遷移學習和預訓練也有助于大模型實現跨領域的應用。通過在多個領域的數據上進行預訓練,大模型可以學

習到不同領域的知識和模式,并在不同領域中進行應

用。這種跨領域的應用能力,有助于大模型更好地服

務于實際需求,推動人工智能技術的創新和發展在大規模數據上進行預訓練后,大模型可以在特定任務的數據上進行微調,從而更好地適應目標任務的特

性和要求。這種微調過程可以幫助大模型更好地理解

和處理目標任務的特定問題,進一步提高模型的性能3.6大模型的特點(8)自監督學習自監督學習利用大規模未標記數據進行訓練,通過從數據中挖掘內在的規律和模式,使模型能夠自動地理解和預測數據中的信息。在大規

模的未標記數據中,大模型通過預測輸入數據的標簽或下一個時刻的狀態來進行訓練。這種訓練方式使得大模型能夠從大量的數據中自動

地學習到語言的內在結構和模式,而不需要人工標注和干預3.6大模型的特點輸

出OUTPUTDogs狗原始數據INPUTRAW

DATAUnlabeleddata未標記數據算法AlgorithmProcessing處理Cats貓Interpretation解

釋TrainingDomainLtaMappingAppearance

ChangeADAPTEDSupervlsed

HMappingAppfcation

PredictionsAppication

Domainsybbycapou

pouauabi8qcpoua

vbbjcapou(9)領域知識融合大模型通過領域知識融合,能夠將不同領域的數據和知識融合在一起,從而更好地模擬現實世界中的復雜現象領域知識融合使得大模型能夠從多個領域中學習到廣泛的知識和模式,并將這些知識和模式整合到統一的框架中3.6大模型的特點TrainingLabelsProdie-tionsSupervised?(10)自動化和效率大模型在應用中展現出高度的自動化和效率。由于大模型具有強大的表達能力和學習能力,它可以自動化許多復雜的任務,大大提高工作

效率。大模型通過預訓練和微調過程,能夠自動地適應特定任務,而不需要過多的手工調整和干預。這使得大模型能夠快速地應用于各種

實際場景,并且自動地處理復雜的任務,如自動編程、自動翻譯、自動摘要等3.6大模型的特點3.7大模型的分類語言大模型是指在自然語言處理(Natural

LanguageProcessing,NLP)領域中的一類大模型,通常

用于處理文本數據和理解自然語言。這類大模型

的主要特點是它們在大規模語料庫上進行了訓練,

以學習自然語言的各種語法、語義和語境規則。代表性產品包括GPT

系列

(OpenAl)、Bard(Google)、DeepSeek、文心

言(百度)等視覺大模型是指在計算機視覺

(Computer

Vision,CV)

域中使用的大模型,通常用于圖像處理和分析。

這類模型通過在大規模圖像數據上進行訓練,可

以實現各種視覺任務,如圖像分類、目標檢測、

圖像分割、姿態估計、人臉識別等。代表性產品

包括VIT

列(Google)、

心UFO、華為盤古

CV

、INTERN(

)

等多模態大模型是指能夠處理多種不同類型數據的大模型,例如

文本、圖像、音頻等多模態數據。這類模型結合

了NLP

和CV

的能力,以實現對多模態信息的綜合

理解和分析,從而能夠更全面地理解和處理復雜

的數據。代表性產品包括DingoDB

多模向量數據

庫(九章云極DataCanvas)、DALL-E(OpenAl)、悟空畫畫(華為)、

midjourney

3.7大模型的分類

3.7大模型的分類按照應用領域的不同,大模型主要可以分為L0

、L1

、L2三個層級通用大模型LO是指可以在多個領域和任務上通用

的大模型。它們利用大算力、使用

海量的開放數據與具有巨量參數的

深度學習算法,在大規模無標注數

據上進行訓練,以尋找特征并發現

規律,進而形成可“舉一反三”的

強大泛化能力,可在不進行微調或

少量微調的情況下完成多場景任務,

相當于AI完成了“通識教育”行業大模型L1是指那些針對特定行業或領域的大

模型。它們通常使用行業相關的數

據進行預訓練或微調,以提高在該

領域的性能和準確度,相當于AI成

為“行業專家”垂直大模型L2是指那些針對特定任務或場景的大

模型。它們通常使用任務相關的數

據進行預訓練或微調,以提高在該

任務上的性能和效果3.8大模型的應用領域3.8大模型的應用領域大模型的應用領域非常廣泛,涵蓋了自然語言處理、計算機視覺、語音識別、推薦系統、醫療健康、金融風控、工業制造、

生物信息學、自動駕駛、氣候研究等多個領域(

2

)

覺大模型在計算機視覺領域也有廣泛應用,可以用于圖像分類(識別圖像中的物體和場景)、目標檢測(能夠定位并識別圖像中的特定物體)、圖像生成(如風格遷移、圖像超分辨率增強)、人臉識別(用

于安全驗證和身份識別)、醫學影像分析(輔助醫生診斷疾病)等(

1

)

理大模型在自然語言處理領域具有重要的應用,可以用于文本生成(如文章、小說、新聞等的創作)、翻譯系統(能夠實現高質量的

跨語言翻譯)、問答系統(能夠回答用戶提出的問題)、情感分析

(用于判斷文本中的情感傾向)、語言生成(如聊天機器人)等戶行為理產品推薦系統戶標的物mdsdt

監3.8大模型的應用領域(3)語音識別大模型在語音識別領域也有應用,如語音識別、語音合成等。通過

學習大量的語音數據,大模型可以實現高質量的跨語言翻譯和語音

識別以及生成自然語音(4)推薦系統大模型可以用于個性化推薦、廣告推薦等任務。通過分析用戶的歷史

行為和興趣偏好,大模型可以為用戶提供個性化的推薦服務,提高用

戶滿意度和轉化率

3.8大模型的應用領域大模型可以用于自動駕駛中的感知、決策

等任務。通過學習大量的駕駛數據,大模型可以實現對車輛周圍環境的感知和識別,

以及進行決策和控制,提高自動駕駛的安

全性和效率大模型可以用于信用評估、欺詐檢測等任

務。通過分析大量的金融數據,大模型可

以評估用戶的信用等級和風險水平,以及

檢測欺詐行為,提高金融系統的安全性和

穩定性大模型可以用于醫療影像診斷、疾病預測等任務。通過學習大量的醫學影像數據,

大模型可以輔助醫生進行疾病診斷和治療

方案制定,提高醫療水平和效率000金融風控00

3.8大模型的應用領域在生物信息學領域,大模型可以用于基因序列分析(識別基因中的功能元件和變異

位點)、蛋白質結構預測(推測蛋白質的

二級和三級結構)、藥物研發(預測分子

與靶點的相互作用)等在氣候研究領域,大模型可以處理氣象數據,進行天氣預測和氣候模擬。它們能夠

分析復雜的氣象現象,提供準確的氣象預

報,幫助人們做出應對氣候變化的決策大模型可以用于質量控制、故障診斷等任務。通過學習大量的工業制造數據,大模

型可以輔助工程師進行產品質量控制和故工業制造氣候研究生物信息學障診斷,提高生產效率和產品質量3.9大模型對人們工作和生活的影響3.9.1大模型對工作的影響3.9.2大模型對生活的影響

3.9.1大模型對工作的影響從而減輕了人們的工作負擔。

例如,在金融領域,大模型可以自動分析大量的金融數據,

幫助人們做出更準確的決策如,需要更多的人來開發和維

護大模型,也需要更多的人來

利用大模型進行各種應用開發本數據,提高工作效率。例如,確地了解問題現狀,預測未來在翻譯領域,大模型能夠自動

趨勢,從而做出更明智的決策翻譯多種語言,減少人工翻譯的時間和成本,提高翻譯效率大模型在自然語言處理、機器

翻譯等領域的應用,使得人們

能夠快速、準確地處理大量文大模型能夠收集、整理和分析

大量的數據,通過數據挖掘和

機器學習技術,幫助人們更準大模型的發展使得一些繁瑣、

隨著大模型的普及和應用,將

重復的工作可以由機器來完成,創造出許多新的就業機會。例自動化

部分工作創造新的

就業機會優化決策過程提高工作效率

3.9.2大模型對生活的影響增強娛樂體驗大模型在娛樂領域的應用,可以提供更

加豐富、多樣的娛樂體驗。例如,通過

大模型的語音識別功能,人們可以通過

語音指令控制游戲,實現更加智能化的

游戲體驗提高學習效率大模型在教育領域的應用,可以幫助人

們更高效地學習新知識。例如,通過大

模型的智能推薦功能,人們可以根據自

己的興趣和需求,獲取更加個性化的學

習資源改善生活質量大模型在智能家居、智能客服等領域的

應用,使得人們的生活更加便利、舒適。

例如,通過智能家居系統,人們可以通

過語音指令控制家電,實現智能化生活3.10本地部署大模型本地部署大模型數據隱私與安全性定制化與靈活性成本與資源優化離線與高效使用

3.10.1為什么需要本地部署大模型避免使用限制·

裝Ollama·下

載DeepSeekR1·運行DeepSeekR1·使用Open

WebUI增強交互體驗Get

up

and

running

with

largelanguage

models.Run

Uama

3.3.Depseek-RL

Phi-4.MistralGemma

2.andother

models,locally.

3.10.2本地部署大模型方法CWindowslsystem3ZcmdeseolamsrundepseL1.5

口×ierosoft

Tindows

[成本10.0.20621.4(e)Microsoft

Corporaticn.

保面所有權利

.S:Wsers)ziyul)ollaandeepseek-rl:1.5b22請問如何學習人工智能<think>模擬人病的思維活動,比如識別、理解、決策等。對吧?那我得先明白A1的基本概念和目標。具體安裝過程請參考廈門大學數據庫實驗室博客

https://dblab.xmu.edu.cn/blog/5816/GrammarcheckswitfobenernsabiyGiveme

ideasorwhatosdowthmykirOvercome

procrastinationemesp,我現在要學人工智能。聽起來挺復雜的,但我得一步步來,首先,我應該了解什么是人工智能(AI)。

新說它就是正計算機能夠+請介紹如何學習人工智能◆建議oldeepseek-r1:1.5b

個山

thrmOKIha

WdDownload

43.11基于大模型的智能體智能體(AIAgent),又稱“人工智能代理”,

是一種模仿人類智能行為的智能化系統,它就像

是擁有豐富經驗和知識的“智慧大腦”,能夠感

知所處的環境,并依據感知結果,自主地進行規

劃、決策,進而采取行動以達成特定目標。簡單

來說,智能體能夠根據外部輸入做出決策,并通

過與環境的互動,不斷優化自身行為。智能體本身既不是單純的軟件也不是硬件,而是

一個更為寬泛的概念,它們可以是軟件程序、機

器人或其他形式的系統,具備一定的自主性和智

3.11基于大模型的智能體基于大模型的智能體是指利用大語言模型(如

GPT、BERT

等)作為核心組件,構建的能夠執

行特定任務、與環境交互并做出決策的人工智能

系統。這些智能體具有自主性、交互性、適應性

等特點,能夠模擬人類的認知和決策過程,提供

更加自然、高效和個性化的交互體驗。它們能夠

處理海量數據,進行高效的學習與推理,并展現

出跨領域的應用潛力。

3.11基于大模型的智能體身體大姚:A

大橫型行為:工作流形象:絕/數字人具然碼度:ASRTS智能體基本信息能稱:A

實新互論小云號:500*34212>>>>>>>>AI

for

Real-time

Communication聲營/麗露輸入輸出:ARTC文學錯入騙出:PVM實時互動Ai信息感知

3.11基于大模型的智能體2025年1月23日,OpenA

I

發布了一個創新性的智能體——Operator,

它是一個能夠像人類一樣使用計算機的智能體。

它基于OpenAI

最新研發的CUA(Computer-Using

Agent)模

,CUA

將GPT-4o

的視覺功能與通過強化學習獲得的

高級推理相結合,經過訓練可以與圖形用戶界面(GUI,

即人們在屏幕上看到的按鈕、菜單和文本字段)進行交互。

Operator

通過觀察屏幕并使用虛擬鼠標和鍵盤來完成任務,而無需依賴專門的API接口。這種設計使其可以適配任何為

人類設計的軟件界面,帶來極高的靈活性。Operator

好比一個博士水平的個人助理,你給他一個復雜的任務,它就會自動執行。Operator

的主要功能包括自主完成

諸如采購雜貨、提交費用報表、訂票、買日用品、填寫表格等任務,旨在通過自動化操作提升日常生活和工作效率。它

還可以一邊在StubHub

搜索勇士隊比賽門票,

一邊處理網球場預訂、尋找清潔服務和DoorDash

訂餐,實現多任務并行處理

3.11基于大模型的智能體2025年2月3日,OpenA

I

發布了一款新的智能體產品——Deep

Research。Deep

Research由OpenAI

o3模型的一個版

本提供支持,該模型針對網頁瀏覽和數據分析進行了優化,它利用推理來搜索、解釋和分析互聯網上的大量文本、圖像

和PDF,

并根據需要根據遇到的信息做出調整。Deep

Research具有以下四大核心技術:(1)數據雷達。會自動24小時掃描全球知識庫。(2)知識拼圖。能把零散的信息拼成完整的戰略地圖。(3)邏輯推理。發現矛盾時,自動回溯、驗證,調整推理路徑。(4)學術裁縫。可以綜合各種知識,生成完美的報告,還附帶文獻引用。OpenAlDEEP

RESEARCH文心智能體平臺AgentBuilder

官方想象即現實人人都是開發者基于文心大模型的智能體平臺>一句話、零代碼創建智能體>調優迭代快、分發渠道廣、商業可閉環>3.11基于大模型的智能體Coze(扣子)4.AIGC

應用與實踐4.1AIGC概述4.2文本類AIGC應用實踐4.3圖片類AIGC應用實踐4.4語音類AIGC應用實踐4.5視頻類AIGC應用實踐4.6AIGC在輔助編程中的應用4.7Al搜索4.8Al智能辦公4.1AIGC

概述4.1.1什么是AIGC4.1.2AIGC與大模型的關系4.1.3常見的AIGC應用場景4.1.4AIGC技術對行業發展的影響4.1.5AIGC技術對職業發展的影響4.1.6常見的AIGC大模型工具4.1.7AIGC大模型的提示詞AIGC

稱為"ArtificialIntelligenceGeneratedContent",中

文翻譯為"人工智能生成內容"。這是

種新的創作方式,利用人工智能

技術來生成各種形式的內容,包括文字、音樂、圖像、視頻等■

AIGC是人工智能進入全新發展時期的重要標志,其核心技術包括生成對抗網

絡(GAN,Generative

AdversarialNetworks)、大型預訓練模型、多模態

技術等■AIGC的核心思想是利用人工智能算法生成具有一定創意和質量的內容。通

訓練模型和大量數據的學習,AIGC

可以根據輸入的條件或指導,生成與之相關的內容。例如,通過輸入關鍵詞、描述或樣本,AIGC

可以生成與之相匹配

的文章、圖像、音頻等■AIGC技術不僅可以提高內容生產的效率和質量,還可以為創作者提供更多的

靈感和支持。在文學創作、藝術設計、游戲開發等領域,AIGC可以自動創作

出高質量的文本、圖像和音頻等內容。同時,AIGC

也可以應用于媒體、教育、娛樂、營銷、科研等領域,為用戶提供高質量、高效率、高個性化的內容服務4.1.1什么是AIGC大模型與AIGC

之間的關系可以說是相輔相成、相互促進的。大模型為AIGC

提供了強大的技術基礎和支撐,而AIGC

則進一步推動了大模型的發展和應用,具體如下:01

02034.1.2

AIGC與大模型的關系大模型為AIGC

提供了豐

富的數據資源和強大的計

算能力大模型和AIGC的結合,

也帶來了廣泛的應用前景AIGC的需求也推動了大

模型的發展

4.1.3常見的AIGC

應用場景AIGC

可以應用于各行各業,主要包括但不限于生成文字、圖像、音頻、視頻等,具體如下:游戲生成場景原畫,生成角色

形象,生成世界觀,生成

數值,生成3D

模型,生成

NPC

對話,音效生成辦公寫周報日報,寫方案,寫

運營活動,制作PPT,

讀后感,寫代碼電商生成商品標題、描述、廣

告文案和廣告圖生成分鏡頭腳本,生成劇

本腳本,臺詞潤色,生成

推廣宣傳物料,音樂生成頭像生成,照片修復,圖

像生成,音樂生成娛

影視

4.1.3常見的AIGC

應用場景動漫原畫繪制,動畫生成,分鏡

生成,音樂生成設計UI

設計,美術設計,插畫設計,建筑設計藝術寫詩,寫小說,生成藝術創

作品,草圖生成,藝術風格轉換,音樂創作媒體軟文撰寫,大綱提煉,熱點

寫教育批改試卷,試卷創建,搜題

答題,課程設計,課程總結,虛擬講師生活制定學習計劃,做旅游規劃4.1.4

AIGC技術對行業發展的影響AIGC

技術對行業發展的影響深遠且廣泛,主要體現在以下幾個方面:內容創作領域的革新生產力提升與成本降低AIGC

技術能夠自動生成高質量的文本、圖像、音頻和視頻等內容,極大地提高了內容創作的效率。在新聞、廣告、自媒體等領域,AIGC

已經實現了廣泛

應用,幫助創作者快速生成多樣化、個性化的內容,滿足市場需求。這種技

術革新不僅降低了內容創作的成本,還激發了創作者的創新靈感,推動了內容產業的繁榮發展。AIGC

技術的快速發展為傳統行業帶來了轉型升級的契機。通過與AIGC

術的深度融合,傳統行業可以探索新的商業模式和服務模式,實現創新發展。

例如,在零售業中,AIGC

技術可以用于智能推薦、虛擬試衣等場景,提升購

物體驗并促進銷售增長。在金融領域,AIGC

技術可以應用于投資策略優化、

風險管理等方面,提高金融機構的決策效率和準確性。AIGC

技術在多個行業中展現了其提升生產力和降低成本的潛力。例如,在游戲開發領域,AIGC

技術可以用于場景構建、角色互動等,減少人工制作的工

作量,提高開發效率。在制造業中,AIGC

技術可以輔助設計、優化生產流程,

降低生產成本。這些應用使得企業能夠更快地響應市場變化,提升競爭力。AIGC

技術通過提供個性化、定制化的內容和服務,顯著提升了用戶體驗。在

智能客服、在線教育等領域,AIGC

技術可以根據用戶的需求和偏好提供精準

的服務,滿足用戶的個性化需求。這種以用戶為中心的服務模式不僅增強了

用戶的滿意度和忠誠度,還為企業帶來了更多的商業機會。用戶體驗的升級

推動行業創新與轉型職業發展路徑的多樣化AIGC

技術的發展為職業發展路徑提供了更

多的可能性。從業者可以根據自己的興趣和

特長,選擇適合自己的職業發展方向,例如,

一些對AI

技術感興趣的從業者可以選擇成為

AI

訓練師或機器學習工程師,而一些具有創

意和設計才能的從業者則可以利用AIGC

術來提升自己的創作能力。持續學習與技能提升面對AIGC

技術的快速發展,從業者需要不

斷學習和提升自己的技能水平。通過參加培

訓課程、閱讀專業書籍、參與技術論壇等方

式,從業者可以緊跟技術前沿,保持自己的

競爭力。工作方式的變革AIGC

技術改變了傳統的工作方式,使得遠

程工作、靈活辦公成為可能。許多企業開始

用AIGC

技術來優化工作流程,減少人力

成本,提高工作效率。這種變革不僅為員工

提供了更加靈活的工作方式,也為企業帶來

了更大的經濟效益。傳統職業的轉型升級AIGC

技術也為傳統職業的轉型升級提供了

契機。許多傳統職業如編輯、設計師、教師

等,在AIGC

技術的輔助下,工作效率和創

作質量得到了顯著提升。同時,這些職業也

需要從業者不斷適應技術變革,掌握新的技

能和工具,以適應市場需求的變化。新興職業的出現隨著AIGC

技術的快速發展,

一系列與該技

術相關的新興職業應運而生。例如,

AI

訓練

師、機器學習工程師、數據標注員等職業需

求激增。這些新興職業不僅要求從業者具備

扎實的技術基礎,還需要不斷學習和掌握最

新的AIGC

技術動態。4.1.5AIGC技術對職業發展的影響AIGC

技術對職業發展產生了深遠的影響,主要體現在以下幾個方面:

4.1.6常見的AIGC

大模型工具常見的AIGC

大模型工具包括:OpenAI的ChatGPTDeepSeek

科大訊飛的訊飛星火

阿里的通義千問百度文心一言

字節跳動豆包

Kimi這些工具基于大規模語言模型技術,具備文本生成、語言理解、知識問答、邏輯推理等多種能力,可廣泛應用于寫

作輔助、內容創作、智能客服等多個領域。通過不斷迭代和優化,為用戶提供更加智能、高效的內容生成解決方案引導生成

增強交互性提高準確性4.1.7

AIGC大模型的提示詞AIGC

大模型的提示詞(Prompt)

指用戶向大模型輸入的文本內容,用于觸發大模型的響應并指導其如何生成或回應

這些提示詞可以是一個問題、

一段描述、

一個指令,甚至是一個帶有詳細參數的文字描述。它們為大模型提供了生成對

應文本、圖片、音頻、視頻等內容的基礎信息和指導方向。提示詞的重要作用如下:4.1.7

AIGC大模型的提示詞使用提示詞需要注意一些技巧,這樣可以從大模型獲得更加符合我們預期要求的結果,主要技巧如下:簡潔明確

考慮受眾

分解復雜任務

使用肯定性指令示例驅動

明確角色

遵守規則

自然語言回答4.2文本類AIGC

應用實踐4.2.1案例1:與DeepSeek進行對話4.2.2案例2:與百度文心一言進行對話4.2.3案例3:使用訊飛智文生成PPT4.2.1案例1:與DeepSeek進行對話1.快速體驗DeepSeek訪

問DeepSeek

網(https://chat.deepseek.com/),會出現如圖7-1所示對話界面,在提示詞輸入框的底部,有

兩個按鈕,即“深度思考(R1)”和“聯網搜索”,可以用鼠標點擊來選中或取消,默認情況下,“深度思考(R1)”按

是處于選中狀態,“聯網搜索”則處于未選中狀態。兩個按鈕的功能如下:(1)深度思考(R1)。表示觸發更復雜的多步推理能力,適合需要邏輯鏈分析的場景,典型使用場景包括數學題/物理

題推導、文學作品的隱喻分析、編程問題的架構設計、需要分步驟解釋的操作指南等。(2)聯網搜索。表示實時獲取最新網絡信息,適合時效性強的查詢,典型使用場景包括查詢實時股價/匯率、驗證最

新科研成果、獲取突發事件進展、檢索特定網頁內容等。

我是DeepSeek,很高興見到你!我可以幫你寫代碼、讀文件、寫作各種創意內容,請把你的任務交給我吧~給

DeepSeek

發送消息深度思考(R1)田聯網搜索

0

個4.2.1案例1:與DeepSeek

進行對話1.

快速體驗DeepSeek在提示詞輸入框中輸入“請模仿李白的《望廬山瀑布》做一首詩,題目是《看廈門鼓浪嶼》”,然后回車,或者用鼠

標點擊提示詞輸入框右側的箭頭按鈕,向DeepSeek

發起提問。DeepSeek

給出的回答如圖7-2所示,需要注意的是,

大模型屬于概率模型,每次生成的回答內容可能不完全相同。《看廈門鼓浪嶼》鷺島東南煙水遙,日光巖上碧云飄。琴潮忽卷干堆雪,散作鳳凰霞萬條。注:本詩仿太白雄奇飄逸之風,首句以“煙水遙”勾勒海上仙山意境,承以日光巖實景作天地支點。轉句化琴

島聲波為視覺浪涌,取“千堆雪”暗合東坡赤壁豪情,結句鳳凰木朱華迸天,將聲、光、色熔鑄為漫天紅霞,

較之銀河落九天另開海上生霞之瑰麗新境。就已深度思考(用時21秒)O

叩4.2.1案例1:與DeepSeek進行對話2.DeepSeek

的基本用法(1)基本原則:簡單直接,自然表達。①無需復雜結構。直接描述需求即可,無需添加“角色扮演”(如“假設你是專

家”)或復雜指令(如“用學術語言分三點回答”)。比如,你可以直接向DeepSeek

提問“什么是光合作用?”、“如何

用Python

寫一個計算器程序?”,而不建議使用提示詞“請以生物學教授的身份,用三個段落解釋光合作用,每段不超過

100字”。②多輪對話優化結果。如果首次回答不完整,可通過追問補充細節,無需一次性給出完美提示。比如,第一輪提

問“寫一首關于秋天的詩”,第二輪提問“加入一些悲傷的情緒”,第三輪提問“把‘落葉’換成比喻句”。(2)不同場景的提問技巧(非必需,但可提升效率)。雖然簡單提問即可滿足大多數需求,但在復雜任務中,適當提供背

景信息或明確需求會讓結果更精準,具體技巧包括:①知識類問題。比如,基礎提問是“量子力學的基本原理是什么?”,

優化后的提問是“用通俗易懂的語言解釋量子糾纏,適合高中生理解”,②創作類任務(寫作、編程等)。比如,基礎提

問是“寫一個關于人工智能的科幻短篇故事”,優化后的提問是“寫一個反烏托邦主題的科幻故事,主角是女性工程師,結

局有反轉”。③實用建議(學習、工作等)。比如,基礎提問是“如何提高英語聽力?”,優化后的提問是“我每天只有

30分鐘學習時間,有哪些高效的英語聽力練習方法?”。④復雜任務(數據分析、代碼調試)。比如,基礎提問是“這段

Python

代碼報錯了,幫我看看問題”,優化后的提問是“我的代碼目標是爬取網頁數據,但遇到SSL

證書錯誤。報錯信息

如下:[粘貼代碼]”。4.2.1案例1:與DeepSeek

進行對話2.DeepSeek

的基本用法作為初學者,DeepSeek

的一些“魔法”指令也很有用,比如,你可以輸入“/步驟如何用手機拍攝旅游照片”,

DeepSeek

返回的回答結果就會按照步驟詳細給出拍攝旅游照片的說明,再比如,你可以輸入“請解釋量子計算,

然后/簡化”,它就會返回比較簡明扼要的回答。指令功能/續寫當回答中斷時自動繼續生成/簡化將復雜內容轉換成大白話/示例要求展示實際案例(特別是寫代碼時)/步驟讓AI分步驟指導操作流程/檢查幫你發現文檔中的錯誤表DeepSeek的“魔法”指令4.2.1案例1:與DeepSeek

進行對話3.使用DeepSeek

處理文檔點擊DeepSeek

界面中的「回形針」圖標上傳文件,支持的文件類型包括文本類(PDF、DOCX、TXT、Markdown)、數據類(CSV、X

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論