《人工智能基礎(chǔ)與應(yīng)用(第2版)》全套教學(xué)課件_第1頁(yè)
《人工智能基礎(chǔ)與應(yīng)用(第2版)》全套教學(xué)課件_第2頁(yè)
《人工智能基礎(chǔ)與應(yīng)用(第2版)》全套教學(xué)課件_第3頁(yè)
《人工智能基礎(chǔ)與應(yīng)用(第2版)》全套教學(xué)課件_第4頁(yè)
《人工智能基礎(chǔ)與應(yīng)用(第2版)》全套教學(xué)課件_第5頁(yè)
已閱讀5頁(yè),還剩493頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《人工智能基礎(chǔ)與應(yīng)用》模塊1人工智能:開啟智慧新時(shí)代模塊2Python:人工智能開發(fā)語言模塊3線性回歸:預(yù)測(cè)未來趨勢(shì)模塊4分門別類:幫你“分而治之”模塊5物以類聚:發(fā)現(xiàn)新簇群模塊6個(gè)性化推薦:主動(dòng)滿足你的需求模塊7語音識(shí)別:讓機(jī)器對(duì)你言聽計(jì)從模塊8人臉識(shí)別:機(jī)器也認(rèn)識(shí)你全套可編輯PPT課件

本課件是可編輯的正常PPT課件模塊?人工智能:開啟智慧新時(shí)代1-1人工智能的緣起本課件是可編輯的正常PPT課件目錄CONTENTS什么是人工智能01人工智能的發(fā)展歷程02人工智能的特征及典型應(yīng)用03人工智能的緣起1.什么是人工智能場(chǎng)景導(dǎo)入Deepseek為啥引起國(guó)內(nèi)外轟動(dòng)?1、訓(xùn)練成本低;2、性能上比肩頂尖模型;3、開源、算法優(yōu)化;4、用戶體驗(yàn)和使用成本優(yōu)勢(shì);Other本地部署……Deepseek的橫空出世意味著什么?本課件是可編輯的正常PPT課件人工智能的緣起1.什么是人工智能場(chǎng)景導(dǎo)入春晚機(jī)器人為什么有如此驚艷的表現(xiàn)?例如:-周圍感知--決策選擇--身體平衡--與人協(xié)作-……請(qǐng)大家結(jié)合機(jī)器人表現(xiàn)和你的認(rèn)知,說說你對(duì)人工智能概念的理解?本課件是可編輯的正常PPT課件人工智能的緣起1.什么是人工智能場(chǎng)景導(dǎo)入上圖中的商品推薦和AI文生圖意味著什么?這其中有沒有智能的成分在里面?本課件是可編輯的正常PPT課件人工智能的緣起1.什么是人工智能人工智能的定義馬文·明斯基的觀點(diǎn):“人工智能是一門科學(xué),是使機(jī)器做那些人需要通過智能來做的事情”尼爾斯·尼爾森提出:“人工智能是一門關(guān)于研究知識(shí)的表示、知識(shí)的獲取和知識(shí)的運(yùn)用的學(xué)科”目前學(xué)術(shù)主流觀點(diǎn):“人工智能是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能行為的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門綜合性科學(xué)”本課件是可編輯的正常PPT課件人工智能的緣起2.人工智能的發(fā)展歷程人工智能發(fā)展的階段1人工智能的萌芽期本課件是可編輯的正常PPT課件人工智能的緣起2.人工智能的發(fā)展歷程人工智能發(fā)展的階段2人工智能的啟動(dòng)期參加達(dá)特茅斯會(huì)議的部分大佬ELIZA對(duì)話程序界面本課件是可編輯的正常PPT課件人工智能的緣起2.人工智能的發(fā)展歷程人工智能發(fā)展的階段3人工智能的消沉期AI新技術(shù)難突破,表現(xiàn)不佳經(jīng)濟(jì)不景氣、政府對(duì)AI資助減少計(jì)算機(jī)算力和存力有限AIWinter(AI之冬)本課件是可編輯的正常PPT課件人工智能的緣起2.人工智能的發(fā)展歷程人工智能發(fā)展的階段4人工智能的突破期基于xcon系統(tǒng)的商業(yè)計(jì)算機(jī)BP算法奠定了多層神經(jīng)網(wǎng)絡(luò)發(fā)展的基礎(chǔ),開創(chuàng)了人工智能的數(shù)據(jù)驅(qū)動(dòng)時(shí)代。本課件是可編輯的正常PPT課件人工智能的緣起2.人工智能的發(fā)展歷程人工智能發(fā)展的階段5人工智能的高速發(fā)展期“深藍(lán)”挑戰(zhàn)卡斯帕羅夫ChatGPT對(duì)話界面AlphaGo挑戰(zhàn)李世石本課件是可編輯的正常PPT課件人工智能的緣起2.人工智能的發(fā)展歷程人工智能發(fā)展的階段人工智能大致發(fā)展歷程本課件是可編輯的正常PPT課件人工智能的緣起3.人工智能的特征及典型應(yīng)用人工智能的特征像人一樣思考像人一樣行動(dòng)具體表現(xiàn)具有學(xué)習(xí)能力具有感知能力具有決策能力具有行動(dòng)能力本課件是可編輯的正常PPT課件人工智能的緣起3.人工智能的特征及典型應(yīng)用人工智能的典型應(yīng)用智能駕駛?cè)四樧R(shí)別智慧醫(yī)療智能家居媒體娛樂軍事無人機(jī)仿生機(jī)器人(索菲亞)本課件是可編輯的正常PPT課件Thankyouverymuch!人工智能基礎(chǔ)與應(yīng)用本課件是可編輯的正常PPT課件模塊?人工智能:開啟智慧新時(shí)代1-2機(jī)器學(xué)習(xí)與深度學(xué)習(xí)本課件是可編輯的正常PPT課件目錄CONTENTS機(jī)器學(xué)習(xí)的含義01深度學(xué)習(xí)的崛起02神經(jīng)網(wǎng)絡(luò)的魅力031-2機(jī)器學(xué)習(xí)與深度學(xué)習(xí)1.機(jī)器學(xué)習(xí)的含義專門研究計(jì)算機(jī)模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。機(jī)器學(xué)習(xí)主要特點(diǎn)利用算法從數(shù)據(jù)中學(xué)習(xí)規(guī)律和模式,如垃圾分類、線性回歸房?jī)r(jià)預(yù)測(cè)等模型所需的數(shù)據(jù)規(guī)模可大可小,通常通過特征選擇、降維等技術(shù)來處理大規(guī)模數(shù)據(jù)集模型一般較為簡(jiǎn)單,主要是線性模型和統(tǒng)計(jì)模型等優(yōu)點(diǎn)是預(yù)測(cè)準(zhǔn)度較高,適用于各種類型的數(shù)據(jù)和任務(wù);缺點(diǎn)是需要足夠的數(shù)據(jù)和特征工程,對(duì)于復(fù)雜任務(wù)的建模能力有限本課件是可編輯的正常PPT課件1-2機(jī)器學(xué)習(xí)與深度學(xué)習(xí)2.深度學(xué)習(xí)的崛起深度學(xué)習(xí)(DeepLearning)屬于機(jī)器學(xué)習(xí)的子類,是利用深度神經(jīng)網(wǎng)絡(luò)來解決特征表達(dá)并處理任務(wù)的一種學(xué)習(xí)方法。深度學(xué)習(xí)主要特點(diǎn)使用神經(jīng)網(wǎng)絡(luò)模型,通過反向傳播算法和梯度下降優(yōu)化技術(shù)來調(diào)整網(wǎng)絡(luò)權(quán)重和參數(shù)尤其對(duì)于復(fù)雜的任務(wù)和模型,需要大量的數(shù)據(jù)集模型通常非常復(fù)雜,具有大量的神經(jīng)元和層數(shù),能自動(dòng)提取和抽象出有用的特征優(yōu)點(diǎn)是有強(qiáng)大的表征能力和泛化能力,能夠處理復(fù)雜的非線性問題;缺點(diǎn)是計(jì)算量大、訓(xùn)練時(shí)間長(zhǎng),對(duì)大規(guī)模數(shù)據(jù)集的需求較高本課件是可編輯的正常PPT課件1-2機(jī)器學(xué)習(xí)與深度學(xué)習(xí)2.深度學(xué)習(xí)的崛起場(chǎng)景導(dǎo)入冷撲大師動(dòng)物識(shí)別文生視頻車牌識(shí)別本課件是可編輯的正常PPT課件1-2機(jī)器學(xué)習(xí)與深度學(xué)習(xí)3.神經(jīng)網(wǎng)絡(luò)的魅力感知機(jī)(單層神經(jīng)網(wǎng)絡(luò))單層神經(jīng)網(wǎng)絡(luò)MarkI感知機(jī)(美國(guó)國(guó)家歷史博物館)本課件是可編輯的正常PPT課件1-2機(jī)器學(xué)習(xí)與深度學(xué)習(xí)3.神經(jīng)網(wǎng)絡(luò)的魅力人工神經(jīng)網(wǎng)絡(luò)的模型單層神經(jīng)網(wǎng)絡(luò)本課件是可編輯的正常PPT課件1-2機(jī)器學(xué)習(xí)與深度學(xué)習(xí)3.神經(jīng)網(wǎng)絡(luò)的魅力神經(jīng)網(wǎng)絡(luò)模擬大腦的功能單層神經(jīng)網(wǎng)絡(luò)本課件是可編輯的正常PPT課件1-2機(jī)器學(xué)習(xí)與深度學(xué)習(xí)3.神經(jīng)網(wǎng)絡(luò)的魅力場(chǎng)景導(dǎo)入神經(jīng)網(wǎng)絡(luò)的工作過程單層神經(jīng)網(wǎng)絡(luò)本課件是可編輯的正常PPT課件Thankyouverymuch!人工智能基礎(chǔ)與應(yīng)用本課件是可編輯的正常PPT課件模塊?人工智能:開啟智慧新時(shí)代1-3生成式人工智能本課件是可編輯的正常PPT課件目錄CONTENTS生成式人工智能的概念01AIGC的特征及核心技術(shù)02大模型的應(yīng)用舉例031-3生成式人工智能1.生成式人工智能的概念是指基于生成對(duì)抗網(wǎng)絡(luò)、大型預(yù)訓(xùn)練模型等人工智能的技術(shù)方法,通過已有數(shù)據(jù)的學(xué)習(xí)和識(shí)別,經(jīng)歷訓(xùn)練、微調(diào)與生成,以及評(píng)估和調(diào)整等階段,最后以適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容的技術(shù)。

AIGC五個(gè)方面的生成內(nèi)容本課件是可編輯的正常PPT課件1-3生成式人工智能2.AIGC的特征及核心技術(shù)(1)AIGC的特征本課件是可編輯的正常PPT課件1-3生成式人工智能2.AIGC的特征及核心技術(shù)(2)AIGC的核心技術(shù)本課件是可編輯的正常PPT課件1-3生成式人工智能2.AIGC的特征及核心技術(shù)(2)AIGC的核心技術(shù)基礎(chǔ)模型包括深度變分自編碼、生成對(duì)抗神經(jīng)網(wǎng)絡(luò)、擴(kuò)散模型、Transformer和VisionTransformer等技術(shù)。本課件是可編輯的正常PPT課件1-3生成式人工智能2.AIGC的特征及核心技術(shù)(2)AIGC的核心技術(shù)經(jīng)典的預(yù)訓(xùn)練大模型本課件是可編輯的正常PPT課件1-3生成式人工智能3.大模型及應(yīng)用舉例ChatGPT-3OpenAI于2020年5月發(fā)布的GPT-3受到了大量新聞報(bào)道和公眾關(guān)注。在兩年內(nèi),GPT-3已經(jīng)積累了100萬訂閱用戶。ChatGPT為用戶提供了一個(gè)與人工智能對(duì)話的直觀界面,也許可以滿足人類與生俱來的與他人溝通和聯(lián)系的愿望。ChatGPT-3是ChatGPT系列的第三個(gè)版本,它擁有1750億個(gè)參數(shù),是當(dāng)時(shí)全球最大的預(yù)訓(xùn)練語言模型,在自然語言理解、生成和對(duì)話能力方面都取得了重大突破。本課件是可編輯的正常PPT課件1-3生成式人工智能3.大模型及應(yīng)用舉例清華ChatDD2023年9月21日,水木分子發(fā)布新一代對(duì)話式藥物研發(fā)助手ChatDD(DrugDesign)和全球首個(gè)千億參數(shù)多模態(tài)生物醫(yī)藥對(duì)話大模型ChatDD-FM100B,其在C-Eval評(píng)測(cè)中達(dá)到全部醫(yī)學(xué)4項(xiàng)專業(yè)第一,是唯一在該4項(xiàng)評(píng)測(cè)中平均分超過90分的模型ChatDD能夠?qū)Χ嗄B(tài)數(shù)據(jù)進(jìn)行融合理解,與專家自然交互人機(jī)協(xié)作,將人類專家知識(shí)與大模型知識(shí)聯(lián)結(jié),重新定義藥物研發(fā)模式。本課件是可編輯的正常PPT課件1-3生成式人工智能3.大模型及應(yīng)用舉例谷歌Gemini2023年12月Gooqle發(fā)布了全新多模態(tài)大模型Gemini,能夠?qū)崿F(xiàn)多源多模態(tài)數(shù)據(jù)的輸入和輸出,包括文本、代碼、視頻、音頻和圖像,并擁有較好的跨模態(tài)識(shí)別、推理能力。2024年2月,Google推出Gemini1.5系列模型,提升了多模態(tài)大模型的計(jì)算效率,能夠從規(guī)模龐大的上下文(如多個(gè)長(zhǎng)文檔、數(shù)小時(shí)的視頻等)中調(diào)用細(xì)粒度信息并進(jìn)行推理。2024年9月,Google對(duì)Gemini1.5模型進(jìn)行更新,提升性能、加快響應(yīng)速度。本課件是可編輯的正常PPT課件1-3生成式人工智能3.大模型及應(yīng)用舉例谷歌DeepMind—AlphaFold32024年5月8日,DeepMind與lsomorphicLabs共同推出Transformer+Diffusion架構(gòu)的生成式A模型--AlphaFold3。AlphaFold3以前所未有的精確度成功預(yù)測(cè)所有生命分子的結(jié)構(gòu)及其相互作用方式;傳統(tǒng)生物學(xué)需要人類用顯微鏡從不同的角度觀察,耗時(shí)久目精度低。AlphaFold3的問世意味著將對(duì)更多變革性的科學(xué)研究起到推動(dòng)作用,包括基因組學(xué)研究、加速藥物設(shè)計(jì)、新材料開發(fā)、培育作物等等。本課件是可編輯的正常PPT課件1-3生成式人工智能3.大模型及應(yīng)用舉例OpenAI—GPT-42024年6月1日,谷歌DeepMind、約翰斯·霍普金斯大學(xué)和牛津大學(xué)等機(jī)構(gòu)的學(xué)者發(fā)布的研究證實(shí):GPT-4在心智理論任務(wù)上的表現(xiàn)完全達(dá)到成年人類的水平;在第6階推理上的表現(xiàn)大幅超過人類。自然子刊NatureHumanBehavioui已證實(shí):得益于龐大的數(shù)據(jù)庫(kù),GPT-4比人類更能理解對(duì)話中的諷刺和暗示。來自阿肯色大學(xué)的研究團(tuán)隊(duì)發(fā)現(xiàn)ChatGPT-4在創(chuàng)造性思維測(cè)試中的表現(xiàn)已經(jīng)超越人類。本課件是可編輯的正常PPT課件1-3生成式人工智能3.大模型及應(yīng)用舉例deepseek強(qiáng)化學(xué)習(xí)技術(shù):采用大規(guī)模強(qiáng)化學(xué)習(xí),僅需少量標(biāo)注數(shù)據(jù)即可顯著提升模型性能。智能訓(xùn)練場(chǎng):構(gòu)建了智能訓(xùn)練場(chǎng),提升推理能力,在推理任務(wù)上可與OpenAIO1媲美。開源共享:完全開源,降低了AI應(yīng)用門檻,賦能開源社區(qū)發(fā)展。部署廣泛:上線后迅速與眾多平臺(tái)和企業(yè)達(dá)成合作,展示出強(qiáng)大的市場(chǎng)適應(yīng)性和技術(shù)兼容性。應(yīng)用登頂:DeepSeek7天突破1億用戶,具有強(qiáng)大的市場(chǎng)吸引力和用戶基礎(chǔ)。本課件是可編輯的正常PPT課件Thankyouverymuch!人工智能基礎(chǔ)與應(yīng)用本課件是可編輯的正常PPT課件模塊?人工智能:開啟智慧新時(shí)代項(xiàng)目1—智作演示文稿本課件是可編輯的正常PPT課件目錄CONTENTS提出問題01解決方案02預(yù)備知識(shí)03完成任務(wù)04一、提出問題如何自動(dòng)生成PPT?場(chǎng)景導(dǎo)入提供工作效率便捷自動(dòng)生成應(yīng)對(duì)多個(gè)場(chǎng)景內(nèi)容豐富契合AIGC技術(shù)助力問題解決本課件是可編輯的正常PPT課件二、解決方案選擇AIGC工具訊飛星火文心一言華為盤古KIMI+…本課件是可編輯的正常PPT課件三、預(yù)備知識(shí)

星火認(rèn)知大模型的服務(wù)本課件是可編輯的正常PPT課件三、預(yù)備知識(shí)

星火認(rèn)知大模型的服務(wù)本課件是可編輯的正常PPT課件四、完成任務(wù)任務(wù)1—擬定一個(gè)主題任務(wù)描述確定一個(gè)能準(zhǔn)確概括你PPT內(nèi)容的主題,建議你從演示文稿的中心思想、你要表述的目的性、主要觀點(diǎn)等方面綜合研判PPT的主題。此處是要制作一個(gè)關(guān)于人工智能簡(jiǎn)要發(fā)展歷史的PPT。/?from=sparkHome本課件是可編輯的正常PPT課件四、完成任務(wù)任務(wù)1—擬定一個(gè)主題任務(wù)目標(biāo)確定一個(gè)關(guān)于人工智能發(fā)展歷史進(jìn)程的鮮明主題,有助于大模型的理解,以便生成一份高質(zhì)量的演示文稿。本課件是可編輯的正常PPT課件四、完成任務(wù)任務(wù)1—擬定一個(gè)主題完成步驟1:進(jìn)入圖1-27所示的訊飛智文操作界面,選擇“主題創(chuàng)建”方式來生成演示文稿本課件是可編輯的正常PPT課件四、完成任務(wù)任務(wù)1—擬定一個(gè)主題完成步驟2:?jiǎn)螕簟伴_始創(chuàng)作”按鈕,出現(xiàn)圖1-28所示的操作窗口本課件是可編輯的正常PPT課件四、完成任務(wù)任務(wù)1—擬定一個(gè)主題完成步驟3:在文本框輸入主題,以完成主題輸入任務(wù)本課件是可編輯的正常PPT課件四、完成任務(wù)任務(wù)2—生成和保存演示文稿任務(wù)描述讓大模型按擬定好的演示文稿的主題,自動(dòng)生成大綱和內(nèi)容,用戶可以根據(jù)具體需求對(duì)大綱進(jìn)行編輯和修改,并選擇適配的模板進(jìn)行配色,最終生成一份演示文稿。本課件是可編輯的正常PPT課件四、完成任務(wù)任務(wù)2—生成和保存演示文稿任務(wù)目標(biāo)自動(dòng)生成一份與主題契合的演示文稿,并將演示文稿下載到本地以方便隨時(shí)使用和修改。本課件是可編輯的正常PPT課件四、完成任務(wù)任務(wù)2—生成和保存演示文稿完成步驟1生成大綱進(jìn)入演示文稿的大綱編輯界面。本課件是可編輯的正常PPT課件四、完成任務(wù)任務(wù)2—生成和保存演示文稿完成步驟2選擇模板進(jìn)入下圖所示的模板配色界面。本課件是可編輯的正常PPT課件四、完成任務(wù)任務(wù)2—生成和保存演示文稿完成步驟3保存演示文稿經(jīng)過片刻的內(nèi)容生成過程,如下圖所示,一個(gè)科技藍(lán)樣式、目錄清晰、圖文并茂的演示文稿就已生成。本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件模塊?Python:人工智能開發(fā)語言2-1初識(shí)Python本課件是可編輯的正常PPT課件目錄CONTENTSPython簡(jiǎn)介01Python的特點(diǎn)及應(yīng)用領(lǐng)域02一.Python簡(jiǎn)介發(fā)明人:吉多·范羅蘇姆本課件是可編輯的正常PPT課件一.Python簡(jiǎn)介最受歡迎的計(jì)算機(jī)語言本課件是可編輯的正常PPT課件二.Python的特點(diǎn)及應(yīng)用領(lǐng)域1Python特點(diǎn)Python為人工智能首選語言本課件是可編輯的正常PPT課件二.Python的特點(diǎn)及應(yīng)用領(lǐng)域2Python應(yīng)用領(lǐng)域數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)、深度學(xué)習(xí)本課件是可編輯的正常PPT課件二.Python的特點(diǎn)及應(yīng)用領(lǐng)域2Python應(yīng)用領(lǐng)域云計(jì)算與運(yùn)維Web應(yīng)用開發(fā)本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件2-2Python開發(fā)環(huán)境搭建模塊?Python:人工智能開發(fā)語言本課件是可編輯的正常PPT課件目錄CONTENTS安裝Python01安裝Anaconda02淺嘗Python03一.安裝Python1.下載Python安裝文件本課件是可編輯的正常PPT課件一.安裝Python1.下載Python安裝文件本課件是可編輯的正常PPT課件一.安裝Python2.安裝Python安裝設(shè)置界面安裝成功提示界面本課件是可編輯的正常PPT課件一.安裝Python2.安裝PythonPython快捷菜單安裝成功提示界面Python3.10ModuleDocs(64-bit):內(nèi)置服務(wù)式的Python模塊幫助文檔。IDLE(Python3.1064-bit):Python自帶的集成開發(fā)環(huán)境(IntegratedDevelopmentandLearningEnvironment,IDLE)。Python3.10Manuals(64-bit):Python幫助文檔。Python3.10(64-bit):Python解釋器。本課件是可編輯的正常PPT課件二.安裝Anaconda1.安裝AnacondaAnaconda是一個(gè)可以便捷安裝開發(fā)包且對(duì)包能夠進(jìn)行統(tǒng)一管理的工具,它包含了conda、numpy、scipy、pandas、notebook在內(nèi)的超過180多個(gè)科學(xué)包及其依賴項(xiàng)。官網(wǎng)下載界面本課件是可編輯的正常PPT課件二.安裝Anaconda1.安裝AnacondaAnaconda安裝完成勾選安裝選項(xiàng)本課件是可編輯的正常PPT課件二.安裝Anaconda2.啟動(dòng)JupyterNotebook啟動(dòng)JupyternotebookAnaconda的快捷菜單本課件是可編輯的正常PPT課件二.安裝Anaconda2.啟動(dòng)JupyterNotebookJupyterNotebook主頁(yè)本課件是可編輯的正常PPT課件二.安裝Anaconda3.淺嘗Python新建case2-1的腳本源程序編寫源代碼本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件2-3Python編程基礎(chǔ)模塊?Python:人工智能開發(fā)語言本課件是可編輯的正常PPT課件目錄CONTENTS變量01分支結(jié)構(gòu)02循環(huán)結(jié)構(gòu)03組合數(shù)據(jù)類型04一.變量1.變量定義程序需要將數(shù)據(jù)存儲(chǔ)到變量中,變量是計(jì)算機(jī)內(nèi)存的存儲(chǔ)位置的表示,也叫內(nèi)存變量。變量用標(biāo)識(shí)符來命名,也就是每個(gè)變量都有自己的名字,但命名變量的時(shí)候不能讓變量名字與Python保留的關(guān)鍵字沖突。Python的關(guān)鍵字本課件是可編輯的正常PPT課件一.變量2.變量命名規(guī)則定義變量在Python內(nèi)部是有類型的,如int、float、str等類型,但是在編程時(shí)無須關(guān)注變量類型,所有的變量都無須提前聲明,賦值后就能使用。另外,可以將不同類型的數(shù)據(jù)賦值給同一個(gè)變量,所以變量的類型是可以隨時(shí)改變的,可以用函數(shù)type來查看變量的類型。本課件是可編輯的正常PPT課件二.分支結(jié)構(gòu)1.執(zhí)行流程語法表示ifcondition_1:

statement_block_1elifcondition_2:

statement_block_2else:

statement_block_3本課件是可編輯的正常PPT課件二.分支結(jié)構(gòu)2.例子【引例2-2】判斷狗對(duì)應(yīng)于人類的年齡。(1)引例描述輸入狗的實(shí)際年齡,按下列公式計(jì)算狗對(duì)應(yīng)于人類的年齡。

上式中x表示狗的實(shí)際年齡,y表示狗對(duì)應(yīng)于人類的年齡。源代碼本課件是可編輯的正常PPT課件三.循環(huán)結(jié)構(gòu)1.while循環(huán)語法表示while循環(huán)條件(condition):

執(zhí)行語句(statements)…本課件是可編輯的正常PPT課件三.循環(huán)結(jié)構(gòu)2.例子源代碼【引例2-3】多次反復(fù)計(jì)算狗對(duì)應(yīng)于人類的年齡。(1)引例描述多次反復(fù)計(jì)算不同狗的年齡對(duì)應(yīng)于人類的年齡,直到用戶按“Q”鍵退出。本課件是可編輯的正常PPT課件四.組合數(shù)據(jù)類型1.列表列表用方括號(hào)“[]”來表示,里面的各元素用逗號(hào)分開,列表的各元素可以是不同的數(shù)據(jù)類型。創(chuàng)建一個(gè)列表,只要把用逗號(hào)分開的所有的元素使用方括號(hào)括起來即可。示例代碼本課件是可編輯的正常PPT課件二.安裝Anaconda1.安裝AnacondaAnaconda是一個(gè)可以便捷安裝開發(fā)包且對(duì)包能夠進(jìn)行統(tǒng)一管理的工具,它包含了conda、numpy、scipy、pandas、notebook在內(nèi)的超過180多個(gè)科學(xué)包及其依賴項(xiàng)。官網(wǎng)下載界面本課件是可編輯的正常PPT課件二.安裝Anaconda1.安裝AnacondaAnaconda安裝完成勾選安裝選項(xiàng)本課件是可編輯的正常PPT課件二.安裝Anaconda2.啟動(dòng)JupyterNotebook啟動(dòng)JupyternotebookAnaconda的快捷菜單本課件是可編輯的正常PPT課件二.安裝Anaconda2.啟動(dòng)JupyterNotebookJupyterNotebook主頁(yè)本課件是可編輯的正常PPT課件二.安裝Anaconda3.淺嘗Python新建case2-1的腳本源程序編寫源代碼本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件2-4NumPy基礎(chǔ)應(yīng)用模塊?Python:人工智能開發(fā)語言本課件是可編輯的正常PPT課件目錄CONTENTS求解三元一次方程01數(shù)組計(jì)算02向量化處理03一.求解三元一次方程1.NumPy安裝在Anaconda中已包含NumPy等基礎(chǔ)庫(kù),如果其中沒有找到NumPy,說明它還沒有安裝或已被卸載,需要執(zhí)行以下命令來安裝NumPy。

pip3installnumpyNumpy安裝界面本課件是可編輯的正常PPT課件一.求解三元一次方程2.引例執(zhí)行結(jié)果:本課件是可編輯的正常PPT課件二.數(shù)組計(jì)算1.數(shù)組定義數(shù)組是NumPy中最基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu),N維數(shù)組對(duì)象是ndarray,它是一系列同類型元素的集合,以0開始表示集合中元素的索引。在深度學(xué)習(xí)中,神經(jīng)元之間的連接關(guān)系往往采用數(shù)組形式的參數(shù)來表示,還有大數(shù)據(jù)的統(tǒng)計(jì)也常常采用數(shù)組特性進(jìn)行排序、去重和統(tǒng)計(jì)計(jì)算等。使用NumPy提供的數(shù)組操作,比使用常規(guī)的Python數(shù)組操作有更高的效率和更簡(jiǎn)潔的編程代碼。ndarray0開始索引表示處理高校編程簡(jiǎn)潔本課件是可編輯的正常PPT課件二.數(shù)組計(jì)算2.引例1 importnumpyasnp2 iris_data=np.loadtxt("./data/iris.csv",delimiter=",",skiprows=1)3 print(type(iris_data))4 print(iris_data.shape)5 print('花萼長(zhǎng)度的最大值:',np.max(iris_data[:,1]))6 print('花萼長(zhǎng)度的最小值:',np.min(iris_data[:,1]))7 print('花萼長(zhǎng)度的平均值:',np.mean(iris_data[:,1]))8 print('花萼長(zhǎng)度的標(biāo)準(zhǔn)差:',np.std(iris_data[:,1]))9 print('花萼長(zhǎng)度的方差:',np.var(iris_data[:,1]))本課件是可編輯的正常PPT課件二.數(shù)組計(jì)算2.引例執(zhí)行結(jié)果:數(shù)組計(jì)算方便代碼簡(jiǎn)潔高效本課件是可編輯的正常PPT課件三.向量化處理1.概念本課件是可編輯的正常PPT課件三.向量化處理2.引例讀數(shù)據(jù)本課件是可編輯的正常PPT課件三.向量化處理2.引例VS結(jié)果對(duì)比:本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件2-5Matplotlib基礎(chǔ)應(yīng)用模塊?Python:人工智能開發(fā)語言本課件是可編輯的正常PPT課件目錄CONTENTS繪制直方圖01繪制散點(diǎn)圖02一.繪制直方圖1.Matplotlib簡(jiǎn)介Python的第三方庫(kù)Matplotlib提供了豐富的繪圖功能,是一個(gè)非常好用的數(shù)據(jù)可視化工具。Anaconda中已包含該工具,可以直接調(diào)用該第三方庫(kù)。matplotlib官網(wǎng)本課件是可編輯的正常PPT課件一.繪制直方圖2.引例本課件是可編輯的正常PPT課件一.繪制直方圖2.引例運(yùn)行結(jié)果:本課件是可編輯的正常PPT課件二.繪制散點(diǎn)圖1.概念散點(diǎn)圖利用一系列的散點(diǎn)將兩個(gè)變量的聯(lián)合分布情況描繪出來,可以從圖形分布中推斷一些信息,如兩個(gè)變量間是否存在某種有意義的關(guān)系,當(dāng)數(shù)據(jù)以恰當(dāng)?shù)姆绞皆谏Ⅻc(diǎn)圖中展示出來時(shí),就可以非常直觀地觀察到某些趨勢(shì)或者模式,也就可以揭示變量之間的關(guān)系。下面,以鳶尾花數(shù)據(jù)集為例,利用seaborn庫(kù)的散點(diǎn)圖嘗試揭示鳶尾花花瓣的寬度和長(zhǎng)度之間的關(guān)系。本課件是可編輯的正常PPT課件二.繪制散點(diǎn)圖2.引例本課件是可編輯的正常PPT課件二.繪制散點(diǎn)圖2.引例執(zhí)行結(jié)果:本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件2-6項(xiàng)目1—精準(zhǔn)扶貧計(jì)劃模塊?Python:人工智能開發(fā)語言本課件是可編輯的正常PPT課件目錄CONTENTS提出問題01解決方案02預(yù)備知識(shí)03任務(wù)1—從鍵盤輸入方程的系數(shù)04任務(wù)2—調(diào)用roots函數(shù)求解方程05一.提出問題問題描述某縣城當(dāng)年有約12000個(gè)貧困人口,為合理利于扶貧資源、保持可持續(xù)減貧目標(biāo),計(jì)劃3年后將貧困人口控制在2000左右,你認(rèn)為將年平均貧困人口下降率定為多少比較合適?如何利用numpy求解該問題本課件是可編輯的正常PPT課件二.解決方案方案分析數(shù)學(xué)描述:解決流程:本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)求根函數(shù)rootsnumpy.roots([多項(xiàng)式系數(shù)])Polynomial([多項(xiàng)式系數(shù)]).roots()用法1:用法2:本課件是可編輯的正常PPT課件四.任務(wù)1——從鍵盤輸入方程的系數(shù)1.兩種實(shí)現(xiàn)代碼方法1方法2本課件是可編輯的正常PPT課件四.任務(wù)1——從鍵盤輸入方程的系數(shù)2.運(yùn)行結(jié)果方法1結(jié)果:方法2結(jié)果:本課件是可編輯的正常PPT課件五.任務(wù)2——調(diào)用roots函數(shù)求解方程1.任務(wù)描述用兩種方法實(shí)現(xiàn)!本課件是可編輯的正常PPT課件五.任務(wù)2——調(diào)用roots函數(shù)求解方程2.實(shí)現(xiàn)代碼方法1:方法2:本課件是可編輯的正常PPT課件五.任務(wù)2——調(diào)用roots函數(shù)求解方程2.運(yùn)行結(jié)果方法1:方法2:本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件2-7項(xiàng)目2—解讀第二產(chǎn)業(yè)的GDP發(fā)展趨勢(shì)模塊?Python:人工智能開發(fā)語言本課件是可編輯的正常PPT課件目錄CONTENTS提出問題01解決方案02預(yù)備知識(shí)03任務(wù)1—讀取GDP數(shù)據(jù)并觀察數(shù)據(jù)結(jié)構(gòu)04任務(wù)2—繪制GDP數(shù)據(jù)的折線圖05一.提出問題問題描述當(dāng)拿到大量有關(guān)GDP的數(shù)據(jù)時(shí),如何從這些表面看起來雜亂無章的數(shù)據(jù)中解讀出一些有價(jià)值的信息呢?顯然,如果能將這些數(shù)據(jù)以圖形的方式展現(xiàn)出來,如將這些數(shù)據(jù)以隨時(shí)間(或另一個(gè)變量)而變化的關(guān)系在圖上繪制出來,是否能直觀地幫助人們更深入洞悉數(shù)據(jù)背后可能隱藏的一些有用信息呢?如何用圖形展示數(shù)據(jù)規(guī)律本課件是可編輯的正常PPT課件二.解決方案方案分析使用工具:解決方案示意圖:數(shù)據(jù)處理繪制圖形本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)Lineplot函數(shù)本課件是可編輯的正常PPT課件四.任務(wù)1——讀取GDP數(shù)據(jù)并觀察數(shù)據(jù)結(jié)構(gòu)1.讀數(shù)據(jù)用Pandas讀數(shù)據(jù)數(shù)據(jù)排序本課件是可編輯的正常PPT課件四.任務(wù)1——從鍵盤輸入方程的系數(shù)2.觀察數(shù)據(jù)12行、4列數(shù)據(jù),每列數(shù)據(jù)有列名本課件是可編輯的正常PPT課件五.任務(wù)2——繪制GDP數(shù)據(jù)的折線圖1.現(xiàn)實(shí)代碼為什么類型轉(zhuǎn)換本課件是可編輯的正常PPT課件五.任務(wù)2——繪制GDP數(shù)據(jù)的折線圖2.運(yùn)行結(jié)果你能解讀出哪些結(jié)論?本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件3-1認(rèn)識(shí)機(jī)器學(xué)習(xí)模塊?線性回歸:預(yù)測(cè)未來趨勢(shì)本課件是可編輯的正常PPT課件目錄CONTENTS機(jī)器如何學(xué)習(xí)01機(jī)器學(xué)習(xí)算法02一.機(jī)器如何學(xué)習(xí)1.機(jī)器學(xué)習(xí)的一般流程機(jī)器通過學(xué)習(xí),就具備了可以自主獲得事物規(guī)律或解決問題的能力本課件是可編輯的正常PPT課件一.機(jī)器如何學(xué)習(xí)2.機(jī)器學(xué)習(xí)的三要素經(jīng)驗(yàn)數(shù)據(jù)從哪學(xué)?算法怎么學(xué)?模型學(xué)到什么?以算力作為支撐本課件是可編輯的正常PPT課件二.機(jī)器學(xué)習(xí)算法1.監(jiān)督學(xué)習(xí)所謂監(jiān)督學(xué)習(xí):是指機(jī)器在有已知輸入值xi和輸出值y的經(jīng)驗(yàn)數(shù)據(jù)(樣本)的情況下開展的學(xué)習(xí)。學(xué)習(xí)方法特點(diǎn):(1)訓(xùn)練的數(shù)據(jù)有標(biāo)簽(label)。(2)樣本的特征和標(biāo)簽已知。(3)學(xué)習(xí)的目的就是建立一個(gè)將輸入準(zhǔn)確映射到輸出的模型。基于動(dòng)物特征的貓鼠分類的監(jiān)督學(xué)習(xí)本課件是可編輯的正常PPT課件二.機(jī)器學(xué)習(xí)算法2.無監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí):就是指機(jī)器在學(xué)習(xí)過程中不受監(jiān)督,學(xué)習(xí)模型不斷提高自我認(rèn)知和不斷鞏固,最后進(jìn)行自我歸納來達(dá)到學(xué)習(xí)目的。學(xué)習(xí)方法特點(diǎn):(1)無需大量的標(biāo)注數(shù)據(jù)。(2)以更接近人類的學(xué)習(xí)方式不斷自我發(fā)現(xiàn)、學(xué)習(xí)和調(diào)整。不同分類結(jié)果的無監(jiān)督學(xué)習(xí)本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件3-2認(rèn)識(shí)線性回歸模塊?線性回歸:預(yù)測(cè)未來趨勢(shì)本課件是可編輯的正常PPT課件目錄CONTENTS線性回歸的數(shù)學(xué)表達(dá)式01梯度下降法03線性回歸的幾個(gè)概念02一.線性回歸的數(shù)學(xué)表達(dá)式定義及表達(dá)式線性回歸(linearregression)是一種通過擬合自變量xi與因變量y之間的最佳線性關(guān)系,來預(yù)測(cè)目標(biāo)變量的方法。如果上式中只包括一個(gè)自變量x和一個(gè)因變量y,且二者的關(guān)系可用一條直線近似表示,則這種回歸分析被稱為一元線性回歸分析。如果回歸分析中包括兩個(gè)或兩個(gè)以上的自變量xi,且因變量y和自變量xi之間是線性關(guān)系,則稱其為多元線性回歸分析。本課件是可編輯的正常PPT課件二.線性回歸的幾個(gè)概念1.方差衡量誤差真實(shí)值:預(yù)測(cè)值:y本課件是可編輯的正常PPT課件二.線性回歸的幾個(gè)概念2.總平方和SST:衡量了所有觀測(cè)值相對(duì)于整體均值的離散程度。其值越大,說明原始的樣本本身具有越大的波動(dòng),這種波動(dòng)反映了因變量的整體偏差。如何評(píng)價(jià)上述直線對(duì)真實(shí)值擬合的好壞程度本課件是可編輯的正常PPT課件二.線性回歸的幾個(gè)概念3.擬合優(yōu)度R2:稱為判斷系數(shù)或擬合優(yōu)度。由右式可知,線性回歸方程以外的其他因素引起的誤差SSE越小,R2就越接近1,表示此線性回歸方程可以很好地解釋因變量的變化;反之,如果SSE越大,接近總體偏差SST,R2就越接近0,說明此問題可能不適合采用線性回歸模型解決。盡可能最小y=+本課件是可編輯的正常PPT課件三.梯度下降法1.定義?梯度下降法:?是一種用于求解函數(shù)最小值的優(yōu)化算法。其基本思想是通過迭代的方式,沿著函數(shù)的負(fù)梯度方向逐步減小函數(shù)值,直到達(dá)到局部最小值。梯度下降法適用于求解無約束優(yōu)化問題,常用于機(jī)器學(xué)習(xí)中的參數(shù)優(yōu)化。損失函數(shù)L可以理解為系數(shù)b和w的函數(shù),記為尋找損失函數(shù)L(b,w)的最小值的過程,實(shí)際就是按照某種方向,不斷去微調(diào)b和w的值,一步一步嘗試找到這個(gè)最小值。本課件是可編輯的正常PPT課件Min()三.梯度下降法2.求解過程本課件是可編輯的正常PPT課件三.梯度下降法3.線性回歸解決問題一般步驟01根據(jù)問題構(gòu)建一個(gè)線性回歸模型,即構(gòu)建一個(gè)函數(shù)。02用樣本訓(xùn)練模型,使用梯度下降法調(diào)整模型參數(shù),目標(biāo)使損失函數(shù)最小。03重復(fù)步驟(2),直至找到損失函數(shù)的最小值。04用驗(yàn)證集測(cè)試模型的精度,評(píng)價(jià)指標(biāo)常為均方誤差MSE。05如預(yù)測(cè)結(jié)果不滿意,則需要改進(jìn)模型(如加大訓(xùn)練集、改變學(xué)習(xí)率等)。06回到步驟(2),重新訓(xùn)練模型,直至獲得滿意的模型。07利用自變量xi和滿意的模型去計(jì)算預(yù)測(cè)值y,從而解決預(yù)測(cè)問題。本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件3-3項(xiàng)目1—預(yù)測(cè)二手車價(jià)格模塊?線性回歸:預(yù)測(cè)未來趨勢(shì)本課件是可編輯的正常PPT課件目錄CONTENTS提出問題01預(yù)備知識(shí)03解決方案02任務(wù)1—準(zhǔn)備訓(xùn)練集和測(cè)試集04任務(wù)3—模型的測(cè)試及評(píng)估06任務(wù)2—模型的構(gòu)建與訓(xùn)練05一.提出問題問題描述

市面上二手車種類繁多,又涉及到汽車的諸多專業(yè)知識(shí),對(duì)于多數(shù)人而言,購(gòu)買一輛與實(shí)際價(jià)格相符、車型適中的二手車,并不是一件輕松的事情。如果能從二手車交易的歷史記錄中發(fā)現(xiàn)某種規(guī)律,如何合理評(píng)估一臺(tái)二手車的預(yù)交易價(jià)格呢?讓機(jī)器幫你找到這個(gè)問題的答案本課件是可編輯的正常PPT課件二.解決方案1.問題本質(zhì)二手車價(jià)格預(yù)測(cè)問題,其實(shí)是尋找二手車的基本特征(如汽車品牌、變速箱類型、已使用年限等)與價(jià)格之間的關(guān)系多元線性回歸的機(jī)器學(xué)習(xí)問題本課件是可編輯的正常PPT課件二.解決方案2.解決方案本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)1.數(shù)據(jù)歸一化(1)min-max標(biāo)準(zhǔn)化(2)零均值標(biāo)準(zhǔn)化本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)2.線性回歸模型如何訓(xùn)練1)定義模型:假設(shè)有9個(gè)自變量x(品牌、車身類型等)影響二手車的價(jià)格,模型的輸出值是價(jià)格y。因此,模型的假設(shè)函數(shù)表達(dá)式如下。2)構(gòu)造損失函數(shù):

3)開始訓(xùn)練:初始化參數(shù),包括參數(shù)φ、學(xué)習(xí)率和迭代次數(shù)n。將樣本數(shù)據(jù)輸入模型,計(jì)算損失函數(shù)。利用學(xué)習(xí)算法如梯度下降法尋找損失函數(shù)的最小值,并依次更新模型的參數(shù)。不斷重復(fù)步驟(2)、(3),直到模型收斂于或訓(xùn)練迭代次數(shù)達(dá)到設(shè)定閾值n即停止。本課件是可編輯的正常PPT課件四.任務(wù)1——準(zhǔn)備訓(xùn)練集和測(cè)試集1.樣本數(shù)據(jù)結(jié)構(gòu)本課件是可編輯的正常PPT課件四.任務(wù)1——準(zhǔn)備訓(xùn)練集和測(cè)試集2.數(shù)據(jù)集歸一化處理切分?jǐn)?shù)據(jù)切分?jǐn)?shù)據(jù)本課件是可編輯的正常PPT課件四.任務(wù)1——準(zhǔn)備訓(xùn)練集和測(cè)試集2.數(shù)據(jù)集歸一化處理歸一化后的樣本數(shù)據(jù)本課件是可編輯的正常PPT課件四.任務(wù)1——準(zhǔn)備訓(xùn)練集和測(cè)試集3.數(shù)據(jù)集分成訓(xùn)練集和測(cè)試集訓(xùn)練集測(cè)試集本課件是可編輯的正常PPT課件五.任務(wù)2——模型的構(gòu)建與訓(xùn)練1.了解模型參數(shù)本課件是可編輯的正常PPT課件五.任務(wù)2——模型的構(gòu)建與訓(xùn)練2.代碼實(shí)現(xiàn)構(gòu)建模型本課件是可編輯的正常PPT課件五.任務(wù)2——模型的構(gòu)建與訓(xùn)練2.代碼實(shí)現(xiàn)模型訓(xùn)練后的結(jié)果為啥模型得分不高?本課件是可編輯的正常PPT課件六.任務(wù)3——模型的測(cè)試及評(píng)估1.計(jì)算均方誤差代碼執(zhí)行后的結(jié)果本課件是可編輯的正常PPT課件六.任務(wù)3——模型的測(cè)試及評(píng)估2.繪制預(yù)測(cè)效果圖實(shí)現(xiàn)代碼本課件是可編輯的正常PPT課件六.任務(wù)3——模型的測(cè)試及評(píng)估2.繪制預(yù)測(cè)效果圖運(yùn)行結(jié)果本課件是可編輯的正常PPT課件六.任務(wù)3——模型的測(cè)試及評(píng)估3.誤差原因分析01異常值對(duì)預(yù)測(cè)結(jié)果的影響。02樣本集特征值個(gè)數(shù)過少對(duì)預(yù)測(cè)結(jié)果的影響。03樣本的規(guī)模對(duì)預(yù)測(cè)結(jié)果的影響。04其它,如模型類型等。本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件3-4項(xiàng)目2—預(yù)測(cè)投保人醫(yī)療費(fèi)用模塊?線性回歸:預(yù)測(cè)未來趨勢(shì)本課件是可編輯的正常PPT課件目錄CONTENTS提出問題01預(yù)備知識(shí)03解決方案02任務(wù)1—加載數(shù)據(jù)并進(jìn)行數(shù)據(jù)預(yù)處理04任務(wù)3—進(jìn)一步改善模型性能06任務(wù)2—訓(xùn)練和測(cè)試醫(yī)療費(fèi)用預(yù)測(cè)模型05一.提出問題問題描述我國(guó)農(nóng)村醫(yī)療保險(xiǎn)和全民醫(yī)保制度的全面實(shí)施,緩解了廣大人民群眾“看病貴”的問題,提高了人民群眾的生活質(zhì)量,也改變了人們對(duì)保險(xiǎn)的認(rèn)識(shí),越來越多人的接受和認(rèn)可商業(yè)保險(xiǎn)。與此同時(shí),醫(yī)療保險(xiǎn)公司作為一種商業(yè)經(jīng)營(yíng)實(shí)體,對(duì)投保人在未來可能發(fā)生的醫(yī)療費(fèi)用進(jìn)行預(yù)測(cè),這是醫(yī)療保險(xiǎn)公司回避風(fēng)險(xiǎn)、提高經(jīng)營(yíng)利潤(rùn)的一種保障措施。如何能得到一個(gè)較為精準(zhǔn)的醫(yī)療費(fèi)用預(yù)測(cè)模型呢機(jī)器如何去學(xué)習(xí)預(yù)測(cè)?本課件是可編輯的正常PPT課件二.解決方案1.問題本質(zhì)醫(yī)療費(fèi)用預(yù)測(cè)問題,就是試圖從投保人的特征變量入手,通過機(jī)器學(xué)習(xí)提供的某種模型,如線性回歸等,來尋找一個(gè)醫(yī)療費(fèi)用與投保人特征相關(guān)的函數(shù)表達(dá)式。仍然采用多元線性回歸來求解問題本課件是可編輯的正常PPT課件二.解決方案2.解決方案本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)1.DataFrame數(shù)據(jù)的檢索用途:從數(shù)據(jù)集中切分出需要的數(shù)據(jù)loc方法使用名稱檢索iloc方法使用索引號(hào)檢索本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)1.DataFrame數(shù)據(jù)的檢索示例:運(yùn)行結(jié)果本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)2.DataFrame數(shù)據(jù)的更改1)按索引條件直接更改:結(jié)果本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)2.DataFrame數(shù)據(jù)的更改2)用apply方法更改:結(jié)果本課件是可編輯的正常PPT課件四.任務(wù)1——加載數(shù)據(jù)并進(jìn)行數(shù)據(jù)預(yù)處理1.導(dǎo)入相關(guān)庫(kù)并加載數(shù)據(jù)讀取的數(shù)據(jù)本課件是可編輯的正常PPT課件四.任務(wù)1——加載數(shù)據(jù)并進(jìn)行數(shù)據(jù)預(yù)處理2.數(shù)據(jù)清洗和轉(zhuǎn)換對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換,以方便機(jī)器學(xué)習(xí)本課件是可編輯的正常PPT課件四.任務(wù)1——加載數(shù)據(jù)并進(jìn)行數(shù)據(jù)預(yù)處理3.數(shù)據(jù)的歸一化處理歸一化后的樣本數(shù)據(jù)本課件是可編輯的正常PPT課件五.任務(wù)2——訓(xùn)練和測(cè)試醫(yī)療費(fèi)用預(yù)測(cè)模型1.構(gòu)建線性回歸模型構(gòu)建線性回歸模型本課件是可編輯的正常PPT課件五.任務(wù)2——訓(xùn)練和測(cè)試醫(yī)療費(fèi)用預(yù)測(cè)模型2.準(zhǔn)備訓(xùn)練集和測(cè)試集按7∶3的比例分為訓(xùn)練集和測(cè)試集本課件是可編輯的正常PPT課件五.任務(wù)2——訓(xùn)練和測(cè)試醫(yī)療費(fèi)用預(yù)測(cè)模型3.模型訓(xùn)練和測(cè)試運(yùn)行結(jié)果本課件是可編輯的正常PPT課件五.任務(wù)2——訓(xùn)練和測(cè)試醫(yī)療費(fèi)用預(yù)測(cè)模型4.預(yù)測(cè)結(jié)果可視化可視化結(jié)果本課件是可編輯的正常PPT課件六.任務(wù)3——進(jìn)一步改善模型性能1.改進(jìn)方向01分析樣本特征的相關(guān)性。Age與bmi強(qiáng)相關(guān)本課件是可編輯的正常PPT課件六.任務(wù)3——進(jìn)一步改善模型性能1.改進(jìn)方向02考慮模型中是否存在非線性變量。處理辦法本課件是可編輯的正常PPT課件六.任務(wù)3——進(jìn)一步改善模型性能1.改進(jìn)方向03評(píng)估連續(xù)性變量的影響是否也是連續(xù)的。處理辦法本課件是可編輯的正常PPT課件六.任務(wù)3——進(jìn)一步改善模型性能1.改進(jìn)方向改進(jìn)舉例:消除bmi和smoker的共同作用本課件是可編輯的正常PPT課件六.任務(wù)3——進(jìn)一步改善模型性能1.改進(jìn)方向改進(jìn)后的效果:相對(duì)于前一個(gè)模型,改進(jìn)后的模型得分一下子提高到0.869,說明此模型能更好地解釋醫(yī)療費(fèi)用的變化,這可能提示肥胖吸煙者對(duì)醫(yī)療費(fèi)用的影響是巨大的。本課件是可編輯的正常PPT課件六.任務(wù)3——進(jìn)一步改善模型性能2.預(yù)測(cè)費(fèi)用預(yù)測(cè)費(fèi)用:本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件4-1分類器模塊?分門別類:幫你“分而治之”本課件是可編輯的正常PPT課件目錄CONTENTS什么是分類器01分類器如何工作02一.什么是分類器1.概念分類器:分類是人工智能的一種重要方法,是在已有數(shù)據(jù)的基礎(chǔ)上學(xué)習(xí)出一個(gè)分類函數(shù)或構(gòu)造出一個(gè)分類模型,該函數(shù)或者模型就是一個(gè)能完成分類任務(wù)的人工智能系統(tǒng),即人們通常所說的分類器。。數(shù)據(jù)集分類器給定的某個(gè)類型本課件是可編輯的正常PPT課件二.分類器如何工作1.一般工作過程三個(gè)關(guān)鍵要素:1樣本特征2正負(fù)樣本3分類器類型本課件是可編輯的正常PPT課件二.分類器如何工作2.三個(gè)概念(1)樣本特征。樣本特征提取是分類器工作的首要任務(wù),如果待分類對(duì)象沒有提取特征,也就沒有分類的依據(jù),就無從辨別對(duì)象的種類。綜合考慮關(guān)聯(lián)對(duì)象的差異,提取出有效的特征,讓分類器準(zhǔn)確工作。(2)正、負(fù)樣本。針對(duì)分類問題,正樣本是指想要正確分類出的類別所對(duì)應(yīng)的樣本,負(fù)樣本是指不屬于這一類別的樣本。既要考慮正樣本,又要根據(jù)實(shí)際工作場(chǎng)景,合理選取足夠多的負(fù)樣本,保證模型訓(xùn)練效果。(3)分類器。分類器通過學(xué)習(xí)得到一個(gè)目標(biāo)函數(shù)或模型(以下統(tǒng)稱為模型),它能把樣本的特征集X映射到一個(gè)預(yù)先定義的類別號(hào)y。本課件是可編輯的正常PPT課件二.分類器如何工作2.三個(gè)概念那么,機(jī)器學(xué)習(xí)中,常見的分類器有哪些呢本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件4-2幾種主要的分類器模塊?分門別類:幫你“分而治之”本課件是可編輯的正常PPT課件目錄CONTENTS決策樹01k近鄰分類器03貝葉斯分類器02神經(jīng)網(wǎng)絡(luò)05支持向量機(jī)04一.決策樹概念決策樹(decisiontree):用于決策的一棵“樹”,它從根節(jié)點(diǎn)出發(fā),通過決策節(jié)點(diǎn)對(duì)樣本的不同特征進(jìn)行劃分,按照結(jié)果進(jìn)入不同的選擇分支,最終到達(dá)某一葉子節(jié)點(diǎn),獲得分類結(jié)果。垃圾郵件分類決策樹:本課件是可編輯的正常PPT課件二.貝葉斯分類器1.概念貝葉斯分類器(bayesclassifier):就是對(duì)于給定的分類項(xiàng),利用貝葉斯定理,求解該分類項(xiàng)在預(yù)先給定條件下各類別中出現(xiàn)的概率,哪個(gè)概率最大,就將其劃分為哪個(gè)類別。貝葉斯定理公式:本課件是可編輯的正常PPT課件二.貝葉斯分類器2.舉例用貝葉斯分類器來判定垃圾郵件:

x=[1,0]分別表示正常郵件和垃圾郵件E:由n個(gè)關(guān)鍵詞組成的郵件本課件是可編輯的正常PPT課件三.k近鄰分類器概念k近鄰(k-NearestNeighbor,KNN)分類器:把每個(gè)具有n個(gè)特征的樣本看作n維空間的一個(gè)點(diǎn),對(duì)于給定的新樣本,先計(jì)算該點(diǎn)與其他點(diǎn)的距離(相似度),然后將新樣本指派為周圍k個(gè)最近鄰的多數(shù)類。什么形狀的物體本課件是可編輯的正常PPT課件四.支持向量機(jī)1.概念支持向量機(jī)(SupportVectorMachine,SVM):基本思想是通過非線性映射,把樣本空間映射到一個(gè)高維的特征空間,將原本樣本空間線性不可分的問題,轉(zhuǎn)化成在高維空間通過線性超平面將樣本完全劃分開的問題。不可分:可分:本課件是可編輯的正常PPT課件四.支持向量機(jī)1.原理超平面離直線兩邊的數(shù)據(jù)的間隔越大,對(duì)訓(xùn)練集的數(shù)據(jù)的局限性或噪聲有最大的容忍能力,也就是所謂的魯棒性。支持向量機(jī)就是要找到使這個(gè)間隔最大的決策超平面。本課件是可編輯的正常PPT課件五.神經(jīng)網(wǎng)絡(luò)1.概念?神經(jīng)網(wǎng)絡(luò)(NeuralNetwork)?是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。權(quán)重值w激活函數(shù)φ加權(quán)求和及函數(shù)sgn處理神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu):本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件4-3項(xiàng)目1—識(shí)別貓狗模塊?分門別類:幫你“分而治之”本課件是可編輯的正常PPT課件目錄CONTENTS提出問題01預(yù)備知識(shí)03解決方案02任務(wù)1—樣本數(shù)據(jù)預(yù)處理04任務(wù)3—評(píng)估模型效果06任務(wù)2—構(gòu)建及訓(xùn)練KNN模型05一.提出問題問題描述

對(duì)于人類來說,可以很容易識(shí)別身邊的貓和狗,這是人類視覺經(jīng)千萬年演變進(jìn)化的結(jié)果。但對(duì)于計(jì)算機(jī)而言,想讓它識(shí)別一個(gè)圖像上的貓和狗就不那么容易了。如何能讓計(jì)算機(jī)識(shí)別出下圖中的貓和狗呢?本課件是可編輯的正常PPT課件二.解決方案1.選擇分類器選用KNN其核心思想是:如果一個(gè)樣本在特征空間中的k個(gè)最近鄰中的多數(shù)屬于某個(gè)類別,則該樣本也屬于這個(gè)類別。通常采用歐氏距離來計(jì)算兩樣本之間的距離大小,并據(jù)此找到某樣本的k個(gè)最近鄰。貓或狗?K個(gè)最近鄰中,多數(shù)是貓K個(gè)最近鄰中,多數(shù)是狗本課件是可編輯的正常PPT課件二.解決方案2.解決方案本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)1.圖像灰度化灰度化實(shí)現(xiàn)代碼:本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)2.歐氏距離點(diǎn)X與點(diǎn)Y之間的歐氏距離等于各特征值之差的平方和的平方根用KNN算法計(jì)算兩個(gè)樣本之間的距離,以此來判定某個(gè)樣本周圍哪些鄰居離它是最近的或者是最相似的。歐氏距離是常用的一種計(jì)算公式。樣本X與樣本Y之間的歐氏距離等于各特征值之差的平方和的平方根本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)3.

KNN算法的主要參數(shù)點(diǎn)X與點(diǎn)Y之間的歐氏距離等于各特征值之差的平方和的平方根本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)4.分類性能度量指標(biāo)(1)真正(TruePositive,TP):被模型預(yù)測(cè)為正的正樣本。(2)假正(FalsePositive,F(xiàn)P):被模型預(yù)測(cè)為正的負(fù)樣本。(3)假負(fù)(FalseNegative,F(xiàn)N):被模型預(yù)測(cè)為負(fù)的正樣本。(4)真負(fù)(TrueNegative,TN):被模型預(yù)測(cè)為負(fù)的負(fù)樣本。(1)真正(TruePositive,TP):被模型預(yù)測(cè)為正的正樣本。(2)假正(FalsePositive,F(xiàn)P):被模型預(yù)測(cè)為正的負(fù)樣本。(3)假負(fù)(FalseNegative,F(xiàn)N):被模型預(yù)測(cè)為負(fù)的正樣本。(4)真負(fù)(TrueNegative,TN):被模型預(yù)測(cè)為負(fù)的負(fù)樣本。本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)4.分類性能度量指標(biāo)(1)精確率(2)正確率(3)召回率(4)F1值本課件是可編輯的正常PPT課件四.任務(wù)1——樣本數(shù)據(jù)預(yù)處理1.將圖像信息轉(zhuǎn)存為向量(1)導(dǎo)入相關(guān)的庫(kù)(2)定義轉(zhuǎn)換函數(shù)img2array將圖像數(shù)據(jù)轉(zhuǎn)換成一維向量本課件是可編輯的正常PPT課件四.任務(wù)1——樣本數(shù)據(jù)預(yù)處理1.將圖像信息轉(zhuǎn)存為向量(3)調(diào)用函數(shù)生成向量保存灰度圖像信息的向量?jī)?nèi)容本課件是可編輯的正常PPT課件四.任務(wù)1——樣本數(shù)據(jù)預(yù)處理2.批量生成樣本數(shù)據(jù)(1)生成所有樣本的特征值和標(biāo)簽值本課件是可編輯的正常PPT課件四.任務(wù)1——樣本數(shù)據(jù)預(yù)處理2.批量生成樣本數(shù)據(jù)(2)樣本數(shù)據(jù)的歸一化處理歸一化數(shù)據(jù)生成訓(xùn)練集和測(cè)試集本課件是可編輯的正常PPT課件四.任務(wù)2——構(gòu)建及訓(xùn)練KNN模型1.構(gòu)建KNN模型上述代碼定義一個(gè)KNN模型knn,模型中參數(shù)n_neighbors=13(采用訓(xùn)練樣本數(shù)量的平方根的一半)、p=2表示使用歐氏距離來計(jì)算樣本相似度大小,weights='distance'表示權(quán)重與距離成反比,即更近的近鄰有更高的權(quán)重。本課件是可編輯的正常PPT課件四.任務(wù)2——構(gòu)建及訓(xùn)練KNN模型2.訓(xùn)練模型(1)用訓(xùn)練集x_train、y_train來訓(xùn)練模型(2)觀察模型訓(xùn)練效果訓(xùn)練效果不錯(cuò),在測(cè)試集上是否任然有很好的表現(xiàn)?本課件是可編輯的正常PPT課件四.任務(wù)3——評(píng)估模型效果1.

測(cè)試模型性能模型性能測(cè)試報(bào)告評(píng)價(jià)精度為63%狗的召回率62%貓的召回率64%什么原因?qū)е履P筒焕硐耄勘菊n件是可編輯的正常PPT課件四.任務(wù)3——評(píng)估模型效果2.通過交叉表了解模型的錯(cuò)分情況(1)直觀分析:本課件是可編輯的正常PPT課件四.任務(wù)3——評(píng)估模型效果2.通過交叉表了解模型的錯(cuò)分情況(2)交叉表分析:正確識(shí)別36個(gè)錯(cuò)誤劃分34個(gè)本課件是可編輯的正常PPT課件四.任務(wù)3——評(píng)估模型效果2.通過交叉表了解模型的錯(cuò)分情況如何去改善模型的性能例如嘗試改變模型參數(shù)K本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件3-4項(xiàng)目2—輔助診斷乳腺癌模塊?分門別類:幫你“分而治之”本課件是可編輯的正常PPT課件目錄CONTENTS提出問題01預(yù)備知識(shí)03解決方案02任務(wù)1—準(zhǔn)備訓(xùn)練集和測(cè)試集04任務(wù)3—評(píng)估模型診斷效果06任務(wù)2—構(gòu)建和訓(xùn)練模型05一.提出問題問題描述隨著醫(yī)療AI在醫(yī)療領(lǐng)域的投入使用,如今智慧醫(yī)療科技的新紀(jì)元已經(jīng)開啟,如圖4-17所示,借助“人工智能大腦”,AI輔助診療新時(shí)代正在到來。而現(xiàn)在AI輔助診斷技術(shù)的應(yīng)用,能夠很大程度地提高醫(yī)療機(jī)構(gòu)、醫(yī)生的工作效率,降低醫(yī)生的工作強(qiáng)度,降低漏診率。那么,AI是如何輔助醫(yī)生進(jìn)行病情診斷的呢本課件是可編輯的正常PPT課件二.解決方案1.問題本質(zhì)從活檢數(shù)據(jù)中判斷患者是有病還是沒病,本身是一個(gè)二分類問題,另外,活檢數(shù)據(jù)稀有、獲取成本高,符合SVM的適用條件,為此,采用SVM進(jìn)行分類。采用SVM求解問題本課件是可編輯的正常PPT課件二.解決方案2.解決方案本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)1.SVM的最優(yōu)分界面H0則是最優(yōu)分界面,因?yàn)樗絻蛇吪R界分界面的距離最大,具有較強(qiáng)的抗噪聲能力和較小的泛化誤差。本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)2.SVM模型參數(shù)核函數(shù)K(x,y)變換線性不可分線性可分SVM模型的常用參數(shù)本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)3.解讀數(shù)據(jù)集其中id列是編號(hào),無實(shí)際意義。診斷列diagnosis取值[M|B],分別表示診斷為惡性或良性。其他30個(gè)列由細(xì)胞核的10個(gè)不同特征的平均值、標(biāo)準(zhǔn)差、最差值等構(gòu)成。本課件是可編輯的正常PPT課件四.任務(wù)1——準(zhǔn)備訓(xùn)練集和測(cè)試集1.按比例生成訓(xùn)練集和測(cè)試集8:2比例降為1維本課件是可編輯的正常PPT課件四.任務(wù)1——準(zhǔn)備訓(xùn)練集和測(cè)試集2.觀察測(cè)試集的分布情況用數(shù)據(jù)預(yù)測(cè)是否患病本課件是可編輯的正常PPT課件五.任務(wù)2——構(gòu)建和訓(xùn)練模型1.用訓(xùn)練樣本訓(xùn)練SVM模型訓(xùn)練模型構(gòu)建模型用支持向量機(jī)svm構(gòu)建預(yù)測(cè)模型,核函數(shù)為rbf,懲罰參數(shù)C取值為1本課件是可編輯的正常PPT課件五.任務(wù)2——構(gòu)建和訓(xùn)練模型1.查看模型訓(xùn)練效果訓(xùn)練得分不理想什么原因本課件是可編輯的正常PPT課件五.任務(wù)3——評(píng)估模型診斷效果1.用測(cè)試樣本測(cè)試SVM模型運(yùn)行結(jié)果如何改善本課件是可編輯的正常PPT課件五.任務(wù)3——評(píng)估模型診斷效果2.改善模型的性能1歸一化:2調(diào)整模型參數(shù)C:改善前改善后本課件是可編輯的正常PPT課件五.任務(wù)3——評(píng)估模型診斷效果2.改善模型的性能還有哪些改進(jìn)模型的辦法本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件5-1聚類分析模塊?物以類聚:發(fā)現(xiàn)新簇群本課件是可編輯的正常PPT課件目錄CONTENTS何為聚類分析01常見聚類方法02聚類性能度量03一.何為聚類分析1.定義聚類分析:他是一種典型的無監(jiān)督學(xué)習(xí),也就是在事先不知道每個(gè)樣本的類別、沒有對(duì)應(yīng)標(biāo)簽值的情況下,將未知類別的樣本按照一定的規(guī)則劃分成若干個(gè)相對(duì)獨(dú)立的簇。簇的特點(diǎn):同一個(gè)簇中的樣本盡可能相似不同的簇中的樣本盡可能不相似本課件是可編輯的正常PPT課件一.何為聚類分析2.典型應(yīng)用領(lǐng)域領(lǐng)域銷售領(lǐng)域醫(yī)學(xué)領(lǐng)域生物領(lǐng)域安全領(lǐng)域本課件是可編輯的正常PPT課件一.何為聚類分析3.幾個(gè)概念如何去描述簇?簇質(zhì)心簇大小簇密度簇號(hào)…本課件是可編輯的正常PPT課件二.常見聚類方法1.基于劃分的聚類本課件是可編輯的正常PPT課件二.常見聚類方法2.基于層次的聚類本課件是可編輯的正常PPT課件二.常見聚類方法3.基于密度的聚類本課件是可編輯的正常PPT課件三.聚類性能度量2.三個(gè)概念無論使用什么聚類方法對(duì)樣本進(jìn)行分簇,都會(huì)涉及如何對(duì)聚類后的結(jié)果進(jìn)行評(píng)估,以度量聚類模型的性能的問題。聚類性能度量指標(biāo)用于對(duì)聚類后的結(jié)果進(jìn)行評(píng)估,分為內(nèi)部指標(biāo)和外部指標(biāo)兩大類。外部指標(biāo)要事先指定聚類模型作為參考來評(píng)估聚類結(jié)果的好壞,稱為有標(biāo)簽的評(píng)估;而內(nèi)部指標(biāo)是指不借助任何外部參考,只用參與聚類的樣本本身評(píng)估聚類結(jié)果的好壞。內(nèi)部指標(biāo)慣性值輪廓系數(shù)CH分?jǐn)?shù)該值越小越好,越小證明樣本在類間的分布越集中值越大,說明同類樣本相距越近,不同樣本相距越遠(yuǎn)。當(dāng)簇密集且分離較好時(shí),CH分?jǐn)?shù)更高,因此CH值越大越好。本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件5-2k均值聚類模塊?物以類聚:發(fā)現(xiàn)新簇群本課件是可編輯的正常PPT課件目錄CONTENTSk均值算法01k均值算法應(yīng)用提示02一.k均值算法1.概念k均值(k-means)算法是一種基于距離劃分的聚類算法,由于其具有算法簡(jiǎn)單、靈活性高、運(yùn)行效果足夠好等特點(diǎn),因此較常用。該算法計(jì)算樣本與簇質(zhì)心的距離,與簇質(zhì)心相近的樣本被劃分為同一簇。重用歐式距離計(jì)算樣本之間的相似度本課件是可編輯的正常PPT課件一.k均值算法2.算法流程本課件是可編輯的正常PPT課件一.k均值算法2.算法流程“×”為質(zhì)心,第一輪迭代后用分別標(biāo)記為星形和圓形來表示兩個(gè)類別,此時(shí)新的質(zhì)心的位置已經(jīng)發(fā)生了改變。圖5-5(e)和圖5-5(f)重復(fù)了圖5-5(c)和圖5-5(d)所示的過程。××本課件是可編輯的正常PPT課件二.k均值算法應(yīng)用提示1.k的初值k的初值。k是一個(gè)提前定義好的數(shù),其目標(biāo)是最小化每個(gè)簇內(nèi)部的差異,最大化簇之間的差異。那k取什么值合適呢?它取決于具體的業(yè)務(wù)需求或分析動(dòng)機(jī)。例如,營(yíng)銷部門只有3種不同的客戶資源來支撐拓展市場(chǎng),那么設(shè)定k=3以聚類3種不同的客戶可能是一個(gè)不錯(cuò)的決定。k=沒有先驗(yàn)知識(shí),建議令然后在附近值搜索。本課件是可編輯的正常PPT課件二.k均值算法應(yīng)用提示2.初始質(zhì)心的選擇k均值算法對(duì)初始質(zhì)心是比較敏感的,這意味著隨機(jī)的初始質(zhì)心可能會(huì)對(duì)最終的聚類結(jié)果產(chǎn)生較大的影響。選擇初始質(zhì)心的方法有3種:一是如果事先知道某幾個(gè)樣本彼此之間完全不同,就選擇它們作為初始質(zhì)心;二是跳出樣本范圍,在特征空間的任意地方取隨機(jī)值為初始質(zhì)心;三是分段選擇初始質(zhì)心,第一個(gè)初始質(zhì)心隨機(jī)選擇,其他初始質(zhì)心按距離已定初始質(zhì)心最遠(yuǎn)的樣本點(diǎn)來選擇。建議:通過多次運(yùn)行,以聚類性能最優(yōu)的聚類結(jié)果為最優(yōu)解。本課件是可編輯的正常PPT課件二.k均值算法應(yīng)用提示3.聚類完畢后有簇號(hào)聚類后所有樣本都是有簇號(hào)的。原來沒有標(biāo)簽號(hào)(簇號(hào))的樣本經(jīng)過聚類會(huì)擁有一個(gè)簇號(hào)。相同簇號(hào)的樣本的特征平均值就是該簇質(zhì)心的坐標(biāo),這也是k均值算法名稱的由來。提示:簇號(hào)默認(rèn)從0開始,相同簇號(hào)的樣本屬于一類。本課件是可編輯的正常PPT課件二.k均值算法應(yīng)用提示4.聚類結(jié)束條件盡管聚類能產(chǎn)生新的信息,但人們不應(yīng)該在新信息的準(zhǔn)確性上花費(fèi)太多時(shí)間,因?yàn)榫垲愂菬o監(jiān)督學(xué)習(xí),所以更應(yīng)該關(guān)注對(duì)新信息的洞察和理解。當(dāng)樣本數(shù)量很大,或者定義的聚類誤差很嚴(yán)苛?xí)r,為避免聚類陷入遲遲不出結(jié)果的尷尬局面,必須設(shè)定最大迭代次數(shù)和誤差閾值,滿足其一即可停止聚類。提示:迭代達(dá)到最大值,停止;或相鄰兩次聚類后質(zhì)心移動(dòng)的距離小于誤差閾值,停止。本課件是可編輯的正常PPT課件人工智能基礎(chǔ)與應(yīng)用Thankyouverymuch!本課件是可編輯的正常PPT課件5-3項(xiàng)目1—探究企鵝物種的分類模塊?物以類聚:發(fā)現(xiàn)新簇群本課件是可編輯的正常PPT課件目錄CONTENTS提出問題01預(yù)備知識(shí)03解決方案02任務(wù)1—樣本數(shù)據(jù)的預(yù)處理04任務(wù)3—繪制企鵝聚類后的散點(diǎn)圖06任務(wù)2—確定企鵝物種數(shù)量k的最佳值05一.提出問題問題描述由于全球氣候變暖和人類活動(dòng)的影響,企鵝的生存狀況并不樂觀。因此,我們應(yīng)該采取行動(dòng)來保護(hù)這些迷人的生物,以確保它們能夠正常繁衍、繼續(xù)生存。為此,一項(xiàng)必要的工作就是研究如何區(qū)分企鵝的種類、哪些特征決定了它們的差異。一眼看企鵝都很相似,如何區(qū)分不用物種的企鵝呢?弄清這些問題就能更好地保護(hù)不同的企鵝,使它們成為人類永遠(yuǎn)的朋友。本課件是可編輯的正常PPT課件二.解決方案1.選擇聚類法k均值算法解決問題基本思想:基于企鵝的一些形態(tài)特征(如嘴的大小、體重等)反映了企鵝的獨(dú)特之處和一些重要信息,然后用聚類算法K-Means對(duì)樣本進(jìn)行聚類,最后得到各樣本的類別。聚類0類1類0類本課件是可編輯的正常PPT課件二.解決方案2.具體方案本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)1.企鵝常識(shí)已知地球上現(xiàn)存的企鵝共有20余種,它們的頭部顏色、個(gè)體大小、體型等不盡相同。其中喙的長(zhǎng)度、深度,鰭肢的長(zhǎng)度和重量等特征對(duì)企鵝的生存影響較大。這些特征之間是否存在強(qiáng)相關(guān)關(guān)系,這樣的關(guān)系是否會(huì)對(duì)企鵝的分類造成影響?可以通過后期的數(shù)據(jù)分析找到該問題的答案。本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)2.數(shù)據(jù)降維點(diǎn)X與點(diǎn)Y之間的歐氏距離等于各特征值之差的平方和的平方根什么是降維?為什么要降維?前文已經(jīng)談到,在衡量采用什么方法來分析數(shù)據(jù)之前最好能對(duì)數(shù)據(jù)的全貌有一個(gè)可視化的了解,能從中發(fā)現(xiàn)一些內(nèi)在規(guī)律或啟示,以便更好地指導(dǎo)人們選擇相對(duì)合理的方法來解決問題。通常只在二維或三維的空間可視化數(shù)據(jù),但原始數(shù)據(jù)的實(shí)際維度可能是四維甚至更高維度。采用數(shù)據(jù)降維的方法將原始數(shù)據(jù)的維度降為二維或三維,以便進(jìn)行可視化處理,從而直觀了解數(shù)據(jù)的分布。除此之外,數(shù)據(jù)降維還有提高計(jì)算速度、提高模型擬合度等好處。本課件是可編輯的正常PPT課件三.預(yù)備知識(shí)2.數(shù)據(jù)降維點(diǎn)X與點(diǎn)Y之間的歐氏距離等于各特征值之差的平方和的平方根【引例5-1】分析企鵝數(shù)據(jù)集中可能存在的強(qiáng)相關(guān)特征,選取合適的特征集,采用PCA對(duì)企鵝數(shù)據(jù)集penguins進(jìn)行降維,并繪制降維后的數(shù)據(jù)散點(diǎn)圖。(1)繪制出熱力圖,了解各特征之間的相關(guān)度。本課件是可編輯的正常PPT課件三

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論