




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)據(jù)可視化8DataVisualization內(nèi)容概述本章學(xué)習目標財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析(1)理解數(shù)據(jù)分析中不同類型數(shù)據(jù)的含義和統(tǒng)計學(xué)意義(5)能夠利用Matplotlib、Seaborn進行Python財務(wù)數(shù)據(jù)分析。(4)掌握Matplotlib、Seaborn中基本圖形的繪制方法;(2)熟練掌握Matplotlib繪圖的基本過程;(3)熟悉Matplotlib對象的屬性和方法;
目錄CONTENTS財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析第8章數(shù)據(jù)可視化6.1Matplotlib入門
6.2定量和定性數(shù)據(jù)
【Python財務(wù)數(shù)據(jù)分析】——財務(wù)數(shù)據(jù)的可視化基礎(chǔ)圖形Matplotlib入門PartOne01財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析數(shù)據(jù)可視化數(shù)據(jù)的圖形呈現(xiàn)是探索、分析數(shù)據(jù)的常用方法。相對于文字表述,圖形更加直觀且形象化,更適合人類的思維模式理解。使用圖形來表示數(shù)據(jù)的方法稱為數(shù)據(jù)可視化。數(shù)據(jù)以圖形圖像形式表示,可以揭示隱藏的數(shù)據(jù)特征,直觀傳達關(guān)揵信息;輔助建立數(shù)據(jù)分析模型,展示分析結(jié)果。Matplotlib和Seaborn是Python繪圖第三方庫,同時Pandas集成了Matplotlib中的常用可視化圖形接口,可通過Series和DataFrame兩種數(shù)據(jù)結(jié)構(gòu)面向?qū)ο蟮慕涌诜绞胶唵握{(diào)用。Pandas繪圖中僅集成了常用的圖表接口,更多復(fù)雜的繪圖需求往往還需依賴Matplotlib或者其他可視化庫。財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析Matplotlib繪圖過程1)導(dǎo)入模塊importmatplotlib.pyplotasplt2)獲取繪圖數(shù)據(jù)3)繪圖4)裝飾圖形5)保存與顯示圖形繪圖過程,雖然簡單,但是從面向?qū)ο蟮囊暯强捶炊缓美斫?。原因是,在繪圖的過程隱式地創(chuàng)建畫布(figure)和繪圖區(qū)域(axes)。因此我們不推薦。使用plt的屬性和方法賦予畫布和繪圖區(qū)域,完成繪圖的過程更清晰,而且可以繪制更復(fù)雜的圖形。財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析Matplotlib繪圖對象和類畫布Figure、子圖Axes和數(shù)軸Axis關(guān)系示意圖Figure是容納多個Axes的畫板或畫布,而Axes則是所有圖標數(shù)據(jù)、圖例配置等繪圖形元素的容器,稱為一個繪圖區(qū)域。面向?qū)ο蟮睦L圖,就是將plt中的圖形賦值給一個Figure或Axes實例,通過調(diào)用Figure或Axes兩類實例的方法完成繪圖。財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析Matplotlib繪圖對象和類1)創(chuàng)建畫布創(chuàng)建畫布,包括創(chuàng)建figure和axes對象,常用方法:(1)plt.figure(),接收一個元組作為figsize參數(shù)設(shè)置圖形大小,返回一個figure對象;(2)plt.axes(),接收一個figure或在當前畫布上添加一個子圖,返回該axes對象,并將其設(shè)置為“當前”子圖,缺省時會在繪圖前自動添加;(3)plt.subplot(),接收3個數(shù)字或1個3位數(shù)作為子圖的行數(shù)、列數(shù)和當前子圖索引。索引從1開始,返回一個axes對象用于繪圖操作??梢岳斫獬墒窍入[式執(zhí)行了plt.figure,然后在創(chuàng)建的figure對象上添加子圖,并返回當前子圖實例;(4)plt.subplots(),接收一個行數(shù)nrows和列數(shù)ncols作為參數(shù),創(chuàng)建一個figure對象和相應(yīng)數(shù)量的axes對象,同時返回該figure對象和axes對象嵌套列表,并默認選擇最后一個子圖作為“當前”圖。財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析Matplotlib繪圖對象和類2)子圖——axes對象(1)創(chuàng)建axes對象Matplotlib定義了一個Axes(軸域)類,創(chuàng)建的對象被稱為axes對象(即軸域?qū)ο螅蚍Q為子圖)。axes對象可以理解為有軸(axis)的集合,一般包含基本的2個axis,用來確定一個區(qū)域。一個畫布設(shè)置若干繪圖區(qū)域,從而實現(xiàn)對畫布的布局。默認情況下,函數(shù)創(chuàng)建一個標準的axes對象填滿整個圖表區(qū)域。當只有畫布上只有一張子圖時,可以用plt代替ax。財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析Matplotlib繪圖對象和類(2)axes對象的屬性和方法axes的屬性和方法,本質(zhì)上是由plt賦予的。因此axes的成員和plt類似,但是也要注意個別方法有細微差異。2)子圖——axes對象①plot()繪圖②grid()網(wǎng)格格式設(shè)置③xscale()或yscale(),spines()坐標軸④xlim()和ylim()坐標軸范圍⑤xticks()和yticks()刻度和刻度標簽⑥legend()繪制圖例財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析Matplotlib繪圖對象和類plt.subplot()函數(shù)可以均等地劃分畫布,語法格式:3)subplot()函數(shù)和add_subplot()函數(shù)財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析Matplotlib繪圖對象和類3)subplot()函數(shù)和add_subplot()函數(shù)nrows×nclos表示子圖數(shù)量,subplot(233)表示在當前畫布的右上角創(chuàng)建一個2行3列的繪圖區(qū)域,同時選擇在第3個位置繪制子圖。財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析Matplotlib繪圖對象和類4)subplots()函數(shù)subplots()函數(shù)與subplot()函數(shù)類似。其不同之處在于subplots()既創(chuàng)建了一個包含子圖區(qū)域的畫布,又創(chuàng)建了子圖對象,而subplot()只是創(chuàng)建一個在當前畫布下的子圖對象。subplots的函數(shù)語法格式:fig,ax=plt.subplots(nrows,ncols)nrows與ncols表示兩個整數(shù)參數(shù),其他指定子圖所占的行數(shù)、列數(shù)。函數(shù)的返回值是一個元組,包括一個畫布對象和所有的子圖對象。其中子圖對象的數(shù)量等于nrows×ncols,且每個axes對象均可通過索引值訪問。財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析Matplotlib繪圖對象和類5)subplot2grid()函數(shù)plt.subplot2grid()函數(shù)能夠在畫布的特定位置創(chuàng)建axes對象。還可以使用不同數(shù)量的行、列來創(chuàng)建跨度不同的繪圖區(qū)域。即subplot2gird()函數(shù)可以以非等分的形式對畫布進行切分,并按照繪圖區(qū)域的大小來展示最終繪圖結(jié)果。plt.subplot2grid()函數(shù)語法格式:plt.subplot2grid(shape,#規(guī)定的網(wǎng)格區(qū)域作為畫布劃分location,#子圖繪制位置,初始位置(0,0)第1行第1列rowspan,#子圖跨越網(wǎng)格區(qū)域行數(shù)colspan)#圖跨越網(wǎng)格區(qū)域列數(shù)定量和定性數(shù)據(jù)PartTwo02財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析定性與定量數(shù)據(jù)是指對客觀事件進行記錄并可以鑒別的符號,也就是對事物的性質(zhì)、狀態(tài)以及相互關(guān)系等進行記載的物理符號或這些物理符號的組合。數(shù)據(jù)按性質(zhì)可分為:(1)定性數(shù)據(jù)(qualitativedata)在統(tǒng)計學(xué)上的包括分類數(shù)據(jù)和順序數(shù)據(jù),是一組表示事物性質(zhì)、規(guī)定事物類別的文字表述型數(shù)據(jù)。見表示事物屬性的數(shù)據(jù)(注冊地、上市公司板塊、公司行業(yè)、債券評級等)。(2)定量數(shù)據(jù)(Quantitativedata)的,反映事物數(shù)量特征的數(shù)據(jù),如金額、價格、重量、速度等物理量。財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析數(shù)據(jù)分類4種測定尺度的意義與特征:分類(nominal)尺度:無序類別數(shù)據(jù)。分類尺度將數(shù)字作為事物總體中不同類別/組別的代碼,是最低層次的尺度。順序(ordinal)尺度:順序數(shù)據(jù)。順序尺度不但可以用數(shù)表示量的不同類別,而且也反映量的大小順序關(guān)系,從而可以列出各類的次序。定距(interval)尺度:間隔數(shù)據(jù)。定距尺度是對事物類別或次序之間間距的計量,它通常使用度量衡單位作為計量尺度。定距尺度是比順序尺度高一層次的計量尺度。比例(ratio)尺度:連續(xù)數(shù)據(jù)。比例尺度是在定距尺度的基礎(chǔ)上,確定可以作為比較的基數(shù),將兩種相關(guān)的數(shù)加以對比,而形成新的相對數(shù)。【財務(wù)應(yīng)用與實踐】
財經(jīng)數(shù)據(jù)的可視化基礎(chǔ)圖形PartPractice05財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析類別數(shù)據(jù)可視化——柱狀圖柱狀圖是一種用矩形柱來表示數(shù)據(jù)分類的圖表,柱狀圖可以垂直繪制,也可以水平繪制,它的高度與其所表示的數(shù)值成正比關(guān)系。柱狀圖顯示了不同類別之間的比較關(guān)系,圖表的一個軸指定被比較的類別,另一個軸則表示具體的類別值。Matplotlib提供了bar()和barh()函數(shù)來繪制柱狀圖。財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析類別數(shù)據(jù)可視化——餅圖餅圖只適用排列在數(shù)據(jù)幀的一列或一行中的數(shù)據(jù)。餅圖顯示一個數(shù)據(jù)系列中各項的大小與各項總和的比例。即顯示為數(shù)據(jù)占整個餅圖的百分比。Matplotlib提供了pie()函數(shù)來繪制餅圖。財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析順序數(shù)據(jù)可視化——箱線圖四分位數(shù)是把所有數(shù)值由小到大排列并分成四等份,處于三個分割點位置的數(shù)值分別是:第一四分位數(shù)(Q1),等于該樣本中所有數(shù)值由小到大排列后第25%的數(shù)字第二四分位數(shù)(Q2),又稱“中位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第50%的數(shù)字第三四分位數(shù)(Q3),等于該樣本中所有數(shù)值由小到大排列后第75%的數(shù)字第三、四分位數(shù)與第一四分位數(shù)的差距又稱四分位距(IQR)。計算公式:IQR
=
Q3
?
Q1財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析順序數(shù)據(jù)可視化——箱線圖箱線圖作為描述統(tǒng)計的工具之一,其可以直觀明了地識別數(shù)據(jù)中的異常值,非對稱分布數(shù)據(jù)的特征,也可以用來對若干批次數(shù)據(jù)比較分析。財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析間隔數(shù)據(jù)可視化——直方圖直方圖是一種統(tǒng)計圖表,用于展示數(shù)據(jù)的分布情況。它的主要特點包括:直觀展示數(shù)據(jù)的頻率分布。通過矩形的高度來表示數(shù)據(jù)落在各個區(qū)間的數(shù)量或頻率。財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析比例數(shù)據(jù)可視化——散點圖散點圖來表述兩個連續(xù)變量X和Y之間的關(guān)系,圖中的每個點表示目標數(shù)據(jù)集中的每個樣本,在直角坐標系平面上數(shù)據(jù)點的分布和因變量隨自變量而變化的大致趨勢。由此趨勢可以選擇合適的函數(shù)進行擬合,以用來表示某些模型,進而找到變量之間的函數(shù)關(guān)系。財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)分析比例數(shù)據(jù)可視化——蜂巢圖當有成千上萬的數(shù)據(jù)樣本點時,散點圖會變得過于密集而無法解釋。當數(shù)據(jù)量大我們采用蜂巢圖(Hexbin)。其將圖表劃分為了一個六邊形區(qū)域,基于聚合方法(例如點的數(shù)量),為區(qū)域的不同部分添加不同深度的顏色。hexbin()函數(shù)用于制作點x,y的2D六角形裝箱圖,顏色深度表示樣本點數(shù)量財務(wù)數(shù)據(jù)分析財務(wù)數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030雞養(yǎng)殖行業(yè)市場深度分析及發(fā)展策略研究報告
- 高一歷史教學(xué)計劃的跨學(xué)科融合
- 拍賣市場收益分析協(xié)議
- 施工期間環(huán)境保護協(xié)議
- 2025-2030金屬纜索內(nèi)固定系統(tǒng)市場供給現(xiàn)狀分析及發(fā)展趨勢預(yù)判研究報告
- 2025-2030迷你酒吧行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 2025-2030起重運輸設(shè)備行業(yè)發(fā)展分析及發(fā)展趨勢與投資前景預(yù)測研究報告
- 2025-2030豚鼠食品行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 2025-2030花灑產(chǎn)業(yè)政府戰(zhàn)略管理與區(qū)域發(fā)展戰(zhàn)略研究咨詢報告
- 2024-2025學(xué)年度校園文化建設(shè)計劃
- DB32/T 4220-2022消防設(shè)施物聯(lián)網(wǎng)系統(tǒng)技術(shù)規(guī)范
- 車位轉(zhuǎn)讓合同協(xié)議書
- 合伙經(jīng)營貨車輛協(xié)議書
- 2025年農(nóng)村個人果園承包合同
- 企業(yè)管理流程數(shù)字化轉(zhuǎn)型計劃
- 機械通氣患者護理
- 2025年數(shù)控技術(shù)專業(yè)畢業(yè)考試試題及答案
- 車牌租賃協(xié)議和抵押合同
- 《張敏瑞的傳奇人生》課件
- 2024年液壓與氣動技術(shù)試題及答案
評論
0/150
提交評論