可視化數據的分布繪制雙變量分布繪制成對的雙變量分布_第1頁
可視化數據的分布繪制雙變量分布繪制成對的雙變量分布_第2頁
可視化數據的分布繪制雙變量分布繪制成對的雙變量分布_第3頁
可視化數據的分布繪制雙變量分布繪制成對的雙變量分布_第4頁
可視化數據的分布繪制雙變量分布繪制成對的雙變量分布_第5頁
已閱讀5頁,還剩12頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

可視化數據的分布-繪制雙變量分布、繪制成對的雙變量分布教師:亢華愛北京信息職業技術學院商務數據分析與應用專業教學資源庫目錄Contents繪制成對的雙變量分布繪制雙變量分布1PART繪制雙變量分布繪制雙變量分布兩個變量的二元分布可視化也很有用。在Seaborn中最簡單的方法是使用jointplot()函數,該函數可以創建一個多面板圖形,比如散點圖、二維直方圖、核密度估計等,以顯示兩個變量之間的雙變量關系及每個變量在單獨坐標軸上的單變量分布jointplot()函數的語法格式seaborn.jointplot(x,y,data=None,kind='scatter',stat_func=<functionpearsonr>,color=None,size=6,ratio=5,space=0.2,dropna=True,xlim=None,ylim=None,joint_kws=None,marginal_kws=None,annot_kws=None,**kwargs)參數含義(1)kind:表示繪制圖形的類型。(2)stat_fune:用于計算有關關系的統計量并標注圖。(3)color:表示繪圖元素的顏色。(4)size:用于設置圖的大小(正方形)。(5)ratio:表示中心圖與側邊圖的比例。該參數的值越大,則中心圖的占比會越大。(6)space:用于設置中心圖與側邊圖的間隔大小。(7)xlim,ylim:表示x、y軸的范圍。下面以散點圖、二維直方圖、核密度估計曲線為例子,為大家介紹如何使用Seaborn繪制這些圖形繪制雙變量分布調用seahorn.jointplot()函數繪制散點圖的示例如下In[16]:#創建DataFrame對象dataframe_obj=pd.DataFrame({"x":np.random.randn(500),"y":np.random.randn(500)})#繪制散點圖sns.jointplot(x=”x”,y="y",data=dataframe_obj)Out[16]:<seaborn.axisgrid.JointGridat0xcaea240>繪制雙變量分布繪制散點圖上述示例中,首先創建了一個DataFrame對象dataframe_obj作為散點圖的數據,其中x軸和y軸的數據均為500個隨機數,接著調用jointplot()函數繪制一個散點圖,散點圖x軸的名稱為“x”,y軸的名稱為“y”運行結果如圖所示,從圖中看出,散點圖的底部顯示了計算的兩個系數:pearsonr和p,另外在圖表的上方和右側增加了直方圖,便于觀察x和y軸數據的整體分布情況,并且它們的均值都是0。繪制單變量分布運行結果二維直方圖類似于“六邊形”圖,主要是因為它顯示了落在六角形區域內的觀察值的計數,適用于較大的數據集。當調用jointplot0函數時,只要傳入kind="hex",就可以繪制二維直方圖,具體示例代碼如下In[17]:#繪制二維直方圖sns.jointplot(x="x",y="y",data=dataframe_obj,kind="hex")Out[17]:<seaborn.axisgrid.JointGridat0xc274da0>繪制雙變量分布繪制二維直方圖運行結果如圖所示,從六邊形顏色的深淺,可以觀察到數據密集的程度,另外,圖形的上方和右側仍然給出了直方圖。注意,在繪制二維直方圖時,最好使用白色背景。繪制單變量分布運行結果利用核密度估計同樣可以查看二元分布,Seaborn中用等高線圖來表示。當調用jointplot()函數時只要傳入就可以繪制核密度估計圖形,具體示例代碼如下In[18]:#核密度估計Sns.jointpJLot(x="x",y="y",data=dataframe_obj,kind="kde"x")Out[18]:<seaborn.axisgrid.JointGridatOxcdf5588>繪制雙變量分布繪制核密度估計圖形上述示例中,繪制了核密度的等高線圖,另外,在圖形的上方和右側給出了核密度曲線圖運行結果如圖所示,通過觀察等高線的顏色深淺,可以看出哪個范圍的數值分布的最多,哪個范圍的數值分布的最少。繪制單變量分布運行結果2PART繪制成對的雙變量分布繪制成對的雙變量分布要想在數據集中繪制多個成對的雙變量分布,則可以使用pairplot()函數實現,該函數會創建一個坐標軸矩陣,并且顯示DataFrame對象中每對變量的關系。pairplot()函數也可以繪制每個變量在對角軸上的單變量分布。通過sns.pairplot()函數繪制數據集變量間關系的圖形,示例代碼如下In[19]:#加載seaborn中的數據集dataset=sns.load_dataset("tips")#繪制多個成對的雙變量分布sns.pairplot(dataset)Out[19]:<seaborn.axisgrid.PairGridat0xd3b26d8>繪制成對的雙變量分布上述示例中,通過load_dataset()函數加載了seaborn中內置的數據集(單擊鏈接https:///mwaskom/seaborn-data可以查看內置的所有數據集),根據ti

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論