



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第pandas的排序、分組groupby及cumsum累計求和方式目錄生成一列sum_age對age進行累加生成一列sum_age_new按照gender和is_good對age進行累加根據不同的性別對年齡進行等級排序對數據排序之后,分組,并累計求和pandas分組排序功能
生成一列sum_age對age進行累加
df['sum_age']=df['age'].cumsum()
print(df)
生成一列sum_age_new按照gender和is_good對age進行累加
df['sum_age_new']=df.groupby(['gender','is_good'])['age'].cumsum()
print(df)
根據不同的性別對年齡進行等級排序
df['rank_g']=df.groupby(['gender'])['age'].rank()
print(df)
這里的rank()即rank_g,并不是按照1、2、3、4、、依次排
按照官方文檔的意思,該函數是沿著某個軸來計算數值數據等級(1到n)。默認情況下,為相等的值分配同一個等級,該等級是這些值的等級的平均值。
例子:
importpandasaspd
obj=pd.Series([7,-5,7,4,2,0,4])
print(obj.rank())
代碼對[7,-5,7,4,2,0,4]進行從小到大地排序,很明顯地,可以排成[-5,0,2,4,4,7,7],數值7有第6和第7兩個位置,那應該排序應該排到第幾級?根據官方文檔,取平均值,(6+7)/2=6.5,所以兩個7的等級都為6.5,同理可得兩個4的等級都為(4+5)/2=4.5。
輸出:
06.5
11.0
26.5
34.5
43.0
52.0
64.5
dtype:float64
對數據排序之后,分組,并累計求和
#對StartTime進行排序,ConnectionType分組,temp進行累計求和cumsum
wsw_1=wsw.sort_values(['StartTime'])
wsw_1.loc[:,'ConnectionNumber']=wsw_1.groupby(['ConnectionType'])['temp'].cumsum()
這里如果不對starttime排序,ConnectionNumber不會按時間順序,統計drilling、tripping的number數
pandas分組排序功能
在一個班級里,學生考試科目有語文、數學、英語,分別有對應的成績。
現在,想要列出每個科目班級的前五名的情況,要求包含科目、姓名、成績、名次。
通過以下代碼實現:
importpandasaspd
a=['小紅','小綠','小藍','小白','小青','小紫','小粉','小傻','小紅','小綠','小藍','小白','小青','小紫','小粉','小傻','小紅','小綠','小藍','小白','小青','小紫','小粉','小傻']
b=['語文','語文','語文','語文','語文','語文','語文','語文','數學','數學','數學','數學','數學','數學','數學','數學','英語','英語','英語','英語','英語','英語','英語','英語']
c=[97,65,23,43,67,23,55,98,56,45,67,78,98,45,87,65,67,23,55,98,56,45,67,78]
len(a),len(b),len(c)
df=pd.DataFrame({'name':a,'kemu':b,'score':c})
df2=df.sort_values(['kemu','score','name'],ascending=[1,0,1])
df2['rn']=df2.groupby(['kemu']).ra
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 車位銷售贈品合同協議
- 輔導機構教師合同協議
- 配合過戶補償協議書范本
- 《課堂的智慧交鋒》課件
- 五四青年團日活動策劃方案
- 物業代繳協議書
- 軟件無償借用合同協議
- 道路黑化工程合同協議
- 農村生態環境保護與農業發展協同協議
- 車隊用工協議書范本
- 2023年08月甘肅省農業科學院公開招聘30人筆試歷年難易錯點考題薈萃附帶答案詳解
- 建筑樁基技術規范 JGJ94-2008
- 藍色簡約畢業答辯PPT通用模板
- 九年級上冊Unit4Iusedtobeafraidofthedark.演示文稿1
- 圖形創意(高職藝術設計)PPT完整全套教學課件
- 廣東華附奧校初中入學考試英語試卷
- 灌溉工程監理質量評估報告
- 廈門大學《應用多元統計分析》試題B
- 藝術課程標準(2022年版)
- JGJ142-2004《地面輻射供暖技術規程》條文說明
- 信任五環(用友營銷技巧) PPT資料
評論
0/150
提交評論