《Pandas數據處理》教案1.1.2 統計各學科的得分信息_第1頁
《Pandas數據處理》教案1.1.2 統計各學科的得分信息_第2頁
《Pandas數據處理》教案1.1.2 統計各學科的得分信息_第3頁
《Pandas數據處理》教案1.1.2 統計各學科的得分信息_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

《pandas數據處理》教案課題統計各學科的得分信息課時2課型新課教學目標能讀入Excel中的數據能查找、修改數據能計算總分、平均分、最高分、最低分以及排序教學重點及突破方法1.調用pd.read_excel()函數讀入Excel中的數據2.計算總分、平均分、最高分、最低分以及排序(微視頻引領、學生操作嘗試)教學難點及化解方法iloc和loc切片方法(微視頻引領、學生操作嘗試)教學方法講授法、演示法、操作法教學資源微視頻、PPT教學過程教學環節(時長)教學內容教師活動學生活動設計意圖創設情景明確任務5讀入excel文件“2019級電商1班學生成績表.xlsx",數據見表1.1.4,在“2019級電商1班學生成績表”中,完成如下任務操作:1.修改龔林的名字為龔琳。2.將請假的考試科目記0分,見表1.1.4中加框的數據。3.求出各個同學的總分,并按照總分從高到低排序。4.在每列的最后分別求出各個科目的平均分、最高分、最低分。創設情景,引導學生思考怎樣讀入Excel中的數據,怎樣查找、修改,計算?思考老師提出的問題?創建情景,調動學生學習的積極性實施任務分析解題思路10Excel數據表的讀入和數據計算,需要分別用pipinstallopenpyxl和pipinstallnumpy安裝第三方庫。使用pd.read_excel(r“文件保存路徑”)將Excel工作表中的數據讀入到DataFrame,用iloc查詢數據,用replace替換數據,用numpy.sum()、numpy.mean()、numpy.max()和numpy.min()分別計算總分、平均分、最高分和最低分,使用sort_values對數據進行排序。分析解題的思路思考問題,聆聽教師的講解教師以問題引導學生主動思考,體現學生在課堂上的主體地位實施任務分析程序代碼20importpandasaspdimportnumpyasnp①將numpy模塊以np為別名導入,因為numpy是python的第三方庫,所以使用前需要用命令pipinstallnumpy進行安裝。data=pd.read_excel(r"D:\pydata\項目一\2019級電商1班學生成績表.xlsx")②調用pd.read_excel()函數讀入Excel文件"2019級電商1班學生成績表.xlsx"中的數據,函數執行后會返回包含excel文件數據的數據框,賦值給變量data。pd.read_excel()函數會使用第三方模塊openpyxl,所以需要提前使用命令pipinstallopenpyxl安裝該模塊。data.iloc[3,1]="龔琳"③使用iloc屬性定位第4行第2列(行、列下標從0開始)的數據,并將其修改為“龔琳”。iloc使用下標定位數據,方括號中的值必須為整數。iloc[3,1]中第一個下標表示行下標,第二個下標表示列下標,都是從0開始計數,所以行下標3表示第4行,列下標1表示第2列。data.replace("請假",0,inplace=True)④使用replace函數將數據框中的值“請假”替換為0,inplace表示是否在原數據上修改,默認為False,表示不修改原數據,設置為True則會修改原數據。data["總分"]=data.iloc[:,2:].apply(np.sum,axis=1)計算每個學生各學科的總分賦值給“總分”列。data.iloc[:,2:]選擇所有行(行切片”:”表示所有行)從第3列開始到最后的所有列(列切片”2:”表示從第3列開始到最后的所有列)。apply(np.sum,axis=1)使用apply()方法對每一行的數據求總和,即計算總分。其中第一個參數np.sum(求總和函數)是要應用到數據框每一行數據的函數,即以每一行的數據為參數求總和。axis表示方向,0表示按列方向求和,1表示按行方向求和。最后將求得的和賦給“總分“列。data.sort_values(by="總分",ascending=False,inplace=True)使用sort_values進行排序,by指定按照“總分”排序,ascending默認為True表示升序排序,False表示降序排序,inplace設置為True則表示會修改原數據。data=data.append(round(data.loc[:,"語文":"總分"].apply([np.mean,np.max,np.min],axis=0),2),ignore_index=True)計算各學科的統計值并添加到數據框的末尾。data.loc[:,"語文":"總分"]使用loc屬性選擇“語文”到“總分”之間的所有列。apply([np.mean,np.max,np.min],axis=0)表示對每一列數據應用函數進行統計。關鍵字參數axis=0表示將函數應用到每一列數據,即用每一列數據作為參數調用函數。[np.mean,np.max,np.min]表示對每一列依次應用np.mean()、np.max()和np.min()求出平均分、最高分和最低分。round(apply([np.mean,np.max,np.min],axis=0),2)表示對apply([np.mean,np.max,np.min],axis=0)求出的數據框中的每一個值四舍五入保留兩位小數。ignore_index表示忽略被添加行的索引['mean','amax','amin']。append()方法返回添加行以后的數據框,但原數據框并不發生改變,所以需要將返回值賦給變量data,才能保存計算結果。data.iloc[-3:,1]=["平均分","最高分","最低分"]使用iloc屬性將最后三行第二列的數據依次修改為“平均分”、“最高分”和“最低分”。在行切片中-3表示倒數第3行,“-3:“表示從倒數第3行開始到最后一行,即最后3行。data.iloc[-3:,:1]=""=9\*GB3⑨⑨將第一列最后三行的NaN改為空字符串。print(data)分析程序代碼1.聆聽教師的講解2.理解程序代碼的含義和作用學習編寫程序代碼解決問題分享評價5展示學生調試結果組織學生評價操作過程學生展示分享提高回顧總結3調用pd.read_excel()函數讀入Excel中的數據iloc和loc切片方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論