




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
統(tǒng)計(jì)平均錄取分?jǐn)?shù)最高的前10所學(xué)校
問(wèn)題描述利用2007年-2017年全國(guó)部分高校的錄取數(shù)據(jù)(“school.csv”),統(tǒng)計(jì)表中各學(xué)校各年所有地區(qū)所有專業(yè)的錄取平均分?jǐn)?shù),同時(shí)計(jì)算出各校11年的平均錄取分?jǐn)?shù)(即“歷年平均“),對(duì)“歷年平均“按降序排序,輸出“歷年平均“排名前10名高校的2016年和2017年錄取分?jǐn)?shù),并使用柱狀圖對(duì)數(shù)據(jù)進(jìn)行可視化,見(jiàn)表8.1.2和圖8.1.1。問(wèn)題描述表8.1.2排名前10名高校的2016年和2017年錄取分?jǐn)?shù)題前思考表8.1.2問(wèn)題分析根據(jù)問(wèn)題描述,填寫以下表格importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='學(xué)校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='歷年平均')④school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='學(xué)校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='歷年平均')④school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼importmatplotlib.pyplotasmp,導(dǎo)入繪圖matplotlib模塊的pythlot模塊。importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='學(xué)校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='歷年平均')④school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼修改圖表中的字體為'SimHei',即微軟雅黑。importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='學(xué)校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='歷年平均')④school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼pd.read_csv(),讀取scv格式的文件,保存到變量data中。程序代碼年份學(xué)校200720082009...20162017歷年平均上海交通大學(xué)646.889306629.036697632.233684...631.875000642.674419633.169404上海交通大學(xué)醫(yī)學(xué)院NaNNaN616.873239...NaNNaN623.438735東北大學(xué)NaNNaNNaN...578.368852558.357143575.552047東南大學(xué)614.896175591.421806597.955086...617.122905610.714286605.567555中南大學(xué)NaNNaN573.813187...590.922515578.175799585.413828........................西北工業(yè)大學(xué)609.861194584.370717586.713650...596.427160585.677494594.821507西安交通大學(xué)NaNNaNNaN...621.912442615.031250616.226291重慶大學(xué)595.704776576.811665575.806564...595.470426584.288973584.892715總計(jì)622.189012605.856792596.173174...603.825497592.947777603.538463表8.1.4匯總數(shù)據(jù)后的統(tǒng)計(jì)表importpandasaspdimportmatplotlib.pyplotasmp①mp.rcParams['font.sans-serif']=['SimHei']②data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')③school_score=pd.pivot_table(data=data,index='學(xué)校',columns='年份',values='平均分',aggfunc='mean',margins=True,margins_name='歷年平均')④school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼調(diào)用pivot_table()函數(shù)為數(shù)據(jù)框data建立數(shù)據(jù)透視表。school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼對(duì)數(shù)據(jù)school_score[:-1]進(jìn)行排序。程序代碼年份學(xué)校200720082009...20162017歷年平均清華大學(xué)673.598291661.736264657.629167...675.017668669.352941664.742333北京大學(xué)662.169717653.086116646.217469...657.943231647.438272653.195701中國(guó)科學(xué)技術(shù)大學(xué)649.917553631.515873637.829016...648.400000633.673469642.332882浙江大學(xué)646.584775629.181495632.155280...638.600000653.500000635.590120表8.1.5排序后得到的數(shù)據(jù)school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼school_score_sort_2year.plot(),使用基本繪圖函數(shù)plot()對(duì)數(shù)據(jù)school_score_sort_2year繪圖。程序代碼school_score_sort=school_score[:-1].sort_values(by='歷年平均',ascending=False)[:10]⑤school_score_sort_2year=school_score_sort[[2016,2017]]⑥print(school_score_sort_2year)mp.figure("高校錄取分?jǐn)?shù)線TOP10")⑦school_score_sort_2year.plot(kind='bar',color=['magenta','blueviolet'],edgecolor='black')⑧mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16)⑨mp.xlabel("學(xué)校",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.ylim(0,850)mp.gcf().autofmt_xdate()⑩mp.show()程序代碼mp.title("高校錄取分?jǐn)?shù)線TOP10",fontsize=16),mp.title()設(shè)置柱狀圖的標(biāo)題樣式。程序代碼任務(wù)小結(jié)1.描述pivot_table()函數(shù)作用2.使用pivot_table()函數(shù)制作數(shù)據(jù)透視表一展身手現(xiàn)有8000余條近20年的部分電影數(shù)據(jù)“2_movies.csv”,數(shù)據(jù)包含電影名稱、導(dǎo)演、編劇、主演、豆瓣評(píng)分等數(shù)據(jù),表中的內(nèi)容如表8.1.7所示。請(qǐng)統(tǒng)計(jì)表中“制片國(guó)家/地區(qū)”列中“中國(guó)大陸”的影片,按“導(dǎo)演”分組計(jì)算電影的平均評(píng)分,輸出評(píng)分最高的前10位導(dǎo)演的評(píng)分?jǐn)?shù)據(jù)并使用柱狀圖對(duì)數(shù)據(jù)進(jìn)行可視化分析。一展身手導(dǎo)演豆瓣評(píng)分方熒9.2王樹(shù)忱9.2貝納爾多·貝托魯奇9.2郭寶昌9.2王君正9.1嚴(yán)定憲9.0吳貽弓8.9王昕8.9謝添8.8原雅軒8.7表8.1.8導(dǎo)演評(píng)分TOP10制作團(tuán)隊(duì)制作:XXXXXX統(tǒng)計(jì)文理科歷年平均錄取分?jǐn)?shù)和最高錄取分?jǐn)?shù)主講人:xxxxxxxx學(xué)校問(wèn)題描述利用2007年-2017年全國(guó)部分高校的錄取數(shù)據(jù)(“school.csv”),對(duì)所有學(xué)校各年的文理科錄取分?jǐn)?shù)進(jìn)行統(tǒng)計(jì),分文理科求各年平均分的平均值和最高分的最大值見(jiàn)表8.1.9。然后對(duì)數(shù)據(jù)使用折線圖進(jìn)行可視化,結(jié)果見(jiàn)圖8.1.3。問(wèn)題描述
表8.1.9文理科錄取分?jǐn)?shù)統(tǒng)計(jì)表年份文科最高分
理科最高分文科平均分理科平均分2007922.0935.0608.514698624.2250572008962.0938.0606.258122618.2237592009929.0939.0583.196112599.2652572010929.0939.0586.286123601.4219512011930.0937.0589.928152607.6971682012913.0920.0600.072553602.1053132013913.0900.0593.982100601.7683592014876.0888.0598.288899605.7370672015905.0892.0598.675602609.0660262016706.0720.0585.795933607.9855942017680.0715.0591.062164593.398057題前思考表8.1.10問(wèn)題分析根據(jù)問(wèn)題描述,填寫以下表格問(wèn)題描述問(wèn)題解答本問(wèn)題中,需要計(jì)算文理科的平均分、最高分,使用pivot_table()函數(shù)分析數(shù)據(jù)時(shí),行索引和列索引分別是什么?
按題目要求,對(duì)平均分列進(jìn)行什么操作,對(duì)最高分列進(jìn)行什么操作?如何將不同操作應(yīng)用到不同列?
因?yàn)橐獙?duì)兩列進(jìn)行不同的操作,你認(rèn)為結(jié)果數(shù)據(jù)框的列索引應(yīng)該是什么
怎么從數(shù)據(jù)透視表中得到結(jié)果所要求的數(shù)據(jù)列?
在圖形可視化過(guò)程中,折線圖的參數(shù)是什么?x坐標(biāo)標(biāo)簽和y坐標(biāo)標(biāo)簽分別是什么?importpandasaspdimportmatplotlib.pyplotasmpmp.rcParams['font.sans-serif']=['SimHei']data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')subject=pd.pivot_table(data=data,index='年份',columns='文理科',values=['平均分','最高分'],aggfunc={'平均分':'mean','最高分':'max'})①subject.columns=['文科平均分','理科平均分','綜合平均分','文科最高分','理科最高分','綜合最高分']②subject_wen_li=subject[['文科平均分','文科最高分','理科平均分','理科最高分']]③程序代碼使用pivot_table()函數(shù)對(duì)data數(shù)據(jù)進(jìn)行分析。題前思考表8.1.11讀取文件后得到的數(shù)據(jù)文理科年份平均分文科
理科
綜合最高分文科
理科
綜合2007608.514698624.225057641.419492922.0935.0704.02008606.258122618.223759367.488027962.0938.0669.02009583.196112599.265257NaN929.0939.0NaN2010586.286123601.421951NaN929.0939.0NaN2011589.928152607.697168NaN930.0937.0NaN2012600.072553602.105313NaN913.0920.0NaN2013593.982100601.768359NaN913.0900.0NaN2014598.288899605.737067NaN876.0888.0NaN2015598.675602609.066026NaN905.0892.0NaN2016585.795933607.985594NaN706.0720.0NaN2017591.062164593.398057NaN680.0715.0NaNimportpandasaspdimportmatplotlib.pyplotasmpmp.rcParams['font.sans-serif']=['SimHei']data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')subject=pd.pivot_table(data=data,index='年份',columns='文理科',values=['平均分','最高分'],aggfunc={'平均分':'mean','最高分':'max'})①subject.columns=['文科平均分','理科平均分','綜合平均分','文科最高分','理科最高分','綜合最高分']②subject_wen_li=subject[['文科平均分','文科最高分','理科平均分','理科最高分']]③程序代碼subject.columns=['文科平均分','理科平均分','綜合平均分','文科最高分','理科最高分','綜合最高分'],修改列索引,將原二級(jí)索引改為簡(jiǎn)單索引。程序代碼年份文科平均分理科平均分綜合平均分文科最高分理科最高分綜合最高分2007608.514698624.225057641.419492922.0935.0704.02008606.258122618.223759367.488027962.0938.0669.02009583.196112599.265257NaN929.0939.0NaN2010586.286123601.421951NaN929.0939.0NaN2011589.928152607.697168NaN930.0937.0NaN2012600.072553602.105313NaN913.0920.0NaN2013593.982100601.768359NaN913.0900.0NaN2014598.288899605.737067NaN876.0888.0NaN2015598.675602609.066026NaN905.0892.0NaN2016585.795933607.985594NaN706.0720.0NaN2017591.062164593.398057NaN680.0715.0NaN表8.1.12替換列索引之后的數(shù)據(jù)框importpandasaspdimportmatplotlib.pyplotasmpmp.rcParams['font.sans-serif']=['SimHei']data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')subject=pd.pivot_table(data=data,index='年份',columns='文理科',values=['平均分','最高分'],aggfunc={'平均分':'mean','最高分':'max'})①subject.columns=['文科平均分','理科平均分','綜合平均分','文科最高分','理科最高分','綜合最高分']②subject_wen_li=subject[['文科平均分','文科最高分','理科平均分','理科最高分']]③mp.figure("文理科近10年分?jǐn)?shù)")④程序代碼取subject對(duì)象中'文科平均分','文科最高分','理科平均分','理科最高分'4列數(shù)據(jù),保存到變量subject_wen_li中。importpandasaspdimportmatplotlib.pyplotasmpmp.rcParams['font.sans-serif']=['SimHei']data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')subject=pd.pivot_table(data=data,index='年份',columns='文理科',values=['平均分','最高分'],aggfunc={'平均分':'mean','最高分':'max'})①subject.columns=['文科平均分','理科平均分','綜合平均分','文科最高分','理科最高分','綜合最高分']②subject_wen_li=subject[['文科平均分','文科最高分','理科平均分','理科最高分']]③mp.figure("文理科近10年分?jǐn)?shù)")④subject_wen_li.plot(kind='line',marker='o',xticks=subject_wen_li.index)⑤mp.title("文理科近10年分?jǐn)?shù)",fontsize=16)⑥mp.xlabel("年份",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.show()程序代碼創(chuàng)建一個(gè)名為"文理科近10年分?jǐn)?shù)"的繪圖窗口。subject.columns=['文科平均分','理科平均分','綜合平均分','文科最高分','理科最高分','綜合最高分']②subject_wen_li=subject[['文科平均分','文科最高分','理科平均分','理科最高分']]③mp.figure("文理科近10年分?jǐn)?shù)")④subject_wen_li.plot(kind='line',marker='o',xticks=subject_wen_li.index)⑤mp.title("文理科近10年分?jǐn)?shù)",fontsize=16)⑥mp.xlabel("年份",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.show()程序代碼kind='line'表示類型為折線圖;marker='o'表示折線圖上點(diǎn)的形狀,'o'表示是圓形;xticks=subject_wen_li.index表示x坐標(biāo)序列是index索引;style=['k-','k:','k-.','k--']依次指出各列數(shù)據(jù)的顏色和線型。subject.columns=['文科平均分','理科平均分','綜合平均分','文科最高分','理科最高分','綜合最高分']②subject_wen_li=subject[['文科平均分','文科最高分','理科平均分','理科最高分']]③mp.figure("文理科近10年分?jǐn)?shù)")④subject_wen_li.plot(kind='line',marker='o',xticks=subject_wen_li.index)⑤mp.title("文理科近10年分?jǐn)?shù)",fontsize=16)⑥mp.xlabel("年份",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.show()程序代碼設(shè)置折線圖的標(biāo)題及字號(hào)。程序代碼任務(wù)小結(jié)1.描述pivot_table()函數(shù)作用2.如何對(duì)不同的列實(shí)施不同的統(tǒng)計(jì)方法一展身手現(xiàn)有8000余條近20年的部分電影數(shù)據(jù)“2_movies.csv”,表中的內(nèi)容如表8.1.7所示。請(qǐng)對(duì)“豆瓣評(píng)分”大于8的高分影片,按“制片國(guó)家/地區(qū)”統(tǒng)計(jì)影片的數(shù)量,輸出數(shù)量最多的10個(gè)地區(qū),并使用餅圖對(duì)各制片國(guó)家/地區(qū)的數(shù)據(jù)可視化,完成后的可視圖如下圖8.1.4所示。一展身手表8.1.7高分影片數(shù)量TOP10地區(qū)各地區(qū)電影數(shù)量美國(guó)705日本383法國(guó)248英國(guó)230中國(guó)大陸149中國(guó)香港116德國(guó)108意大利91中國(guó)臺(tái)灣52韓國(guó)51制作團(tuán)隊(duì)制作:XXXXXX統(tǒng)計(jì)各專業(yè)歷年平均錄取分?jǐn)?shù)主講人:xxXXXXXXXXXXXXXXXXXXXXX問(wèn)題描述利用2007年-2017年全國(guó)部分高校的錄取數(shù)據(jù)(“school.csv”),統(tǒng)計(jì)歷年來(lái)各專業(yè)的錄取平均分,輸出錄取平均分最高的前10個(gè)專業(yè)并使用柱狀圖可視化錄取數(shù)據(jù)。題前思考表8.2.1問(wèn)題分析根據(jù)問(wèn)題描述,填寫以下表格問(wèn)題描述問(wèn)題解答統(tǒng)計(jì)歷年來(lái)各專業(yè)的錄取平均分,需要對(duì)數(shù)據(jù)按“專業(yè)”進(jìn)行分組計(jì)算,使用哪一個(gè)函數(shù)對(duì)數(shù)據(jù)進(jìn)行分組計(jì)算?
使用哪一個(gè)函數(shù)對(duì)數(shù)據(jù)進(jìn)行排序?本活動(dòng)中排序的鍵是什么?
使用什么方法獲取錄取分?jǐn)?shù)線最高的前10條數(shù)據(jù)?
在圖形可視化過(guò)程中,柱狀圖的參數(shù)是什么?x坐標(biāo)標(biāo)簽和y坐標(biāo)標(biāo)簽分別是什么?
使用什么方法填充柱狀圖的顏色?importpandasaspdimportmatplotlib.pyplotasmpmp.rcParams['font.sans-serif']=['SimHei']data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')major=data.groupby(by='專業(yè)').agg({"平均分":'mean'}).sort_values(by='平均分',ascending=False)[:10]①mp.figure("專業(yè)分?jǐn)?shù)TOP10")②color=mp.get_cmap('hsv',len(major))(range(len(major)))③mp.bar(major.index,major['平均分'],color=color,edgecolor='black')④mp.title("專業(yè)分?jǐn)?shù)TOP10",fontsize=16)⑤mp.xlabel("專業(yè)",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.gcf().autofmt_xdate()⑥mp.show()程序代碼groupby()的功能是分組,分組鍵為'專業(yè)';agg()方法是一種聚合方法,它可以一次性求出不同字段的不同統(tǒng)計(jì)性指標(biāo)。程序代碼專業(yè)平均分世界歷史600.600000世界史604.666667中醫(yī)學(xué)類591.458333中國(guó)共產(chǎn)黨歷史628.681818中國(guó)少數(shù)民族語(yǔ)言文學(xué)560.659091......食品質(zhì)量與安全588.815085高分子材料與工程604.579802高分子材料與科學(xué)640.333333高分子材料加工工程590.052632麻醉學(xué)588.216867表8.2.2
按“專業(yè)“分組求平均數(shù)得到的數(shù)據(jù)表8.2.3錄取平均分最高的數(shù)據(jù)專業(yè)平均分印地語(yǔ)701.000000理科實(shí)驗(yàn)班類685.933333經(jīng)濟(jì)與金融668.041812工程力學(xué)與航天航空工程666.963636數(shù)理基礎(chǔ)科學(xué)666.452381制造自動(dòng)化與測(cè)控技術(shù)665.766917地球與空間科學(xué)662.485714工程物理662.104651中國(guó)語(yǔ)言文學(xué)660.428571印度尼西亞語(yǔ)657.200000importpandasaspdimportmatplotlib.pyplotasmpmp.rcParams['font.sans-serif']=['SimHei']data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')major=data.groupby(by='專業(yè)').agg({"平均分":'mean'}).sort_values(by='平均分',ascending=False)[:10]①mp.figure("專業(yè)分?jǐn)?shù)TOP10")②color=mp.get_cmap('hsv',len(major))(range(len(major)))③mp.bar(major.index,major['平均分'],color=color,edgecolor='black')④mp.title("專業(yè)分?jǐn)?shù)TOP10",fontsize=16)⑤mp.xlabel("專業(yè)",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.gcf().autofmt_xdate()⑥mp.show()程序代碼創(chuàng)建一個(gè)名為"專業(yè)分?jǐn)?shù)TOP10"的繪圖窗口。importpandasaspdimportmatplotlib.pyplotasmpmp.rcParams['font.sans-serif']=['SimHei']data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')major=data.groupby(by='專業(yè)').agg({"平均分":'mean'}).sort_values(by='平均分',ascending=False)[:10]①mp.figure("專業(yè)分?jǐn)?shù)TOP10")②color=mp.get_cmap('hsv',len(major))(range(len(major)))③mp.bar(major.index,major['平均分'],color=color,edgecolor='black')④mp.title("專業(yè)分?jǐn)?shù)TOP10",fontsize=16)⑤mp.xlabel("專業(yè)",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.gcf().autofmt_xdate()⑥mp.show()程序代碼創(chuàng)建一個(gè)顏色映射的名稱為'hsv',
顏色數(shù)量為len(major)的Colormap類對(duì)象程序代碼圖8.2.2mp.get_cmap('hsv',len(major))取得的顏色映射對(duì)象圖8.2.3
部分顏色映射圖importpandasaspdimportmatplotlib.pyplotasmpmp.rcParams['font.sans-serif']=['SimHei']data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')major=data.groupby(by='專業(yè)').agg({"平均分":'mean'}).sort_values(by='平均分',ascending=False)[:10]①mp.figure("專業(yè)分?jǐn)?shù)TOP10")②color=mp.get_cmap('hsv',len(major))(range(len(major)))③mp.bar(major.index,major['平均分'],color=color,edgecolor='black')④mp.title("專業(yè)分?jǐn)?shù)TOP10",fontsize=16)⑤mp.xlabel("專業(yè)",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.gcf().autofmt_xdate()⑥mp.show()程序代碼繪制柱狀圖。行索引為major.index;
列索引是major['平均分'],柱狀圖的顏色是color,邊框顏色為'black'。data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')major=data.groupby(by='專業(yè)').agg({"平均分":'mean'}).sort_values(by='平均分',ascending=False)[:10]①mp.figure("專業(yè)分?jǐn)?shù)TOP10")②color=mp.get_cmap('hsv',len(major))(range(len(major)))③mp.bar(major.index,major['平均分'],color=color,edgecolor='black')④mp.title("專業(yè)分?jǐn)?shù)TOP10",fontsize=16)⑤mp.xlabel("專業(yè)",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.gcf().autofmt_xdate()⑥mp.show()程序代碼設(shè)置柱狀圖的標(biāo)題及字號(hào)。data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')major=data.groupby(by='專業(yè)').agg({"平均分":'mean'}).sort_values(by='平均分',ascending=False)[:10]①mp.figure("專業(yè)分?jǐn)?shù)TOP10")②color=mp.get_cmap('hsv',len(major))(range(len(major)))③mp.bar(major.index,major['平均分'],color=color,edgecolor='black')④mp.title("專業(yè)分?jǐn)?shù)TOP10",fontsize=16)⑤mp.xlabel("專業(yè)",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.gcf().autofmt_xdate()⑥mp.show()程序代碼自動(dòng)將x坐標(biāo)刻度標(biāo)簽旋轉(zhuǎn)到合適位置,文字頂端對(duì)齊。任務(wù)小結(jié)1.描述groupby()、agg()方法及各參數(shù)的作用2.使用顏色映射表有哪些步驟一展身手現(xiàn)有8000余條電影數(shù)據(jù)“2_movies.csv”,表中的內(nèi)容如表8.1.7所示。統(tǒng)計(jì)表中各地區(qū)自2010年來(lái)所有影片的平均得分,輸出平均得分最高的10個(gè)地區(qū)如表8.2.4所示,最后對(duì)得分最高的前10條數(shù)據(jù)使用柱狀圖可視化。完成后的柱狀圖如圖8.2.4所示。一展身手表8.2.4各地區(qū)電影評(píng)分平均分TOP10地區(qū)
得分奧地利
Austria9.500突尼斯8.400蒙古8.400黎巴嫩8.225巴勒斯坦8.200愛(ài)沙尼亞8.200斯洛伐克8.100波黑8.100馬其頓8.100格魯吉亞8.050制作團(tuán)隊(duì)制作:XXXXXX統(tǒng)計(jì)各地區(qū)最高錄取分?jǐn)?shù)的平均值主講人:xxXXXXXXXXXXXXXXXXXXXXX問(wèn)題描述利用2007年-2017年全國(guó)部分高校的錄取數(shù)據(jù)(“school.csv”),按“考生地區(qū)”分組統(tǒng)計(jì)2016年全國(guó)各地區(qū)高校的錄取最高分的平均值見(jiàn)表8.2.5,使用柱狀圖可視化數(shù)據(jù)見(jiàn)圖8.2.5。表8.2.5各地區(qū)錄取最高分平均值考生地區(qū)最高分河北654.234652北京647.129944山東644.476526重慶639.820621四川635.562427云南632.557823陜西630.983776遼寧628.917614題前思考表8.2.4問(wèn)題分析根據(jù)問(wèn)題描述,填寫以下表格問(wèn)題描述問(wèn)題解答要篩選2016年各地區(qū)的最高錄取分,篩選的表達(dá)式該如何書寫?篩選的是哪兩列的數(shù)據(jù)?
數(shù)據(jù)篩選后需要對(duì)數(shù)據(jù)進(jìn)行分組計(jì)算,groupby()中的分組鍵是什么?
使用哪一個(gè)函數(shù)來(lái)計(jì)算平均錄取分?
分析柱狀圖的顏色,使用什么方法來(lái)填充柱狀圖的顏色?
importpandasaspdimportmatplotlib.pyplotasmpmp.rcParams['font.sans-serif']=['SimHei']data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')area_high=data.loc[data['年份']==2016,['考生地區(qū)','最高分']]①area_high_sort=area_high.groupby(by='考生地區(qū)').mean().sort_values(by='最高分',ascending=False)②print(area_high_sort)mp.figure("各地區(qū)錄取最高分平均值",figsize=(16,9))③程序代碼第一個(gè)參數(shù)是行索引,data['年份']==2016即篩選出年份為2016的所有行;第二個(gè)參數(shù)是列索引,即篩選['考生地區(qū)','最高分']兩列數(shù)據(jù)importpandasaspdimportmatplotlib.pyplotasmpmp.rcParams['font.sans-serif']=['SimHei']data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')area_high=data.loc[data['年份']==2016,['考生地區(qū)','最高分']]①area_high_sort=area_high.groupby(by='考生地區(qū)').mean().sort_values(by='最高分',ascending=False)②print(area_high_sort)mp.figure("各地區(qū)錄取最高分平均值",figsize=(16,9))③程序代碼按“考生地區(qū)”對(duì)數(shù)據(jù)進(jìn)行分組,對(duì)最高分所在列的數(shù)據(jù)求平均值并降序排序程序代碼8.2.6分組計(jì)算后的數(shù)據(jù)8.2.7排序后的數(shù)據(jù)考生地區(qū)最高分云南632.557823北京647.129944四川635.562427寧夏587.973236安徽625.475610……遼寧628.917614重慶639.820621陜西630.983776青海561.598425黑龍江623.632011考生地區(qū)最高分河北654.234652北京647.129944山東644.476526重慶639.820621四川635.562427……福建602.557616廣東599.190231寧夏587.973236青海561.598425江蘇386.433943importpandasaspdimportmatplotlib.pyplotasmpmp.rcParams['font.sans-serif']=['SimHei']data=pd.read_csv(r"D:\pydata\項(xiàng)目八\school.csv",engine='python')area_high=data.loc[data['年份']==2016,['考生地區(qū)','最高分']]①area_high_sort=area_high.groupby(by='考生地區(qū)').mean().sort_values(by='最高分',ascending=False)②print(area_high_sort)mp.figure("各地區(qū)錄取最高分平均值",figsize=(16,9))③程序代碼創(chuàng)建一個(gè)名為"各地區(qū)錄取最高分平均值"的16英寸寬9英寸高的繪圖窗口color=mp.get_cmap('gist_rainbow',len(area_high_sort))(range(len(area_high_sort)))④mp.bar(area_high_sort.index,area_high_sort['最高分'],0.6,color=color,edgecolor='black')⑤fora,binenumerate(area_high_sort['最高分'].values):mp.text(a,b,'%d'%b,va='bottom',ha='center',fontsize=9)⑥mp.title("各省份錄取分?jǐn)?shù)線",fontsize=16)⑦mp.xlabel("省份",fontsize=12)mp.ylabel("分?jǐn)?shù)",fontsize=12)mp.gcf().autofmt_xdate()⑧mp.show()程序代碼get_cmap()是取得顏色映射的函數(shù)返回值為Colormap類對(duì)象,'gist_rainbow'是顏色映射的名字color=mp.get_cmap('gist_rainbow',len(area_high_sort))(range(len(area_high_sort)))④mp.bar(area_high_sort.index,area_high_sort['最高分'],0.6,color=color,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年文化旅游演藝項(xiàng)目市場(chǎng)細(xì)分與精準(zhǔn)營(yíng)銷研究報(bào)告
- 2025年新初二英語(yǔ)人教新版學(xué)困生專題復(fù)習(xí)《任務(wù)型閱讀》
- 五金制品行業(yè)跨境電商平臺(tái)數(shù)據(jù)分析與應(yīng)用報(bào)告
- 鄉(xiāng)鎮(zhèn)集鎮(zhèn)車輛管理辦法
- 鄉(xiāng)間旅游公路管理辦法
- 中職學(xué)校班長(zhǎng)管理辦法
- 企業(yè)產(chǎn)業(yè)基金管理辦法
- 企業(yè)檔案遺失管理辦法
- 企業(yè)融資墊款管理辦法
- 代收代支款項(xiàng)管理辦法
- 薄膜溫室大棚結(jié)構(gòu)計(jì)算書
- 醫(yī)療器械知識(shí)產(chǎn)權(quán)保護(hù)指南
- 應(yīng)急救援與自救技能培訓(xùn)
- 鉛銻合金 標(biāo)準(zhǔn)
- 創(chuàng)新方法教程題庫(kù)題庫(kù)(449道)
- 液壓支架工理論知識(shí)考試題庫(kù)300題(含答案)
- 公司崗位職級(jí)管理制度
- 圍手術(shù)期患者血液管理指南
- GB/T 21471-2008錘上鋼質(zhì)自由鍛件機(jī)械加工余量與公差軸類
- 廣東省肇慶市2021-2022學(xué)年高二數(shù)學(xué)下學(xué)期期末考試試題(附解析)
- 工程結(jié)構(gòu)檢測(cè)鑒定與加固第1章工程結(jié)構(gòu)檢測(cè)鑒定與加固概論課件
評(píng)論
0/150
提交評(píng)論