




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2025年大數(shù)據(jù)分析師職業(yè)技能測(cè)試卷:Python數(shù)據(jù)分析庫(kù)Pandas高級(jí)應(yīng)用考試時(shí)間:______分鐘總分:______分姓名:______一、Pandas庫(kù)基本操作與應(yīng)用要求:熟練掌握Pandas庫(kù)的基本操作,包括數(shù)據(jù)選擇、數(shù)據(jù)排序、數(shù)據(jù)篩選等,并能夠應(yīng)用這些操作解決實(shí)際問(wèn)題。1.數(shù)據(jù)選擇(1)從以下DataFrame中選擇年齡大于30歲的行,并返回新的DataFrame。```pythonimportpandasaspddata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(2)從以下DataFrame中選擇名為'Charlie'的行,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(3)從以下DataFrame中選擇年齡在25歲到40歲之間的行,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(4)從以下DataFrame中選擇名為'Alice'或'David'的行,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(5)從以下DataFrame中選擇年齡大于等于25歲且小于等于40歲的行,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(6)從以下DataFrame中選擇年齡在25歲到40歲之間的行,并返回新的DataFrame,同時(shí)將年齡列乘以2。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(7)從以下DataFrame中選擇名為'Alice'或'David'的行,并返回新的DataFrame,同時(shí)將工資列加上1000。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(8)從以下DataFrame中選擇年齡在25歲到40歲之間的行,并返回新的DataFrame,同時(shí)將工資列除以2。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```2.數(shù)據(jù)排序(1)將以下DataFrame按照年齡降序排序,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(2)將以下DataFrame按照工資升序排序,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(3)將以下DataFrame按照年齡升序排序,并返回新的DataFrame,同時(shí)將工資列乘以2。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(4)將以下DataFrame按照工資降序排序,并返回新的DataFrame,同時(shí)將年齡列加上10。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```3.數(shù)據(jù)篩選(1)從以下DataFrame中篩選出工資大于等于7000的行,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(2)從以下DataFrame中篩選出年齡小于35歲的行,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(3)從以下DataFrame中篩選出年齡小于35歲且工資大于等于7000的行,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(4)從以下DataFrame中篩選出年齡小于35歲或工資大于等于7000的行,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(5)從以下DataFrame中篩選出年齡小于35歲且工資大于等于7000的行,并返回新的DataFrame,同時(shí)將年齡列乘以2。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(6)從以下DataFrame中篩選出年齡小于35歲或工資大于等于7000的行,并返回新的DataFrame,同時(shí)將工資列加上1000。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(7)從以下DataFrame中篩選出年齡小于35歲且工資大于等于7000的行,并返回新的DataFrame,同時(shí)將年齡列除以2。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(8)從以下DataFrame中篩選出年齡小于35歲或工資大于等于7000的行,并返回新的DataFrame,同時(shí)將工資列乘以2。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```四、Pandas庫(kù)數(shù)據(jù)聚合與分組要求:熟練掌握Pandas庫(kù)中的數(shù)據(jù)聚合和分組功能,并能夠使用這些功能對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。1.數(shù)據(jù)聚合(1)對(duì)以下DataFrame中的'salary'列進(jìn)行求和,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(2)對(duì)以下DataFrame中的'salary'列進(jìn)行平均值計(jì)算,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(3)對(duì)以下DataFrame中的'salary'列進(jìn)行最大值計(jì)算,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(4)對(duì)以下DataFrame中的'salary'列進(jìn)行最小值計(jì)算,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(5)對(duì)以下DataFrame中的'salary'列進(jìn)行標(biāo)準(zhǔn)差計(jì)算,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(6)對(duì)以下DataFrame中的'salary'列進(jìn)行方差計(jì)算,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(7)對(duì)以下DataFrame中的'salary'列進(jìn)行眾數(shù)計(jì)算,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(8)對(duì)以下DataFrame中的所有列進(jìn)行描述性統(tǒng)計(jì),并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```五、Pandas庫(kù)數(shù)據(jù)透視表與交叉表要求:掌握Pandas庫(kù)中數(shù)據(jù)透視表和交叉表的使用,能夠根據(jù)需求創(chuàng)建相應(yīng)的表格,并進(jìn)行簡(jiǎn)單的數(shù)據(jù)分析。1.數(shù)據(jù)透視表(1)創(chuàng)建以下DataFrame的數(shù)據(jù)透視表,以'name'為行標(biāo)簽,'age'為列標(biāo)簽,'salary'為值。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(2)創(chuàng)建以下DataFrame的數(shù)據(jù)透視表,以'age'為行標(biāo)簽,'salary'為列標(biāo)簽,'name'為值。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(3)創(chuàng)建以下DataFrame的數(shù)據(jù)透視表,以'name'為行標(biāo)簽,'salary'為列標(biāo)簽,計(jì)算平均值。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(4)創(chuàng)建以下DataFrame的數(shù)據(jù)透視表,以'age'為行標(biāo)簽,'salary'為列標(biāo)簽,計(jì)算眾數(shù)。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(5)創(chuàng)建以下DataFrame的數(shù)據(jù)透視表,以'name'為行標(biāo)簽,'age'為列標(biāo)簽,計(jì)算標(biāo)準(zhǔn)差。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(6)創(chuàng)建以下DataFrame的數(shù)據(jù)透視表,以'age'為行標(biāo)簽,'salary'為列標(biāo)簽,計(jì)算方差。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(7)創(chuàng)建以下DataFrame的數(shù)據(jù)透視表,以'name'為行標(biāo)簽,'age'為列標(biāo)簽,計(jì)算工資總和。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(8)創(chuàng)建以下DataFrame的數(shù)據(jù)透視表,以'age'為行標(biāo)簽,'salary'為列標(biāo)簽,計(jì)算工資平均值。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```六、Pandas庫(kù)數(shù)據(jù)處理與操作要求:掌握Pandas庫(kù)中的數(shù)據(jù)處理和操作功能,能夠?qū)?shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換和擴(kuò)展等操作。1.數(shù)據(jù)清洗(1)從以下DataFrame中刪除重復(fù)行,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(2)從以下DataFrame中刪除包含空值的行,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(3)從以下DataFrame中刪除所有包含空值的列,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(4)從以下DataFrame中刪除所有空值,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(5)從以下DataFrame中刪除指定列,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(6)從以下DataFrame中刪除指定行,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(7)從以下DataFrame中刪除所有重復(fù)列,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```(8)從以下DataFrame中刪除所有重復(fù)行,并返回新的DataFrame。```pythondata={'name':['Alice','Bob','Charlie','David','Eve'],'age':[25,35,40,28,45],'salary':[5000,7000,6000,5500,8000]}df=pd.DataFrame(data)```本次試卷答案如下:一、Pandas庫(kù)基本操作與應(yīng)用1.數(shù)據(jù)選擇(1)答案:```pythonfiltered_df=df[df['age']>30]```解析思路:使用布爾索引選擇年齡大于30歲的行。(2)答案:```pythonfiltered_df=df[df['name']=='Charlie']```解析思路:使用等式索引選擇名為'Charlie'的行。(3)答案:```pythonfiltered_df=df[(df['age']>25)&(df['age']<40)]```解析思路:使用邏輯與操作符選擇年齡在25歲到40歲之間的行。(4)答案:```pythonfiltered_df=df[df['name'].isin(['Alice','David'])]```解析思路:使用isin方法選擇名為'Alice'或'David'的行。(5)答案:```pythonfiltered_df=df[(df['age']>=25)&(df['age']<=40)]```解析思路:使用邏輯與操作符選擇年齡在25歲到40歲之間的行。(6)答案:```pythonfiltered_df=df[df['age']>25].assign(age2=df['age']*2)```解析思路:首先篩選年齡大于25歲的行,然后使用assign方法創(chuàng)建一個(gè)新列'age2',其值為原始年齡列的兩倍。(7)答案:```pythonfiltered_df=df[df['name'].isin(['Alice','David'])].assign(salary2=df['salary']+1000)```解析思路:首先篩選名為'Alice'或'David'的行,然后使用assign方法創(chuàng)建一個(gè)新列'salary2',其值為原始工資列加1000。(8)答案:```pythonfiltered_df=df[(df['age']>25)&(df['age']<40)].assign(salary2=df['salary']/2)```解析思路:首先篩選年齡在25歲到40歲之間的行,然后使用assign方法創(chuàng)建一個(gè)新列'salary2',其值為原始工資列的一半。二、Pandas庫(kù)基本操作與應(yīng)用(1)答案:```pythonsorted_df=df.sort_values(by='age',ascending=False)```解析思路:使用sort_values方法按年齡降序排序。(2)答案:```pythonsorted_df=df.sort_values(by='salary',ascending=True)```解析思路:使用sort_values方法按工資升序排序。(3)答案:```pythonsorted_df=df.sort_values(by='age',ascending=True).assign(age2=df['age']*2)```解析思路:首先按年齡升序排序,然后使用assign方法創(chuàng)建一個(gè)新列'age2',其值為原始年齡列的兩倍。(4)答案:```pythonsorted_df=df.sort_values(by='salary',ascending=False).assign(salary2=df['salary']+10)```解析思路:首先按
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國(guó)10金裝金箔酒數(shù)據(jù)監(jiān)測(cè)報(bào)告
- 2025至2030年中國(guó)高分辨率CMOS工業(yè)數(shù)字相機(jī)市場(chǎng)分析及競(jìng)爭(zhēng)策略研究報(bào)告
- 2025至2030年中國(guó)錐形入口孔板市場(chǎng)分析及競(jìng)爭(zhēng)策略研究報(bào)告
- 2025至2030年中國(guó)重型限位開(kāi)關(guān)市場(chǎng)分析及競(jìng)爭(zhēng)策略研究報(bào)告
- 2025至2030年中國(guó)耳針模型市場(chǎng)分析及競(jìng)爭(zhēng)策略研究報(bào)告
- 2025至2030年中國(guó)空調(diào)系統(tǒng)熒光檢漏儀市場(chǎng)分析及競(jìng)爭(zhēng)策略研究報(bào)告
- 2025至2030年中國(guó)電流組合式繼電器市場(chǎng)分析及競(jìng)爭(zhēng)策略研究報(bào)告
- 2025至2030年中國(guó)熱貼市場(chǎng)分析及競(jìng)爭(zhēng)策略研究報(bào)告
- 2025至2030年中國(guó)無(wú)紡布濕式PU合成皮革市場(chǎng)分析及競(jìng)爭(zhēng)策略研究報(bào)告
- 2025至2030年中國(guó)微孔板市場(chǎng)分析及競(jìng)爭(zhēng)策略研究報(bào)告
- 拆分合同:合伙企業(yè)解散及債務(wù)分擔(dān)協(xié)議
- 2025河北邯鄲市肥鄉(xiāng)區(qū)選聘農(nóng)村黨務(wù)(村務(wù))工作者100人筆試參考題庫(kù)完整參考答案詳解
- 酒店安保部管理制度
- 2025年05月四川阿壩州級(jí)事業(yè)單位公開(kāi)選調(diào)工作人員78人筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 2025-2030中國(guó)硫酸鈣晶須行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及競(jìng)爭(zhēng)格局與投資發(fā)展研究報(bào)告
- DB31/T 1035-2017綠化有機(jī)覆蓋物應(yīng)用技術(shù)規(guī)范
- 2025年農(nóng)業(yè)果園土地租賃承包合同
- 2025小升初人教版六年級(jí)英語(yǔ)下學(xué)期期末綜合測(cè)試模擬練習(xí)卷
- 青浦區(qū)區(qū)管企業(yè)統(tǒng)一招聘考試真題2024
- Seldinger穿刺技術(shù)課件
- 船體結(jié)構(gòu)與制圖知到智慧樹(shù)期末考試答案題庫(kù)2025年華中科技大學(xué)
評(píng)論
0/150
提交評(píng)論