第十章 python大數(shù)據(jù)分析_第1頁
第十章 python大數(shù)據(jù)分析_第2頁
第十章 python大數(shù)據(jù)分析_第3頁
第十章 python大數(shù)據(jù)分析_第4頁
第十章 python大數(shù)據(jù)分析_第5頁
已閱讀5頁,還剩21頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《財(cái)務(wù)分析》微課《財(cái)務(wù)分析》蔣琰,張莉芳,萬如榮主編人民郵電出版社2023年版江蘇省重點(diǎn)建設(shè)教材第十章Python在財(cái)務(wù)大數(shù)據(jù)中的應(yīng)用10第十章Python在財(cái)務(wù)大數(shù)據(jù)中的應(yīng)用教學(xué)目標(biāo):了解Python在財(cái)務(wù)大數(shù)據(jù)分析中的優(yōu)勢(shì);熟悉Python在財(cái)務(wù)大數(shù)據(jù)當(dāng)中應(yīng)用的相關(guān)細(xì)節(jié);熟悉Python在數(shù)據(jù)爬取、數(shù)據(jù)加工、數(shù)據(jù)挖掘、數(shù)據(jù)可視化中的應(yīng)用方法。第十章Python在財(cái)務(wù)大數(shù)據(jù)中的應(yīng)用

一、Python在財(cái)務(wù)分析的應(yīng)用

二、Python財(cái)務(wù)數(shù)據(jù)爬取

三、Python財(cái)務(wù)大數(shù)據(jù)分析

四、Python財(cái)務(wù)大數(shù)據(jù)可視化分析(一)Python用于財(cái)務(wù)分析的優(yōu)勢(shì)Python技術(shù)具有較高的可讀性、可移植性和合作程度高的特點(diǎn),在財(cái)務(wù)數(shù)據(jù)挖掘和數(shù)據(jù)分析中作用明顯,具體體現(xiàn)在以下幾方面:數(shù)據(jù)挖掘靈活度高數(shù)據(jù)分析高效快捷數(shù)據(jù)分析可視化展現(xiàn)為企業(yè)業(yè)務(wù)與財(cái)務(wù)的融合提供支撐第一節(jié)Python在財(cái)務(wù)分析的應(yīng)用(二)用于財(cái)務(wù)分析的Python操作流程財(cái)務(wù)數(shù)據(jù)的采集數(shù)據(jù)分析方式選擇數(shù)據(jù)分析過程第一節(jié)Python在財(cái)務(wù)分析的應(yīng)用(二)用于財(cái)務(wù)分析的Python操作流程財(cái)務(wù)數(shù)據(jù)的采集網(wǎng)絡(luò)爬蟲要解決問題主要有三個(gè):爬什么?到哪里去爬?數(shù)據(jù)清洗、儲(chǔ)存?具體來說可分為獲取所有股票代碼、尋找合適財(cái)務(wù)數(shù)據(jù)接口、數(shù)據(jù)的清洗及保存以及編寫Python程序下載數(shù)據(jù)。當(dāng)然如果需要其他類型的數(shù)據(jù),可能還需使用其他python的爬蟲方法加以實(shí)現(xiàn)。第一節(jié)Python在財(cái)務(wù)分析的應(yīng)用(二)用于財(cái)務(wù)分析的Python操作流程2、數(shù)據(jù)分析方式選擇選擇適合的預(yù)測(cè)模型以完成財(cái)務(wù)分析,常見預(yù)測(cè)模型包括灰色預(yù)測(cè)模型、回歸模型等。第一節(jié)Python在財(cái)務(wù)分析的應(yīng)用(二)用于財(cái)務(wù)分析的Python操作流程3、數(shù)據(jù)分析過程 1、四種包導(dǎo)入 2、使用pandas讀取數(shù)據(jù) 3、轉(zhuǎn)換數(shù)據(jù) 4、劃分訓(xùn)練以及測(cè)試集 5、循環(huán)多元回歸模型 6、對(duì)比預(yù)測(cè)數(shù)據(jù)與實(shí)際數(shù)據(jù)的差異第一節(jié)Python在財(cái)務(wù)分析的應(yīng)用(二)用于財(cái)務(wù)分析的Python操作流程綜上所述,將Python與財(cái)務(wù)大數(shù)據(jù)結(jié)合是一種比較有效的工作方式,能夠通過切實(shí)的方案,有效提升企業(yè)戰(zhàn)略管理工作的落實(shí)效益,實(shí)現(xiàn)經(jīng)濟(jì)效益最大化,同時(shí)也能夠不斷提升企業(yè)在市場(chǎng)競(jìng)爭(zhēng)當(dāng)中的地位,使企業(yè)獲得穩(wěn)定發(fā)展。第一節(jié)Python在財(cái)務(wù)分析的應(yīng)用(三)python基礎(chǔ)架構(gòu)本書使用Anaconda作為本章的python基礎(chǔ)架構(gòu)。Anaconda指的是一個(gè)開源的Python發(fā)行版本,其包含了conda、Python等180多個(gè)科學(xué)包及其依賴項(xiàng)。因?yàn)榘舜罅康目茖W(xué)包,Anaconda的下載文件比較大(約531MB),如果只需要某些包,或者需要節(jié)省帶寬或存儲(chǔ)空間,也可以使用Miniconda這個(gè)較小的發(fā)行版(僅包含conda和Python)。

詳細(xì)安裝教程見:/p/3084e62f51b1第一節(jié)Python在財(cái)務(wù)分析的應(yīng)用一、獲取所有股票代碼想要爬取所有上市公司財(cái)務(wù)數(shù)據(jù),我們首先需要取得所有上市公司的股票代碼。本節(jié)使用一個(gè)提供免費(fèi)財(cái)經(jīng)數(shù)據(jù)的網(wǎng)站——Tushare財(cái)經(jīng)庫,從該網(wǎng)站數(shù)據(jù)接口可獲得所有股票代碼、滬深300成分股等相關(guān)數(shù)據(jù)。(一)Tushare財(cái)經(jīng)庫安裝參照anaconda平臺(tái)安裝第三方包的方法,可在JupyterNotebook里輸入以下內(nèi)容。操作完成后即可成功安裝Tushare財(cái)經(jīng)庫。第二節(jié)Python財(cái)務(wù)數(shù)據(jù)爬取!pipinstalltushare第二節(jié)Python財(cái)務(wù)數(shù)據(jù)爬取第二節(jié)Python財(cái)務(wù)數(shù)據(jù)爬取第二節(jié)Python財(cái)務(wù)數(shù)據(jù)爬取(三)使用數(shù)據(jù)接口爬取數(shù)據(jù)此外我們也可以使用數(shù)據(jù)接口來爬取數(shù)據(jù)。具體操作如下:(1)打開任意財(cái)經(jīng)網(wǎng)站股票專欄。(2)輸入任意股票代碼,比如“600660”,進(jìn)入股票詳情頁。(3)查找諸如“財(cái)務(wù)報(bào)表”“財(cái)務(wù)數(shù)據(jù)”“財(cái)務(wù)分析”之類的字樣,進(jìn)入細(xì)分欄目。(4)在細(xì)分欄目找到“下載”或者“導(dǎo)出”之類的功能按鈕。右擊鏈接,選擇復(fù)制鏈接地址。(5)分析鏈接地址,查看導(dǎo)入股票代碼所在位置。第二節(jié)Python財(cái)務(wù)數(shù)據(jù)爬取二、尋找合適的財(cái)務(wù)數(shù)據(jù)接口由于Python能夠直接處理的文件格式為xml、csv、json、xls,較優(yōu)策略為:盡量查找能夠提供此類格式的文本的數(shù)據(jù)接口。例如Python的文本分析,數(shù)據(jù)清洗最為便捷的即為csv格式的文本。csv格式文本的內(nèi)容緊湊,可以排除無用字節(jié)的干擾。但當(dāng)所取得的數(shù)據(jù)并非自己所需的格式時(shí),需要將數(shù)據(jù)轉(zhuǎn)換為自己需要的內(nèi)容(為了說明數(shù)據(jù)清洗及轉(zhuǎn)換過程,這里專門選擇了一個(gè)xls格式的財(cái)務(wù)接口)。第二節(jié)Python財(cái)務(wù)數(shù)據(jù)爬取第二節(jié)Python財(cái)務(wù)數(shù)據(jù)爬取四、編寫Python程序下載數(shù)據(jù)第二節(jié)Python財(cái)務(wù)數(shù)據(jù)爬取#!/usr/bin/py#filename=RPDownloader.pyfrommodules.Utilsimporte2csvfrommodules.FiimporttcodeimportpandasasPdimportrequestsasro#下載資產(chǎn)負(fù)債表defdownloadBSRP(stocklist):num=0forcinstocklist:bs_url='/stockdata/{co}.html'.format(co=tcode(c))ct=ro.get(bs_url).textto_file='bs{co}.csv'.format(co=tcode(c))open(to_file,'w').write(e2csv(ct))num=num+1returnnum第三節(jié)Python財(cái)務(wù)大數(shù)據(jù)分析二、盈利能力分析&營(yíng)運(yùn)能力分析&償債能力分析二、盈利能力分析&營(yíng)運(yùn)能力分析&償債能力分析二、盈利能力分析&營(yíng)運(yùn)能力分析&償債能力分析第四節(jié)Python財(cái)務(wù)大數(shù)據(jù)可視化分析一、庫介紹(一)MatplotlibMatplotlib是Python的一個(gè)2D繪圖庫,它以各種硬拷貝格式和跨平臺(tái)的交互式環(huán)境生成出版質(zhì)量級(jí)別的圖形。通過Matplotlib,開發(fā)者可以僅利用幾行代碼,便生成繪圖,如直方圖、功率譜、條形圖、錯(cuò)誤圖、散點(diǎn)圖等。(二)TushareTushare是一個(gè)免費(fèi)、開源的Py

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論