




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、1SAS基礎(chǔ)與金融計算;.2上節(jié)課上機操作(1)p對上節(jié)課生成的最終數(shù)據(jù)集對上節(jié)課生成的最終數(shù)據(jù)集total進(jìn)行如下操作:進(jìn)行如下操作:n(1)剔除金融業(yè)上市公司;)剔除金融業(yè)上市公司;n(2)剔除每股收益為負(fù)的上市公司;)剔除每股收益為負(fù)的上市公司;n(3)由于數(shù)據(jù)集中年漲跌幅采用百分比表示,建立一個新的變量,采用小數(shù)表示。)由于數(shù)據(jù)集中年漲跌幅采用百分比表示,建立一個新的變量,采用小數(shù)表示。n(4)建立一個新的變量,表示除第一大股東外其它股東所持有的股份比例。)建立一個新的變量,表示除第一大股東外其它股東所持有的股份比例。3(1)剔除金融業(yè)上市公司)剔除金融業(yè)上市公司p第一步:第一步: 運
2、用運用substr語句語句pData test; set total; code=substr(code,1,6); Run;4p第二步:第二步: nData temp1; set test; if code=000562 or code=000001 or code=000563 or code=600015 or code=600016 or code=600030 or code=600036 or code=600816 or code=600000 or code=601998 or code=601328 or code=601166 or code=601318 or code=
3、601398 or code=601628 then delete; Run; 5(2)剔除每股收益為負(fù)的上市公司)剔除每股收益為負(fù)的上市公司pData temp2; set temp1; if eps=0 ; Run;6(3)建立新變量:用小數(shù)表示的漲跌幅)建立新變量:用小數(shù)表示的漲跌幅pData temp3; set temp2; re2=re/100; Run;7(4)建立新的變量表示其它股東持股比例)建立新的變量表示其它股東持股比例pData temp4; set temp3; ratio2=1-ratio/100; Run;8本節(jié)課上機作業(yè)(2)p公共信箱下載數(shù)據(jù)集公共信箱下載數(shù)據(jù)集
4、test1和和test2,運用,運用SAS將將test1和和test2縱向拼成新的數(shù)據(jù)縱向拼成新的數(shù)據(jù)test。p根據(jù)股票收益率大小將根據(jù)股票收益率大小將test分成四個組,并形成四個子數(shù)據(jù)集:分成四個組,并形成四個子數(shù)據(jù)集:tmp1,tmp2,tmp3,tmp4。p在數(shù)據(jù)集在數(shù)據(jù)集test中中,第一大股東持股比例在第一大股東持股比例在50%以上且每股收益超過以上且每股收益超過1元的公司有多少家?元的公司有多少家?9描述統(tǒng)計分析描述統(tǒng)計分析 常見的數(shù)據(jù)統(tǒng)計描述量及意義常見的數(shù)據(jù)統(tǒng)計描述量及意義 (1)(1)表示分布平均水平和位置的特征量表示分布平均水平和位置的特征量: : 均值均值:數(shù)據(jù)的平均
5、值數(shù)據(jù)的平均值Mean 眾數(shù)眾數(shù):觀測值中出現(xiàn)最頻繁的數(shù)值觀測值中出現(xiàn)最頻繁的數(shù)值Mode 中位數(shù)中位數(shù):觀測值排序中處于中間位置的值觀測值排序中處于中間位置的值Median 百分位數(shù)百分位數(shù):中位數(shù)的推廣中位數(shù)的推廣P1、P33、P9910 (2)(2)表示分布離散程度的特征量表示分布離散程度的特征量211()1niisxxn 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 Std 方差方差2211()1niisxxn Var 變異系數(shù)變異系數(shù)100sCvx CV 標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤sStdeern STDEER11 (3 3)表示形狀的特征量)表示形狀的特征量: :偏度和峰度偏度和峰度313()(1)(2)ixxngnns 偏度
6、(偏度( Skewness ):): 偏度主要用于判斷分布形狀是否對稱:偏度主要用于判斷分布形狀是否對稱: 若若g1=0,則對稱;,則對稱; 若若g10,則分布右偏(正偏);,則分布右偏(正偏); 若若g10,表示變量分布比正態(tài)分布更集中,分布呈尖峰狀態(tài),平均數(shù)的代表性較好;,表示變量分布比正態(tài)分布更集中,分布呈尖峰狀態(tài),平均數(shù)的代表性較好; 若若g20,表示變量分布比正態(tài)分布更分散,分布呈平坦峰,平均數(shù)的代表性較差。,表示變量分布比正態(tài)分布更分散,分布呈平坦峰,平均數(shù)的代表性較差。13 SAS中可以對數(shù)據(jù)進(jìn)行描述統(tǒng)計分析的過程步有很多,其中兩個最常用的過程步是:中可以對數(shù)據(jù)進(jìn)行描述統(tǒng)計分析的
7、過程步有很多,其中兩個最常用的過程步是: (1)MEANS過程(均值過程)過程(均值過程) (2)UNIVARIATE過程(單變量過程)過程(單變量過程)14 MEANS過程用來對數(shù)據(jù)集中的數(shù)值變量計算簡單描述統(tǒng)計量。該過程由下列語句過程用來對數(shù)據(jù)集中的數(shù)值變量計算簡單描述統(tǒng)計量。該過程由下列語句控制:控制:PROC MEANS options statistics-keywords; VAR variables; BY variables; CLASS variables; OUTPUT OUT=SAS-data-set output-statistics;Run;1. MEANS過程過程1
8、5(1)PROC MEANS語句語句 PROC MEANS options statistic-keywords options :DATA=SAS data set,即,即用以說明過程分析處理的數(shù)據(jù)集的名字,若省略,用以說明過程分析處理的數(shù)據(jù)集的名字,若省略,則用最近操作的則用最近操作的SASSAS數(shù)據(jù)集;數(shù)據(jù)集; statistic-keywords:在:在MEANS過程中指出你需要計算哪些統(tǒng)計量。過程中指出你需要計算哪些統(tǒng)計量。16 N,MEAN,STD,MIN,MAX,SUM, Variance,CV,STDERR,T,PRT,Range, SKEWNESS,KURTOSIS,CLM,
9、LCLM,UCLM,Maxdec T:檢驗總體平均值是否為檢驗總體平均值是否為0的的T統(tǒng)計量的值統(tǒng)計量的值 PRT:大于大于T的概率的概率 Maxdec=n:指定打印統(tǒng)計量的小數(shù)位的位數(shù)指定打印統(tǒng)計量的小數(shù)位的位數(shù) 如省略不寫,如省略不寫,SAS將固定輸入默認(rèn)的最常見的幾個統(tǒng)計量。將固定輸入默認(rèn)的最常見的幾個統(tǒng)計量。該過程可計算如下統(tǒng)計量:該過程可計算如下統(tǒng)計量:17VAR variables 規(guī)定要計算描述性統(tǒng)計量的數(shù)值變量及順序。規(guī)定要計算描述性統(tǒng)計量的數(shù)值變量及順序。 若省略該句,則對除若省略該句,則對除BY、CLASS語句中列出的變量之外所有數(shù)值變量計算描述性統(tǒng)語句中列出的變量之外所有
10、數(shù)值變量計算描述性統(tǒng)計量。計量。(2)VAR語句語句18(3)BY語句語句 BY variables; 使用使用BY語句可以用語句可以用BY變量定義的觀測組分別計算其相應(yīng)的描述統(tǒng)計量。當(dāng)使用變量定義的觀測組分別計算其相應(yīng)的描述統(tǒng)計量。當(dāng)使用BY語句時,要求輸入數(shù)據(jù)集已按語句時,要求輸入數(shù)據(jù)集已按BY變量排序。變量排序。(4)CLASS語句語句 CLASS variables; 該語句和該語句和BY語句一樣,可用語句一樣,可用CLASS變量定義的觀測組分別計算其相應(yīng)的描述統(tǒng)計量。變量定義的觀測組分別計算其相應(yīng)的描述統(tǒng)計量。不同點在于排序要求,不同點在于排序要求,CLASS語句不要求數(shù)據(jù)集事先已按
11、語句不要求數(shù)據(jù)集事先已按CLASS變量排序。變量排序。19p(5)Freq語句語句 Freq variable; 該語句指定一個數(shù)值型的變量,它的值表示輸入數(shù)據(jù)集中相應(yīng)觀測出現(xiàn)的頻數(shù)。該變該語句指定一個數(shù)值型的變量,它的值表示輸入數(shù)據(jù)集中相應(yīng)觀測出現(xiàn)的頻數(shù)。該變量的值應(yīng)為正整數(shù)。若變量值量的值應(yīng)為正整數(shù)。若變量值1或缺失,相應(yīng)的觀測不參加計算統(tǒng)計量。若這個值不或缺失,相應(yīng)的觀測不參加計算統(tǒng)計量。若這個值不是正整數(shù),則取整數(shù)部分。是正整數(shù),則取整數(shù)部分。20p(5)Weight語句語句 Weight variable; 該語句規(guī)定一個數(shù)值型的變量,它的值表示相應(yīng)觀測的權(quán)數(shù)。該變量的值應(yīng)大于該語句
12、規(guī)定一個數(shù)值型的變量,它的值表示相應(yīng)觀測的權(quán)數(shù)。該變量的值應(yīng)大于0。若變量值若變量值0或缺失,假定該值為或缺失,假定該值為0。21 OUTPUT OUT=SAS-data-set output-statistics; 該語句要求該語句要求MEANS過程把計算的描述統(tǒng)計量輸出到新的過程把計算的描述統(tǒng)計量輸出到新的SAS數(shù)據(jù)集中,并用任數(shù)據(jù)集中,并用任選項規(guī)定新數(shù)據(jù)集的名及所包含的變量名。這里:選項規(guī)定新數(shù)據(jù)集的名及所包含的變量名。這里: OUT=SAS-data-set:給出由:給出由MEANS過程產(chǎn)生的輸出數(shù)據(jù)集的名字,若想創(chuàng)建一個過程產(chǎn)生的輸出數(shù)據(jù)集的名字,若想創(chuàng)建一個永久數(shù)據(jù)集,則必須規(guī)定
13、一個兩級名字,缺省時,機器默認(rèn)的數(shù)據(jù)集名為永久數(shù)據(jù)集,則必須規(guī)定一個兩級名字,缺省時,機器默認(rèn)的數(shù)據(jù)集名為data1等。等。 Output-statistics:規(guī)定在新數(shù)據(jù)集中所要求的統(tǒng)計量,并規(guī)定存放這些統(tǒng)計量的變:規(guī)定在新數(shù)據(jù)集中所要求的統(tǒng)計量,并規(guī)定存放這些統(tǒng)計量的變量名。量名。 (6)OUTPUT語句語句22Data student; input class sex $ age weight height ;cards; 1 f 15 46 156 1 f 14 41 149 1 m 13 48 155 1 m 14 38 150 2 m 16 55 165 2 f 17 50 16
14、0 2 f 16 60 165 2 m 17 65 175 3 f 18 65 165 3 f 17 58 160 3 m 18 70 180 3 m 17 68 176;Run;例例23Proc means data= student; var age weight height ;Run;Proc means data= student maxdec=2; var age weight height ; by sex;Run;觀察以下幾組程序觀察以下幾組程序24proc means data= student maxdec=2; var age weight height ; class sex;run;proc means data= student maxdec=2; var age weight height ; output out=sta n=num mean=a1 a2 a3 std=b1 b2 b3 max=c1 c2 c3;run;25libname a d:sasdata;proc means data= student maxdec=2; var age weight height ; output out=a.sta n=num mean=a1 a2 a3 std=b1 b2 b
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 信陽職業(yè)技術(shù)學(xué)院《版畫基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 山西大同大學(xué)《植物病蟲害防治理論》2023-2024學(xué)年第一學(xué)期期末試卷
- 陜西工商職業(yè)學(xué)院《自然科學(xué)(電工學(xué))》2023-2024學(xué)年第一學(xué)期期末試卷
- 氣道管理及護(hù)理
- 幼兒老師法律法規(guī)培訓(xùn)
- 管道超聲無損檢測技術(shù)應(yīng)用
- 網(wǎng)絡(luò)售賣培訓(xùn)課件
- 流向收集年工作總結(jié)
- 新生兒藥疹的護(hù)理
- 就業(yè)創(chuàng)業(yè)教育體系構(gòu)建與實施
- 吸入劑的正確使用
- 鐵路施工安全培訓(xùn)
- 《造林綠化落地上圖操作技術(shù)規(guī)范》
- 國企基金公司招聘考試題
- 燒傷科普講座課件
- 《狼性企業(yè)文化》課件
- 智慧能源管理平臺建設(shè)方案書
- 周轉(zhuǎn)材料管理制度范本
- 《線性代數(shù)》課程思政的案例及思考
- 免疫規(guī)劃媽媽課堂培訓(xùn)
- 江西管理職業(yè)學(xué)院教師招聘考試歷年真題
評論
0/150
提交評論