




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數據的收集與處理析來估計整體的情況(周思遠,李欣怡,2022)。遵循這種理論框架進行調研可獲知所以我們要運用SPSS軟件,對整個上證A股(含ST)進行隨能有效的提高工作效率,起到事半功倍的效果(郭子豪,劉雅靜,2022)。3.1收集數據1.研究對象A股,也叫人民幣普通股,發行主體是中國境內公司,提供給境內機構、組織或者個人用人民幣來認購和交易的普通股股票[6]。研究對象是所有的上證A股。2.研究步驟找到所有上證股(含S)的股票序號,運用SPSS軟件對上證A股的股票序號進行隨機抽樣20只股票,鑒于上述分析得出20只股票的總資產利潤率、凈資產利潤率、每股收益、資產負債率、個指標整理到一個表上,且意義收集每我們分析所用到的原數據(張宇婷,劉凡,2022)。以6個指標為例展示結果,其余詳情見附錄,結果如表一所示:表1.不同股票6個指標的數據股票名字基本每股收益(元)凈資產收益總資產收益資產負債比存貨周轉率總資產周轉云天化0.0480.0090.0020.8970.0210.005浪莎股份-0.047-0.01-0.0080.1810.0080.002長春一東0.0320.0120.010.5040.0220.004中閩能源-0.061-0.541-0.0120.6070.0240.002北京城建0.440.0410.0130.6640.0010.001酒鋼宏興-0.51-0.235-0.0680.7050.060.008國旅聯合0.0440.0610.0250.5580.0340.001龍凈環保0.2950.090.0250.7290.0050.003海潤光伏0.0140.0110.0030.6850.0420.002亨通光電0.310.0650.0260.6650.0210.006天士力0.9080.1350.0740.0160.0310.006匯通能源0.0450.0140.0060.567259.190.009龍頭股份0.1150.0290.020.3160.0270.011浙報傳媒0.30.0910.0670.310.2040.003新黃浦0.240.0380.0370.6070.0010.001金龍汽車0.4350.080.040.7670.0530.007綠庭投資0.0240.0320.0170.2850.2630.002匹凸匹-0.128-0.078-0.0490.56900三安光電0.460.0920.0640.2810.0140.002文投控股0.0830.088-0.0070.7470.1410.0013.2處理數據股票名字基本每股收益(元)凈資產收益總資產收益資產負債比存貨周轉率總資產周轉云天化-0.473-0.05-0.541.574-0.1630.279浪莎股份-0.719-0.171-0.696-1.418-0.163-0.73長春一東-0.514-0.033-0.394-0.068-0.163-0.096中閩能源-0.757-3.522-0.7670.36-0.163-0.815北京城建0.5520.151-0.3450.601-0.163-1.06酒鋼宏興-1.93-1.591-1.7010.773-0.1621.394國旅聯合-0.4830.279-0.1540.16-0.162-1.114龍凈環保0.1730.459-0.1540.872-0.163-0.275海潤光伏-0.56-0.042-0.5120.69-0.162-0.632亨通光電0.2120.204-0.1360.605-0.1630.582天士力1.7740.7430.671-2.106-0.1620.654匯通能源-0.48-0.023-0.4620.1976.0021.939龍頭股份-0.2970.078-0.233-0.855-0.1632.358浙報傳媒0.1860.4640.56-0.878-0.158-0.418新黃浦0.030.1310.060.362-0.163-1.132金龍汽車0.5390.3960.1081.03-0.1621.136綠庭投資-0.5350.092-0.274-0.983-0.157-0.792匹凸匹-0.931-0.598-1.3790.203-0.163-1.373三安光電0.6040.4750.504-0.999-0.163-0.801文投控股-0.3820.449-0.6750.948-0.16-1.1144聚類分析聚類分析的目的是把分類對象按一定規劃分成若干類,這些類不是事先給定的,而是根據數據的特征確定的,這在某種程度上證明對類的數目和類的結構不必做任何假定。在同一類里這些對象在某種意義上傾向于彼此相似,而在不同類里的對象傾向于不相似(林俊杰,孫婉清,2022)。通過總結現有階段性的研究成果,本文可以為后續研究提供一定的指導。首先,在研究方法上,本文能夠發現一系列可以優化和改進的地方。先前的研究階段為本文提供了寶貴的經驗教訓,揭示了哪些方法是有效的,哪些需要進一步調整或摒棄。例如,在數據收集方面,本文可以更加注重樣本的多樣性和代表性,確保所選取的樣本能夠準確反映目標群體的整體特征。此外,針對不同的研究問題,靈活運用多種數據收集技術可以提高數據的全面性和可靠性。聚類分析常常用來探索“自然的”或“實在的”類的數目實現都是未知的(陶哲瀚,葉慧玲,2019)。聚類分析可根據分類的對象分為R型聚類分析和RQ型聚類(吳志強,王秀英,2019)。4.1定距型變量個體間的距離離就越大,所以距離實際上是一個不相似性的度量(葉偉明,陳靜嫻,2020)[7]。設x(x1,x2,,xp)和y(y1,y2,,yp)為兩樣本,則所定義的距離一般應該滿足如下三個條件:1.非負性:d(x,y)0且d(x,y)0當且僅當xy;d(xyd(xy)d(x,y)d(x,z)d(z,y)類(王宇軒,劉雅欣,2023)。當考慮慮變量間的相關性的距離有明考夫斯基(Minkowski)距離,公式如下(李語嫣,陳云濤,2020):當各變量的單位不同或變異性相差很大時,應先對各變量的數據做標準化處理,然后再用標準化后的數據計算距離13。常用的標準化處理中xi和sii分別為樣本均值和樣本方差。在明考夫斯基距離中根據q值距離分為三種情況(張曉彤,劉美靜,2021):當q1時,稱為絕對值距離,公式如下:當q2時,稱為歐氏距離,公式如下:當q時,稱為切比雪夫距離,公式如下:一般人們經常用到的是歐氏距離(薛宇峰,馬思敏,2021)。在這等情況下考慮慮變量間的相關性的距離另一個是蘭氏(Lance和Williams)距離:蘭氏距離無需標準化,適用于或漢異常值的數據。第三個是馬氏距離,其公式表達式如下:其中s樣本協方差矩陣(李宇浩,王婧怡,2023)。遵循這種理論框架進行調研可獲知最后一個是斜角空間距離,公式如下:其中rij是第i個變量與第j個變量之間的相關系數。當p個變量都互不相關時,該距離為歐氏距離的1/p倍[8]。4.2系統聚類法系統聚類法(或層次聚類法)是通過一系列相繼的合并或一系列相繼的分割來進行的,分為聚焦的和分割的兩種,適用于樣品數目n不是非常大的情形(羅思琪,王文彬,2021)。4.2.1系統聚類法的思想聚集系統法的基本思想是:開始時將n個樣本各自作為一類,并規定樣品之間的距離和類與類之間的距離,綜合以上所做的分析內容然后將距離最近的兩類合并成一個新類,計算新類與其他類的距離;重復進行兩個最近類的合并,每次減少一類,直至所有的樣品合為一類,分割系統法的聚類步驟與聚集系統法正好相反(李婷怡,周雅涵,2023)。由n個樣品組成一類開始,按某種最優準則將它分割成兩個盡可能遠離的子類,再用同樣準則將每一子類進一步地分割成兩類,鑒于上述分析得出從中選一個分割最優的子類,這樣類數將由兩類增加到三類。本文的框架模型建立在現有理論基礎之上,無論是在信息流動還是數據分析方法上,都體現了對前人研究成果的尊重與繼承,并在此基礎上進行了創新與發展。首先,在信息流動的設計方面,本文借鑒了經典的信息處理理論,確保信息從采集、傳輸到分析的每一個環節都能夠高效且準確地進行。通過對數據來源的嚴格篩選和標準化處理流程,使得信息的質量得到了有效保障,從而也能夠更好地注重信息流動的透明度與可追溯性。如此下去,直至所有n個樣品各自為一類或采用停止規則(趙海龍,劉瑞琪,2020)。4.2.2系統聚類法的方法以下我們用dij表示第i個樣本與第j個樣本的距離,G1,G2表示類,DKL表示GK與GL的距離。本論文所用到的聚集系統聚類法中每個樣品都是自成一類(謝志杰,李夢琪,2017),類與類之間的距離和樣品與贗品之間的距離相同(除立離差平方和法之外)即DKL=dKL,所以,初期的距離矩陣全部相同,記為D(0)=dij。在聚類之前先對各變量作標準化變化,在這樣的大環境之下以保證各變量在聚類中所起的作用相同。以下介紹幾種系統聚類的方法(程思遠,蔣夢琪,2017):1.最短距離法(或單鏈接法)定義類與類之間的距離為兩類最近樣品間的距離,公式如下:聚類方法(程子和,蔣欣怡,2017):(1)規定樣品之間的距離,計算樣品的距離矩陣D(0),他是一個對稱矩陣;(2)選擇D(0)中最小的元素,設為DKL,則GK將和GL合并成一個新類,記為GM=GK∪GL(3)計算GM與任一類GJ之間距離的遞推公式為在D(0)中,GK和GL所在的行和列合并成一個新行新列,對應GM,該行列上的距離值有上市遞推公式所求的,在此現實背景下其余行列上的距離值不變,這樣我們就得到了新的距離矩陣,記為D(1)(程浩宇,蔣夢琳,2021)。就上述階段性研究成果與計算結論而言,和前文綜述的結果大體一致。這首先意味著本研究在方法論方面切實有效且可靠。這種一致性,既驗證了先前研究得出的結論,又為現有的理論框架提供了額外的支撐依據。通過嚴密的研究設計流程、全面的數據收集舉措以及精確的分析方法,本文能夠復刻前人研究中的關鍵成果,進而在此基礎上開展深入研討。這不僅提升了對研究假設的信任度,也證明了所采用研究方法的科學性。此外,該一致性為跨研究的比較提供了基準,有助于推動更為完善、系統的理論體系的形成。對D(1)重復上述對D(0)的兩步得到D(2)。如此下去,知道所有的類都合并為一類為止。需要注意的是如果D(m)中最小的元素不止一個,則稱此現象為結,對應這些最小元素的類,由此可見一斑可以任選一對或同時合并。該方法不適合對分離很差的群體進行聚類(程頂遠,蔣雅琳,2021)[9]。2.最長距離法(或完全鏈接法)定義類與類之間的距離為兩類最遠樣品間的距離,即聚類方法(梁欣怡,李杰群,2022):(1)規定樣品之間的距離,這些行為透露出一些意圖計算樣品的距離矩陣D(0),他是一個對稱矩陣;(2)選擇D(0)中最小的元素,設為DKL,則GK將和GL合并成一個新類,記為GM=GK∪GL(3)計算GM與任一類GJ之間距離的遞推公式為在D(0)中,GK和GL所在的行和列合并成一個新行新列,對應GM,該行列上的距離值有上市遞推公式所求的,這在某種程度上證明其余行列上的距離值不變,這樣我們就得到了新的距離矩陣,記為D(1)。對D(1)重復上述對D(0)的兩步得到D(2)。如此下去,知道所有的類都合并為一類為止。但是該聚類方法容易被異常值嚴重扭曲(劉晨曦,李馨雨,2020)。3.類平均法(或平均鏈接法)定義一:把類與類之間的距離定義為所有樣品之間的平均距離,即定義GK和GL之間的距離為其中nK和nL分別為類GK和GL的樣品個數,dij為GK中的樣品i與GL中的樣品j之間的距離。容易得到GM與任一類GJ之間距離的遞推公式:定義二:類與類之間的平方距離為樣品對之間的平方距離的平均值,即GM與任一類GJ之間距離的遞推公式:這在某種程度上映射類平均法較好地利用了所有樣品之間的信息,在很多情況下它被認為是一種比較好的系統聚類法。重心法類與類之間的距離定義為它們的重心(均值)之間的歐氏距離。設GK和GL的重心分別為和,則GK與GL之間的平方距離為:合并GK和GL之后的新類GM的重心是它是和,的加權平均,這在某個角度上證明了其中為GM的樣品個數。GM與任一類GJ之間距離的遞推公式(李雅雯,張浩銘,2020):與其他系統聚類法相比,重心法在在處理異常值方面更為穩健,但在別的方面一般不如類平均法或利差平方和法的效果好。5.離差平方和法(或Ward方法)類中各樣品到類重心的平方歐氏距離之和稱為(類內)離差平方和。設類GK和GL合并成新類GM,則GK,GL和GM的利差平方和分別是(田晶晶,張偉鵬,2022)對固定的類內樣品數,在這等情況下他們反映了格子類內樣品的分散程度。若GK和GL這兩類相聚較近,則合并后所贈加的離差平方和WM-WL-WK應較小,否則,應較大。GK和GL之間的平方距離為或者離差平方和法的平方距離遞推公式如下:離差平方和法在許多場合下優于重心法,但其對異常值很敏感。4.3系統聚類結果近年來中國股市的發展壯大是有目共睹的,遵循這種理論框架進行調研可獲知隨著中國的股市逐步走向完善、走向規模化價格及其內在價值回歸,是未來股市發展的重要方向。然而,股票漲價無常、股市變幻莫測,投資者要想在股市投資中贏取豐厚的回報,成為一個成功的投資者(孫鵬飛,李夢琪,2020)[10],綜合以上所做的分析內容就得認真研究上市公司的歷史業績和發展前景,詳細分析上市公司的財務情況,對上市公司的股票價值進行合理運算。聚類分析是一種行之有效的指導證券投資的方法。在選擇數據分析方法時,本文不僅運用了傳統的統計工具,如描述性統計和回歸分析,還融入了近年來快速發展的數據挖掘技術和算法。例如,通過聚類分析來發現數據中的潛在模式,或利用決策樹算法預測未來趨勢。這些先進的方法為深入理解復雜現象提供了強有力的支持,并有助于揭示隱藏在海量數據背后的深層次關系。此外,本文還特別強調了混合方法的應用,即將定量研究與定性研究相結合,以獲得更加全面的研究視角。運用聚類分析模型,能幫助投資者正確的理解和把握股票的總體特征,確定投資范圍,并通過類的總體價格水平,鑒于上述分析得出來預測股票價格的變動趨勢,選擇有利的投資時機(孫玉龍,郭婷婷,2019)。聚類分析首先是基于各類股票的行業因素、公司因素、收益性、成長性能基本方面的考察,然后利用綜合評價指標來衡量樣本股票的“相似程度"。聚類分析是建立在基礎分析之上的,立足于對股票基本層面的量化分析,彌補了基礎分析對影響股票價格的因素,大多是定性分析的不足。其次與現代投資組合理論相比,聚類分析法顯得直觀、實用,在這樣的大環境之下而且在應用時所受的局限小、操作性強,有一定的優越性,適合于廣大投資者采用(黃國華,趙曉宇,2019)。在這里我們以Ward法為操作原理、SPSS為操作工具對數據進行聚類分析。在進行聚類分析之前我們需對數據進行標準化處理,故這里我們用的是在之前標準化后的數據。圖5.1使用Ward聯接的樹狀圖4.4系統聚類結果分析根據SPSS得到的圖5.1可知,我們可將股票分為三類。第三類屬于中的股票屬于低收益的差勁股,表示盈利能力的三個指標每股收益、凈資產收益率和總資產收益率基本均為負數,說明上市公司基本沒有獲利,股東們的投資也是基本虧損的(劉嘉凱,龔佳麗,2021)[11]。在此現實背景下凈利潤同比增長率和要營業總收入同比增長率基本為負,說明其上市公司基本沒有什么成長性。總資產周轉率也基本接近于0,說明第三類的股票的公司的管理能力也非常差(陳瑞鵬,劉文浩,2024)。特別是較低的每股公積金和每股未分配利潤說明這一類的公司股本擴張能力較低,擴張余地較小,公司能夠提供的潛在能力也較弱。這一類的股票基本不具有投資的價值。第二類中的股票的每股收益都比較低,由此可見一斑尤其是總資產收益率基本接近于0,個別為負,說明該類的盈利能力非常低。但其庫存周轉率較高,說明該類的公司管理能力較強。在研究進程里對誤差的把控上,本文主要憑借一套嚴謹的辦法與舉措,來保障數據的精準性以及結果的可信度。先是悉心擬定詳盡的研究規劃,接著對可能引發誤差的各類要素展開全面的剖析與估量。這里面涵蓋了環境變量、人為操作的差別,還有數據計算的精準度等情況。運用標準化的操作步驟與技術手段,以此確保數據具備一致性與可重復性。為進一步提升數據品質,還推行了雙重數據錄入以及交叉驗證機制,從而切實規避了因人為大意或輸入失誤造成的數據偏差。利潤同比增長率也較高,說明該類公司具有較高的成長性。總的來說,該類股票相對第三類的股票來說比較具有潛力,但現在的效益不是太好。所以這一類的股票投資價值一般。第一類中的股票在行業中處于領先地位,盈利能力較強,經營狀況良好。有較高的凈資產收益率,每股凈資產也比較多,這些行為透露出一些意圖說明該類股票的盈利能力相當不錯,且股本擴張的能力也很強勁,有很大的潛力,發展前景也相當樂觀,應屬于投資者首選投資對象(劉書涵,陳思雨,2024)。在第一類的股票中,有個別股票的凈資產收益率小于這一類中的凈資產收益率這一指標的均值,這在某種程度上證明而利潤同比增長率、每股凈資產、每股公積金和每股未分配利潤均高于該類中這些指標的均值,說明這三只股票具有較高的成長能力和股本擴張能力。
5.動態聚類法在系統聚類法中,對于那些先前已經被錯誤分類的樣品不再提供重新的分配機會,而動態聚類法則允許樣本沖一個類移動到另一個類[12]。動態聚類法的計算量要比建立在距離矩陣上的系統聚類法的計算量小的多,這在某種程度上映射所以動態聚類法能夠對樣本量較大的樣本進行聚類5.1動態聚類法的基本思想動態聚類法的基本思想:選擇一批凝聚點或給出一個初始的分類,讓樣品按某種原則想凝聚點凝聚,對凝聚點進行不斷的修改和迭代,直至分類比較合理或迭代穩定為止(張逸凡,王靜怡,2023)。在數據解析階段,過往研究的經驗啟示本文應加大對新興分析工具和技術的運用力度。隨著信息技術的迅猛發展,諸如大數據分析、機器學習算法等先進工具正逐漸成為科學研究中的重要組成部分。這些技術不僅可以幫助本文更高效地處理海量數據,還能夠挖掘出傳統方法難以發現的深層次信息和模式。因此,在后續的研究中,本文應該積極探索如何將這些先進技術融入到本文的分析框架中,以提升研究結果的精確度和洞察力。類的個數k需事先指定一個。選擇初始凝聚點(或給出初始分類)的一種簡單方法是采取隨機抽選樣品的方法,這在某個角度上證明了可以要求凝聚點之間至少應間隔摸個距離值。動態聚類法值能用于對樣品的聚類。5.2動態聚類法的方法K均值法——比較流行的動態聚類法1.基本步驟:(1)選擇k個樣品作為初始凝聚點,獲獎所有樣品分為k個初始類,然后將這k個類的重心(或均值)作為初始凝聚點;(2)對除凝聚點之外的所有樣品逐個歸類,在這等情況下將每個樣品歸入離他最近的那個類(一般采用歐氏距離),該類的凝聚點更新為這一點的均值,直至所有的樣品都歸了類;(3)重復步驟直到所有樣品都不能再分類配了為止。2.聚類分析終止的兩個條件:(1)迭代次數。當目前的迭代次數等于指定的某個數時。(2)類中心點偏移程度。遵循這種理論框架進行調研可獲知新確定的類中心點距上次迭代所形成的類中心點的最大偏移小于所屬指定的值。5.3動態聚類法結果及分析首先,聚類分析是建立在基礎分析之上的,立足于對股票基本層面的量化分析,彌補了基礎分析對影響股票價格的因素大多是定性分析的不足。綜合以上所做的分析內容作為理性的長期投資的參考依據,鑒于上述分析得出其目的在于從股票基本特征決定的內在價值中發掘股票真正的投資價值。其次,在建立聚類分析模型時,進一步考慮了對股票投資價值有著重要影響的行業和公司的成長性。成長性是一個變化的趨勢,在哥登模型中,假設股息按不變的增長率g增長與實際情況不符。在這樣的大環境之下就是運用多階段增長模型,要準確地給出不同增長階段的參數g也是十分困難的。因此在探討股票的成長性時,選取了如主營收入增長率、凈利潤增長率等客觀指標,由此投資者就能正確預測股票的發展潛力(左景軒,牛俊杰,2021)。再次,與現代投資組合理論相比,聚類分析法顯得直觀、實用,而且在應用時所受的局限小,操作性強,在此現實背景下有一定的優越性,適合于廣大投資者采用。聚類分析建立的是一種長期投資的理念,因此在我國證券市場走向成熟的過程中,提倡運用這種理性的投資分析方法,不僅可以降低投資風險,規范投資行為,還有利于促進股票公司從經營業績和成長能力出發參與市場競爭,促進了我國證券市場的健康發展(金子睿,洪浩宇,2021)。由此可見一斑在進行聚類分析之前我們需對數據進行標準化處理,故這里我們用的是標準化后的數據。在這里我們以k均值法為操作原理、Matlab為操作工具對數據進行聚類分析。表5.1k均值法聚類結果股票名稱種類股票名稱種類云天化3天士力2浪莎股份2匯通能源3長春一東2龍頭股份2中閩能源1浙報傳媒3北京城建3新黃浦2酒鋼宏興1金龍汽車1國旅聯合1綠庭投資3龍凈環保2匹凸匹1海潤光伏3三安光電2亨通光電3文投控股3由上表可明顯看到聚類結果,聚成三類。第三類的股票中是低收益的差勁股,他的每股收益和粽子長收益率都是相對較低。特別是較低的每股公積金和每股為分配利潤說明這一類的公司股本擴張能力較低,擴張余地較小,這些行為透露出一些意圖公司能夠提供的潛在能力也較弱。在對理論架構的校驗與完善方面,本文收集到了充裕且精確的數據材料。這些數據所涉及的研究對象極為廣泛,還涵蓋了不同時期以及多樣的社會環境,進而為理論架構的全方位驗證給予了堅實有力的支撐。運用統計分析工具對定量數據加以處理,能夠切實檢驗原理論架構里的各項假設,同時察覺到其中存在的缺陷。后續的研究打算納入更多變量或者采用規模更大的樣本,以此進一步增強理論架構的闡釋能力與預測效能。負的營業總收入同比增長率說明第二類公司不具有成長能力,更不具備擴大市場規模的能力。第二類的股票中的股票,盈利能力非常差,每股收益、凈資產收益率和總資產收益率這三個指標均為負數(林俊豪,何雅瀾,2020)。這在某種程度上證明表示成長性的指標凈利潤同比增長率和營業總收入同比增長率均為負值,說明該類股票不具有成長能力。每股凈資產等表示股本擴張能力的指標也相對較低,所以這一類的股票投資價值一般。第一類中的股票在行業中處于領先地位,盈利能力較強,經營狀況良好。有較高的凈資產收益率,每股凈資產也比較多,這在某種程度上映射說明該類股票的盈利能力相當不錯,且股本擴張的能力也很強勁,有很大的潛力,發展前景也相當樂觀,應屬于投資者首選投資對象。在第一類的股票中,北京城建的凈資產收益率小于這一類中的凈資產收益率這一指標的均值,而每股凈資產、每股公積金和每股未分配利潤均高于該類中這些指標的均值,說明這只股票具有較高的成長能力和股本擴張能力。這在某個角度上證明了相比國內房地產行業的市盈率還是比較低的,說明該上市公司的股價目前還有很大上升空間。
6.聚類效果評價方差分析就是從對觀測變量的方差分分解入手,通過推斷控制變兩個水平下個觀測變量總體的均值是否存在顯著差異[13],反洗控制變量是否給觀測變量帶來了顯著影響,進而對控制變量各個水平對觀測變量影響的程度進行剖析。方差分析認為,觀測變量值得變化受兩類因素影響:在這等情況下一是控制因素,即不同水平所產生的因素(何子軒,趙天佑,2020);二是隨機因素所產生的影響,主要是指實驗過程的抽樣誤差。方差分析的基本思想:如果控制變量值在某控制變量的各個水平下出現了明顯的波動,則認為該控制變量是影響變量的主要因素;反之,如果控制變量值在某控制變量的各個水平下沒有出現明顯的波動[14],遵循這種理論框架進行調研可獲知則認為控制變量沒有對觀測變量產生重要的影響,觀測變量的數據波動基本是由抽樣誤差造成的。6.1方差檢驗首先應該構造檢驗統計量:當顯著性水平為時,臨界值為F(r-1,n-r)分布的1分位點。當F大于F(r-1,n-r)分布的1分位點或檢驗統計量的p值小于時,拒絕原假設,說明該因素的不同水平對總體均值有顯著性影響。綜合以上所做的分析內容當F大于F(r-1,n-r)分布的1分位點或檢驗統計量的p值大于于時,接受原假設,說明該因素的不同水平對總體均值沒有顯著性影響。6.2結果分析通過在MATLAB中求解方差檢驗,求得結果如下:表6.1MATLAB求得結果指標誤差平方和自由度組間誤差自由度組內誤差自由度組間誤差組內誤差F值x1373725.75211.253512.880.3240.07x2373724.63212.373512.310.3534.84x3373716.74220.26358.370.5814.47x437374.93232.07352.470.922.69x537370.81236.19350.411.030.39x637373.97233.03351.990.942.1x7373713.01223.99356.50.699.49x837370.9236.1350.451.030.44x9373719.26217.74359.630.5119x1037379.22227.78354.610.795.81x11373720.65216.353510.330.4722.1MATLAB中在給定的顯著性水平0.05下,除了x4,x5,x6和x8所對應的檢驗量的p值大于顯著性水平0.05外,其他變量的p值都小于顯著性水0.05。說明x4,x5,x6和x8對股票市場的影響不顯著,鑒于上述分析得出故我們認為在每股收益等這些影響因素里,每股收益、凈資產利潤率、總資產利潤率、凈利潤增長率、每股凈資產、每股公積金和每股未分配利潤這7個因素對股票市場的波動具有顯著的影響。7結論本文介紹了聚類分析和方差分析對證券投資指導作用。在這樣的大環境之下首先我們證券投資的專業知識,從上市公司的盈利能力等五個方面來考慮選取了每股收益、資產凈利潤增長率等11個指標作為一下的分析指標。再利用SPSS抽取20只股票進行分析,以分析的結果對總體進行估計。首先我們對原先選出來的11個指標進行聚類分析,在此現實背景下分別運用系統聚類法中的Ward法和動態聚類中的k均值法對其進行聚類。依據每個類中的各個指標,判斷出業績較好的類,業績一般的類和業績較差的類。其次在我們所選取的指標中,由此可見一斑由于我們是從上市公司的能力的5個方面來考慮,選取了11個指標,所以指標之間可能存在著相似性,信息可能會重疊,且11個指標比較多,對我們后面的分析增加難度。所以我們對其進行主成分分析,將相似性較大的指標合并了起來,不僅能夠達到降維的效果,而且可以更直觀的反映分析的結果。附錄表8.15個指標標準化處理數據股票名字每股收益凈資產收益率總資產收益率存貨周轉率總資產周轉率云天化0.225-0.1490.1881.202-0.734浪莎股份-0.183-0.2270.1131.134-0.547長春一東0.07-0.196-0.531-0.815-0.174中閩能源0.19-0.22-0.9980.079-1.691北京城建0.134-0.1652.3410.3921.85酒鋼宏興-4.747-0.216-0.68-0.498-0.699國旅聯合0.271-0.166-1.105-1.152-0.831龍凈環保0.158-0.133-0.027-0.6180.59海潤光伏0.365-0.165-0.856-0.631-0.78亨通光電0.178-0.1150.7630.451.13天士力0.142-0.1560.678-0.1341.264匯通能源0.195-0.204-0.276-0.636-0.031龍頭股份0.153-0.157-0.1250.244-0.208浙報傳媒0.137-0.137-0.298-0.385-0.014新黃浦0.185-0.1720.622-0.0061.012金龍汽車0.241-0.1330.441-0.2921.037綠庭投資0.275-0.156-0.964-0.869-1.226匹凸匹-1.62-0.229-0.828-1.174-0.34三安光電0.164-0.150.280.4750.339文投控股0.2655.994-0.6370.942-1.717[X,TX]=xlsread('ward.xlsx');Y=zscore(X);%數據標準化g=[X(:,12)][d,p,s]=manova1(Y(:,1:11),g)%多元方差分析K均值法聚類及方差分析:[X,TX]=xlsread('源數據1.xlsx');Y=zscore(X);%數據標準化rand('twister',1);[idx,C]=kmeans(Y(:,1:11),3);%kmeans方法n=hist(idx,3)%各類包含的個數[d,p,s]=manova1(Y(:,1:11),idx)%多元方差分析%以下一元方差分析SSTR=diag(s.B);%類間平方和SSE=diag(s.W);%類內平方和F=SSTR/s.dfB./(SSE/s.dfW);%F統計量p=1-fcdf(F,s.dfB,s.dfW);%p值anov1b=[diag(s.T),s.dfT*ones(length(SSTR),1),SSTR,s.dfB*ones(length(SSTR),1),SSE,s.dfW*ones(length(SSTR),1),SSTR/s.dfB,SS
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合作共建基地協議書
- 醫院客服外包協議書
- 員工失職賠償協議書
- 華為維修免責協議書
- 財務報告審計的主要內容試題及答案
- 分居財產分配協議書
- 2025年工業污染源全面達標排放技術標準與規范研究報告
- 合同部分收款協議書
- 印刷制作月結協議書
- 提高能力2025年財務管理考試試題與答案
- 《陣列式消聲器技術要求》(T-CAEPI 17-2019)
- 社區警務工作培訓
- 山西省眾輝公司招聘考試題庫
- 骨科手術的風險與并發癥預防措施
- 現代室內設計發展趨勢分析
- 農業企業計劃書
- 2023屆天津市河東區高三二模語文試題(解析)
- SWAN產品數據格式說明-包括D131、D35、自動站時序數據、SCIT、TITAN
- 上海中考數學考試大綱
- 一種改進的ip-q諧波電流檢測方法
- 獨醒之累:郭嵩燾與晚清大變局
評論
0/150
提交評論