一類模糊數據的相關系數研究_第1頁
一類模糊數據的相關系數研究_第2頁
一類模糊數據的相關系數研究_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

摘要在統計學中,經常用(皮爾森)相關系數表達兩個變量之間線性關系的強弱,并揭示關系方向。相關系數所處理的數據都是明確實數值,但當數據是模糊數據時,如何計算此類模糊數據的相關系數一直困擾著統計學研究者。鑒于此,研究當數據為模糊數據比如區間數據時,探討這種模糊數據相關系數,提出一類模糊數據相關系數的定義,并考察將影響大學生數學成績的量化因素當成模糊區間數據進行實證研究分析,得出更符合實際情況、合理的預期結果。同時,研究將模糊區間數據相關定義用于兩種數據都是實數或其中一組數據是實數的情況,揭示出這種廣義模糊相關系數,可用于更廣泛的應用領域。關鍵詞:模糊數據;區間數據;廣義模糊數據;相關系數中圖分類號:f224.0文標志碼a文章號:1673-291x2015)02-0248-04一、人類認知和思維的模糊性人類思維主要源自對自然現象和社會活動的認知意識,因而人類知識語言會因本身的主觀意識、時間、環境和分析事情的角度不同而具有模糊[1,2]。果想要了解某兩個變量如x與y兩個象之間的關系程度一種最直接方法是先(y一組數據的散布圖畫出來察x與y這兩個變量間呈現何種程度的關系畫出數據組散布圖與y之的相關性。事實上,任意個變量之間必定存在某種關系,具體來說包括正相關、負相關或統計無關。因此,測量關系程度的大小則是極為重要的。在統計學上,使用皮爾森相關系數pearsonscorrelationcoefficient)表達兩個變量間線性關系的強度,同時也表達出關系方向。以往相關系數所處理的數據都是明確實數值,但當數據是模糊數據比如區間時,就應適合運用傳統方法計算模糊相關系數(fuzzycorrelation社會科學領域中,就搜集到的數據而言,尤其是關于人類的認知及自身活動,絕大部分都體現出模糊數據的特征近20年來多研究者開始探索如何將模糊數學用于計算數據的類似性和相關性,如ragin2000)和smithson1987)就探究如何將模糊理論用于社會科學,林原宏(2004)提出模糊相關系數即針對模糊性數據,衡量其類似性(similarity)和相關性的系數類似性是計算兩個模糊數據(或模糊集合)的類似程度,相關性則是計算一組模糊數據樣本每個模糊樣本點的兩個模數據相關性管獻中存在許多不同公式liu與kao(2002)[6]研發現,已有模糊數據相關系數仍存在一些問題,有待進一步完善和發展。本文研究將針對區間模糊樣本數據值求得模糊相關系數,將區間型模糊數據分為離散型和連續型,并依據liu等所提出關系數方法先求得模糊相關系數,再對相關系數做適當調整,能使所求出相關系數更加精確。此公式也能用于兩個數據為實數或其中一個數據值為實數的情況,可解釋更多在實際應用中所發生的相關現象。二、以往相關系數定義的不足之處如果想了解x與y兩個現象之間的關系程度,一種最直接方法是,先將x,y)的數據散布圖畫出來。到底x與y這兩量之間呈現何種程度的關系,通過數據散布圖可以查看它們之間的相關性。事實上,任意兩個變量之間必定有關系存在,包括正相關、負相關、或統計無關。因此,測量關系程度的大小是關注焦點。三、一類新的模糊數據相關系數首先考xiyi)第i對本值i=12?與yi均示區間模糊數;x及y分別表示其樣本平均數。研究的兩個變量都是模糊數據時,分別對兩個變量取得模糊區間ixλ與iyλ,如圖。將區間型模糊數間均勻分配兩變量各個樣本區間中心點xi、yi作代表值。當模糊數據為區間型模糊數據,用公式分別兩變量x,取樣本,得

模糊數據的重心值xiyi當代表值針對相關系數值rxy再考慮連續區間模糊數長度不一樣,或區間隸屬度不同,因此必須考慮區間的相關效應。若將兩種相關系數等重相加,所得結果的相關系數可能有一邊出現大于1或小-1情間長度相關效應也不應該重于中心點相關效應。因此,為對區間數據進行合理修正相關系數,用公式加以調整,得到更具有合理性的模糊數據相關系數慮取以為底自然對數ln函數行轉換連區間樣本xi的度連區間樣yi的度lyi,則修正長度相關系數為四、實證應用分析本節給出區間模糊數相關系數的實例應用面例3.1處i組量均為實數;(ii)一組變量為連續型等距尺度區間模糊數據,另一組變量為實數,與)組變量皆為連續型等距尺度模糊數據的情形4.1.3與均是兩組變量皆為連續型等距尺度模糊數據,并利用定義3.1公計算相關系數。(一)上網時間與數學成就考察哈爾濱市某高校新生影響數學成績因素機查10學生用糊問卷的方式[7],定各指標的重要性,問題是探討學生數學分數與上網時間是否有內在的聯系(即關系1.學生數學分數xi)為實數,上網時間yi亦為實數根據皮爾森相關系數計算公式學平均成績和平均上網時間的相關系數-也就是學生的平均成績越高,上網時間越少。2.學生數學分數xi)為實數,上網時間yi為區間模糊數假如想要知道數學平均分數和上網時間模糊區間之間的相關系數,這時搜集到的數據如表2。在這個例子里,調查“學生每周上網時數的模糊區間錄“數學平均成績算相關系數,因“學生每周上網時數的模糊區間”經過模糊統計,故為一組模糊數據,而“數學平均分數為組實數用義3.1得到模糊相關系數-0.79由此可知當糊相關系數其中一組為實數時其關系數會等于皮爾森相關系數。3.學生數學分(為區間模糊數,上網時間()區間模糊數據如果研究者搜集到學生一周之間的數學成績分布,為了方便起見,以每10分一區間,則表1的學平均分數變為表3由此表可計算數學分數和上網時間的模糊相關系數。利用定義1可知數學分數與上網時間的區間模糊相關-0.79-0.74關數呈現高度負相關的關系,也就是數學分數越高,上網時數越少,學生每周上網時數會對數學學業成績產生負面的影響。(二)睡眠時間與數學成就為了認識“影響數學成績因素10位生“每天睡眠時間”做模糊問卷調查,并求模糊相關系數,將“每天睡眠時間”指標的問卷結果整理如表4。呈現低度正相關的關系學生眠時數越多學績越好睡時間的影響不大,但仍有一些關系。(三)睡眠時間與上網時間現在考察“每天學生睡眠時間”與“學生一周上網時間”是否有相關,兩組都是區間模糊數據,經收集整理得到下面模糊區間,如表示。表5顯示出低度相關的關系,代學生睡眠時數與上網時間并沒有非常直接關系。這里主要探討影響數學成績因子,并計算與數學成績與其他因子之間的模糊相關系數。通過整理得到表6,從表6得知睡眠時間、上網時間、與學生數學成績之間的區間相關系數。對于學生數學成績影響較大的為上網時間,學生上網時間越多,成績越差。而睡眠時間則和數學成績呈現低度正相關的情形睡眠時間長學成績會越好影幅度較小。

五、結論對于以往相關系數來說,由于模糊

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論