




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第七章 有序地質量最優分割法楊永國中國礦業大學資源與地球科學學院 內容提要:n第一節 概述n第二節 單元有序數據的最優分割n第三節 多元有序數據的最優分割n第四節 最優分割法的計算步驟第一節 概述n 地質數據中有相當多是有序的。這些按一定順序排列的地質變量,叫做有序地質量。例如,沿地層露頭剖面采集的巖石標本;鉆孔取出的巖芯樣品; n 這類數據的特點是樣品的前后次序不能變更。所以,一些不考慮樣品排列順序的數學處理方法,對此不適用。有序地質量最優分割法,就是對一批有序數據(地質體)進行分段的統計方法。 第一節 概述n設有n個按順序排列的樣品,每個樣品測得p個變量,這批數據可用數據矩陣的形式表示為p
2、nnpnnppilxxxxxxxxxxX212222111211ilx其中, 表示第 i個樣品第l個變量的取值。第一節 概述 若對以上n個有序樣品進行分割(分段),可能有 種劃分方法,每一種分法稱為一種分割。 對n個樣品分段并使組內離差平方和最小的分割方法,稱為最優分割法。樣品變量總離差平方和的分解式為: T=W+B (7-1)式中,T為總離差平方和;W為組內離差平方和;B為組間離差平方和。121112211nnnnnccc第一節 概述n由式(7-1)可知,如果n個樣品分為K段,每段的樣品個數為nk,若每個樣品只取一個變量,則 n KknikikkxxW112)(KkkkKknikxxnxxB
3、k12112)()(7-2)(7-3)第一節 概述 因此,尋求最優分割,就是用計算的方法找出使組內離差平方和(W)最小的那些分割點。這與判別分析中費歇準則相似,所以有序地質量最優分割法,有人又稱為“F-分割法”或“有序樣品的聚類分析”。 第二節 單元有序數據的最優分割n主要內容:n一、最優二段分割n二、最優三段分割n三、最優K段分割第二節 單元有序數據的最優分割 若有n個有序樣品,每個樣品只取一個變量,則有n個有序數據序列,為 現在試圖將這n個樣品按順序分割為K段,使段(組)內離差平方和盡可能小,而組間離差平方盡可能大。為此,用 xi,xi+1,xj表示從第i個樣品數據開始至第j個樣品數據為止
4、的某段樣品,其中 1ijn 該段樣品變量的離差平方和為,21nxxxXjaajixxjid12),(),((7-4)第二節 單元有序數據的最優分割n式中n 愈小,表示段內各樣品之間差異性愈小;反之, 愈大,表示段內各樣品之間的差異愈大。因此,又把 稱為 i,j段的段直徑。 jiaaxijjix11),(),(jid),(jid),(jid第二節 單元有序數據的最優分割 在實際應用時,往往事先不知道n個有序樣品客觀上究竟能劃分成幾段。因此,必須從最優分成二段、三段、K段進行分析。第二節 單元有序數據的最優分割一、最優二段分割 若把n個有序樣品 分為兩段,則有如下n-1種不同的分法,即 nxxx,
5、21,121543214321321nnnnnxxxxxxxxxxxxxxxxxxx第二節 單元有序數據的最優分割 在n個有序樣品中,對任意一個j(1jn-1)都可以確定一個二段分割,即1,jj+1,n。若把對n個樣品在第j個樣品處進行的二段分割的組內離差平方和記為 式中,n表示被分割的樣品數;2表示把n個樣品分為二段;j表示以第j個樣品為分割點。), 1(), 1 (); 2(njdjdjWn第二節 單元有序數據的最優分割二、最優三段n若把n個有序樣品 分為三段,其中必有兩個分割點。假設第 和第j個樣品為分割點,則三段分割為n若把三段分割的組內離差平方和記為:n其中a1,j為兩個分割點(1
6、a1j-1, 2jn-1),則n顯然,如果有 為最優三段分割,則 必為最優二段分割 。,21nxxx)(1ja,11axx ,11jaxx1,jnxx); 3(1jaWn), 1(); 2(), 1(), 1(), 1 (); 3(1111njdaWnjdjadadjaWjn); 3(1jaWn); 2(1aWjn因此,如果對n個有序數據進行最優三段分割,必須對任意一個j(2jn-1),即前j個數據先求出其最優二段分割,為n若n則前j個樣品的最優二段分割為), 1()(, 1 )(; 2111jadjadjaWj1)(111)(; 2min); 2(1jjjajjaWaW,11axx ,11j
7、axx第二節 單元有序數據的最優分割三、最優K段分割 若對n個有序樣品數據 進行最優K段分割,可先找出前j(K-1jn-1)個樣品的最優K-1段最優分割,即,21nxxx),; 1(221kjaaaKW 應當指出,分割的段數K一直可做到所要求的段數K為止;或者可以預先給定一個小正數 ,使K段分割的組內離差平方和 后為止。這樣得出的K就是最后的分割的段數。 121( ;,)nkW K a aa第二節 單元有序數據的最優分割 n 由圖7-1所示組內離差平方和是隨分段段數K的增加而單調地減少。所以當K=n時,組內離差平方和為零。因此,可根據組內離差平方和隨段數增加而下降到比較穩定的時候(即圖中曲線平
8、緩時)再確定分段段數。 圖圖7-1 組內離差平組內離差平方和(方和(W)與分)與分段數(段數(K)關系圖)關系圖第三節 多元有序數據的最優分割 為了分層,有時需要匯集樣品更多的信息,采用多個變量指標。例如,采集n個有序樣品,每個樣品測得p個變量,原始數據可構成一個階矩陣,為pnnpnnppxxxxxxxxxX212221111211第三節 多元有序數據的最優分割 在多變量情況下,人們自然會聯想到是否能將單元有序數據最優分割原理引伸到多元數據中來,以此對n個有序樣品進行分割,一般最簡單有效的辦法就是把一段樣品多個變量合并為一個變量來處理,統一定義“段直徑”。但是,為了使不同變量具有共同的數據基礎
9、,事先要對各個變量進行數據規格化處理,如使數據作正規化變換。原始數據矩陣中元素記為: ,則正規化數據為 ), 2 , 1;, 2 , 1(plnixil)minmax()min(111ilniilniilniililxxxxx(7-8)第三節 多元有序數據的最優分割得正規化數據矩陣pnnpnnppzzzzzzzzzZ212222111211第三節 多元有序數據的最優分割n根據正規化數據,將樣品段 i,,j的段直徑定義為n (7-9)n式中n(1 ijn, =1,2,p) (7-10)jiapjizzjid12),(),(jizijjiz11),(第三節 多元有序數據的最優分割n若n個有序樣品分
10、為K段,每段內有nk個樣品,則多元有序數據最優分割的原理與單元有序數據最優分割一樣,使組內離差平方和n應當指出,樣品的段直徑除了用式(7-9)定義外,還可用其它方法定義。),(,),(),(;min),(),(),(),(),;(2211111221121jjajajaKwjizzjidjidjidaaaKWKnnjKKknipkkKKnk第四節 最優分割法的計算步驟1、數據正規化設原始數據矩陣為pnnpnnppxxxxxxxxxX212221111211第四節 最優分割法的計算步驟n將X中的元素xil變換為n(i=1,2,,n;l=1,2,p)n得正規化數據矩陣)minmax()min(11
11、1ilniilniilniililxxxxzpnnpnnppzzzzzzzzzZ212222111211第四節 最優分割法的計算步驟n2、計算段直徑矩陣Dn其中n因為jiapnjijizzjid121 ),(),(jizijjiz11),()(),()(0),(jiijdjijid第四節 最優分割法的計算步驟n故只須計算 個 ,得2) 1( nn),(jidnnnndnddndddD),(), 2()2 , 2(), 1 ()2 , 1 () 1 , 1 (第四節 最優分割法的計算步驟3、計算全部分割的組內離差平方和(或段直徑和)及各種分段的最優分割1)最優二段分割 由D矩陣對每一個m=n,n
12、-1,2計算相應的組內離差平方和,為找出最小值,確定響應的最優二段分割點,即) 1, 2 , 1(), 1(), 1 (); 2(mjmjdjdjWm); 2(min)(; 2111jWmaWmmjm第四節 最優分割法的計算步驟 2)最優三段分割 根據D矩陣及最優二段分割結果,對每一個m=n,n-1,3計算相應的三段分割的組內離差平方和,為然后求出最小值,并確定相應的最優三段分割點,為3 , 1,1, 3 , 2), 1()(; 2),(; 311nnmmjmjdjaWjjaWjm),(; 3min)(),(; 311221jjaWmamaWmmjm第四節 最優分割法的計算步驟3)最優K段分割
13、 根據矩陣D及最優K-1段分割計算結果,對于每一個m=n,n-1,K分別計算相應的K段分割的組內離差平方和,為找出最小值,并確定相應的最優K段分割點,即KnnmmKKjnjdjajajaKWjajajaKWKjKm, 1,1, 1), 1()(,),(),(; 1,),(),(;221221),(,),(),(;min)(,),(),(;22111121jjajajaKWmamamaKWKmmjKKm第四節 最優分割法的計算步驟4 繪制W-K曲線 在W-K曲線上,選擇曲線拐點對應的K值(取整)作為最終分段數。第四節 最優分割法的計算步驟 例7-1 某煤礦所采煤層的煤質牌號為主焦煤。在煤巷中見一
14、火成巖墻侵入煤層,致使煤質發生變化,為弄清楚煤質變化情況,從火成巖附近每隔0.5m依次取一煤樣,獲得6個有序煤樣的鏡煤最大反射率數據為 試進行最優分割。45. 1 ,50. 1 ,80. 1 ,35. 2 ,95. 2 ,20. 3,(%)6543210 xxxxxxR第四節 最優分割法的計算步驟 此樣本的可能分割法共有25-1=31種,今要在這31種分割中找出一種最優的分割(類內差別小,類間差別大)。其作法如下:(1)對原始數據進行正規化變換后得正規化數據,為(2)計算直徑矩陣D,即0 ,0286. 0 ,2000. 0 ,5143. 0 ,8571. 0 ,0000. 1Z第四節 最優分割
15、法的計算步驟00004. 000234. 00147. 001673. 01214. 00494. 005280. 04000. 02161. 00588. 00091336880. 03861. 01246. 00102. 00)6 , 6()6 , 5()5 , 5()6 , 4()5 , 4()4 , 4()6 , 3()5 , 3()4 , 3()3 , 3()6 , 2(5 , 2()4 , 2()3 , 2()2 , 2()6 , 1 ()5 , 1 ()4 , 1 ()3 , 1 ()2 , 1 () 1 , 1 (dddddddddddddddddddddD第四節 最優分割法的
16、計算步驟(3)最優二段分割。由D對于m=6,5,4,3,2時,計算) 1, 2 , 1(), 1(), 1 (); 2(mjnjdjdjWm第四節 最優分割法的計算步驟第四節 最優分割法的計算步驟第四節 最優分割法的計算步驟第四節 最優分割法的計算步驟 從而得到6個樣品的最優二段分割為: 其中, 為分割點。(4)最優三段分割。即對于m=6,5,4,3時,計算當m=6時,則分割點為: ,654321xxxxxx3x1, 2 , 1), 1()(; 2),(; 311mjmjdjaWjjaWjm1316. 0)6 , 6()5(; 25),5(; 31516daWaW0600. 0)6 , 5()
17、4(; 24),4(; 31416daWaW0336. 0)6 , 4()3(; 23),3(; 31316daWaW1673. 0)6 , 3()2(; 22),2(; 31216daWaW0336. 0 3),3(; 3),(; 3min)6(),6(; 3161652216aWjjaWaaWj; 2) 3()6(11 aa3)6(2a第四節 最優分割法的計算步驟第四節 最優分割法的計算步驟第四節 最優分割法的計算步驟第四節 最優分割法的計算步驟(5)最優四段分割。即對于m=6,5,4時,計算當m=6時,則1, 4 , 3), 1()(),(; 3),(),(; 42121mjmjdjajaWjjajaWjm第四節 最優分割法的計算步驟第四節 最優分割法的計算步驟第四節 最優分割法的計算步驟(6)最優五段分割。即對于m=6,5時,計算5 , 4), 1()(),(),(; 4),(),(),(; 5321321jmjdjajajaWjjajajaWjm第四節 最優分割法的計算步驟當m=5時,則其中則其分割點為: 0)5 , 5()4(),4(),4(; 44),4(),4(),4(; 532143215daaaWaaaW04),4(),4(),4(; 5)5(),5(),5(),5(; 5321543215aaaWaaaaW; 1)4(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中學文綜試題及答案
- 中醫診斷學試題及答案
- 金融行業財務記賬代理合同
- 成都事業單位員工勞動合同續簽與變更合同
- 廁所工程節水減排設計與施工合同
- 成都租賃合同(含租客入住前檢查)
- 彩票銷售渠道拓展與區域市場合作協議書
- 長沙市二手房買賣合同(20篇)
- 上海市企業信息化實施現狀分析報告
- 計算機嵌入式硬件評測試題及答案
- 2025年基金與投資管理考試試卷及答案
- 2025年河北省中考乾坤押題卷物理試卷B及答案
- 幼兒園中班創意美術《甜甜圈》課件
- Starlink低軌衛星通信星座深度分析
- 江蘇省無錫市2023年中考物理試題(含答案)
- 2023年廣東初中學業水平考試生物試卷真題(含答案)
- GB/T 7759.2-2014硫化橡膠或熱塑性橡膠壓縮永久變形的測定第2部分:在低溫條件下
- 2023年中原農業保險股份有限公司招聘筆試題庫及答案解析
- GB/T 24782-2009持久性、生物累積性和毒性物質及高持久性和高生物累積性物質的判定方法
- 微創冠狀動脈搭橋手術方法及圍術期處理原則微創冠脈搭橋進展課件
- 住院患者出院后的隨訪與指導流程圖
評論
0/150
提交評論