




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
機器學習-FP-GROWTH算法李家豪機器學習-FP-GROWTH算法李家豪目錄2Apriori算法和FP-GROWTH算法的比較FP-GROWTH算法原理FP-GROWTH代碼實現(python)示例:從新聞網站點擊流中挖掘新聞報道目錄2Apriori算法和FP-GROWTH算法的比較FP-回憶Apriori算法3項集:項的集合稱為項集,即商品的組合。k項集:k件商品的組合,不關心商品件數,僅商品的種類。頻繁項集:如果項集的相對支持度滿足給定的最小支持度閾值,則該項集是頻繁項集。強關聯規則:滿足給定支持度和置信度閾值的關聯規則支持度:support(A->B)=P(AB)置信度:confidence(A->B)=P(A|B)回憶Apriori算法3項集:項的集合稱為項集,即商品的組合回憶Apriori算法4回憶Apriori算法4回憶Apriori算法5回憶Apriori算法5Apriori算法的挑戰6挑戰多次數據庫掃描巨大數量的候補項集繁瑣的支持度計算改善Apriori:基本想法
減少掃描數據庫的次數
減少候選項集的數量簡化候選項集的支持度計算Apriori算法的挑戰6挑戰FP-GROWTH算法優點相比Apriori算法需要多次掃描數據庫,FPGrowth只需要對數據庫掃描2次。第1次掃描事務數據庫獲得頻繁1項集。第2次掃描建立一顆FP-Tree樹。7FP-GROWTH算法優點相比Apriori算法需要多次掃描FP-GROWTH算法原理-實例1要找總是一起購買的商品,比如[薯片,雞蛋]就是一條頻繁模式(規律)。8IDItems1牛奶,雞蛋,面包,薯片2雞蛋,爆米花,薯片,啤酒3牛奶,面包,啤酒4牛奶,雞蛋,面包,爆米花,薯片,啤酒5雞蛋,面包,薯片6雞蛋,面包,啤酒7牛奶,面包,薯片8牛奶,雞蛋,面包,黃油,薯片9牛奶,雞蛋,黃油,薯片FP-GROWTH算法原理-實例1要找總是一起購買的商品,比FP-GROWTH算法原理-實例1-統計頻次Step1:先掃描數據庫,統計所有商品的出現次數(頻數),然后按照頻數遞減排序,刪除頻數小于最小支持度的商品。設最小支持度數為:minsup=4統計頻數:牛奶6,雞蛋7,面包7,薯片7,爆米花2,啤酒4,黃油2.降序排序:薯片7,雞蛋7,面包7,牛奶6,啤酒4(刪除小于minsup的商品)9IDItems1牛奶,雞蛋,面包,薯片2雞蛋,爆米花,薯片,啤酒3牛奶,面包,啤酒4牛奶,雞蛋,面包,爆米花,薯片,啤酒5雞蛋,面包,薯片6雞蛋,面包,啤酒7牛奶,面包,薯片8牛奶,雞蛋,面包,黃油,薯片9牛奶,雞蛋,黃油,薯片
頻繁1項集,記為F1FP-GROWTH算法原理-實例1-統計頻次Step1:先掃FP-GROWTH算法原理-實例1-重新排序10IDItems1牛奶,雞蛋,面包,薯片2雞蛋,爆米花,薯片,啤酒3牛奶,面包,啤酒4牛奶,雞蛋,面包,爆米花,薯片,啤酒5雞蛋,面包,薯片6雞蛋,面包,啤酒7牛奶,面包,薯片8牛奶,雞蛋,面包,黃油,薯片9牛奶,雞蛋,黃油,薯片IDItems1薯片,雞蛋,面包,牛奶2薯片,雞蛋,啤酒3面包,牛奶,啤酒4薯片,雞蛋,面包,牛奶,啤酒5薯片,雞蛋,面包6雞蛋,面包,啤酒7薯片,面包,牛奶8薯片,雞蛋,面包,牛奶9薯片,雞蛋,牛奶Step2:對每一條數據記錄,按照F1重新排序。FP-GROWTH算法原理-實例1-重新排序10IDItemFP-GROWTH算法原理-實例1-建立FP樹11IDItems1薯片,雞蛋,面包,牛奶2薯片,雞蛋,啤酒3面包,牛奶,啤酒4薯片,雞蛋,面包,牛奶,啤酒5薯片,雞蛋,面包6雞蛋,面包,啤酒7薯片,面包,牛奶8薯片,雞蛋,面包,牛奶9薯片,雞蛋,牛奶Step3:把第二步重新排序后的記錄,插入到fp-tree中Step3.1:插入第一條(第一步有一個虛的根節點)FP-GROWTH算法原理-實例1-建立FP樹11IDIteFP-GROWTH算法原理-實例1-建立FP樹12IDItems1薯片,雞蛋,面包,牛奶2薯片,雞蛋,啤酒3面包,牛奶,啤酒4薯片,雞蛋,面包,牛奶,啤酒5薯片,雞蛋,面包6雞蛋,面包,啤酒7薯片,面包,牛奶8薯片,雞蛋,面包,牛奶9薯片,雞蛋,牛奶Step3.2:插入第二條。根結點不管,然后插入薯片,在step3.1的基礎上+1,則記為2;同理雞蛋記為2;啤酒在step3.1的樹上是沒有的,那么就開一個分支。FP-GROWTH算法原理-實例1-建立FP樹12IDIteFP-GROWTH算法原理-實例1-建立FP樹13IDItems1薯片,雞蛋,面包,牛奶2薯片,雞蛋,啤酒3面包,牛奶,啤酒4薯片,雞蛋,面包,牛奶,啤酒5薯片,雞蛋,面包6雞蛋,面包,啤酒7薯片,面包,牛奶8薯片,雞蛋,面包,牛奶9薯片,雞蛋,牛奶Step3.3:插入第三條FP-GROWTH算法原理-實例1-建立FP樹13IDIteFP-GROWTH算法原理-實例1-建立FP樹14IDItems1薯片,雞蛋,面包,牛奶2薯片,雞蛋,啤酒3面包,牛奶,啤酒4薯片,雞蛋,面包,牛奶,啤酒5薯片,雞蛋,面包6雞蛋,面包,啤酒7薯片,面包,牛奶8薯片,雞蛋,面包,牛奶9薯片,雞蛋,牛奶同理,剩余記錄依次插入fp-tree中。FP-GROWTH算法原理-實例1-建立FP樹14IDIteFP-GROWTH算法原理-實例1-建立FP樹15圖中左邊的一列叫做頭指針表,樹中相同名稱的節點要鏈接起來,鏈表的第一個元素就是頭指針表里的元素。虛線連接起來的表示同一個商品,各個連接的數字加起來就是該商品出現的總次數。FP-GROWTH算法原理-實例1-建立FP樹15圖中左邊的FP-GROWTH算法原理-實例1-挖掘頻繁項集Step4:從FP-Tree中找出頻繁項集。遍歷表頭項中的每一項(以“牛奶:6”為例),從FP-Tree中找到所有的“牛奶”結點,向上遍歷它的祖先結點,得到4條路徑,如表所示。16FP-GROWTH算法原理-實例1-挖掘頻繁項集Step4:FP-GROWTH算法原理-實例1-挖掘頻繁項集Step4:從FP-Tree中找出頻繁項集。對于每一條路徑上的節點,其count都設置為牛奶的count(路徑中最末尾的商品數)17FP-GROWTH算法原理-實例1-挖掘頻繁項集Step4:FP-GROWTH算法原理-實例1-挖掘頻繁項集Step4:從FP-Tree中找出頻繁項集。因為每一項末尾都是牛奶,可以把牛奶去掉,得到條件模式基,此時的后綴模式是:牛奶。18FP-GROWTH算法原理-實例1-挖掘頻繁項集Step4:FP-GROWTH算法原理-實例2把例子簡化一下,請看以下實例219TidItems1I1,I2,I52I2,I43I2,I34I1,I2,I45I1,I36I2,I37I1,I38I1,I2,I3,I59I1,I2,I3FP-GROWTH算法原理-實例2把例子簡化一下,請看以下實FP-GROWTH算法原理-實例2-統計頻次先掃描數據庫,統計所有商品的出現次數(頻數)定義min_sup=2,按照頻數遞減排序,刪除頻數小于最小支持度的商品。重新排列得到頻繁1-項目集F20I1I2I3I4I567622I2I1I3I4I576622FP-GROWTH算法原理-實例2-統計頻次先掃描數據庫,統FP-GROWTH算法原理-實例2-重新排序21I27I16I36I42I52TidItems1I2,I1,I52I2,I43I2,I34I2,I1,I45I1,I36I2,I37I1,I38I2,I1,I3,I59I2,I1,I3FP-GROWTH算法原理-實例2-重新排序21I27I16FP-GROWTH算法原理-實例2-創建根結點和頻繁項目表22Item-nameNode-headI2NullI1NullI3NullI4NullI5NullNullFP-GROWTH算法原理-實例2-創建根結點和頻繁項目表2FP-GROWTH算法原理-實例2-加入第一個事務(I2,I1,I5)23FP-GROWTH算法原理-實例2-加入第一個事務(I2,IFP-GROWTH算法原理-實例2-加入第二個事務(I2,I4)24FP-GROWTH算法原理-實例2-加入第二個事務(I2,IFP-GROWTH算法原理-實例2-加入第三個事務(I2,I3)25FP-GROWTH算法原理-實例2-加入第三個事務(I2,IFP-GROWTH算法原理-實例2-加入第四個事務(I2,I1,I4)26FP-GROWTH算法原理-實例2-加入第四個事務(I2,IFP-GROWTH算法原理-實例2-加入第五個事務(I1,I3)27FP-GROWTH算法原理-實例2-加入第五個事務(I1,IFP-GROWTH算法原理-實例2-加入第六個事務(I2,I3)28FP-GROWTH算法原理-實例2-加入第六個事務(I2,IFP-GROWTH算法原理-實例2-加入第七個事務(I1,I3)29FP-GROWTH算法原理-實例2-加入第七個事務(I1,IFP-GROWTH算法原理-實例2-加入第八個事務(I2,I1,I3,I5)30FP-GROWTH算法原理-實例2-加入第八個事務(I2,IFP-GROWTH算法原理-實例2-加入第九個事務(I2,I1,I3)31FP-GROWTH算法原理-實例2-加入第九個事務(I2,IFP-GROWTH算法原理-實例2-挖掘頻繁項集首先考慮I5,得到條件模式基:<(I2,I1:1)>、<I2,I1,I3:1>構造條件FP-Tree32得到I5頻繁項集:{{I2,I5},{I1,I5},{I2,I1,I5}}FP-GROWTH算法原理-實例2-挖掘頻繁項集首先考慮I5FP-GROWTH算法原理-實例2-挖掘頻繁項集接著考慮I4,得到條件模式基:
<(I2,I1:1)>、<I2:1>構造條件FP-Tree33得到I4頻繁項集:{{I2,I4}}FP-GROWTH算法原理-實例2-挖掘頻繁項集接著考慮I4FP-GROWTH算法原理-實例2-挖掘頻繁項集然后考慮I3,得到條件模式基:
<(I2,I1:2)>、<I2:2>、<I1:2>構造條件FP-Tree34由于此樹不是單分支路徑,因此需要遞歸挖掘I3FP-GROWTH算法原理-實例2-挖掘頻繁項集然后考慮I3FP-GROWTH算法原理-實例2-挖掘頻繁項集遞歸考慮I3,此時得到I1條件模式基<(I2:2)>,即I1,I3的條件模式基為<(I2:2)>構造條件FP-Tree35得到I3的頻繁項目集{{I2,I3},{I1,I3},{I2,I1,I3}}FP-GROWTH算法原理-實例2-挖掘頻繁項集遞歸考慮I3FP-GROWTH算法原理-實例2-挖掘頻繁項集最后考慮I1,得到條件模式基:<(I2:4)>構造條件FP-Tree36得到I1的頻繁項目集:{I2,I1}FP-GROWTH算法原理-實例2-挖掘頻繁項集最后考慮I1FP-GROWTH算法實現-數據處理37項集e,m,q,s,t,y,x,zx,s,r,o,ns,u,t,w,v,y,x,zq,p,r,t,y,x,zh,r,z,p,jz格式化處理FP-GROWTH算法實現-數據處理37項集e,m,q,s,代碼實現-FP樹數據結構38代碼實現-FP樹數據結構38代碼實現-構造FP樹步驟39代碼實現-構造FP樹步驟39代碼實現-構造FP樹40代碼實現-構造FP樹40代碼實現-構造FP樹41代碼實現-構造FP樹41代碼實現-構造FP樹(updateTree函數)42代碼實現-構造FP樹(updateTree函數)42代碼實現-構造FP樹(updateHeader函數)43代碼實現-構造FP樹(updateHeader函數)43代碼實現-構造FP樹(驗證)44代碼實現-構造FP樹(驗證)44代碼實現-挖掘頻繁項集步驟從構建好的FP樹中抽取頻繁項集的步驟如下:(1)從FP樹中獲取條件模式基;(2)利用條件模式基,構建一個條件FP樹;(3)迭代重復(1)(2),直到樹包含一個元素項為止。45代碼實現-挖掘頻繁項集步驟從構建好的FP樹中抽取頻繁項集的步條件模式基定義條件模式基是以所查找元素項為結尾的路徑集合。每一條路徑其實都是一條前綴路徑。簡而言之,一條前綴路徑就是介于所查找元素項與樹根節點之間的所有內容。每一個頻繁項的所有前綴路徑(條件模式基):46條件模式基定義條件模式基是以所查找元素項為結尾的路徑集合。每代碼實現-抽取條件模式基47eg:t的第1條前綴路徑prefixPath=t,s,y,x,z;代碼實現-抽取條件模式基47eg:t的第1條前綴路徑pref代碼實現-抽取條件模式基48代碼實現-抽取條件模式基48代碼實現-抽取條件模式基(驗證)49代碼實現-抽取條件模式基(驗證)49代碼實現-創建條件FP樹50代碼實現-創建條件FP樹50代碼實現-創建條件FP樹51代碼實現-創建條件FP樹51代碼實現-運行52代碼實現-運行52示例:從新聞網站點擊流中挖掘新聞報道-數據格式53示例:從新聞網站點擊流中挖掘新聞報道-數據格式53示例:從新聞網站點擊流中挖掘新聞報道-代碼在源數據集合中,包含將近100w條記錄,該文件中的每一行代表某個用戶瀏覽過的新聞報道。一些用戶只看過一篇報道,而有些用戶看過2498篇報道,用戶和報道被編碼成整數。54示例:從新聞網站點擊流中挖掘新聞報道-代碼在源數據集合中,包示例:從新聞網站點擊流中挖掘新聞報道-結果55示例:從新聞網站點擊流中挖掘新聞報道-結果55謝謝!56謝謝!56機器學習-FP-GROWTH算法李家豪機器學習-FP-GROWTH算法李家豪目錄58Apriori算法和FP-GROWTH算法的比較FP-GROWTH算法原理FP-GROWTH代碼實現(python)示例:從新聞網站點擊流中挖掘新聞報道目錄2Apriori算法和FP-GROWTH算法的比較FP-回憶Apriori算法59項集:項的集合稱為項集,即商品的組合。k項集:k件商品的組合,不關心商品件數,僅商品的種類。頻繁項集:如果項集的相對支持度滿足給定的最小支持度閾值,則該項集是頻繁項集。強關聯規則:滿足給定支持度和置信度閾值的關聯規則支持度:support(A->B)=P(AB)置信度:confidence(A->B)=P(A|B)回憶Apriori算法3項集:項的集合稱為項集,即商品的組合回憶Apriori算法60回憶Apriori算法4回憶Apriori算法61回憶Apriori算法5Apriori算法的挑戰62挑戰多次數據庫掃描巨大數量的候補項集繁瑣的支持度計算改善Apriori:基本想法
減少掃描數據庫的次數
減少候選項集的數量簡化候選項集的支持度計算Apriori算法的挑戰6挑戰FP-GROWTH算法優點相比Apriori算法需要多次掃描數據庫,FPGrowth只需要對數據庫掃描2次。第1次掃描事務數據庫獲得頻繁1項集。第2次掃描建立一顆FP-Tree樹。63FP-GROWTH算法優點相比Apriori算法需要多次掃描FP-GROWTH算法原理-實例1要找總是一起購買的商品,比如[薯片,雞蛋]就是一條頻繁模式(規律)。64IDItems1牛奶,雞蛋,面包,薯片2雞蛋,爆米花,薯片,啤酒3牛奶,面包,啤酒4牛奶,雞蛋,面包,爆米花,薯片,啤酒5雞蛋,面包,薯片6雞蛋,面包,啤酒7牛奶,面包,薯片8牛奶,雞蛋,面包,黃油,薯片9牛奶,雞蛋,黃油,薯片FP-GROWTH算法原理-實例1要找總是一起購買的商品,比FP-GROWTH算法原理-實例1-統計頻次Step1:先掃描數據庫,統計所有商品的出現次數(頻數),然后按照頻數遞減排序,刪除頻數小于最小支持度的商品。設最小支持度數為:minsup=4統計頻數:牛奶6,雞蛋7,面包7,薯片7,爆米花2,啤酒4,黃油2.降序排序:薯片7,雞蛋7,面包7,牛奶6,啤酒4(刪除小于minsup的商品)65IDItems1牛奶,雞蛋,面包,薯片2雞蛋,爆米花,薯片,啤酒3牛奶,面包,啤酒4牛奶,雞蛋,面包,爆米花,薯片,啤酒5雞蛋,面包,薯片6雞蛋,面包,啤酒7牛奶,面包,薯片8牛奶,雞蛋,面包,黃油,薯片9牛奶,雞蛋,黃油,薯片
頻繁1項集,記為F1FP-GROWTH算法原理-實例1-統計頻次Step1:先掃FP-GROWTH算法原理-實例1-重新排序66IDItems1牛奶,雞蛋,面包,薯片2雞蛋,爆米花,薯片,啤酒3牛奶,面包,啤酒4牛奶,雞蛋,面包,爆米花,薯片,啤酒5雞蛋,面包,薯片6雞蛋,面包,啤酒7牛奶,面包,薯片8牛奶,雞蛋,面包,黃油,薯片9牛奶,雞蛋,黃油,薯片IDItems1薯片,雞蛋,面包,牛奶2薯片,雞蛋,啤酒3面包,牛奶,啤酒4薯片,雞蛋,面包,牛奶,啤酒5薯片,雞蛋,面包6雞蛋,面包,啤酒7薯片,面包,牛奶8薯片,雞蛋,面包,牛奶9薯片,雞蛋,牛奶Step2:對每一條數據記錄,按照F1重新排序。FP-GROWTH算法原理-實例1-重新排序10IDItemFP-GROWTH算法原理-實例1-建立FP樹67IDItems1薯片,雞蛋,面包,牛奶2薯片,雞蛋,啤酒3面包,牛奶,啤酒4薯片,雞蛋,面包,牛奶,啤酒5薯片,雞蛋,面包6雞蛋,面包,啤酒7薯片,面包,牛奶8薯片,雞蛋,面包,牛奶9薯片,雞蛋,牛奶Step3:把第二步重新排序后的記錄,插入到fp-tree中Step3.1:插入第一條(第一步有一個虛的根節點)FP-GROWTH算法原理-實例1-建立FP樹11IDIteFP-GROWTH算法原理-實例1-建立FP樹68IDItems1薯片,雞蛋,面包,牛奶2薯片,雞蛋,啤酒3面包,牛奶,啤酒4薯片,雞蛋,面包,牛奶,啤酒5薯片,雞蛋,面包6雞蛋,面包,啤酒7薯片,面包,牛奶8薯片,雞蛋,面包,牛奶9薯片,雞蛋,牛奶Step3.2:插入第二條。根結點不管,然后插入薯片,在step3.1的基礎上+1,則記為2;同理雞蛋記為2;啤酒在step3.1的樹上是沒有的,那么就開一個分支。FP-GROWTH算法原理-實例1-建立FP樹12IDIteFP-GROWTH算法原理-實例1-建立FP樹69IDItems1薯片,雞蛋,面包,牛奶2薯片,雞蛋,啤酒3面包,牛奶,啤酒4薯片,雞蛋,面包,牛奶,啤酒5薯片,雞蛋,面包6雞蛋,面包,啤酒7薯片,面包,牛奶8薯片,雞蛋,面包,牛奶9薯片,雞蛋,牛奶Step3.3:插入第三條FP-GROWTH算法原理-實例1-建立FP樹13IDIteFP-GROWTH算法原理-實例1-建立FP樹70IDItems1薯片,雞蛋,面包,牛奶2薯片,雞蛋,啤酒3面包,牛奶,啤酒4薯片,雞蛋,面包,牛奶,啤酒5薯片,雞蛋,面包6雞蛋,面包,啤酒7薯片,面包,牛奶8薯片,雞蛋,面包,牛奶9薯片,雞蛋,牛奶同理,剩余記錄依次插入fp-tree中。FP-GROWTH算法原理-實例1-建立FP樹14IDIteFP-GROWTH算法原理-實例1-建立FP樹71圖中左邊的一列叫做頭指針表,樹中相同名稱的節點要鏈接起來,鏈表的第一個元素就是頭指針表里的元素。虛線連接起來的表示同一個商品,各個連接的數字加起來就是該商品出現的總次數。FP-GROWTH算法原理-實例1-建立FP樹15圖中左邊的FP-GROWTH算法原理-實例1-挖掘頻繁項集Step4:從FP-Tree中找出頻繁項集。遍歷表頭項中的每一項(以“牛奶:6”為例),從FP-Tree中找到所有的“牛奶”結點,向上遍歷它的祖先結點,得到4條路徑,如表所示。72FP-GROWTH算法原理-實例1-挖掘頻繁項集Step4:FP-GROWTH算法原理-實例1-挖掘頻繁項集Step4:從FP-Tree中找出頻繁項集。對于每一條路徑上的節點,其count都設置為牛奶的count(路徑中最末尾的商品數)73FP-GROWTH算法原理-實例1-挖掘頻繁項集Step4:FP-GROWTH算法原理-實例1-挖掘頻繁項集Step4:從FP-Tree中找出頻繁項集。因為每一項末尾都是牛奶,可以把牛奶去掉,得到條件模式基,此時的后綴模式是:牛奶。74FP-GROWTH算法原理-實例1-挖掘頻繁項集Step4:FP-GROWTH算法原理-實例2把例子簡化一下,請看以下實例275TidItems1I1,I2,I52I2,I43I2,I34I1,I2,I45I1,I36I2,I37I1,I38I1,I2,I3,I59I1,I2,I3FP-GROWTH算法原理-實例2把例子簡化一下,請看以下實FP-GROWTH算法原理-實例2-統計頻次先掃描數據庫,統計所有商品的出現次數(頻數)定義min_sup=2,按照頻數遞減排序,刪除頻數小于最小支持度的商品。重新排列得到頻繁1-項目集F76I1I2I3I4I567622I2I1I3I4I576622FP-GROWTH算法原理-實例2-統計頻次先掃描數據庫,統FP-GROWTH算法原理-實例2-重新排序77I27I16I36I42I52TidItems1I2,I1,I52I2,I43I2,I34I2,I1,I45I1,I36I2,I37I1,I38I2,I1,I3,I59I2,I1,I3FP-GROWTH算法原理-實例2-重新排序21I27I16FP-GROWTH算法原理-實例2-創建根結點和頻繁項目表78Item-nameNode-headI2NullI1NullI3NullI4NullI5NullNullFP-GROWTH算法原理-實例2-創建根結點和頻繁項目表2FP-GROWTH算法原理-實例2-加入第一個事務(I2,I1,I5)79FP-GROWTH算法原理-實例2-加入第一個事務(I2,IFP-GROWTH算法原理-實例2-加入第二個事務(I2,I4)80FP-GROWTH算法原理-實例2-加入第二個事務(I2,IFP-GROWTH算法原理-實例2-加入第三個事務(I2,I3)81FP-GROWTH算法原理-實例2-加入第三個事務(I2,IFP-GROWTH算法原理-實例2-加入第四個事務(I2,I1,I4)82FP-GROWTH算法原理-實例2-加入第四個事務(I2,IFP-GROWTH算法原理-實例2-加入第五個事務(I1,I3)83FP-GROWTH算法原理-實例2-加入第五個事務(I1,IFP-GROWTH算法原理-實例2-加入第六個事務(I2,I3)84FP-GROWTH算法原理-實例2-加入第六個事務(I2,IFP-GROWTH算法原理-實例2-加入第七個事務(I1,I3)85FP-GROWTH算法原理-實例2-加入第七個事務(I1,IFP-GROWTH算法原理-實例2-加入第八個事務(I2,I1,I3,I5)86FP-GROWTH算法原理-實例2-加入第八個事務(I2,IFP-GROWTH算法原理-實例2-加入第九個事務(I2,I1,I3)87FP-GROWTH算法原理-實例2-加入第九個事務(I2,IFP-GROWTH算法原理-實例2-挖掘頻繁項集首先考慮I5,得到條件模式基:<(I2,I1:1)>、<I2,I1,I3:1>構造條件FP-Tree88得到I5頻繁項集:{{I2,I5},{I1,I5},{I2,I1,I5}}FP-GROWTH算法原理-實例2-挖掘頻繁項集首先考慮I5FP-GROWTH算法原理-實例2-挖掘頻繁項集接著考慮I4,得到條件模式基:
<(I2,I1:1)>、<I2:1>構造條件FP-Tree89得到I4頻繁項集:{{I2,I4}}FP-GROWTH算法原理-實例2-挖掘頻繁項集接著考慮I4FP-GROWTH算法原理-實例2-挖掘頻繁項集然后考慮I3,得到條件模式基:
<(I2,I1:2)>、<I2:2>、<I1:2>構造條件FP-Tree90由于此樹不是單分支路徑,因此需要遞歸挖掘I3FP-GROWTH算法原理-實例2-挖掘頻繁項集然后考慮I3FP-GROWTH算法原理-實例2-挖掘頻繁項集遞歸考慮I3,此時得到I1條件模式基<(I2:2)>,即I1,I3的條件模式基為<(I2:2)>構造條件FP-Tree91得到I3的頻繁項目集{{I2,I3},{I1,I3},{I2,I1,I3}}FP-GROWTH算法原理-實例2-挖掘頻繁項集遞歸考慮I3FP-GROWTH算法原
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 北京市清華大學附中2025年化學高二下期末綜合測試試題含解析
- 江西省新余第四中學、上高第二中學2025屆高一化學第二學期期末聯考試題含解析
- 發票搖獎資金管理辦法
- 園區企業梯隊管理辦法
- 江蘇工地進度管理辦法
- 佛教用品規范管理辦法
- 農業公司戰略管理辦法
- 新疆煤礦礦井管理辦法
- 村民身份認定管理辦法
- 小學生經典古詩文誦讀活動
- 尾礦庫安全知識培訓課件
- 跆拳道館技術崗位薪酬制度
- 無人駕駛車法規-深度研究
- 2025年度美團外賣外賣配送配送員績效考核協議4篇
- 《寧晉縣國土空間總體規劃(2021-2035年)》
- 2024年度乳腺癌篩查與早期診斷課件
- 2024年食品檢驗員(高級)職業鑒定理論考試題庫(含答案)
- 工廠物品回收合同模板
- JJF 1168-2024便攜式制動性能測試儀校準規范
- 經橈動脈介入診療患者術肢并發癥預防及護理專家共識解讀
- 專科護士崗位競聘5分鐘
評論
0/150
提交評論