




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、目 錄摘要1 Abstract1一、數據挖掘及電子商務概述2(一) 數據挖掘的基本概念2(二)數據挖掘的主要算法與功能2(三)電子商務的基本概念2(四)本文所涉及的數據挖掘技術2二、電子商務推薦系統的個性化服務需求分析3(一)個性化電子商務3(二) 電子商務個性化推薦服務3(三)數據挖掘在個性化電子商務中的表現形式5三、數據挖掘技術在個性化電子商務系統中的應用研究6(一)利用聚類算法實現電子商務中的用戶聚類6(二)利用關聯規則實現電子商務中的商品推薦9四、應用數據挖掘技術實現電子商務個性化推薦服務13(一)個性化電子商務網站的體系結構13(二)個性化推薦服務系統13(三)電子商務個性化推薦服務
2、為電子商務帶來的好處13五、總結與展望14參考文獻14致謝15數據挖掘在電子商務個性化服務中的應用研究摘要:隨著電子商務的發展壯大,缺乏個性化服務成為制約電子商務發展的關鍵問題。文章針對電子商務的發展現狀以及個性化服務的需求,通過對分析電子商務活動中的客戶、商品等相關信息后,建立了基于數據挖掘技術的電子商務網站個性化商品推薦服務的系統模型,并將數據挖掘中的關聯規則和聚類算法應用在電子商務推薦服務中,實現了電子商務網站的個性化推薦服務,為用戶提供更好、更快、更直接的個性化服務的技術支持。關鍵詞:數據挖掘;電子商務;個性化服務;Apriori算法;聚類算法Application research
3、of electronic commerce personalized services based on Data MiningAbstract: With the development of electronic commerce, the lack of personalized service would govern electronic commerce as a key issue in the development. In this paper, the development of electronic commerce, as well as the demand fo
4、r personalized service is described. Moreover, customers, products and other related information of electronic commerce activities are analysed. The modeling of electronic commerce site personalization products recommended services system based on data mining technology is attained. Association rule
5、s and Cluster Method of data mining are applied in electronic commerce recommended services, in order to achieve a personalized electronic commerce sites recommended services, providing users with better, faster and more direct personalized service of technical support.Key words: Data Mining; Electr
6、onic Commerce; Personalized Service; Apriori Method; Cluster Method一、數據挖掘及電子商務概述(一) 數據挖掘的基本概念數據挖掘(Data Mining),又稱為數據庫中的知識發現(Knowledge Discovery in Database, KDD),就是從大量數據中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程,簡單的說,數據挖掘就是從大量數據中提取或“挖掘”知識。 那么在技術上可以根據它的工作過程分為:數據的抽取、數據的存儲和管理、數據的展現等關鍵技術。(二)數據挖掘的主要算法與功能通常我們所說的數據挖掘
7、的技術基礎就是人工智能。它使用了人工智能中一些已經成熟的算法和技術,如:人工神經網絡,遺傳算法,決策樹,規則推理,模糊邏輯等,就問題的復雜性和難度而言比人工智能要低。進行網絡數據挖掘,主要是對客戶的訪問信息與詳細身份信息進行挖掘,得到客戶的瀏覽行為模式,找到有價值的市場信息,從而有針對性的調整網頁設計,提供個性化的服務。數據挖掘系統利用的技術越多,精確度就越高。數據挖掘的功能算法主要包括以下幾種:(1)構造關聯規則;(2)發現分類規則;(3)數據聚類分析;(4)數據抽象總結。(三)電子商務的基本概念電子商務簡單講就是利用先進的電子技術進行商務活動的總稱,它是通過網絡,使用先進的信息處理工具,利
8、用電子這種載體,將買賣雙方的商務信息、產品信息、銷售信息、服務信息,以及電子支付等商務活動,用相互認同的交易標準來實現,這就是人們所說的“在網上進行買賣活動”。電子商務迅猛發展的時代己經到來,網上購物交易的形式正在改變著傳統的商業模式。電子商務是利用現代計算機網絡進行商務活動的一種先進手段,是推動未來經濟增長的關鍵動力,將打破時空界限,有效地降低企業成本,提高企業的競爭能力。(四)本文所涉及的數據挖掘技術在本中我們將要應用到電子商務個性化服務中的數據挖掘技術是:1關聯規則分析關聯規則分析是從數據庫中發現知識的一類重要的方法,并且通過關聯規則己經抽取出許多對企業有價值的知識。它的思想是,如果兩個
9、以上的數據項的取值之間重復出現的概率較高時,就存在某種關聯,就可以建立起這些數據項之間的關聯規則。2聚類分析數據庫中的數據可以劃分為一系列的有意義的組,組內的各數據差別盡可能小,而組之間的差別盡可能的大。聚類增強了人們對客觀事物的認識,即以聚類來區別事物的不同類型,如蘋果、桔子、香蕉屬于水果。有一點需要明確的是,在進行聚類之前是不知道要劃分成多少個組和什么樣的組,也不知道根據哪些數據項來定義組。聚類是根據數據集的本身特征來進行簇的劃分。二、電子商務推薦系統的個性化服務需求分析(一)個性化電子商務1電子商務個性化服務的概念對電子商務個性化服務不少專家都提出了自己的看法,下面是一些具有代表性的觀點
10、:(1)個性化信息服務是根據客戶的特性提供具有針對性的信息內容和系統功能。(2)個性化信息服務是基于信息用戶的信息使用行為、習慣、偏好和特點,向用戶提供滿足其各種個性化需求的一種服務。(3)所謂個性化信息服務,是指能夠滿足用戶的個人信息需求的一種服務,在某一特定的網上功能和服務方式中,通過用戶自己設定網上信息來源方式、表現形式、特定網上功能及其它網上服務方式等,而主動地向用戶提供可能需要的信息服務。2個性化電子商務服務的意義在現在的商品交易活動中,電子商務是互聯網時代出現的新型商業模式,不同于傳統的商業模式。CRM(Customer Relationship Management)是一種旨在建
11、立客戶與企業之間關系的新型管理機制。CRM要求企業從“以產品為中心”的模式轉向“以用戶為中心”的模式。這就要求開展電子商務的商家必須了解用戶的要求,為用戶提供更好的有針對性的電子商務活動。3個性化電子商務的益處個性化電子商務網站的設計不僅使用戶能夠迅速快捷地獲得信息,提高了用戶的忠誠度。同時為電子商務網站帶來了豐厚的商業利益。主要體現在以下幾個方面:(1)提高電子商務網站的服務;(2)商業智能的發現;(3)建立和加強用戶的忠誠度;(4)增加了電子商務網站訪問量4數據挖掘在電子商務網站中的應用主要體現在以下幾個方面:智能化搜索引擎系統客戶關系管理系統個性化服務系統個性化推薦系統數據挖掘在電子商務
12、網站中的應用圖1 電子商務網站中的數據挖掘領域(二) 電子商務個性化推薦服務1電子商務個性化推薦服務是未來電子商務發展的重要趨勢電子商務打破了傳統商務的時空界線,突出了個性的張揚和創造力的發揮,未來的電子商務的發展必然會加強個性化定制的需求和個性化商品的深度參與。對電子商務企業而言,利用推薦系統將消費者的個人偏好、需求同企業提供的產品和服務結合起來,提供靈活多樣的個性化服務是一個必然的趨勢。2電子商務個性化推薦服務的必要性隨著電子商務的普及和發展,越來越多的用戶接受了網上購物的模式。但是,當用戶和電子商務的商家充分享受電子商務的快捷和方便時,他們同時面臨著某些新的問題。開展在線零售業務的電子商
13、務系統面臨的一個重要問題是:一方面,用戶面對網站上提供的琳瑯滿目的眾多商品,他們只對其中的一部分商品感興趣。然而在用戶的購買過程中,他必須瀏覽許多不相關的網頁,才能在眾多的商品分類中找到自己所需要的商品;另一方面,商家面對眾多的用戶,不知道他們對商品的興趣和要求是什么。因此,電子商務的商家無法及時調整網站的頁面結構,提供給所有的用戶是千篇一律的界面。缺乏個性化服務已經成為制約電子商務發展的關鍵問題。所以個性化推薦服務對于電子商務而言具有寶貴的價值。3在電子商務中提供個性化推薦服務的可能性如今的電子商務企業不同于以往的公司,用戶在瀏覽電子商務網站和網上購物過程中會留下大量有用的信息,企業可以利用
14、數據挖掘技術對日常交易中所積累的數據進行處理,從中提取出有價值的關于用戶訪問行為的知識。利用這些數據,他們可以做以下的事情:(1)根據客戶已經聲明的偏好或是觀察到的行為,在客戶再次訪問該網站時動態地調整頁面結構,改進服務,開展有針對性的電子商務以更好地滿足訪問者的需求。(2) 跟蹤用戶在電子商務網站上的瀏覽行為回應客戶的訂單并在付賬的過程中推薦新的商品。(3)從過去的訪問記錄中記住客戶的偏好,并把這些用于客戶目前的訪問中,在線提出一些合理的推薦意見。這樣將會作到針對不同的用戶提供個性化的服務,提高電子商務的效率,改善電子商務服務商的服務質量并吸引更多的用戶,達到提高電子商務銷售額的目的。4電子
15、商務個性化推薦服務的研究內容電子商務個性化推薦服務主要包括以下兩個方面的內容:一是服務內容的個性化。由于自身條件的不同,客戶對商品和服務的需求也不盡相同,而消費者的需求個性化則是企業電子商務個性化服務的推動力。消費者不再只是被動地接受,商家也不僅僅是提供多樣化的選擇范圍了事,商家必須根據消費者的興趣偏好,及時地為消費者推薦其真正需要的商品,盡量減少消費者在搜尋自己所需商品的過程中所消耗的精力,同時商家也可以將搜集到的消費者個人的偏好參與到商品的設計和制造過程中去,滿足消費者個性化的需求。二是服務方式的個性化。目前,最常用的信息服務方式是“PULL拉”的模式,即信息提供者把所提供的信息直接發布在
16、網頁上,需要的用戶必須去其網站上查找,這使得用戶不得不花費大量的時間和精力在網頁間的轉換上。與“PULL”模式相對應的還有一種“PUSH推”模式,在這種模式下,信息提供者直接將最新信息的標題和摘要發布給已經訂閱的用戶,然后用戶根據自己的需要點擊鏈接訪問網站,閱讀對應的信息。這種模式的優點是很明顯的,尤其是在當今信息爆炸的網絡環境下,用戶可以僅僅關心自己感興趣的那一部分,而沒必要把更多的精力浪費在查找的過程中。電子商務個性化推薦服務是個性化服務在電子商務中的拓展,也是個性化服務新的應用和發展領域。5電子商務個性化推薦服務的特點一直以來,“以用戶為中心”,“用戶至上”都是信息服務機構的宗旨,但卻很
17、少能落到實處。而個性化信息服務為這一理念的貫徹落實提供了可能。個性化信息服務具有以下特點:(1)與用戶的雙向溝通更加便捷,服務內容具有針對性;(2)服務內容,更加豐富,服務方式更加靈活多樣;(3)更為注重主動性與時效性;(4)服務更具智能性。6電子商務推薦系統的類型個性化電子商務主要是通過在線推薦系統表現出來的,電子商務網站的推薦系統可以針對不同的訪問者進行頁面推薦或商品推薦。推薦系統是基于對用戶的歷史瀏覽行為和購買行為進行分析,產生用戶群體的瀏覽模式和購買模式。識別出當前的用戶,將用戶匹配到具有不同的瀏覽模式和購買模式的用戶群體中,實時在線地進行頁面推薦或商品推薦。根據電子商務推薦系統所采用
18、的推薦技術,目前的電子商務推薦系統主要分為以下幾類:(1)基于內容過濾的推薦系統;(2)基于協同過濾技術的推薦系統;(3)混和型推薦系統;(4)基于數據挖掘技術的推薦系統。(三)數據挖掘在個性化電子商務中的表現形式電子商務個性化推薦服務的關鍵在于它能收集用戶興趣資料并根據用戶興趣偏好為用戶主動做出個性化信息推薦。當用戶每次輸入用戶名和密碼登錄電子商務網站后,推薦系統就會按照目標用戶偏好程度的高低推薦用戶最喜愛的N個商品,而且系統給出的推薦是實時更新的,即當系統中的商品信息資料和用戶興趣特征發生改變時,給出的推薦序列會自動改變,為用戶提供了更多的檢索便利,提高企業的服務水平。個性化電子商務主要是
19、通過在線推薦系統表現出來的。如圖2所示。電子商務網站的推薦系統可以針對不同的訪問者進行頁面推薦或商品推薦。推薦系統是基于對用戶的歷史瀏覽行為和購買行為進行分析,產生用戶群體的瀏覽模式和購買模式。識別出當前的用戶,將用戶匹配到具有不同的瀏覽模式和購買模式的用戶群體中,實時在線地進行頁面推薦或商品推薦。數據準備發現用戶模式識別當前用戶當前用戶與模式進行匹配生成推薦頁面或商品集圖2 個性化電子商務推薦系統通過分析可知個性化推薦系統都可抽象成四個層次,即首先收集用戶信息,然后根據用戶信息對用戶進行建模,在構建的用戶模型的基礎上提供個性化的服務策略和服務內容:(1)在個性化推薦服務體系結構中,數據準備模
20、塊是個性化服務系統的基模塊。用戶的信息包括了用戶的個人基本資料、購買的歷史記錄及瀏覽記錄等。個人基本資料可以從用戶注冊表單中獲得;購買的歷史記錄主要存放于電子商務網站的后臺交易數據庫中,包含了每位用戶以前歷次購物的詳細情況記錄,如購物時間、商品清單、價格、折扣等,同時也可以收集用戶放入購物籃而未購買的商品記錄,以及用戶過去瀏覽過的商品的信息等。當然要收集用戶的行為信息,日志文件是必不可少的,如要收集服務器日志,則要在服務器端獲取,抽取出特定用戶的訪問記錄;如要收集用戶瀏覽的頁面和瀏覽行為,則既可以在用戶端獲得,也可以在服務器端從用戶記錄中獲得。(2)個性化推薦服務系統收集到用戶信息后,提交給用
21、戶建模來進行處理,其目的是構建反映用戶興趣特征的用戶模型,回答消費者具有何種特征,他們分別有什么樣的喜好以及他們各自的購買習慣和行為特性等問題,作為個性化推薦模塊的用戶數據基礎。(3)個性化推薦模塊根據用戶的興趣偏好,按一定的推薦算法,對特定用戶計算出兩種推薦結果客戶對任意項的興趣度及前Top-N推薦集,相應地,個性化推薦模塊將產生按興趣度由大到小的信息項推薦集或興趣度大于某一給定閾值的信息項的推薦序列,并以某一特定的形式呈現給特定用戶。(4)個性化推薦是指根據用戶的興趣特點,向用戶推薦其感興趣的頁面和商品集。其原理是根據用戶模型尋找與其匹配的信息,或者尋找具有相近興趣的用戶群,然后相互推薦瀏
22、覽過的信息。三、數據挖掘技術在個性化電子商務系統中的應用研究 在這里我們用關聯規則和聚類算法中比較經典的k-means算法和Apriori算法進行應用研究。(一)利用聚類算法實現電子商務中的用戶聚類1k-means算法介紹1967年,MacQueen在伯克利第五屆數理統計年會上提出k-means算法。它是一種基于樣本間相似性度量的聚類方法,是一種非監督學習的方法。此算法以k為參數,把n個對象分為k個聚類,以使聚類內具有較高的相似度,而且聚類間的相似度較低。它是一種較典型的逐點修改迭代的動態聚類算法,其要點是以誤差平方和為準則函數。誤差平方和e2的公式為: 其中表示第i個用戶的第j個屬性的值,表
23、示第價聚類的中心,表示第j個聚類中共有個用戶。2k-means算法的流程及其在電子商務中的應用研究在這里我們就協同過濾推薦的聚類算法在個性化服務中的應用進行具體的說明。(流程圖為圖3) (1)隨機選擇k個用戶(種子結點)作為初始聚類中心,將k個用戶的興趣值作為初始的聚類中心。(2)對剩余的用戶集合,計算每個用戶與k個聚類中心的相似性,將用戶分配到相似性最高的聚類中。(3)對新生成的聚類,計算聚類中所有用戶興趣值的平均分,生成新的聚類中心。(4)重復(2)、(3)直到誤差平方e2和收斂于某個值。生成聚類之后,下面的工作主要有兩個部分組成: (l)虛擬用戶集生成根據不同的聚類生成對應的聚類中心,聚
24、類中心與聚類中其他用戶的距離之和最小,每一個聚類產生的聚類中心代表該聚類中用戶對頁面的典型興趣值。將所有的聚類中心作為虛擬的用戶集合。(2)推薦產生在虛擬的用戶集合上使用各種相似性度量方法搜索當前用戶的若干最近鄰居,然后根據最近鄰居對頁面的興趣值產生對應的推薦結果。開始隨即選擇k個用戶作為初始聚類中心,將k個用戶的興趣值作為初始的聚類中心。對剩余的用戶集合,計算每個用戶與k個聚類中心的相似性,將用戶分配到相似性最高的聚類中。對新生成的聚類,計算聚類中所有用戶興趣值的平均分,生成新的聚類中心。聚類中心改變結束NY圖3 k-means算法工作流程3k-means算法的應用說明下表是某購物網站的客戶
25、訪問數據,然后隨機抽取部分用戶訪問某購物網站的時候所計算出來的對各商品的興趣值。表1用戶對各商品的興趣值用戶id化妝品服飾日用品10.500.300.1520.200.600.1530.450.200.3040.330.510.0050.180.500.3060.310.460.20取k=2,則算法的執行步驟為:(1)第一次迭代隨機選擇兩個用戶(比如選擇用戶3和用戶4)作為種子,分別搜尋距離兩點最近的用戶產生兩個聚類,分別是1,2,3和4,5,6。表2第一次迭代聚類id化妝品興趣平均值服飾興趣平均值日用品興趣平均值11,2,30.380.370.2024,5,60.270.490.17(2)第
26、二次迭代利用歐式距離公式計算各用戶對聚類1和聚類2興趣值(分別是0.38,0.37,0.20和0.27,0.49,0.17)的相似性,重新調整兩個聚類中用戶,使得聚類內各用戶的差異性降低、聚類間用戶的差異性增大。經計算得出用戶對兩個聚類的相似性如表所示。表3 各用戶對兩個聚類的中心的相似性(距離)用戶id聚類10.38,0.37,0.20聚類20.27,0.49,0.1710.02180.089420.08780.017430.04380.133440.06210.032950.29090.330660.01300.0034調整后的聚類1和聚類2分別是l,3,5和2,4,6表4 第二次迭代聚類
27、id化妝品興趣平均值服飾興趣平均值日用品興趣平均值11,3,50.380.330.2522,4,60.280.520.12 (3)第三次迭代方法和第二次迭代類似。分別得到表5和表6。表5 各用戶對兩個聚類的中心的相似性(距離)用戶id聚類10.38,0.33,0.25聚類20.28,0.52,0.1210.02530.097720.11530.013730.02430.163740.07940.017050.26620.358560.02430.0109表6 第三次迭代聚類id化妝品興趣平均值服飾興趣平均值日用品興趣平均值11,3,50.380.330.2522,4,60.280.520.12
28、將以上的迭代結果分別用圖4、圖5和圖6來表示。注:圖中的數字代表用戶的ID。圖4選擇了用戶3和用戶4作為種子結點,并隨機將兩個聚類賦值為1,2,3和4,5,6。圖4隨機選擇兩個種子、隨機組成兩個聚類圖5是經過第二次迭代后的結果,1、3、5組成一個聚類,2、4、6組成一個聚類。圖5經過第二此迭代后的結果圖6是經過第三次迭代后的結果,和第二次迭代后的結果一樣。圖6經過第三此迭代后的結果由于第三次迭代完成時,各聚類的用戶集和第二次沒有發生變化,并且誤差e2平方和收斂,所以程序結束。此時,可以將0.35,0.33,0.25和0.28,0.52,0.12分別代表兩個虛擬用戶的值。4應用研究結論以后當有新
29、的用戶訪問時,計算其和虛擬用戶的相近程度,如果和第一個虛擬用戶比較臨近,則將第一個虛擬用戶所感興趣的商品集推薦給這個新用戶。雖然實現了個性化推薦,但是在k-menas算法中,k個中心的選取一般為隨機選取或依賴于領域知識,為了更好的選取k個中心以提高聚類的質量,需要以后對k-menas算法進行更好的改進。(二)利用關聯規則實現電子商務中的商品推薦1 Apriori算法介紹Apriori是挖掘關聯規則的一個重要方法。基本思想是:生成特定規模的候選項目集,然后掃描數據庫并進行計數,以確定這些候選項目集是否是大的。在第i趟掃描的過程中,對Ck進行計數。只有那些大的候選集被用于生成下一趟掃描的候選集。算
30、法流程圖描述:(圖7和圖8)利用Apriori-Gen()算法生成候選集C1+1大小為K的候選集Ck篩選出Ck中支持度大于最小支持度的所有項組成頻繁K-項目集LKLK為空,得到頻繁項目集LK不為空(1)生成頻繁項目集圖7k為頻繁項目集L中的項目數大于2的真子集對于k的每一個真子集h,計算它到它關于k的補集k-h的置信度置信度大于最小值,把hk-h添加到關聯規則中置信度部大于最小值(2)生成關聯規則圖82Apriori算法在電子商務中的應用研究用戶購買商品用戶購買商品1護膚品&日用品&衣服&化妝品10體育用品&鞋類&學習用品2體育用品&褲子&裝飾品&鞋類11衣服&體育用品&鞋類&玩具3衣服12體
31、育用品&裝飾品&書本4體育用品&裝飾品&鞋類&書本13體育用品&鞋類5體育用品&書本&玩具14鞋類&玩具&學習用品6鞋類15體育用品&軟件&學習用品7影視&護膚品&化妝品16體育用品&鞋類8軟件17日用品&書本9護膚品&化妝品18衣服&褲子&護膚品&化妝品首先進行的是數據分析,下表是假設用戶訪問某購物網站的時候的記錄。如表7所示。我們將此表作為事物數據庫,并將最小支持度閾值設置為20%,最小置信度閾值設為70%,我們來求該事務數據庫中的頻繁關聯規則。表7 用戶對各商品的興趣值3Apriori算法的應用說明為了方便推導,首先我們將護膚品、日用品、衣服、化妝品、體育用品、褲子、裝飾品、鞋類、軟件、
32、書本、玩具、影視、學習用品分別用大寫字母A,B,C,D,E,F,G,H,I,J,K,L,M替換,將時間省去,故事物數據庫可表示為表8所示。表8 事務數據庫用戶購買商品用戶購買商品1A&B&C&D10E&H&M2E&F&G&H11C&E&H&K3C12E&G&J4E&G&H&J13E&H5E&J&K14H&K&M6H15E&I&M7L&A&D16E&H8I17B&J9A&D18C&F&A&D第一步:求出事務數據庫中所有的頻繁項目集。(1)置候選頻繁1-項目集C1=A,B,C,D,E,F,G,H,I,J,K,L,M。(2)掃描事務數據庫計算C1中各項目集在事物數據庫中的支持數和相應的支持度。如表9
33、所示。表9 事務數據庫(C1)的支持數與支持度候選1項目集支持數支持度A422%B211%C422%D422%E950%F211%G317%H844%I211%J422%K317%L16%M317%(3)根據最小支持度閾值20%得到頻繁1-項目集L1=A,C,D,E,H,J。(4)調用Apriori-Gen(L1)生成候選頻繁2-項目C2=A,C,A,D,A,E,A,H,A,J,C,D,C,E,C,H,C,J,D,E,D,H,D,J,E,H,E,J,H,J。(5)掃描事物數據庫計算C2中各項目集在事物數據庫中的支持數和相應的支持度。如表10所示。表10 事務數據庫(C2)的支持數與支持度候選2
34、項目集支持數支持度A,C211%A,D422%A,E00%A,H00%A,J00%C,D211%C,E16%C,H00%C,J00%D,E00%D,H00%D,J00%E,H633%E,J317%H,J16%(6)根據最小支持度閾值20%得到頻繁2-項目集L2=A,D,E,H。(7)調用Apriori-Gen(L2)生成候選頻繁3-項目集C3=A,D,E,A,D,H,A,E,H,D,E,H。(8)由于候選頻繁項目集A,D,E的長度為2的子集D,E為非頻繁項目集,候選頻繁項目集A,D,H的長度為2的子集D,H為非頻繁項目集,候選頻繁項目集A,E,H的長度為2的子集A,H為非頻繁項目集,候選頻繁項
35、目集D,E,H的長度為2的子集D,H為非頻繁項目集,故可以刪除A,D,E,A,D,H,A,E,H,D,E,H,因此L3為空集,循環結束。(9)L=L1L2=A,C,D,E,H,J,A,D,E,H。第二步:根據L求D中的所有關聯規則,此時只需要考慮長度大于1的頻繁項目集。如項目集A,D,E,H。由項目集A,D生成關聯規則的步驟如下:(1)對于A,D中任意非空真子集A,D分別計算關聯規則AD、DA的置信度,其值分別為:100%、100%。對于E,H中任意非空真子集E,H分別計算關聯規則EH、HE的置信度,其值分別為:75%、67%。(2)根據最小置信度閾值70%,AD、DA、EH為關聯規則,其余均
36、不滿足最小置信度閾值條件,應刪除。4應用研究結論本實驗生成了置信度大于最小置信度閾值的關聯規則:AD、DA、EH,即購買護膚品的顧客必購買化妝品,購買化妝品的顧客必購買護膚品,75%的購買體育用品的顧客會購買鞋類。該電子超市可以利用上述規則在網站構建時把相關商品設計為一跳鏈接或組合銷售以提高銷售量和方便顧客。上文所提到的基于Apriori的頻繁訪問路徑挖掘算法,正如算法所描述的那樣,必須要反復地在事務數據庫中搜索并進行項目集的合并,才能找到滿足最小支持度的頻繁路徑集,在事務數據庫比較龐大的情況下,搜索反復讀庫,可能會造成效率低下,而且需要很長時間。為了提高算法的效率,我們應該還要對這個算法作了
37、一些改進。Apriori算法效率不高的癥結是在于反復生成候選集,并反復根據這個候選集在事務數據庫中進行搜索計算。如果能夠一次性生成全部候選集,則只要掃描一次數據庫就能解決問題,效率自然能夠大大提高。四、應用數據挖掘技術實現電子商務個性化推薦服務(一)個性化電子商務網站的體系結構除了構建一個面向數據挖掘的電子商務網站體系架構。我們又深入地探討了如何在電子商務網站上使用應用挖掘來發現用戶的訪問模式和頻繁訪問路徑。也討論了如何使用內容挖掘來提取和抽取頁面的內容來發現相似頁面的聚類。有了這些信息以后,我們就有可能將得出的知識進行整合和應用,最終建立起一個實用的個性化電子商務網站。(二)個性化推薦服務系
38、統數據挖掘技術在個性化推薦服務主要體現在以下幾個方面(圖9):關聯規則挖掘、聚類算法分析、貝葉斯分類、協同過濾推薦、序列模式挖掘等。關聯規則挖掘聚類算法分析貝葉斯分類個性化推薦服務協同過濾推薦評價序列模式挖掘圖9 個性化推薦服務系統 在上面的文章中,描述了將其中的聚類算法和關聯規則實際運用到電子商務中的過程和算法,得到了想要的結果:實現用戶聚類和商品推薦這兩個步驟,真正實現了電子商務的個性化推薦服務。(三)電子商務個性化推薦服務為電子商務帶來的好處去實現和改善個性化推薦服務,是因為個性化電子商務網站的設計不僅使用戶能夠迅速快捷地獲得信息,提高了用戶的忠誠度,同時為電子商務網站帶來了豐厚的商業利益。主要體現在以下幾個方面:(1)提高電子商務網站的服務:個性化電子商務可以更好地幫助網站的設計者調整站點的邏輯設計,達到方便用戶使用的目的。(2)商業智能的發現:個性化電子商務能夠發現用戶的購買模式,實現不同分類商品的交叉銷售,減少用戶冗余訪問。(3)建立和加強用戶的忠誠度:由于個性化電子商務網站對用戶實現了“一對一”的服務,進一步吸引了用戶,使用戶在站點上逗留的時間加長,有效地防止用戶離去。用戶得到站點給他們提供的個性化服務后,他們會對電子商務站點賦予更多的忠誠。(4)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 國際象棋團體錦標賽行業跨境出海項目商業計劃書
- 遼寧金融職業學院《非線性編輯Ⅱ》2023-2024學年第二學期期末試卷
- 河南開封科技傳媒學院《實驗方法設計與現代測試技術實驗》2023-2024學年第二學期期末試卷
- 重慶理工大學《數據結構及應用》2023-2024學年第二學期期末試卷
- 會計崗位管理制度
- 湖南外國語職業學院《生物工程專業大》2023-2024學年第二學期期末試卷
- 會議管理管理制度
- 廣西經貿職業技術學院《音樂傳播》2023-2024學年第二學期期末試卷
- 傳菜衛生管理制度
- 低壓電房管理制度
- 快樂海豚課件教學課件
- 國開《農村社會學》形考作業1-4參考答案
- 電子煙質量管理手冊
- 城市數字底座CIM數字城市發展方向與技術
- 財政學學習通題庫及答案
- 2023-2024學年全國初二下歷史人教版期末試卷(含答案解析)
- 形勢與政策智慧樹知到答案2024年西北師范大學
- 2024-2030年中國射擊場行業市場發展趨勢與前景展望戰略分析報告
- 施工現場建筑垃圾減量化專項方案
- 高三數學一輪復習題型與戰法精準訓練(新高考專用)7.2.2點線面的位置關系(針對練習)(原卷版+解析)
- 2024年吉林省中考歷史試卷真題(含答案)
評論
0/150
提交評論