數據挖掘技術在電子商務網站中的應用_第1頁
數據挖掘技術在電子商務網站中的應用_第2頁
數據挖掘技術在電子商務網站中的應用_第3頁
數據挖掘技術在電子商務網站中的應用_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數據挖掘技術在電子商務網站中的應用    摘 要:在電子商務日趨激烈的競爭環境下,用戶希望在眾多的電子商務網站中找到最佳選擇,而商家希望能夠通過為用戶提供方便快捷的選擇,獲得忠誠的客戶。商家如何能有效留住客戶,防止客戶流失,提高銷售力及競爭力,是目前電子商務所面臨的挑戰。 關鍵詞:電子商務;推薦系統;數據挖掘 當用戶和電子商務的商家充分享受電子商務的快捷和方便時,他們同時面臨著某些新的問題。一方面,用戶面對網站上提供的琳瑯滿目的眾多商品,他們只對其中的一部分商品感興趣。用戶要實現一次的購買,就必須瀏覽許多不相關的網頁,在眾多的商品分類中找到自己所需要的商

2、品;另一方面,商家面對眾多的用戶,不知道他們對商品的興趣和要求是什么。因此,電子商務的商家無法及時調整網站的頁面結構,提供給所有的用戶是千篇一律的界面。缺乏個性化服務己經成為制約電子商務發展的關鍵問題?;赪eb數據挖掘技術的電子商務推薦系統提供了一種有效的解決方法。 推薦系統就是根據用戶個人的喜好、習慣來向其推薦信息、商品的程序。電子商務推薦系統能夠直接與用戶交互,模擬商店銷售人員向用戶提供商品推薦,幫助用戶找到所需商品,從而順利完成購買過程。從用戶角度來看,電子商務推薦系統通過對收集到的用戶的訪問行為、訪問頻度、訪問內容等瀏覽信息進行挖掘,提取用戶的特征,獲取用戶訪問Web的模式,動態地調

3、整頁面結構,為用戶實現主動推薦,提供個性化服務;從企業角度來看,企業希望能夠獲取用戶的訪問規律,以幫助企業確定顧客消費的生命周期,針對不同的產品制定相應的營銷策略,進一步優化網站的組織結構和服務方式,以提高網站的效率。推薦系統在幫助了客戶的同時也提高了顧客對商務活動的滿意度,換來對商務網站的進一步支持。 一、推薦系統在電子商務活動中的作用 一般說來,推薦系統在電子商務活動中的作用可以歸納為以下幾點: (一)把瀏覽者轉變成購買者 己有明確購物目標的客戶也許可以借助檢索系統找到自己需要的東西,但對于大多數只是四處逛逛看一看的沖浪者,或是對自己的需要比較模糊的購買者,很難有耐心在幾十頁長的商品目錄逐

4、項查找是否有自己感興趣的東西。而推薦系統通過合適的推薦,可以將一個瀏覽者變為購買者。 (二)提高電子商務系統的交叉銷售能力 電子商務推薦系統在用戶購買過程中向用戶提供其它有價值的商品推薦,用戶能夠從提供的推薦列表中購買自己確實需要但在購買過程中沒有想到的商品,從而有效提高電子商務系統的交叉銷售。例如站點可以根據客戶當前購物車中的物品向他們推薦一些和這些己選購的物品相關的物品。如果有一個比較好的推薦系統,則企業的平均定購量就可能增加。 (三)提高客戶對電子商務網站忠誠度。 與傳統的商務模式相比,電子商務系統使得用戶擁有越來越多的選擇,用戶更換商家及其方便,只需要一兩次鼠標的點擊就可以在不同電子商

5、務系統之間跳轉。電子商務推薦系統分析用戶的購買習慣,根據用戶需求向用戶提供有價值的商品推薦。如果電子商務推薦系統的推薦質量很高,用戶可以很容易找到自己想要的商品,那么用戶會再次訪問這個網站,并會推薦給其他人,這對于網站來說是一個很大的優勢。 二、數據挖掘技術在電子商務推薦系統的具體應用 數據挖掘是在大型數據存儲庫中,自動地發現有用信息的過程。數據挖掘技術用來探查大型 數據庫,發現先前未知的有用模式。電子商務推薦系統將數據挖掘技術運用到電子商務領域,以數據挖掘為基礎衍生出許多算法。 (一)基于關聯規則的推薦算法 關聯規則是數據挖掘技術的一種,該技術挖掘發現大量數據中項集之間有趣的關聯或相關聯系。

6、關聯規則挖掘的一個典型例子就是購物籃分析。該過程通過發現顧客放入其購物籃中不同商品之間的聯系,分析顧客的購買習慣。通過了解哪些商品頻繁地被顧客同時購買,這種關聯的發現可以幫助商家制定營銷策略。 關聯規則的挖掘是一個兩步過程: 首先,找出所有頻繁項集。這些項集出現的頻繁性至少和預定義的最小支持計數一樣。其次,由頻繁項集產生強關聯規則。這些規則必須滿足最小支持度和最小置信度。 關聯規則挖掘算法的瓶頸出現在第一步。由于第一步需要反復掃描交易數據庫,所以增加了系統的開銷,降低了系統性能。例如:Aprior算法是一種最有影響的挖掘關聯規則頻繁項集的算法。該算法使用一種稱為逐層搜索的迭代方法尋找頻繁項集,

7、它開創性地使用基于支持度的剪枝技術,系統地控制候選項集指數增長。它缺點就是由于數據庫數據的增多,需要多次掃描數據庫,這樣便影響了系統的性能。 (二)基于內同的推薦算法 基于內容的推薦系統的產生根源于信息檢索與信息過濾。其具體是根據項之間的相似性來進行推薦的,先用機器學習等技術分析用戶已經評分的項的內容,建立用戶檔案,然后從項集中選擇與用戶檔案相似的項,再從中根據評分選擇一定的項推薦給用戶,最后根據用戶的反饋信息修正推薦。 基于內容得推薦技術具有一定的局限性。首先,資源內容必須以機器可以理解的格式表示,而很多信息例如圖像、視頻等多媒體信息是很難做到這一點的;其次,資源內容的分析范圍比較小,不能提

8、供較多的建議;再次,基于內容的推薦不能從質量、樣式、審美等角度對項進行過濾。 (三)協同過濾推薦算法 協同過濾是在信息過濾和信息系統中正迅速成為一項很受歡迎的技術。與傳統的基于內容過濾直接分析內容進行推薦不同,協同過濾分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些相似用戶對某一信息的評價,形成系統對該指定用戶對此信息的喜好程度預測。 協同過濾推薦算法的缺點是:(1)用戶對商品的評價非常稀疏,這樣基于用戶的評價所得到的用戶間的相似性可能不準確(即稀疏性問題)。(2)隨著用戶和商品的增多,系統的性能會越來越低(即可擴展性問題)。(3)如果從來沒有用戶對某一商品加以評價,則這個商品

9、就不可能被推薦(即最初評價問題)。 為了彌補各種推薦方法的缺點,在實際中常采用組合推薦。在組合推薦上,國外的有關學者提出了七種組合思路: (1)加權:加權多種推薦技術結果。 (2)變換:根據問題背景和實際情況采用不同的推薦技術。 (3)混合:同時采用多種推薦技術給出多種推薦結果,為用戶提供參考。 (4)特征組合:組合來自不同推薦數據源的特征被另一種推薦算法所采用。 (5)層疊:先用一種推薦技術產生一種粗糙的推薦結果,第二種推薦技術在此推薦結果的基礎上進一步做出更精確的推薦。 (6)特征擴充:一種技術產生附加的特征信息嵌入到另一種推薦技術的特征輸入中。 (7)Metal-Level:一種推薦方法

10、產生的模型作為另一種推薦方法的輸入。 盡管理論上有很多種推薦組合方法,但在某一具體問題中并不見得都有效,組合推薦一個最重要的原則,就是通過組合后要能避免或彌補各自推薦技術的弱點。 三、電子商務推薦算法面臨的挑戰 電子商務推薦技術在實際應用中取得了巨大成功,許多電子商務網站都提供了各種不同的推薦服務。但隨著站點結構內容的復雜度和用戶人數的增加,電子商務推薦算法也面臨許多挑戰,主要包括: (一)實時性和擴展性問題:對于上百萬之巨的數據,推薦系統必須快速處理、實時搜索,在幾毫秒內處理成千上萬用戶并提供推薦。通常的推薦算法將遭到嚴重的實時性和擴展性問題。 (二)智能化推薦:目前大部分的協同過濾推薦系統

11、采用顯示評分輸入的方式提供個推薦服務,用戶必須顯示輸入對商品的數值評分。這種方式一方面使得評分數據的獲取比較準確可信,但同時也使得用戶在使用上不是很方便。如何根據用戶的行為向用戶提供完全智能化得推薦需要做進一步的研究。 (三)實時性與推薦質量之間的平衡:推薦系統的推薦精度和實時性是一對矛盾。大部分推薦技術在保證實時性要求的同時,是以犧牲推薦系統的推薦質量為前提的。在提供實時推薦服務的同時,如何有效提高推薦系統的推薦質量,需要做進一步深入的研究。 (四)效率更好的數據挖掘算法的研究:更有效的K-最近搜索算法和聚類算法能夠提高推薦的實時性和準確性。目前的推薦系統中,K-最近搜索算法存在實時性的不足

12、等缺陷,難以快速處理大規模的數據;質量高的聚類算法能夠有效分割用戶群,適合推薦的聚類算法的性能也有待提高。 (五)新型電子商務推薦系統體系結構研究:當前大部分的電子商務推薦系統都只是一個單一的工具,只能提供一種推薦模型。但由于電子商務系統本身的復雜性,不同場合需要不同類型的推薦。因此,需要研究新型電子商務推薦系統體系結構,以有效集成多種推薦工具,收集多種類型的數據,提供多種推薦模型,使得不同的推薦工具組合使用,互補長短,滿族不同類型的推薦需要。 參考文獻: 1 曾子明,余小鵬(著):電子商務推薦系統與智能談判技術M武漢大學出版社2008.5 2Mehmed Kantardzic (著) 閃四清

13、,陳茵,程雁 等(譯):數據挖掘概念、模型、方法和算法M 清華大學出版社 2003.8 3 Pang-Ning Tan Michael Steinbach Vipin Kumar (著) 范明,范宏建 等(譯):數據挖掘導論M 人民郵電出版社 2006.5 4李雄飛,李軍(著):數據挖掘與知識發現M 高等教育出版社 2003 5劉旭東 張津銘:電子商務推薦系統研究綜述J 商場現代化 2008.10 (四)效率更好的數據挖掘算法的研究:更有效的K-最近搜索算法和聚類算法能夠提高推薦的實時性和準確性。目前的推薦系統中,K-最近搜索算法存在實時性的不足等缺陷,難以快速處理大規模的數據;質量高的聚類算

14、法能夠有效分割用戶群,適合推薦的聚類算法的性能也有待提高。 (五)新型電子商務推薦系統體系結構研究:當前大部分的電子商務推薦系統都只是一個單一的工具,只能提供一種推薦模型。但由于電子商務系統本身的復雜性,不同場合需要不同類型的推薦。因此,需要研究新型電子商務推薦系統體系結構,以有效集成多種推薦工具,收集多種類型的數據,提供多種推薦模型,使得不同的推薦工具組合使用,互補長短,滿族不同類型的推薦需要。 參考文獻: 1 曾子明,余小鵬(著):電子商務推薦系統與智能談判技術M武漢大學出版社2008.5 2Mehmed Kantardzic (著) 閃四清,陳茵,程雁 等(譯):數據挖掘概念、模型、方法

15、和算法M 清華大學出版社 2003.8 3 Pang-Ning Tan Michael Steinbach Vipin Kumar (著) 范明,范宏建 等(譯):數據挖掘導論M 人民郵電出版社 2006.5 4李雄飛,李軍(著):數據挖掘與知識發現M 高等教育出版社 2003 5劉旭東 張津銘:電子商務推薦系統研究綜述J 商場現代化 2008.10 (四)效率更好的數據挖掘算法的研究:更有效的K-最近搜索算法和聚類算法能夠提高推薦的實時性和準確性。目前的推薦系統中,K-最近搜索算法存在實時性的不足等缺陷,難以快速處理大規模的數據;質量高的聚類算法能夠有效分割用戶群,適合推薦的聚類算法的性能也

16、有待提高。 (五)新型電子商務推薦系統體系結構研究:當前大部分的電子商務推薦系統都只是一個單一的工具,只能提供一種推薦模型。但由于電子商務系統本身的復雜性,不同場合需要不同類型的推薦。因此,需要研究新型電子商務推薦系統體系結構,以有效集成多種推薦工具,收集多種類型的數據,提供多種推薦模型,使得不同的推薦工具組合使用,互補長短,滿族不同類型的推薦需要。 參考文獻: 1 曾子明,余小鵬(著):電子商務推薦系統與智能談判技術M武漢大學出版社2008.5 2Mehmed Kantardzic (著) 閃四清,陳茵,程雁 等(譯):數據挖掘概念、模型、方法和算法M 清華大學出版社 2003.8 3 Pa

17、ng-Ning Tan Michael Steinbach Vipin Kumar (著) 范明,范宏建 等(譯):數據挖掘導論M 人民郵電出版社 2006.5 4李雄飛,李軍(著):數據挖掘與知識發現M 高等教育出版社 2003 5劉旭東 張津銘:電子商務推薦系統研究綜述J 商場現代化 2008.10 (四)效率更好的數據挖掘算法的研究:更有效的K-最近搜索算法和聚類算法能夠提高推薦的實時性和準確性。目前的推薦系統中,K-最近搜索算法存在實時性的不足等缺陷,難以快速處理大規模的數據;質量高的聚類算法能夠有效分割用戶群,適合推薦的聚類算法的性能也有待提高。 (五)新型電子商務推薦系統體系結構研

18、究:當前大部分的電子商務推薦系統都只是一個單一的工具,只能提供一種推薦模型。但由于電子商務系統本身的復雜性,不同場合需要不同類型的推薦。因此,需要研究新型電子商務推薦系統體系結構,以有效集成多種推薦工具,收集多種類型的數據,提供多種推薦模型,使得不同的推薦工具組合使用,互補長短,滿族不同類型的推薦需要。 參考文獻: 1 曾子明,余小鵬(著):電子商務推薦系統與智能談判技術M武漢大學出版社2008.5 2Mehmed Kantardzic (著) 閃四清,陳茵,程雁 等(譯):數據挖掘概念、模型、方法和算法M 清華大學出版社 2003.8 3 Pang-Ning Tan Michael Steinbach Vipin Kumar (著) 范明,范宏建 等(譯):數據挖掘導論M 人民郵電出版社 2006.5 4李雄飛,李軍(著):數據挖掘與知識發現M 高等教育出版社 2003 5劉

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論