面向數據挖掘的云端實施方案_第1頁
面向數據挖掘的云端實施方案_第2頁
面向數據挖掘的云端實施方案_第3頁
面向數據挖掘的云端實施方案_第4頁
面向數據挖掘的云端實施方案_第5頁
已閱讀5頁,還剩8頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

面向數據挖掘的云端實施方案摘要:云端運算是一種基于互聯網的新興應用計算機技術,數據挖掘是商業智能的重要環節,DataMining與云端運算的結合將極大提高數據挖掘的應用與統計科學的發展。本文提出了云端的數據挖掘即服務(DMaaS,DataMiningasaServes)的概念,分別從IaaS、PaaS與DMaas給出了面向數據挖掘的云端實施方案;設計出商用DM軟件與開源DM軟件的云端實施平臺,引入R中平行運算技術對Cloud-R進行改進。關鍵詞:云端運算;DataMining;DMaaS;平行運算中圖分類號:C81文獻標識碼:ATheCloudComputingProgramforDataMiningTechnologyAbstract:CloudcomputingisakindofnewlyemergingtechnologyofcomputerapplicationbasedonInternet.DataMiningisakeystepinBusinessIntelligence.ThecombinationofDataMiningandCloudcomputingwillgreatlyenhancetheapplicationofDataMiningandthedevelopmentofStatisticsScience.ThepaperproposestheconceptofDMaaSandprovidesimplicationprogramsofcloudcomputingfromtheaspectofIaaS,PaaSandDMaaSrespectively.ThepaperdesignsthecloudcomputingplatformsofCommercialDMsoftwareandopensourceDMsoftware,andintroducesparallelcomputinginRtoimproveCloud-R.Keywords:CloudComputing;DataMining;DMaaS;ParallelComputing引言數據挖掘也是商業智能的重要環節,數據倉庫是數據挖掘得以發展的基礎,也是商業智能的支撐,由此可見數據倉庫對于商業智慧來言具有很重要的作用,它集成了企業的最核心的數據,隨著企業對數據的再次利用和深入挖掘,海量數據的高效計算問題成為企業最為關注的一個問題之一。在商業智慧(BI)活動中,數據倉庫與數據挖掘要求的費用支出龐大,很多中小企業望而卻步。云端運算的出現,對中小企業來講,是一個振奮人心的好消息。如果云端運算應用在商業智能上,由于云端運算具有按需使用、按使用收費特性,這將大大減少企業應用商業智能的成本。此外,一方面,我們可以通過云的數據倉庫實現海量數據的高效計算。另一方面,云端運算可以實現在線支付使用數據挖掘工具和商業智能相關分析處理軟件。數據挖掘(DataMining)具備更多的工具與更成熟的功能,與領導品牌的BI解決方案并駕其驅,但投資成本卻更低;DataMining大幅提升的效能與新增強化的功能,吸引我們全面升級以發揮新技術的效益。例如,臺灣廣達電腦有限公司以Intel搭配SQLServer,所耗費的成本卻低于Unix的三分之一,創造了絕對的成本優勢。目前,在線數據挖掘服務也受到大陸許多企業的青睞,中國的海量信息技術有限公司提供的名“海納睿”的在線數據挖掘服務,可以利用其在在線網絡數據挖掘技術上的優勢,為用戶提供個性化需求,定制個性模塊服務,以此來滿足網站的不同需求。此外,開源商業智慧(BI)廠商生態系統逐漸崛起,包括JasperSoft、Actuate、Pentagon、SpagoBI等。云端運算(CloudComputing)是分布式處理(DistributedComputing)、并行處理(ParallelComputing)和網格計算(GridComputing)的發展,或者說是這些計算機科學概念的商業實現,它具有超大規模、虛擬化、高可靠度、高通用性、使用者付費、成本低、高擴充性等特色。云端運算將龐大運算操作拆成千百個較小的操作,再交給遠程、多臺服務器同時運算;透過此種技術,網絡服務提供者可以在數秒之內,處理數以千萬計的信息,并提供和超級計算機一樣強大效能的網絡服務,以符合網絡用戶日增的各種需求。云端運算基于因特網的運算方式,它通過因特網為個人使用者或企業使用者提供按需即取的服務。直觀來講,云端算法就是讓網絡上不同計算機同時幫你做一件事情,大幅度的提高了處理速度和效率。云端運算的最終目標即為所有的資源均來自于云端,使用者只需一個連接云端的設備(手機等)和簡單的界面(如瀏覽器等)即可,Google搜尋服務,Gmail,YouTube,GoogleDocs,GoogleTalk,iGoogle,GoogleCalendar已充分使用云端運算技術;其它如微軟,YAHOO,AMAZON也采用這種技術提升網絡服務功能。從概念上說,使用者需要云端運算的計算平臺或IT基礎設施,并在這些平臺與設施中運行應用。因此,計算云給予使用者進入硬件、軟件及數據資源的服務,此后,一個集成的計算平臺以一種透明的方式進行服務。軟件軟件即服務SaaS平臺即服務平臺即服務PaaS架構即服務架構即服務IaaS圖1云端架構服務層次示意圖云端運算包括以下幾個層次的服務,架構即服務(IaaS),平臺即服務(PaaS)和軟件即服務(SaaS)。云端運算服務通常提供通用的通過瀏覽器存取的在線商業應用,軟件和數據可儲存在數據中心。架構即服務提供了核心計算資源和網絡架構的服務,如防火墻、路由器、下載分配等。架構即服務供貨商包括亞馬遜的彈性計算云EC2和Joyent。平臺即服務提供平臺給系統管理員和開發人員,為它構建、測試及部署定制應用程序。平臺即服務供貨商包括微軟的Azure、Google的AppEngine等。軟件即服務通過Internet提供軟件的模式,用戶向提供商租用基于Web的軟件,來管理企業經營活動,且無需對軟件進行維護,服務提供商全權管理和維護軟件。軟件即服務供貨商包括惠普的云打印服務,IBM的LotusLive為企業提供的協作和社交網絡服務。其它SaaS提供商如Birst和SAS提供按需商務智慧服務,S和Zoho提供客戶關系管理(CRM)等。一、面向DM的架構即服務(IaaS)架構即服務(IaaS)作為服務或硬件服務,指的是提供以IT基礎設施為基礎,基于虛擬或物理資源作為一種商品;這些資源滿足內存,CPU類型和能力以及存儲方面的最終用戶的需求,并在大多數情況下是操作系統。用戶按使用計費的基礎上支付,必須建立對這些資源的主持和賣方所擁有的數據中心管理上他們的系統;架構即服務提供了核心計算資源和網絡架構的服務。IaaSIaaS技術實施方案(Technology)技術實施方案(Technology)機房建置(Hardware)構建軟件平臺(Software)圖2IaaS架構圖面向DataMining的IaaS,其軟件平臺、機房建置與技術實施可按照表1中的方案實施。表1面向DM的IaaSIaaS構成實施方案構建軟件平臺(Software)提供用戶R軟件完善的web接口,以及多臺雙核心服務器的支持,進而縮短統計分析上所耗費的計算時間(適用于Cloud-R云端實施平臺)以R統計軟件為基礎,透過網頁瀏覽器即能做出統計運算,并且加入云端技術的支持,讓使用者可以無限擴充運算能力(適用于Cloud-R云端實施平臺)采用SUN-Micro、Trend-Micro技術作為支持,完成硬件虛擬化基本架構以OpenSource為主進行研發,掌握Totalsolution評估Centos,Xen,Hadoop,Tashi,Eucalyptus,Ganglia,Nagios等開源軟件集,進行各項運轉測試機房建置(Hardware)硬件建置:X86PC/服務器為基礎的叢集系統整合云端測試套件(TestSuites);確認示范應用導入需求及測試規格GUIportal建置技術實施方案(Technology)虛擬平臺機:以x86PC服務器架構叢集系統,建立虛擬機平臺,運用開放原始碼軟件,建置如Amazon-like云端服務,實作IaaS試營運自動化負載平衡:在多核系統上使用Xen控制多臺虛擬機并執行不同功能的伺服主機;變動Xen的CreditCPU排程器的weight及cap參數設定,來觀察虛擬伺服主機的效能;利用觀察的經驗數據及機器學習算法建立效能函數模型;利用多目標決策規劃尋找最佳的weight及cap參數設定自動化大量數據切割與整合:以Java語言進行單機系統仿真大量數據切割與重組;設計出單機系統仿真大量數據切割與重組的多引線算法,并開發修正邊緣計算效應的算法(4)服務質量衡量:透過客戶端程序與HadoopDistributedFileSystem(HDFS)上的NameNodedaemon溝通,以得到對客戶端程序存取最有利的DataNodedaemon所在的主機位置及檔案目錄。接著,客戶端程序再直接向DataNodedaemon要數據或上傳數據至該主機上GPU協同平行化程序分析與部屬:以OpenMP、WindowsAPIThreads進行多核心CPU分布式算法設計,并使用NVIDIAGUDAGPU進行分布式算法設計,使兩種不同架構下的計算進行比較與測試,也設計CPU與GPU協同運算算法。云端運算主機使用CPU與NVIDIACUDAGPU協同運算,在時間、人力充足的情況下,可以考慮使用ThreadsAPI對硬件做進一步效能優化注:參考資料:1、謝邦昌.《云端運算在商業智能及數據挖掘的應用前沿綜述》.2010。2、臺灣財團法人信息工業策進會國立中山大學.《臺灣云端達算應用實驗中心研發計劃》.2010.二、面向DM的平臺即服務(PaaS)PaaS(PlatformasaService)就是將云計算時代相應的服務器平臺或者開發環境作為服務提供給用戶,用戶可以在平臺上進行軟件部署及軟件開發等工作陣。平臺即服務(PaaS)作為一個服務解決方案提供應用程序或開發平臺,用戶可以創建自己的應用程序將在云中運行。平臺即服務提供平臺給系統管理員和開發人員,以及它構建、測試及部署定制應用程序。PaaS的實現提供了一個應用程序框架和一組API,可用于編程或開發人員組成的云應用程序的用戶。在一些情況下,PaaS的解決方案通常提供為一體的綜合開發平臺,同時提供一個系統和一個頂尖的IT基礎結構的申請將被執行。(一)接口服務發布接口服務發布是實現PaaS平臺應用管理的關鍵技術。接口服務按照SOA模式,采用WebService技術進行發布。以.Net平臺下的接口設計和發布為例:將所有業務服務功能封裝成接口實體類并編譯,PaaS平臺將實體類的名稱、調用規范、功能描述等信息添加到應用接口列表中,并實現接口與業務實體類的映射;用戶在使用接口時,向平臺發送WebService請求;攔截器將請求截獲后在接口列表中查找出相應接口和實體類,通過反射技術取得實體對象進行業務處理,最后將處理結果返回給用戶。業務業務用戶封裝、編譯接口調用請求業務實體類處理結果WebService業務實體類處理結果WebService攔截器注冊、映射應用接口列表應用接口列表機器學習數據挖掘統計分析機器學習數據挖掘統計分析可視化圖3面向DM的應用接口注冊及調用邏輯結構(二)CommonAPI技術整合現有服務的API,對現有云端服務API進行研究(GoogleAPIs、MicrosoftAzureAPIs、webserviceAPIs),使用規范將定義成說明檔,以利使用者查詢。在使用者自制云端服務的上傳機制,也將撰寫一個網頁,以方便使用者上傳至云端,供其他使用者使用。而在檢查機制上,也會有所限定;利用DWR,讓javascript去呼叫在云端的meta-api即云端服務,以達到云端服務的提供與實現。三、面向DM的軟件即服務(DMaaS)面向DM的軟件即服務DMaaS(DataMiningasaServes)是數據挖掘的新理念,通過Internet提供軟件的模式,用戶向提供商租用基于Web的DM軟件,來進行企業或個人的數據挖掘活動,且無需對軟件進行維護,服務提供商會全權管理和維護軟件。DM軟件在應用時作為服務,通過互聯網提供給顧客。圖4DMaaS示意圖(一)DMaaS的商用軟件DM云端實施平臺DMssS商用軟件DM云端實施平臺是一種通過Internet向用戶提供DM軟件與服務的模式,用戶不用再購買軟件,而改為向服務提供商租用基于Web的商用數據軟件來管理企業經營活動。商用軟件DM平臺降低了用戶電腦安裝或運行應用的需求,減輕了用戶軟件維護的負擔,用戶不需要擔心商業DM軟件版本的不斷更新的問題,只要通過Internet連接到該實施平臺,就能夠使用該平臺提供的最新版本的商用軟件,從而降低了企業與個人軟件購買的費用,大幅度提升了企業和個人進行數據挖掘活動的效率。DMaaS商用軟件DM平臺可以提供的DM軟件包括:SQLserver2008、SPSS19(PAWS)–IBM、SAS、SQL2008+Excel(2008)-DataMiningAdd-in、Clementine12.0、Statistica7.0、WEKA、R+ExcelADD-IN等。相應的商用軟件DM實施平臺如表2所示。

表2DMaaS商用軟件DM云端實施平臺平臺中DM商用軟件DM云端平臺名稱DM云端服務SQLserver2008Cloud-SQLserver決策樹、聚類分析、關聯規則、主成分分析、因子分析、類神經網絡、Logsitc回歸、支持向量機、線性回歸、文本數據挖掘……SPSS19(PAWS)Cloud-SPSSSASCloud-SASSQL2008+Excel(2008)Cloud-SQL+ExcelClementine12.0Cloud-ClementineStatistica7.0Cloud-StatisticaWEKACloud-WEKADMaaS商用軟件DM云端實施平臺能夠為用戶提供便利的DM服務,其優點是操作簡便,用戶界面友好,能夠有效進行企業海量數據的處理與分析。但該平臺也存在一些較為明顯的缺點:(1)DMaaS商用軟件DM云端實施平臺的運營與管理的成本較高,由于該平臺提供的是商用DM軟件,需要花大量資金購買相應DM軟件,隨著商用軟件版本的不斷升級,為了滿足業務的需要,該平臺的商用DM軟件業必須不斷更新,這樣進一步增加了該平臺管理與運營的成本。(2)DMaaS商用軟件DM云端實施平臺提供的DM服務是基于商業DM軟件的,由于目前數據挖掘方法發展迅速,DM方法不斷更新,而常用的商用DM軟件中提供的數據挖掘方法有限,在科學研究與特定商業數據處理過程中,用戶需要用到的許多數據挖掘方法無法通過商用軟件實現。為了解決商用軟件DM云端實施平臺的問題,開源軟件DM平臺有了廣闊的應用與發展空間。(二)DMaaS的開源軟件云端實施平臺—Cloud-R1.Cloud-R簡介對于現今的商業智能分析而言,通常需要進行海量數據的分析。因此,運用計算機的高效運算能力對數據資料進行統計分析已經是統計發展的必然趨勢。以R為首的多套統計軟件都擁有強大的處理以及統計能力。由于R軟件是以GNU自由免費開發中的Slanguage項目而來,具有廣大群眾支持以及快速更新的優點,用戶可以在RProject網站中免費下載使用R軟件。但在商業數據挖掘過程中,R個人用戶的計算機硬件配備無法支持龐大的計算量。此外,由于R軟件版本與程序包更新較快,可能降低了一部分用戶使用R軟件的意愿。針對以上R軟件所固有的缺點,我們希望能夠將R軟件擴充成為一項webservice,R軟件的廣大用戶將能夠透過web接口輕松的使用R軟件,應用云端技術協助負擔信息分析所需要用到的大量運算效能。因此,開源軟件DM云端實施平臺Cloud-R逐漸建立起來,Cloud-R網站將提供用戶R軟件完善的web接口,并且至少有一臺四核心、多臺雙核心服務器的支持,進而縮短統計分析上所耗費的計算時間。Cloud‐R網站主要以R統計軟件為基礎,用戶在網頁瀏覽器即可做出統計運算,由于云端技術的支持,使用者可以無限擴充運算能力。Cloud‐R網站可以藉由任何網頁瀏覽器進行操作。作為與R軟件相互呼應的網路接口,Cloud‐R支援R軟件所提供的所有指令;使用者可實時的運算,并立即將結果及圖片呈現在網頁上。使用者可下載使用過的程序與結果Cloud‐R與其他web接口的R不同的地方在于使用php語言撰寫而成,使用者不需再另外加裝java或是其他套件,用戶只需能夠連接到Internet,即可方便應用該平臺應用R軟件進行統計分析,并且可方便的將統計結果與他人共享。透過Cloud‐R,使用者可以更輕松、無負擔的使用R統計軟件,用戶可通過網頁界面調用資料庫,能夠將所需的分析資料、程序快速的下載到任何計算機中,并且能享用平行運算所帶來的好處。Cloud‐R提供了使用者更便利、更有效率、更強大的計算機運算能力,進一步拉近了用戶使用R軟件的門檻,并推動了統計分析、數學運算的各領域的更快發展。2.Cloud-R技術改進—R的平行運算技術(1)Cloud—R現行的平行運算技術。目前的Cloud‐R在實現平行運算能力方面,需要預先加載R軟件中的networkspace程序包,networkspace提供了完整的平行運算基礎,與過往平行運算所不同的是,networkspace以更有效的方法處理變量的共享問題,讓平行運算的效能能更加發揮。Cloud‐R目前提供一臺四核心主機、兩臺雙核心主機以及Raid5的備份機制,用戶不需擔心計算機效能與儲存空間的問題,在未來的運營中,只要在Cloud‐R網站加入運算能力更強的主機及更大的儲存空間,所有的使用者便能一起享受到升級過后所帶來的便利,而不需再耗費大量時間與財力來擴充個人計算機的效能與容量,同時也有效解決了計算機資源閑置浪費的問題。(2)R的平行運算技術。平行計算是一種許多運算同時實施計算形式,其原理是將大問題分成若干小問題,然后并行的解決問題。目前,Cloud-R中的平行運算中存在一些問題,例如,單獨的程序容易影響一個完整的架構,例如該程序分配到過多的CPU或RAM,而沒有給其他用戶和程序留下資源,或者該程序的運行降低了一個或更多的計算機的運行效率。R中的sfCluster程序能夠有效進行CPU資源的配置。因此,對于工作組或較大的集群,可以在Cloud-R云端實施平臺中引入sfCluster中的平行計算技術。SfCluster的工作流程如下圖所示。初始化執行觀察環啟動R(控制)內存占用檢測啟動R(控制)內存占用檢測檢查R進程檢查R進程觀察環全面資源檢查觀察環全面資源檢查檢測節點撤銷集群安裝檢測節點撤銷集群安裝集群(會話)可視狀態可視狀態關閉LAM集群啟動LAM/MPI關閉LAM集群啟動LAM/MPI集群可選步驟遇錯停止可選步驟遇錯停止圖5SfCluster的工作流程現已開發了管理工具sfCluster和相應的R程序包snowfall,它們旨在使并行程序更簡單和靈活。sfCluster完全隱藏了來自用戶的集群的安裝和處理以及監控所有引起機器和集群問題的并行程序的執行。sfCluster與snowfall的配合使用,可以使用戶在沒有關于集群與計算機配置知識的情況下,仍可以使用R中進行并行計算。此外,snowfall支持PVM和NetWorkSpaces/Sleight的使用。基本來講,snowfall的使用流程機制如下所示:第一,使用sfInit()進行初始化,安裝cluster(如果需要)和內部函數。第二,sfInit()必須在使用snowfall包的任何函數之前被調用。第三,對所有從屬程序輸出所需的變量/對象。第四,使用snowfall計算函數進行一些平行計算。第五,按所需重復多次。最后,使用sfStop()結束平行計算。具體R程序演示如下:library(snowfall)#調用snowfall程序包#1.Initialisationofsnowfall.Snowfall的初始化#(ifusedwithsfCluster,justcallsfInit())(如果使用sfCluster,就調用sfInit())sfInit(parallel=TRUE,cpus=4,type="SOCK")#2.Loadingdata.裝載數據require(mvna)data(sir.adm)#3.Wrapper,whichcanbeparallelised.封裝平行列表wrapper<-function(idx){#Outputprogressinworkerlogfile在文件logfile中輸出進程cat("Currentindex:",idx,"\n")index<-sample(1:nrow(sir.adm),replace=TRUE)temp<-sir.adm[index,]fit<-crr(temp$time,temp$status,temp$pneu)return(fit$coef)}#4.Exportingneededdataandloadingrequired輸出所需的數據并裝載所要求的程序包#packagesonworkers.sfExport("sir.adm")sfLibrary(cmprsk)#5.Startnetworkrandomnumbergenerator啟動網絡隨機數產生器#(as"sample"isusingrandomnumbers).(作為“樣本”使用隨機數)sfClusterSetupRNG()#6.Distributecalculation分配計算result<-sfLapply(1:1000,wrapper)#Resultisalwaysinlistform.結果總在列表中mean(unlist(result))#7.Stopsnowfall結束snowfallsfStop()3.Cloud-R提供的云端服務Cloud-R面向DM的云端服務主要分為兩類,具體內容如下表所示。

表3DMaaS提供的云端服務第一類:數據庫第二類:DataMining新增查詢刪除匯入匯出BinaryClassifier(二元分類)NumericPredictor(數值預測)TimeSeries(時間序列)C&RTREE(分類回歸樹)QuickUnbiasedEfficientStatisticalTree(QUEST判定樹模型)CHAID(分類樹)DecisionList(判定樹列表)Regression(線性回歸分析)PCA/Factor(主成分分析)NeuralNet(類神經網絡)C5.0(判定樹)FeatureSelection(特征選取)DiscriminantAnalysisLogistic(羅吉斯回歸)GeneralizeLinearModel(廣義線性模型)CoxRegression(Cox回歸)SupportVectorMachine(支持向量機)BayesNet(貝氏分類器)SLRM(自我學習反應模型)GRI關聯Apriori關聯CARMA關聯(連續交易)SequenceClusterc序列關聯K-Means(K-Means分群)Kohonen(自我組織化)Two-Step(二階段)Anomaly(異常檢測)RandomForests(隨機森林)ICA(獨立成分分析)Multivariateadaptiveregressionspline(MARS多元適應性回歸平滑)Pmml(預測模型標記語言)Boosting……注:資料來源:謝邦昌.《云端運算在商業智能及數據挖掘的應用前沿綜述》.2010。Cloud-R云端實施平臺可以提供全面而靈活的DM的云端服務,改善了商業軟件云端平臺DM算法更新滯后的缺點,用戶可以應用最新版本的R軟件及最新的R統計方法。用戶也可以根據自己需要,根據實際需要編寫自己的程序。在云端平臺管理方面,由于R軟件是開源軟件,其下載及使用均是免費的,因此較商用軟件云端平臺相比,Cloud-R的具有成本低,管理方便的優點,因此將成為DMaaS未來的發展趨勢。四、結語面向DM的云端運算DMaaS是一個全新的理念,它不但適用于企業信息化的應用模式,又能夠極大促進數據挖掘技術與商業智能的發展。作為一種全新的軟件應用模式,DMaaS發展過程中還面臨著不少問題,其中包括DMaaS模式自身的問題,也有企業用戶及DMaaS供應商的問題。我們有理由相信,DMaaS在發展過程中遇到的問題和阻礙只是暫時的,在未來,DMaaS在云端運算領域有著廣闊的發展及應用前景,DMaaS產業也將會不斷完善,使更多企業和個人受惠于DMaaS。參考文獻[1]A.Berson,S.J.Smith&K.Thearling.BuildingDataMiningApplicationsforCRM[M].McGraw-Hill,1999.[2]A.Rossini,L.Tierney&N.Li.SimpleparallelstatisticalcomputinginR[J].JournalofComputationalandGraphicalStatistics,2007.16(2),399–420.[3]BlackFridaytraffictakesdownS[M].AssociatedPress,2008(11).[4]CHENG,D.PaaS-onomics:ACIO’sGuidetousingPlatform-as-a-ServicetoLowerCostsofApplicationInitiativesWhileImprovingtheBusinessValueofIT[M].Tech.rep.,LongJump,2008.[5]C.Oehmen,J.Nieplocha.Scalablast:Ascalableimplementationofblastforhigh-performancedata-intensivebioinformaticsanalysis[J].IEEETransactionsonParallelandDistributedSystems,2006.17(8),740–749.[6]DEAN,J.,ANDGHEMAWAT,S.Mapreduce:simplifieddataprocessingonlargeclusters[J].InOSDI’04:Proceedingsofthe6thconferenceonSymposiumonOpeartingSystemsDesign&Implementation(Berkeley,CA,USA),USENIXAssociation,2004(10),10.[7]DECANDIA,G.,HASTORUN,D.,JAMPANI,M.,KAKULAPATI,G.,LAKSHMAN,A.,PILCHIN,A.,SIVASUBRAMANIAN,S.,VOSSHALL,P.,ANDVOGELS,W.Dynamo:Amazon’shighlyavailablekey-valuestore[J].InProceedingsoftwenty-firstACMSIGOPSsymposiumonOperatingsystemsprinciples[M],ACMPressNewYork,NY,USA,2007.205–220.[8]E.Alpaydin.IntroductiontoMachineLearning(AdaptiveComputationandMachineLearning)[M].2004.MITPress.[9]GARFINKEL,S.AnEvaluationofAmazon’sGridComputingServices:EC2,S3andSQS[M].Tech.Rep.TR-08-07,HarvardUniversity,August2007.[10]GRAY,J.,ANDPATTERSON,D.AconversationwithJimGray[J].ACMQueue1,4(2003),8–17.[11]HOSANAGAR,K.,KRISHNAN,R.,SMITH,M.,ANDCHUANG,J.Optimalpricingofcontentdeliverynetwork(CDN)services[J].InThe37thAnnualHawaiiInternationalConferenceonSystemSciences,2004.205–214.[12]J.Murty.ProgrammingAmazonWebSe

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論