




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
DataWarehouse
Unit
4TextBContents
NewWords
Abbreviations
Phrases參考譯文NewWordsNewWordsPhrasesAbbreviationsListeningtoTextA數(shù)據(jù)倉庫1.什么是數(shù)據(jù)倉庫?數(shù)據(jù)倉庫是一種系統(tǒng),它將不同來源的數(shù)據(jù)聚合到單一的、集中的、一致的數(shù)據(jù)存儲中,以支持業(yè)務(wù)分析、數(shù)據(jù)挖掘、人工智能(AI)和機器學(xué)習(xí)。數(shù)據(jù)倉庫使組織能夠以標(biāo)準數(shù)據(jù)庫無法實現(xiàn)的方式對大量歷史數(shù)據(jù)(數(shù)拍字節(jié))運行強大的分析。數(shù)據(jù)倉庫成為商業(yè)智能(BI)解決方案的一部分,已經(jīng)有三十多年的歷史了,但是近年來有了巨大的發(fā)展。傳統(tǒng)上,數(shù)據(jù)倉庫部署在本地——通常在大型主機上,其功能主要集中在從其他來源提取數(shù)據(jù)、清理和準備數(shù)據(jù)以及在關(guān)系存儲中加載和維護數(shù)據(jù)。最近,數(shù)據(jù)倉庫可能托管在專用設(shè)備上或云中,并且大多數(shù)數(shù)據(jù)倉庫都已經(jīng)添加了分析功能以及數(shù)據(jù)可視化和演示工具。2.數(shù)據(jù)倉庫的好處數(shù)據(jù)倉庫為以下各項提供了基礎(chǔ):?更一致、更高質(zhì)量的數(shù)據(jù):數(shù)據(jù)倉庫將來自多個不同來源的數(shù)據(jù)匯集在一起,然后對其進行清理、消除重復(fù)并對其進行標(biāo)準化以創(chuàng)建單一可信數(shù)據(jù)源。參考譯文?更快、無限的洞察力:不同的數(shù)據(jù)源限制了可用于支持任何給定決策的數(shù)據(jù)。數(shù)據(jù)倉庫讓使用公司所有數(shù)據(jù)來支持每個決策變得更加容易。?尖端工具支持更明智的決策:數(shù)據(jù)倉庫支持大規(guī)模的商業(yè)智能功能,例如數(shù)據(jù)挖掘(發(fā)現(xiàn)數(shù)據(jù)中看不見的模式和關(guān)系)、人工智能和機器學(xué)習(xí)——數(shù)據(jù)專業(yè)人員和業(yè)務(wù)領(lǐng)導(dǎo)者可以使用的工具來獲得可靠的證據(jù)以做出更明智的決策,其范圍覆蓋從企業(yè)流程到財務(wù)管理和庫存管理的每個領(lǐng)域。?獲得并增強競爭優(yōu)勢:結(jié)合以上所有優(yōu)勢,可以幫助組織更快地從數(shù)據(jù)中找到更多的機會,優(yōu)于來自分散存儲的數(shù)據(jù)。參考譯文參考譯文3.數(shù)據(jù)倉庫結(jié)構(gòu)一般來說,數(shù)據(jù)倉庫具有三層結(jié)構(gòu):?提取層使用稱為ETL(提取、轉(zhuǎn)換和加載)的過程或稱為ELT(提取、加載和轉(zhuǎn)換)的過程來收集、清理和規(guī)范化/轉(zhuǎn)換來自多個源的數(shù)據(jù)。?數(shù)據(jù)存儲層通常是一個關(guān)系數(shù)據(jù)存儲庫,但是具有支持分析處理的模式。?分析層(或客戶層)可以包括從標(biāo)準查詢工具到分析、數(shù)據(jù)挖掘、人工智能或機器學(xué)習(xí)功能以及演示可視化工具的所有內(nèi)容。ETL和ELT是從原始來源提取數(shù)據(jù)并將其集成到數(shù)據(jù)倉庫中的方法。兩者之間的區(qū)別在于數(shù)據(jù)轉(zhuǎn)換的位置。ETL從各種數(shù)據(jù)源系統(tǒng)中提取數(shù)據(jù),使用中間轉(zhuǎn)換引擎對其進行轉(zhuǎn)換,然后將其加載到數(shù)據(jù)倉庫系統(tǒng)中。因為ETL在將數(shù)據(jù)寫入倉庫之前先進行數(shù)據(jù)轉(zhuǎn)換,所以它是加載較小數(shù)據(jù)量和本地數(shù)據(jù)倉庫解決方案的更好選擇。ELT從一個或多個遠程源提取數(shù)據(jù),然后將其加載到目標(biāo)數(shù)據(jù)倉庫中,而無需進行任何格式轉(zhuǎn)換。ELT流程中的數(shù)據(jù)轉(zhuǎn)換發(fā)生在目標(biāo)數(shù)據(jù)庫中。因此,ELT可以更快地將數(shù)據(jù)移至倉庫,從而使其成為較大數(shù)據(jù)量或基于云的數(shù)據(jù)倉庫解決方案的更好選擇。此外,由于ELT不會轉(zhuǎn)換傳輸中的數(shù)據(jù),因此它是唯一適合加載數(shù)據(jù)湖的方法。4.數(shù)據(jù)倉庫與數(shù)據(jù)庫、數(shù)據(jù)湖和數(shù)據(jù)集市在數(shù)據(jù)倉庫、數(shù)據(jù)庫、數(shù)據(jù)湖和數(shù)據(jù)集市之間經(jīng)常會產(chǎn)生混淆。雖然術(shù)語相似,但存在重要區(qū)別。4.1數(shù)據(jù)倉庫與數(shù)據(jù)湖數(shù)據(jù)倉庫將來自多個源的數(shù)據(jù)收集到一個中央存儲庫中,該存儲庫使用為數(shù)據(jù)分析設(shè)計的預(yù)定義模式進行了結(jié)構(gòu)化。數(shù)據(jù)湖基本上是沒有預(yù)定義模式的數(shù)據(jù)倉庫。因此,與數(shù)據(jù)倉庫相比,它支持更多類型的分析。數(shù)據(jù)湖通常建立在像ApacheHadoop這樣的大數(shù)據(jù)平臺之上。4.2數(shù)據(jù)倉庫與數(shù)據(jù)集市數(shù)據(jù)集市是數(shù)據(jù)倉庫的子集,其中包含針對特定業(yè)務(wù)線或部門的數(shù)據(jù)。因為它們包含較小的數(shù)據(jù)子集,所以數(shù)據(jù)集市使部門或業(yè)務(wù)線能夠比使用更廣泛的數(shù)據(jù)倉庫數(shù)據(jù)集時更快地發(fā)現(xiàn)更側(cè)重的見解。
參考譯文4.3數(shù)據(jù)倉庫與數(shù)據(jù)庫建立數(shù)據(jù)庫主要是為了快速查詢和事務(wù)處理,而不是分析。數(shù)據(jù)庫通常用作特定應(yīng)用程序的重點數(shù)據(jù)存儲,而數(shù)據(jù)倉庫則存儲組織中任意數(shù)量(甚至所有)應(yīng)用程序的數(shù)據(jù)。同樣重要的是:數(shù)據(jù)庫從單個(通常是當(dāng)前)時間點捕獲并存儲數(shù)據(jù),而數(shù)據(jù)倉庫包含預(yù)測分析、機器學(xué)習(xí)和其他高級分析所需的當(dāng)前和歷史數(shù)據(jù)。4.4云數(shù)據(jù)倉庫云數(shù)據(jù)倉庫是專門為在云中運行而構(gòu)建的數(shù)據(jù)倉庫,它作為托管服務(wù)提供給客戶。在過去的五到七年中,隨著越來越多的公司使用云服務(wù)并尋求減少其內(nèi)部數(shù)據(jù)中心的占用空間,基于云的數(shù)據(jù)倉庫變得越來越流行。使用云數(shù)據(jù)倉庫,物理數(shù)據(jù)倉庫基礎(chǔ)架構(gòu)由云公司管理,這意味著客戶不必在硬件或軟件上進行前期投資,也不必管理或維護數(shù)據(jù)倉庫解決方案。參考譯文參考譯文5.數(shù)據(jù)倉庫軟件(本地/許可證)企業(yè)可以購買數(shù)據(jù)倉庫許可證,然后在自己的本地基礎(chǔ)結(jié)構(gòu)上部署數(shù)據(jù)倉庫。盡管這通常比云數(shù)據(jù)倉庫服務(wù)貴,但對于希望對數(shù)據(jù)進行更多控制或需要遵守嚴格的安全性或數(shù)據(jù)隱私標(biāo)準或法規(guī)的政府實體、金融機構(gòu)或其他組織,這可能是一個更好的選擇。6.數(shù)據(jù)倉庫設(shè)備數(shù)據(jù)倉庫設(shè)備是硬件和軟件(CPU、存儲、操作系統(tǒng)和數(shù)據(jù)倉
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中學(xué)安全教育考試題及答案
- 新疆昌吉回族自治州木壘縣中2024-2025學(xué)年高二下生物期末質(zhì)量跟蹤監(jiān)視模擬試題含解析
- 天津市薊州區(qū)2024-2025學(xué)年數(shù)學(xué)高二下期末調(diào)研試題含解析
- 城市更新項目廠房土地購置及開發(fā)合作合同
- 休閑農(nóng)業(yè)場地外包租賃合同范本
- 農(nóng)業(yè)銀行信用的借款合同(6篇)
- 愛崗敬業(yè)個人先進事跡(3篇)
- 員工配車公司管理制度
- 公路實施方案的試題及答案
- 公路工程定額分析試題及答案
- 國家開放大學(xué)2025年春《形勢與政策》形考任務(wù)1-5和大作業(yè)參考答案
- 安全生產(chǎn) 規(guī)章制度和安全操作規(guī)程
- 工人下班免責(zé)協(xié)議書
- 美術(shù)有趣的課件
- 創(chuàng)業(yè)扶持政策對數(shù)字化轉(zhuǎn)型的影響研究試題及答案
- 收購公司工作方案
- 高級電工技師試題及答案
- 服飾終端銷售問與答全冊
- 涂裝安全教育試題及答案
- 押題預(yù)測卷01-2025年高考數(shù)學(xué)押題預(yù)測卷(新高考地區(qū)專用)(解析版)
- 醫(yī)療資質(zhì)掛靠協(xié)議書
評論
0/150
提交評論