數據可視化 第2版 課件 項目二 Tableau 連接與管理數據_第1頁
數據可視化 第2版 課件 項目二 Tableau 連接與管理數據_第2頁
數據可視化 第2版 課件 項目二 Tableau 連接與管理數據_第3頁
數據可視化 第2版 課件 項目二 Tableau 連接與管理數據_第4頁
數據可視化 第2版 課件 項目二 Tableau 連接與管理數據_第5頁
已閱讀5頁,還剩36頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Tableau連接與管理數據目錄任務一數據連接任務二數據整合任務三數據維護1數據連接(一)連接Excel表格(二)連接Access文件(三)復制粘貼數據數據連接是利用Tableau進行數據分析的第一步。Tableau幾乎支持所有主流數據源類型,比如常見的MicrosoftExcel文件、CSV文本文件、Access數據庫文件等。本項目將從最簡單的電子表格開始,說明如何通過Tableau快速連接到各類數據源,以及如何對數據源進行整合和維護。(一)連接Excel表格數據連接利用Tableau進行數據分析的首要工作。完成此任務需要熟悉Tableau數據連接功能區按鈕,能夠快速導入各類型數據并切換到Tableau工作表區。下面我們“superset(超市數據)”為例介紹電子表格數據連接的操作。在文件數據源中,電子表格是最常見的,下面以MicrosoftExcel文件為例進行說明。步驟1雙擊Tableau軟件進入到數據連接界面,如圖2-1:圖2-1(一)連接Excel表格步驟2選擇MicrosoftExcel,進入Excel表所在的目錄,單擊文件名,點擊[打開],如圖2-2:圖2-2(一)連接Excel表格注:此時進入編輯數據源界面,可對數據源進行預覽,確定數據源信息無誤。如圖2-3:圖2-3(一)連接Excel表格步驟4點擊[轉到工作表],進入工作表界面,如圖2-4所示:

圖2-4(一)連接Excel表格(二)連接Access文件連接Access文件也可以在數據連接界面實現。和連接Excel文件不同的是,連接到Access文件后數據表下方會出現[新自定義SQL]選項,熟悉SQL的用戶可以使用SQL查詢語句連接數據。注意:連接Access數據源之后,可能會出現“與MicrosoftAccess數據庫通信時出錯。數據源連接可能已丟失”的提示錯誤,原因是未安裝驅動程序,或者安裝的驅動程序位數錯誤。需要安裝與TableauDesktop版本匹配的Access驅動程序。如圖2-5所示,利用SQL語句查詢自然年為2019所有數據。圖2-5(二)連接Access文件如圖2-6,利用自定義SQL查詢生成的數據源。圖2-6(二)連接Access文件(三)復制粘貼數據創建數據源的另外一種方式是將數據復制粘貼到Tableau中,Tableau會根據復制數據自動創建數據源??梢灾苯訌椭频臄祿愋桶琈icrosoftExcel和Word在內的Office應用程序數據、網頁中HTML格式的表格、用逗號或制表符分隔的文本文件數據。步驟1打開本地“superstore(超市數據)”Excel文件并復制數據,如圖2-7所示:圖2-7步驟2轉到Tableau工作表界面,使用快捷鍵Ctrl+V粘貼到表內,如圖2-8:圖2-8(三)復制粘貼數據注:此時在視圖界面將生成如圖2-9所示的文本表:圖2-9(三)復制粘貼數據2數據整合(一)連接兩張表(二)連接多張表(三)數據融合(二)連接兩張表在數據分析過程中,所需的數據可能來自多張表,甚至以不同的文件類型存在。利用Tableau的數據整合功能可實現數據源的多表連接、多數據源的數據整合。下面我們以“2018的各地區GDP情況

”兩張表為例演示數據連接操作。兩張表分別記錄了若干省份(自治區、直轄市)2018年GDP值,并且兩表存在“重復”數據,如圖2-10所示:圖2-10步驟1打開Tableau,連接到表“兩表連接1_1”,點擊[添加],打開表“兩表連接1_2”。如圖2-11:圖2-11(二)連接兩張表注1:連接類型分為內部連接、左側連接、右側連接、完全外部連接4種。其中“內部連接”的結果是兩表所共有的數據個體集合;“左側連接”以左側表為基準,右側表與左邊的表重合的部分數據會被提取出來;“右側連接”表示以右邊的表為基準,左邊的表與右邊的表重合的部分數據會被提取出來;“完全外部連接”表示包含查詢結果集合中的包含左、右表的所有數據行。注2:兩表默認進行內部連接,如果不希望按照默認的方式連接,可以手動為其指定聯接方式:(二)連接兩張表步驟2兩表左側連接的方式如圖2-12:圖2-12(二)連接兩張表步驟3兩表右側聯接的方式如圖2-13:

圖2-13(二)連接兩張表

步驟4兩表完全外部聯接的方式如圖2-14:圖2-14(二)連接兩張表(二)連接多張表步驟1打開Tableau,連接到表“data1”,依次添加表“data2”、“data3”,如圖2-15:圖2-15步驟2分別對兩個連接的連接方式進行設置,如圖2-16:圖2-16完成表聯接后,選擇[轉到工作表],即可在數據窗口看到三張數據表的信息。操作完成■(二)連接多張表(三)數據融合對于同類型數據源,可進行數據連接。對不同類型的數據源,則需要采用數據融合加以整合。

現擬將表“superstore超市數據”與表“2019銷售

”進行整合。由于兩表屬于不同數據源,若直接進行“兩表連接”操作則會出現圖2-17:對于同類型數據源,可進行數據連接。對不同類型的數據源,則需要采用數據融合加以整合。圖2-17注:當表之間自動連接失敗時,會顯示警告信息。此時需要采用添加數據源的方式實現。步驟1連接表“superstore(超市數據)”,依次點選[數據]—[新建數據源]—[工作表1(2019銷售)],如圖2-18:圖2-18(三)數據融合注:在數據融合中,提供主要信息的數據表為主數據源,主數據源帶有藍色標記。如圖2-19:圖2-19(三)數據融合除了主數據源外,其他被使用的數據表帶有橙色標記,作為從數據源。如圖2-20:圖2-20(三)數據融合步驟2依次點選菜單欄[數據]—[編輯關系]來創建或修改當前數據源關聯關系。如圖2-21:圖2-21(三)數據融合步驟3 在彈出的“關系”對話框內,可以通過下拉列表框的方式選擇主數據源,如圖2-22:圖2-22(三)數據融合3數據維護(一)數據查看(二)數據刷新(三)數據替換(四)數據刪除(一)數據查看在數據分析過程中,往往需要查看數據來源??梢来吸c選菜單欄[數據表]—[查看數據]實現。如圖2-23:圖2-23效果如圖2-24,在查看數據界面的[維度]工作區上方有查看數據按鈕,點擊此按鈕可以對數據進行查看。圖2-24(一)數據查看(二)數據刷新當數據源中的數據發生變化后(包括添加新字段或行、更改數據值或字段名稱、刪除數據或字段),需要更新數據源時,可以采用刷新數據操作。依次點選菜單欄[數據]—[當前數據源]—[刷新]。可在不斷開連接的情況下即時更新數據。圖2-25注:如果工作簿中視圖所使用的數據源字段被移除,那么完成刷新數據操作后,將顯示一條警告消息,說明該字段將從視圖中移除。工作表中使用該字段的視圖將無法正確顯示。(二)數據刷新(三)數據替換

如果希望使用新的數據源來替換已有的數據源,而不希望新建工作簿,那么可以進行“替換數據源”操作。如本例中,希望將舊數據源“2019銷售”替換為新數據源“2019產品”。步驟1依次點選菜單欄[數據]—[替換數據源],進入替換數據源對話框。如圖2-26:圖2-26在該工作表中,至少一個使用活躍的數據源是應替換的數據源。步驟2將字段拖到視圖中會將對應的數據源設置為主數據源,主數據源將默認為“替換數據源”對話框中的當前數據源。如圖2-27:圖2-27注:完成數據源替換后,當前工作表的主數據源即變更為新數據源。操作完成■(四)數據刪除使用了新數據源后,可以關閉原有數據源連接,具體方法是依次點選[當前數據]—[關閉

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論