




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
認識數據可視化目錄任務一了解數據可視化的意義與應用任務二理解數據可視化框架任務三認識數據可視化工具Tableau1了解數據可視化的意義與應用(一)認知數據可視化的意義(二)了解企業中數據可視化的應用本項目首先介紹了數據可視化分析的意義與作用,帶領大家認識數據可視化的框架,接著讓大家認識Tableau可視化工具的主要特征與其豐富的產品體系,以及不同場景下的文件管理,最后為大家列舉了幾個Tableau的經典案例。1.高效獲取信息人腦對視覺信息的處理要比書面信息容易得多。使用圖表總結復雜的數據,可以確保對數據信息的理解比混亂的電子表格或者文字報告更快。數據可視化提供了一種非常清晰的溝通方式,使業務領導者能夠更快地理解和處理他們的信息。用一些簡單的圖形就能體現復雜的信息,甚至單個圖形也能做到。決策者可以通過交互元素以及類似于各種新的可視化工具,輕松解釋各種不同數據源。豐富且有意義的數據可視化有助于讓忙碌的管理者及業務伙伴了解問題和制定有效計劃。(一)認知數據可視化的意義2.實時監控指標已經收集到的消費者行為的數據可以為適應性強的公司帶來許多新的機遇,這需要他們不斷地收集和分析這些信息,通過使用數據可視化來監控關鍵指標,與企業內部數據庫實時連接,隨時更新數據。企業領導人可以更早一步發現各大數據集的市場變化和趨勢。(一)認知數據可視化的意義3.精準建立模型當今的商業決策對數據依賴越來越強烈。然而,正確而連貫的數據流對商業用戶做出快速、靈活的決策起到決定性的作用。建立正確的數據流和數據結構才能保證最好的結果,如客戶人群分析、RFM模型、同群分析等。那么,如何精準建立數據模型?
了解業務:了解業務建立概念模型,確定實體與實體關系。
建立模型:在概念模型的基礎上生成邏輯模型,確定實體屬性,標準化數據。
驗證模型:通過具體的業務來驗證模型是否能夠滿足要求。(一)認知數據可視化的意義1.生產制造業生產制造業是典型的數據可視化應用行業。管理生產線、關注生產線的變化是一個最直接的需求。通過將生產制造過程中的數據可視化處理,可以及時發現生產環節出現的問題,提高企業對生產風險的防范能力。如圖1-1所示是一個生產線的數據可視化看板,它將產品的缺陷數據整理成各項指標圖表展示出來。比如缺陷類型、各地區生產產生的缺陷量占比、時間序列下產品缺陷量數據。
圖1-1(二)了解企業中數據可視化的應用2.電商行業電商行業是近年來較為火爆的數據可視化分析領域,電子商務產生的數據有很大的挖掘價值。對于電商來說訂單數據是最直接相關的數據,通過將這部分數據可視化處理,可以清晰的觀測訂單量、銷售額、利潤額等等情況。如圖1-2所示是訂單數據看板,除了一些數據指標卡以外,還有地圖、條形圖用來描述數據。圖1-2(二)了解企業中數據可視化的應用3.金融行業金融行業是數據可視化應用較多的行業,金融行業銀行業務中將信用卡、銀行交易分別統計查看。企業常常面臨人工整理數據比較繁瑣,并且表格數據可讀性低等問題。如圖1-3所示是銀行收入數據看板,圖中有各項數據指標的指標卡,方便企業查看各銀行的業務情況,比如盈利情況、各渠道收入情況、各地區顧客量等等。圖1-3(二)了解企業中數據可視化的應用2理解數據可視化框架(一)了解人在視覺上對圖型規則的敏感度(二)掌握可視化遵循的原則(一)了解人在視覺上對圖型規則的敏感度
圖1-4視覺是獲取外部世界信息的最重要通道,超過50%的人腦機能都用于視覺感知。人眼對視覺符號的感知速度快于數字和文本,并且能夠補充有限的記憶內存。觀察以下數據:X均值9.0,X方差10.0,Y均值7.5,Y方差3.75,相關系數:0.816,數據如圖1-4所示。如圖1-5以圖形的視覺通道迅速發現數據信息:圖1-5(一)了解人在視覺上對圖型規則的敏感度請從圖1-6的數字中找出有幾個9。圖1-6(一)了解人在視覺上對圖型規則的敏感度如圖1-7所示,添加顏色。圖1-7(一)了解人在視覺上對圖型規則的敏感度由此可見,顏色也是一種視覺通道。視覺通道是用于控制幾何標記的展示特性,如圖1-8所示,通常是由幾何標記以及成分組成,幾何標記中通常是一些幾何圖形元素,如:點、線、面、體,成分主要包含標記的位置、大小、形狀、方向、色調、飽和度、亮度等。圖1-8(一)了解人在視覺上對圖型規則的敏感度視覺通道的類型又分為定性(分類)的視覺通道以及定量(連續、有序)的視覺通道。定性(分類)的視覺通道:定性性質和分類性質,關于對象本身的特征和位置。如:形狀、顏色的色調、空間位置。定量(連續、有序)的視覺通道:定量性質或定序性質,對象某一屬性在數值上的大小。如直線的長度、區域的面積、空間的體積、斜度、角度、顏色的飽和度等,如圖1-9所示。圖1-9(一)了解人在視覺上對圖型規則的敏感度數據可視化通過視覺通道為我們清晰有效地傳達溝通信息,具體遵循三個原則:可視性:數據可以用圖表、儀表板等方式來展現,并可對其模式和相互關系進行可視化分析。多維性:可以從數據的多個屬性或變量數據進行切片、鉆取、旋轉等,以此剖析數據,從而多角度、多方面分析數據。交互性:用戶能夠方便地通過交互界面實現數據的管理、計算與預測。(二)掌握可視化遵循的原則3認識數據可視化工具Tableau(一) 認識Tableau(二) 了解Tableau經典案例(一)認識Tableau1.Tableau簡介Tableau是美國Tableau軟件公司出品的一款專業的商業智能軟件,能夠滿足企業的數據分析需求。Tableau目前在全球的用戶已超過50000家,在中國的用戶已超過2000家。2.主要特點簡單、易用、易學,不需要技術背景和統計知識,操作極其簡單。可連接多種數據源,輕松實現數據融合。高效接口集成,具有良好可擴展性,提升數據分析能力。3.產品體系TableauDesktopTableauDesktop是設計和創建美觀的視圖與儀表板、實現快捷數據分析功能的桌面端分析工具,包括TableauDesktopPersonal(個人版)和TableauDesktopProfessional(專業版)兩個版本,支持Windows和Mac操作系統。Tableau個人版僅允許連接到文件和本地數據源,分析成果可以發布為圖片、PDF等格式;而Tableau專業版除了具備個人版的全部功能外,支持的數據源更加豐富,能夠連接到幾乎所有格式的數據和數據庫系統,包括以ODBC方式新建數據源庫,分析成果還可以發布到企業或個人的Tableau服務器、TableauOnline服務器和TableauPublic服務器上,實現移動辦公。因此,專業版比個人版更加通用,但個人版的價格相對專業版也便宜不少。(一)認識Tableau
TableauServerTableauServer是一款商業智能應用程序,用于發布和管理TableauDesktop制作的報表,也可以發布和管理數據源,如自動刷新發布到Server上的數據提取。TableauServer是基于瀏覽器的分析技術,非常適用于企業范圍內的部署,當工作簿做好并發布到TableauServer上后,用戶可以通過瀏覽器或移動終端設備,查看工作簿的內容并與之交互。TableauServer可控制對數據連接的訪問權限,并允許針對工作簿、儀表板甚至用戶設置來設置不同安全級別的訪問權限。通過TableauServer提供的訪問接口,用戶可以搜索和組織工作簿,還可以在儀表板上添加批注,與同事分享數據見解,實現在線互動。利用TableauServer提供的訂閱功能,當允許訪問的工作簿版本有更新時,用戶可以接收到郵件通知。(一)認識TableauTableauOnlineTableauOnline針對云分析而建立,是TableauServer的一種托管版本,省去硬件部署、維護及軟件安裝的時間與成本,提供的功能與TableauServer沒有區別,按每人每年的方式付費使用。TableauMobileTableauMobile是基于iOS和Android平臺移動端應用程序。用戶可通過iPad、Android設備或移動瀏覽器,來查看發布到TableauServer或TableauOnline上的工作簿,并可進行簡單的編輯和導出操作。(一)認識TableauTableauPublicTableauPublic是一款免費的桌面應用程序,用戶可以連接TableauPublic服務器上的數據,設計和創建自己的工作表、儀表板和工作簿,并把成果保存到大眾皆可訪問的TableauPublic服務器上(不可以把成果保存到本地電腦上)。TableauPublic使用的數據和創建的工作簿都是公開的,任何人都可以與其互動并可隨意下載,還可以根據你的數據創建自己的工作簿。(一)認識Tableau注:利用TableauPublic連接數據時,如圖1-10所示,對數據源、數據文件大小和長度都有一定限制:僅包括Excel、Access和多種文本文件格式,對單個數據文件的行數限制為10萬行,對數據的存儲空間限定在50MB以內。圖1-10(一)認識TableauTableauReaderTableauReader是一個免費的桌面應用程序,可以用來打開和查看打包工作簿文件(.twbx),也可以與工作簿中的視圖和儀表板進行交互操作,如篩選、排序、向下鉆取和查看數據明細等。打包工作簿文件可以通過TableauDesktop創建和發布,也可以從TableauPublic服務器下載。用戶無法使用TableauReader創建工作表和儀表板,也無法改變工作簿的設計和布局。(一)認識Tableau文件管理Tableau工作簿(.twb):將所有工作表及其連接信息保存在工作簿文件中,不包括數據。打包工作簿(.twbx):打包工作簿是一個zip文件,保存所有工作表、連接信息以及任何本地資源(如本地文件數據源、背景圖片、自定義地理編碼等)。這種格式最適合對工作進行打包以便與不能訪問該數據的其他人共享。Tableau數據源(.tds):Tableau數據源文件具有.tds文件擴展名。數據源文件是快速連接經常使用的數據源的快捷方式。數據源文件不包含實際數據,只包含新建數據源所必需的信息以及在數據窗口中所做的修改,例如默認屬性、計算字段、組、集等。Tableau數據源(.tdsx):如果連接的數據源不是本地數據源,tdsx文件與tds文件沒有區別。如果連接的數據源是本地數據源,數據源(.tdsx)不但包含數據源(.tds)文件中的所有信息,還包括本地文件數據源(Excel、Access、文本和數據提取)。Tableau書簽(.tbm):書簽包含單個工作表,是快速分享所做工作的簡便方式。Tableau數據提取(.hyper):Tableau數據提取文件具有.hyper文件擴展名。提取文件是部分或整個數據源的一個本地副本,可用于共享數據、脫機工作和提高數據庫性能。(一)認識Tableau注:從10.5開始,新數據提取使用.hyper格式,而不是.tde格式。.Hyper格式的數據提取利用改進的數據引擎,該數據引擎的快速分析和查詢性能與之前的數據引擎不相上下,但可適用于更大的數據提取(一)認識Tableau5.Tableau工作區(1)菜單欄
在菜單欄中主要有“文件”、“數據”、“工作表”、“儀表板”、“故事”、“分析”、“地圖”、“設置格式”、“服務器”、“窗口”、“幫助”菜單。(一)認識Tableau“文件”菜單的主要功能是新建、保存、導入、導出文件等。“數據”菜單的主要功能是管理數據源,比如編輯主副表關系、提取數據等。“工作表”菜單的主要功能是對當前工作表進行操作,比如復制、導出當前工作表,設置當前視圖內容顯示等。“儀表板”菜單的主要功能是對儀表板進行相關操作,比如設置儀表板格式、導出儀表板、設置儀表板交互功能等。“故事”菜單是Tableau8.2之后的新增功能,可以按照自定義順序將圖表或儀表板展示出來。“分析”菜單是對視圖中的數據進行相關操作,比如數據的聚合、數據計算字段的創建、數據預測與數據趨勢線添加等功能。“地圖”菜單是Tableau地圖分析的一大功能,主要包含對地圖的背景圖像設置、地理編碼的導入等功能。“設置格式”菜單主要對當前視圖中的文本部分進行相關設置。“服務器”菜單主要功能為連接到TableauServer服務器,可登錄到TableauServer或其托管版本TableauOnline上,還可將工作簿發布到TableauPublic上。“窗口”菜單可將當前視圖展示進入演示模式(或者點擊F7鍵),并可調整當前視圖內容,還可創建書簽,切換工作表。“幫助”菜單可獲取Tableau相關的幫助文檔或視頻等。(一)認識Tableau(2)工具欄顯示起始頁:單擊來回切換TableauDesktop的起始頁和主界面。撤銷:撤銷剛才的操作。重做:返回撤銷的操作。保存:保存當前視圖進度。新建數據源:連接新的數據源。暫停數據更新:暫停更新數據源。運行更新:更新數據源數據。新建工作表:可新建工作表、儀表板或故事。復制:復制當前工作表、儀表吧或故事。清除工作表:清除當前工作表所有內容。交換行列:交換行功能區以及列功能區的字段。升序:將視圖區的數據按照升序排列。降序:將視圖中的數據按照降序排列。突出顯示:突出顯示視圖中的字段。組:將視圖區中的字段形成組。顯示標簽:顯示或隱藏標簽。固定:固定視圖。視圖顯示模式:共有四種,分別是標準、適合寬度、適合高度、整個視圖。顯示/隱藏卡:對工作表界面各個功能區進行顯示或隱藏。演示模式:視圖區全屏顯示。共享:通過TableauServer或TableauOnline進行分享。(一)認識Tableau(3)數據源顯示框數據源顯示框顯示所有已經連接的數據源,根據數據源的數據集,自動劃分維度值列表和度量值列表。(4)數據分析框匯總與模型等,可以輔助在視圖中添加平均線、趨勢線等。(5)頁面框將字段拖進頁面框,可生成播放菜單,整個視圖可以以播放的方式呈現出來。(6)篩選器將字段拖進篩選器,該字段可生成篩選器。(7)圖形菜單框標記下拉菜單可以選擇視圖的圖形,將字段拖入“顏色”、“大小”,該字段使用顏色或大小來表示。(8)列/行功能區將字段拖到“列”或“行”上面,就能制作相應視圖。(9)智能顯示智能顯示區域列出了24種不同類型的圖形。只要滿足圖形生成的條件,就能生成對應的圖形。將字段拖入到視圖后,可以點擊智能顯示區切換圖形。(一)認識Tableau(二)了解Tableau經典案例1.醫療臨床分析臨床分析讓臨床醫護人員快速、全面地了解各種醫學檢驗項目的臨床意義。如圖1-11所示,本案例建立突顯表,分析周一到周日診所的病人數量情況,由表可知,診所病人數量最多的時間段為6:00am–13:00pm;建立散點圖,分析各個部門病人的最小等待時間與護理評分,從而優化病人看診的時間等待與接受護理的情況。圖1-112.電子商務銷售分析電子商務通常是指是在全球各地廣泛的商業貿易活動中,在因特網開放的網絡環境下,基于瀏覽器/服務器應用方式,買賣雙方不謀面地進行各種商貿活動,實現消費者的網上購物、商戶之間的網上交易和在線電子支付以及各種商務活動、交易活動、金融活動和相關的綜合服務活動的一種新型的商業運營模式。(二)了解Tableau經典案例
如圖1-12所示,本案例通過條形圖反映了不同產品、不同國家、不同客戶的銷售額達前5名的情況;通過氣泡圖反映客戶數量在特定區間內的分布情況;通過地圖展現了各個地區產品銷量情況。圖1-12(二)了解Tableau經典案例3.制造業原料分析服裝業是我國傳統優勢產業之一,在國民經濟中處于重要地位,而服裝材料是指構成服裝的物質基礎,其色彩、質地、風格、表現力等方面的因素直接影響著服裝的表現要素。如圖1-13所示,本案例通過符號地圖,對各個國家的平均每碼距離所花費的金額以及貨物總規模進行統計;通過條形圖,對不同距離段花費金額以及平均每碼所需花費進行對比預算;通過條形圖,對各個紡織物以及其適合的人群規模和每碼所花費金額進行對比分析。圖1-13(二)了解Tableau經典案例習題什么是數據可視化?視覺通道是什么?又是由什么組成?Tableau有哪些產品體系?各產品體系的功能是什么?(二)了解Tableau經典案例感謝聆聽!Tableau連接與管理數據目錄任務一數據連接任務二數據整合任務三數據維護1數據連接(一)連接Excel表格(二)連接Access文件(三)復制粘貼數據數據連接是利用Tableau進行數據分析的第一步。Tableau幾乎支持所有主流數據源類型,比如常見的MicrosoftExcel文件、CSV文本文件、Access數據庫文件等。本項目將從最簡單的電子表格開始,說明如何通過Tableau快速連接到各類數據源,以及如何對數據源進行整合和維護。(一)連接Excel表格數據連接利用Tableau進行數據分析的首要工作。完成此任務需要熟悉Tableau數據連接功能區按鈕,能夠快速導入各類型數據并切換到Tableau工作表區。下面我們“superset(超市數據)”為例介紹電子表格數據連接的操作。在文件數據源中,電子表格是最常見的,下面以MicrosoftExcel文件為例進行說明。步驟1雙擊Tableau軟件進入到數據連接界面,如圖2-1:圖2-1(一)連接Excel表格步驟2選擇MicrosoftExcel,進入Excel表所在的目錄,單擊文件名,點擊[打開],如圖2-2:圖2-2(一)連接Excel表格注:此時進入編輯數據源界面,可對數據源進行預覽,確定數據源信息無誤。如圖2-3:圖2-3(一)連接Excel表格步驟4點擊[轉到工作表],進入工作表界面,如圖2-4所示:
圖2-4(一)連接Excel表格(二)連接Access文件連接Access文件也可以在數據連接界面實現。和連接Excel文件不同的是,連接到Access文件后數據表下方會出現[新自定義SQL]選項,熟悉SQL的用戶可以使用SQL查詢語句連接數據。注意:連接Access數據源之后,可能會出現“與MicrosoftAccess數據庫通信時出錯。數據源連接可能已丟失”的提示錯誤,原因是未安裝驅動程序,或者安裝的驅動程序位數錯誤。需要安裝與TableauDesktop版本匹配的Access驅動程序。如圖2-5所示,利用SQL語句查詢自然年為2019所有數據。圖2-5(二)連接Access文件如圖2-6,利用自定義SQL查詢生成的數據源。圖2-6(二)連接Access文件(三)復制粘貼數據創建數據源的另外一種方式是將數據復制粘貼到Tableau中,Tableau會根據復制數據自動創建數據源。可以直接復制的數據類型包含MicrosoftExcel和Word在內的Office應用程序數據、網頁中HTML格式的表格、用逗號或制表符分隔的文本文件數據。步驟1打開本地“superstore(超市數據)”Excel文件并復制數據,如圖2-7所示:圖2-7步驟2轉到Tableau工作表界面,使用快捷鍵Ctrl+V粘貼到表內,如圖2-8:圖2-8(三)復制粘貼數據注:此時在視圖界面將生成如圖2-9所示的文本表:圖2-9(三)復制粘貼數據2數據整合(一)連接兩張表(二)連接多張表(三)數據融合(二)連接兩張表在數據分析過程中,所需的數據可能來自多張表,甚至以不同的文件類型存在。利用Tableau的數據整合功能可實現數據源的多表連接、多數據源的數據整合。下面我們以“2018的各地區GDP情況
”兩張表為例演示數據連接操作。兩張表分別記錄了若干省份(自治區、直轄市)2018年GDP值,并且兩表存在“重復”數據,如圖2-10所示:圖2-10步驟1打開Tableau,連接到表“兩表連接1_1”,點擊[添加],打開表“兩表連接1_2”。如圖2-11:圖2-11(二)連接兩張表注1:連接類型分為內部連接、左側連接、右側連接、完全外部連接4種。其中“內部連接”的結果是兩表所共有的數據個體集合;“左側連接”以左側表為基準,右側表與左邊的表重合的部分數據會被提取出來;“右側連接”表示以右邊的表為基準,左邊的表與右邊的表重合的部分數據會被提取出來;“完全外部連接”表示包含查詢結果集合中的包含左、右表的所有數據行。注2:兩表默認進行內部連接,如果不希望按照默認的方式連接,可以手動為其指定聯接方式:(二)連接兩張表步驟2兩表左側連接的方式如圖2-12:圖2-12(二)連接兩張表步驟3兩表右側聯接的方式如圖2-13:
圖2-13(二)連接兩張表
步驟4兩表完全外部聯接的方式如圖2-14:圖2-14(二)連接兩張表(二)連接多張表步驟1打開Tableau,連接到表“data1”,依次添加表“data2”、“data3”,如圖2-15:圖2-15步驟2分別對兩個連接的連接方式進行設置,如圖2-16:圖2-16完成表聯接后,選擇[轉到工作表],即可在數據窗口看到三張數據表的信息。操作完成■(二)連接多張表(三)數據融合對于同類型數據源,可進行數據連接。對不同類型的數據源,則需要采用數據融合加以整合。
現擬將表“superstore超市數據”與表“2019銷售
”進行整合。由于兩表屬于不同數據源,若直接進行“兩表連接”操作則會出現圖2-17:對于同類型數據源,可進行數據連接。對不同類型的數據源,則需要采用數據融合加以整合。圖2-17注:當表之間自動連接失敗時,會顯示警告信息。此時需要采用添加數據源的方式實現。步驟1連接表“superstore(超市數據)”,依次點選[數據]—[新建數據源]—[工作表1(2019銷售)],如圖2-18:圖2-18(三)數據融合注:在數據融合中,提供主要信息的數據表為主數據源,主數據源帶有藍色標記。如圖2-19:圖2-19(三)數據融合除了主數據源外,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工業大數據與智能決策
- 465變更管理制度
- ci公司管理制度
- 標準氣瓶使用管理制度
- 校內公物設施管理制度
- 校園醫療安全管理制度
- 校園安全教材管理制度
- 校園樓梯安全管理制度
- 校園疫情食堂管理制度
- 校園規范漢字管理制度
- 電腦教室搬遷方案
- 2023高教版中職中國特色社會主義基礎模塊課程標準
- 林區施工防火安全施工方案
- 充電樁維保合同書樣本
- 16J934-3中小學校建筑設計常用構造做法
- 我的家鄉濰坊昌邑宣傳介紹課件
- 國開學習網《中國古代文化常識》形考任務1-3答案
- 食材配送服務方投標方案(技術標)
- 內河船舶船員健康檢查記錄
- 大學生應急救護智慧樹知到課后章節答案2023年下西安歐亞學院
- 《高中生物必修3課件:細胞分裂和遺傳》
評論
0/150
提交評論