數據可視化系統(更新美學原則版)_第1頁
數據可視化系統(更新美學原則版)_第2頁
數據可視化系統(更新美學原則版)_第3頁
數據可視化系統(更新美學原則版)_第4頁
數據可視化系統(更新美學原則版)_第5頁
已閱讀5頁,還剩65頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據可視化系統(更新美學原則版)第一頁,共70頁。報告提綱數據可視化系統概念和意義1兩個實例:Wordle&Themeriver2可視化交互準則與技術3常用可視化軟件介紹4可視化設計的美學原則5第二頁,共70頁。什么是可視化安斯庫姆四重奏

四組統計性質相同的數據,由統計學家費朗西斯·安斯庫姆提出,用于強調作圖的重要性。第三頁,共70頁。什么是可視化安斯庫姆四重奏

第四頁,共70頁。什么是可視化拿破侖進軍莫斯科維基百科上的文字說明:

第五頁,共70頁。什么是可視化拿破侖進軍莫斯科1869年,法國一名工程師所畫,被譽為有史以來最好的統計可視圖第六頁,共70頁。什么是可視化人眼帶寬100MB/s視覺信息并行處理,模式識別能力強對可視符號的感知速度比文字、數據快定義:將文字、數據等信息用可視的元素,包括顏色、形狀、符號等呈現出來的過程第七頁,共70頁。數據可視化的意義1信息記錄2支持對信息的推理和分析3信息傳播與協同第八頁,共70頁。數據可視化的意義視物致知1854年倫敦布拉德街鬼圖幫助發現霍亂流行的原因第九頁,共70頁。數據可視化分類科學可視化

面向自然科學,如物理、化學、航天航空、生物學等。對數據模型進行解釋、操作,旨在尋找模式、特點和關系。信息可視化

處理抽象、非結構化數據,如文本、圖表、地圖、復雜系統等。可視分析學

以可視交互界面為基礎,綜合圖形學、數據挖掘和人機交互技術,將感知和認知能力以可視方式融入處理過程,進行信息交流和知識提煉,完成分析推理和決策。第十頁,共70頁。數據可視化系統數據可視化系統流程由Card,Mackinlay等人提出的信息可視化參考流程第十一頁,共70頁。數據可視化系統數據的表示與變換

預處理:數據清洗與精簡、整合與集成

組織管理:數據庫、數據倉庫數據的可視化呈現

核心算法、視覺編碼(視覺呈現形式)

靜態與動態、時間連續性等用戶交互

挑戰:智能、使用于不同數據類型的、可支持用戶分

析決策的交互方法。第十二頁,共70頁。數據可視化系統數據可視化系統設計四個級聯的層次第十三頁,共70頁。數據可視化系統算法設計數據到可視化的直觀映射

數據類型(維度、組織形式等)——視圖選擇

數據篩選——信息密度美學因素

顏色、視覺突出、動畫與過渡、可視化隱喻等交互設計

界面、操作、分析和呈現第十四頁,共70頁。實例之一:Wordle基于關鍵詞的文本內容可視化標簽云(TagCloud)用顏色和字體映射關鍵詞的重要性第十五頁,共70頁。實例之一:WordleWordle:標簽云衍化技術在空間利用和美學欣賞方面有所提升第十六頁,共70頁。實例之一:Wordle實現文本分析查找單詞Regex匹配字符串,生成單詞列表。確定字體類型由語系、字符確定,允許不同單詞使用不同字體。猜測語言并刪除停用詞如the,it,to這些用戶不感興趣的停用詞,各個語言提供停用詞列表,文本中前50個詞匹配最高的即為文本語言。給單詞分配權重詞頻即為權重,特殊情況下可能采用詞頻對數。第十七頁,共70頁。實例之一:Wordle實現布局加權單詞轉化為圖形構建了一種字體,其點的大小由詞頻決定,生成Java2D圖形。展現區域檢查單詞邊框,確定區域面積,調整單詞大小使得顯示緊湊。放置隨機貪婪算法,每個單詞分配到一個起始位置,如果與已放置單詞重疊,則更新位置,直到不重疊。不同的放置策略。交疊測試層次邊界框確定是否交疊;沖突檢測的緩存和空間索引技術。第十八頁,共70頁。實例之一:Wordle實現螺旋形遞歸放置策略單詞Denmark所走的路第十九頁,共70頁。實例之一:Wordle實現應用地址其他文字云應用:ImageChef、WordItOut、VocabGrabber

完美支持中文Tagxedo第二十頁,共70頁。實例之二:ThemeRiver時序性的文本內容可視化

主題河流ThemeRiver,經典的展現文本主題演化的可視化方法,采用河流為可視編碼,將主題隱喻為時間上不斷延續的河流。目標:快速、容易發現有用信息。優勢:易于區分固有主題詞和突然出現主題詞;

方便觀察主題詞微妙變化。應用:新聞熱點的時間變化等第二十一頁,共70頁。實例之二:ThemeRiver主題河流圖示FidelCastro演講訪談主題橫軸:時間顏色:主題寬度:主題詞熱度第二十二頁,共70頁。實例之二:ThemeRiver

第二十三頁,共70頁。實例之二:ThemeRiver4.數據預處理中心點:

;處理后數據:5.為滿足約束條件,smooth,美觀要求的改進。基本方法:樣條插值繪制圖形。改進:①增加約束條件:②:用

代替

:用代替6.顏色把主題詞分成相關組,對每組涂上相似顏色。

第二十四頁,共70頁。實例之二:ThemeRiver不同的效果表現缺陷:1.如果主題詞熱度相似,難以區分;2.一張圖反應的主題詞數目有限。第二十五頁,共70頁。數據可視化分類科學可視化

面向自然科學,如物理、化學、航天航空、生物學等。對數據模型進行解釋、操作,旨在尋找模式、特點和關系。信息可視化

處理抽象、非結構化數據,如文本、圖表、地圖、復雜系統等。可視分析學

以可視交互界面為基礎,綜合圖形學、數據挖掘和人機交互技術,將感知和認知能力以可視方式融入處理過程,進行信息交流和知識提煉,完成分析推理和決策。第二十六頁,共70頁。可視化交互緩解有限的可視化空間和數據過載之間的矛盾有限的屏幕尺寸不足以顯示海量數據常用的二維顯示平面對復雜數據的可視化提出了挑戰BenShneiderman提出:overviewfirst,zoomandfilter,thendetail-on-demand描述了通過交互探索大量數據的有效辦法讓用戶更好地參與對數據的理解和分析第二十七頁,共70頁。可視化交互交互準則交互延時交互成本交互場景變化交互技術第二十八頁,共70頁。交互延時指從用戶操作的發生到系統返回結果所經過的時間,是決定交互有效性最重要的因素之一延時與交互操作的類型、用戶體驗主觀感受有密切關系感知處理:旋轉視圖立即反應:點擊選中基本任務:搜索第二十九頁,共70頁。交互延時解決方案系統應該返回給用戶某種視覺信息,確認操作已經完成當一個交互操作完成時間比用戶預期的長,系統將操作進程反饋給用戶,或將這個交互操作轉變成對應的用戶延時期望較大的另一類交互第三十頁,共70頁。交互成本可視化系統應當采用數據挖掘算法自動發現用戶可能會關心的數據或模式,并呈獻給用戶,用戶在這個基礎上通過互動進行更深入的挖掘只提供必需進行交互的交互第三十一頁,共70頁。交互場景變化可視化場景的變化,需要依賴于用戶的視覺和感知記憶避免交互出錯,通過可視化將這些需要用戶記憶的信息在系統中保存并顯示,以減輕用戶的負擔動畫(漸變)用戶自主在場景之間切換變化盲視,系統需要辨別需要用戶進行關注的變化,通過各種手段(高亮),讓用戶的注意力集中到這些區域第三十二頁,共70頁。交互技術選擇導航重配過濾關聯第三十三頁,共70頁。交互技術-選擇大量的數據在視圖上疊加以致視覺混亂的情況下的選擇將堆疊區域和對象放大選擇之后要展示的提示性信息在視圖上的陳列即字符串在有限空間排列的問題偏心標簽當用戶接觸到數據點之前標簽不可見,接觸到數據點時,標簽和數據點之間可視連接第三十四頁,共70頁。交互技術-選擇偏心標簽(ExcentricLabeling)標簽過多(1)顯示區域內標簽數(2)展現區域內部分標簽non-crossinglineslabelingverticallycoherentlabelinghorizontallycoherentlabeling=>用來計算初始位置第三十五頁,共70頁。交互技術-導航人眼可以觀察到的區域及屏幕空間有限,可視化只能顯示從選定視點出發課件的局部數據,并通過改變視點的位置觀察其他部分的數據縮放、平移、旋轉是導航中(調整視點位置、控制視圖內容)的三個最基本手段空間顯示的對象過密時,無法僅通過縮放、平移、旋轉搜尋到目標Link-SlidingBring&Go第三十六頁,共70頁。

交互技術-導航第三十七頁,共70頁。交互技術-導航Bring&GoLinksliding不能解決在眾多目標目的地中選取某一特定目的地一旦選取某一點,將所有鄰近點都顯示在改點附近,當用戶選擇某一鄰近點后,視圖將和Linksliding一樣平滑地移動至目標點所有鄰近點將按遠近距離排列,最短的放在第一個,并按照這個順序從最靠近圓心的圓環開始放置,直到該層圓環被放置滿第三十八頁,共70頁。交互技術-重配為用戶提供觀察數據的不同視角Dust&Magnet第三十九頁,共70頁。交互技術-重配Dust&Magnet某dust與magnet越相關,更快地被這個magnet吸引Magnet的性質Dust關于Magnet所規定的性質的值Magnet的強度Magnet所設置的相斥值quantitativeordinal第四十頁,共70頁。交互技術-過濾在信息過濾的過程中,將視覺編碼和交互緊密迭代進行,動態實時地更新過濾結果動態查詢HomeFinder設置條件的控件Scentedwidgets所有屬性的過濾控件都不相關聯BrushingHistograms第四十一頁,共70頁。交互技術-過濾第四十二頁,共70頁。交互技術-關聯顯示與特定數據對象有關的隱藏對象,用戶需要清楚數據在各個視圖中的具體為止Linking&Brushing:基于維度映射和平行坐標第四十三頁,共70頁。常用可視化軟件不同領域的可視化軟件科學可視化信息可視化可視化分析GrADS氣象OpenDX科學、工程AVS科學、商用Amira生命科學IDL科學WorldWind地理Vis5D空間科學GoogleEarth地球GraphVizGephiCiteSpaceJigsaw文本IN-SPIRE文本Tableau商業Spotfire商業Loggly日志分析Weave網絡數據ManyEyes公眾傳播IBMVisual.ly在線數據可視化允許使用Twitter/Facebook/GooglePlus數據GapminderGooglepublic–DataExplorerPalantir第四十四頁,共70頁。常用可視化軟件Excel

有限的圖形化功能D3D3能夠提供大量線性圖和條形圖之外的復雜圖表樣式,例如Voronoi圖、樹形圖、圓形集群和單詞云等第四十五頁,共70頁。常用可視化軟件PolyMaps

面向數據分析用戶的地圖可視化工具,在地圖處理方面有獨到之處第四十六頁,共70頁。常用可視化軟件SASSAS系統可完成數據管理、報表、圖形和統計功能Gephi社交圖譜數據可視化分析工具Processing

將命令行可視化,實現編程的網絡圖像、動畫與用戶的互動

電子藝術與程序語言的結合R語言

用于統計分析、繪圖的語言和操作環境,可視化功能強大,有ggplot2、lattice等用于可視化的擴展包Weka經典的數據挖掘工具,可完成聚類、分類、回歸等任務第四十七頁,共70頁。可視化設計的美學原則主要有三點:1色彩設計2可視編碼原則3視覺隱喻第四十八頁,共70頁。可視化設計的美學原則色彩設計·灰度值可被認為是有序的·可用于編碼數值型數據·色調通常認為是無序的,可用于編碼不同維度的值第四十九頁,共70頁。可視化設計的美學原則色彩設計色彩漸變表示順序型數據第五十頁,共70頁。可視化設計的美學原則色彩設計不同色彩區分表類別型數據第五十一頁,共70頁。可視化設計的美學原則例:用不同色彩區分表類別型數據Maps第五十二頁,共70頁。可視化設計的美學原則色彩設計最大化色調區分度第五十三頁,共70頁。可視化設計的美學原則色彩設計相似但有區分度第五十四頁,共70頁。可視化設計的美學原則色彩設計高亮重要內容第五十五頁,共70頁。可視化設計的美學原則色彩選擇原則使用有限的色調范圍控制低飽和度色彩中的色彩視覺突出(pop-out)避免過多顏色交錯導致的雜亂無章使用中性背景色控制對全局色彩的影響最小化“同時對比”(simultaneouscontrast)可使用輔助軟件(ColorBrewer等)來選擇合適的色階第五十六頁,共70頁。可視化設計的美學原則可視編碼可視編碼的兩個因素標記(圖形元素:點、線、面)通道(位置、大小、形狀、方向、色調、飽和度、亮度……)第五十七頁,共70頁。可視化設計的美學原則可視編碼類型(type)

是什么/在哪里(what/where)

何種程度(howmuch)表現力(expressiveness)

表達且僅表達數據的完整屬性

判斷標準:精確性、可辨性、可分離性、

視覺突出有效性(effectiveness)

通道表現力符合屬性的重要性第五十八頁,共70頁。可視化設計的美學原則可視編碼通道分類、分組、定量/定序

包含相似接近連接分組表示關系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論