數(shù)據(jù)可視化的基本概述以及幾個工具的推薦_第1頁
數(shù)據(jù)可視化的基本概述以及幾個工具的推薦_第2頁
數(shù)據(jù)可視化的基本概述以及幾個工具的推薦_第3頁
數(shù)據(jù)可視化的基本概述以及幾個工具的推薦_第4頁
數(shù)據(jù)可視化的基本概述以及幾個工具的推薦_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

據(jù)可視化的基本概述以及幾個工具的推薦科學(xué)可視化(ScientificVisualization)、信息可視化(InformationVisualization)和可視分析學(xué)(VisualAnalytics)三個學(xué)科方向通常被看成可視化的三個主要分支。而將這三個分支整合在一起形成的新學(xué)科“數(shù)據(jù)可視化”,這是可視化研究領(lǐng)域的新起點。一—《數(shù)據(jù)可視化》廣義的數(shù)據(jù)可視化涉及信息技術(shù)、自然科學(xué)、統(tǒng)計分析、圖形學(xué)、交互、地理信息等多種學(xué)科。自然科學(xué)信息技術(shù) 統(tǒng)計分析地理信息數(shù)據(jù)可視牝圖形學(xué)數(shù)據(jù)可視牝圖形學(xué)感知與認(rèn)知

科學(xué)交互感知與認(rèn)知

科學(xué)敎據(jù)管理和知識表達(dá)科學(xué)可視化科學(xué)可視化(ScientificVisualization)是科學(xué)之中的一個跨學(xué)科研究與應(yīng)用領(lǐng)域,主要關(guān)注三維現(xiàn)象的可視化,如建筑學(xué)、氣象學(xué)、醫(yī)學(xué)或生物學(xué)方面的各種系統(tǒng),重點在于對體、面以及光源等等的逼真渲染??茖W(xué)可視化是計算機(jī)圖形學(xué)的一個子集,是計算機(jī)科學(xué)的一

個分支??茖W(xué)可視化的目的是以圖形方式說明科學(xué)數(shù)據(jù),使科學(xué)家能夠從數(shù)據(jù)中了解、說明和收集規(guī)律。信息可視化ZCISNhb-25ZCISNM&-&O信息可視化ZCISNhb-25ZCISNM&-&O信息可視化(InformationVisualization)是研究抽象數(shù)據(jù)的交互式視覺表示以加強(qiáng)人類認(rèn)知。抽象數(shù)據(jù)包括數(shù)字和非數(shù)字?jǐn)?shù)據(jù),如地理信息與文本。信息可視化與科學(xué)可視化有所不同:科學(xué)可視化處理的數(shù)據(jù)具有天然幾何結(jié)構(gòu)(如磁感線、流體分布等),信息可視化處理的數(shù)據(jù)具有抽象數(shù)據(jù)結(jié)構(gòu)。柱狀圖、趨勢圖、流程圖、樹狀圖等,都屬于信息可視化,這些圖形的設(shè)計都將抽象的概念轉(zhuǎn)化成為可視化

◎AT-n可視化分析可視分析學(xué)(VisualAnalytics)是隨著科學(xué)可視化和信息可視化發(fā)展而形成的新領(lǐng)域,重點是通過交互式視覺界面進(jìn)行分析推理。2.a.gteek 電troman t蘭g|L±J科學(xué)可視化、信息可視化與可視分析學(xué)三者有一些重疊的目標(biāo)和技術(shù),這些領(lǐng)域之間的邊界尚未有明確共識,初略來說有以下區(qū)分:?科學(xué)可視化處理具有自然幾何結(jié)構(gòu)(磁場、MRI數(shù)據(jù)、洋流)的數(shù)據(jù)。?信息可視化處理抽象數(shù)據(jù)結(jié)構(gòu),如樹或圖形。?可視分析學(xué)將交互式視覺表示與基礎(chǔ)分析過程(統(tǒng)計過程、數(shù)據(jù)

挖掘技術(shù))結(jié)合,能有效執(zhí)行高級別、復(fù)雜的活動(推理、決策)。為什么需要數(shù)據(jù)可視化人類利用視覺獲取的信息量,遠(yuǎn)遠(yuǎn)超出其他器官人類的眼睛是一對高帶寬巨量視覺信號輸入的并行處理器,擁有超強(qiáng)模式識別能力,配合超過50%功能用于視覺感知相關(guān)處理的大腦,使得人類通過視覺獲取數(shù)據(jù)比任何其他形式的獲取方式更好,大量視覺信息在潛意識階段就被處理完成,人類對圖像的處理速度比文本快6萬倍。數(shù)據(jù)可視化正是利用人類天生技能來增強(qiáng)數(shù)據(jù)處理和組織效率??梢暬梢詭椭覀兲幚砀訌?fù)雜的信息并增強(qiáng)記憶大多數(shù)人對統(tǒng)計數(shù)據(jù)了解甚少,基本統(tǒng)計方法(平均值、中位數(shù)、范圍等)并不符合人類的認(rèn)知天性。最著名的一個例子是Anscombe的四重奏,根據(jù)統(tǒng)計方法看數(shù)據(jù)很難看出規(guī)律,但一可視化出來,規(guī)律就非常清楚。XVXyXyXy108.04109.14107.4686+5886.9588J486.77857613138741312.7487.7198.8198.77988.84118.33119.26117.8188,47149.96148.10148.8487,0467.2466.1366.08852544,2643,1045.39191251210.84129.13128.1585.5674.8277.2676.4287.9155,68547455,7386,89II ill IVaII ill IVb ?可視化還可以有效增強(qiáng)人的記憶力,我們經(jīng)常說的一圖勝千言就是可視化對生活的影響。如何實現(xiàn)數(shù)據(jù)可視化

可視化實現(xiàn)流程在技術(shù)上,數(shù)據(jù)可視化最簡單的理解,就是數(shù)據(jù)空間到圖形空間的映射。數(shù)據(jù)空間到圖形空間的映射關(guān)拄駛據(jù)數(shù)據(jù)空間到圖形空間的映射關(guān)拄駛據(jù)—個經(jīng)典的可視化實現(xiàn)流程,是先對數(shù)據(jù)進(jìn)行加工過濾,轉(zhuǎn)變成視覺可表達(dá)的形式(VisualForm),然后再渲染成用戶可見的視圖(View)。DataVisualFormHltemgrenderingLayoiMUlConlwb可視化技術(shù)棧AtreiractData8一DataVisualFormHltemgrenderingLayoiMUlConlwb可視化技術(shù)棧AtreiractData8一user具備專業(yè)素養(yǎng)的數(shù)據(jù)可視化工程師一般來說需要掌握以下技術(shù)棧:?基礎(chǔ)數(shù)學(xué):三角函數(shù)、線性代數(shù)、幾何算法?圖形相關(guān):canvas、svg、webgl、計算圖形學(xué)、圖論?工程算法:基礎(chǔ)算法、統(tǒng)計算法、常用的布局算法?數(shù)據(jù)分析:數(shù)據(jù)清洗、統(tǒng)計學(xué)、數(shù)據(jù)建模?設(shè)計美學(xué):設(shè)計原則、美學(xué)評判、顏色、交互、認(rèn)知?可視化基礎(chǔ):可視化編碼、可視分析、圖形交互

可視化解決方案:圖表的正確使用、常見的業(yè)務(wù)的可視化場景常用的數(shù)據(jù)可視化工具在學(xué)術(shù)界與工程界,數(shù)據(jù)可視化工具都非常之多,學(xué)術(shù)界用得比較多的是R語言,ggplot2,Python可視化庫等,普通用戶喜聞樂見的是Excel,商業(yè)上的產(chǎn)品是Tableau,DOMO,PowerBI等等,是個精彩紛呈的世界。這里有常用的25個數(shù)據(jù)可視化工具對比,沒有完美的可視化工具,每個工具都有各自的優(yōu)缺點。下面是一張工具選擇推薦圖,根據(jù)目的分類,左上是簡單快捷,左下是故事導(dǎo)向,右上是為了分享分析,右側(cè)是創(chuàng)新型圖表,右下是分析型工具。VEGACHARTSFORANALYSISYOUSHOULDPUBLISHLTRA03W&E6DXPROCESSWC;GGVISTABLEAUBOKEHSEABORN”GGPL0T2MATPLOTLIBGOOGLESHEETSEXCELVEGACHARTSFORANALYSISYOUSHOULDPUBLISHLTRA03W&E6DXPROCESSWC;GGVISTABLEAUBOKEHSEABORN”GGPL0T2MATPLOTLIBGOOGLESHEETSEXCEL吧1茫、 ILLUSTRATOHcomvSVEGA-LITEchartsEASYCHARTPLOTLYHIGHGHAHTS時茁rtlGHCHMfiTSCLOUDINNVCVATIVEOUT$IDt-OF-THE*B0KCHAATSQUADR1GRAMCHARTSASPARTOFSTORYTELLING我們常常聽說的數(shù)據(jù)可視化數(shù)據(jù)可視化(DataVisualization)和信息可視化(InformationVisualization)是兩個相近的專業(yè)領(lǐng)域名詞。狹義上的數(shù)據(jù)可視化指的是將數(shù)據(jù)用統(tǒng)計圖表方式呈現(xiàn),而信息可視化則是將非數(shù)字的信息進(jìn)行可視化。前者用于傳遞信息,后者用于表現(xiàn)抽象或復(fù)雜的概念、技術(shù)和信息。而廣義上的數(shù)據(jù)可視化則是數(shù)據(jù)可視化、信息可視化以及科學(xué)可視化等等多個領(lǐng)域的統(tǒng)稱。一一《數(shù)據(jù)可視化之美》我們常常聽說的數(shù)據(jù)可視化大多指狹義的數(shù)據(jù)可視化以及部分信息可視化。根據(jù)數(shù)據(jù)類型和性質(zhì)的差異,經(jīng)常分為以下幾種類型:統(tǒng)計數(shù)據(jù)可視化:用于對統(tǒng)計數(shù)據(jù)進(jìn)行展示、分析。統(tǒng)計數(shù)據(jù)一般都是以數(shù)據(jù)庫表的形式提供,常見的統(tǒng)計可視化類庫有HighCharts、ECharts、G2、Chart.js等等,都是用于展示、分析統(tǒng)計數(shù)據(jù)。關(guān)系數(shù)據(jù)可視化:主要表現(xiàn)為節(jié)點和邊的關(guān)系,比如流程圖、網(wǎng)絡(luò)圖、UML圖、力導(dǎo)圖等。常見的關(guān)系可視化類庫有mxGraph、JointJS、GoJS、G6等。地理空間數(shù)據(jù)可視化:地理空間通常特指真實的人類生活空間,地理空間數(shù)據(jù)描述了一個對象在空間中的位置。在移動互聯(lián)網(wǎng)時代,移動設(shè)備和傳感器的廣泛使用使得每時每刻都產(chǎn)生著海量的地理空間數(shù)據(jù)。常見類庫如Leaflet、Turf、Polymaps等等,最近Uber開源的deck.gl也屬于此類。還有時間序列數(shù)據(jù)可視化(如timeline)、文本數(shù)據(jù)可視化(如worldcloud)等等?;赪eb的可視化技術(shù)在講各種流行類庫框架前,我們先了解下Web圖形的底層技術(shù)規(guī)范。底層技術(shù)規(guī)范SVG:可縮放矢量圖形(ScalableVectorGraphics),是基于可擴(kuò)展標(biāo)記語言(標(biāo)準(zhǔn)通用標(biāo)記語言的子集)用于描述二維矢量圖形的一種圖形格式。Canvas2D:Canvas通過JavaScript來繪制2D圖形,通過逐像素來進(jìn)行渲染。Canvas3DWebGL:WebGL(WebGraphicLibrary)是—個JavaScriptAPI,用于在任何兼容的Web瀏覽器中渲染3D圖形。WebGL程序由用JavaScript編寫的控制代碼和用OpenGL著色語言(GLSL)編寫的著色器代碼構(gòu)成,這種語言類似于C或C++,可在GPU上執(zhí)行。比較流行的基礎(chǔ)繪圖庫,基于SVG的有snap.svg、rapheal.js等,基于Canvas2D的有zrender、g等,基于WebGL的有three.js、SeeneJS、PhiloGL等,這些基礎(chǔ)繪圖庫可以讓上層封裝更簡單容易。我們重點回到基于Web技術(shù)的數(shù)據(jù)可視化類庫。D3D3.js是一個基于數(shù)據(jù)操作文檔的JavaScript庫。D3可以將強(qiáng)大的可視化組件和數(shù)據(jù)驅(qū)動的DOM操作方法完美結(jié)合。D3的優(yōu)劣:?強(qiáng)大的SVG操作能力,可以非常容易的將數(shù)據(jù)映射為SVG屬性?集成了大量數(shù)據(jù)處理、布局算法和計算圖形的工具方法?強(qiáng)大的社區(qū)和豐富的demoAPI太底層,復(fù)用性低,學(xué)習(xí)與使用成本高D3沒有提供封裝好的組件,在復(fù)用性、易用性方面不佳,社區(qū)里有很多基于D3的可視化組件庫:.nvd3.js:基于D3封裝了常見的折線圖、散點圖、餅圖,功能比較簡單de.js:除了提供了常見的圖表外還提供了一些數(shù)據(jù)處理能力e3.js:—個輕量級的基于狀態(tài)管理的圖表庫D3有著Stanford的血脈淵源,在學(xué)術(shù)界享有很高聲譽(yù),靈活強(qiáng)大使得它成為目前領(lǐng)域內(nèi)使用最廣泛的可視化類庫,但偏底層的API和數(shù)據(jù)驅(qū)動模式,使得上手D3存在一定門檻,基于D3的工程實現(xiàn)上需要自己考慮和處理更多內(nèi)容,如動畫、交互、統(tǒng)一樣式等,研發(fā)成本較高。HighChartsHighCharts是一個用純JavaScript編寫的圖表庫,能夠簡單便捷的在Web應(yīng)用上添加交互性圖表。這是在Web上使用最廣泛的圖表,企業(yè)使用需要購買商業(yè)授權(quán)。HighCharts的優(yōu)劣:?使用門檻極低,兼容性好?使用廣泛,非常成熟?樣式比較陳舊、圖表難以擴(kuò)展?商業(yè)上使用需要購買版權(quán)這是圖表界的jQuery,在世界范圍內(nèi)是使用最多最廣的一個可視化類庫,但整體圖表設(shè)計比較陳舊難以擴(kuò)展,同時商業(yè)公司使用需要按照使用人數(shù)購買版權(quán),比較昂貴,阿里有購買過,目前已不推薦使用。EChartsECharts縮寫自EnterpriseCharts,企業(yè)級圖表,開源來自百度數(shù)據(jù)可視化團(tuán)隊,是一個純Javascript的圖表庫,可以流暢的運行在PC和移動設(shè)備上,兼容當(dāng)前絕大部分瀏覽器,底層依賴另一個也是該團(tuán)隊自主研發(fā)的輕量級的Canvas類庫ZRender,提供直觀,生動,可交互,可高度個性化定制的數(shù)據(jù)可視化圖表。ECharts是目前國內(nèi)唯一一個入選GitHub全球可視化榜單的開源項目,2w+star全球排名第三,社區(qū)活躍,覆蓋主流前端框架和8種編程語言的擴(kuò)展,目前國內(nèi)市場占有率處于絕對領(lǐng)先地位。ECharts的優(yōu)劣:?豐富的圖表類型,覆蓋主流常規(guī)的統(tǒng)計圖表?配置項驅(qū)動,三級個性化圖表樣式管理?移動端優(yōu)化,交互和布局適配,按需打包?深度的交互式數(shù)據(jù)探索?地理特效(百度遷徙,百度人氣,公交軌跡等效果)?靈活性上不如Vega等基于圖形語法的類庫?復(fù)雜關(guān)系型圖表比較難定制ECharts能很好滿足傳統(tǒng)圖表需求,但在高度靈活多樣化的可視需求面前,需要另尋出路。LeafletLeaflet是面向移動設(shè)備的交互式地圖的JavaScript庫。測量的JS只有大約38KB,它具有大多數(shù)開發(fā)人員需要的所有映射功能。Leaflet的優(yōu)劣:?專門針對地圖應(yīng)用?mobile兼容性良好?API簡潔、支持插件機(jī)制?功能比較簡單,需要具備二次開發(fā)能力地圖專用,其他領(lǐng)域使用不上。目前Google地圖、高德地圖、百度地圖都擁有自研的JS庫。deck.gldeck.gl是Uber可視化團(tuán)隊基于WebGL開發(fā)的面向大數(shù)據(jù)分析的可視化類庫。deck.gl的優(yōu)劣:?主要以3D地圖可視化為主,內(nèi)置了地理信

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論