數(shù)據(jù)可視化導(dǎo)論
以圖形方式表示數(shù)據(jù)或信息,以便觀察者能夠輕松理解數(shù)據(jù)趨勢(shì)的過(guò)程,這稱為數(shù)據(jù)可視化。使用任何視覺(jué)元素,以便從數(shù)據(jù)中理解和研究趨勢(shì)、異常值和模式。用于數(shù)據(jù)可視化的不同工具包括圖表、地圖和圖形等。這些工具的設(shè)計(jì)方式可以輕松理解和掌握數(shù)據(jù)提供的信息,而不是掃描excel表格的整個(gè)過(guò)程,從而為分析人員節(jié)省時(shí)間。
Hadoop、數(shù)據(jù)科學(xué)、統(tǒng)計(jì)和;其他
餅圖
使用中最普遍的圖表之一是披薩圖或餅圖。
混合物中氣體的比例
這張圖表通常在選舉中用來(lái)顯示哪個(gè)政黨獲得了最多的選票,盡管它非常受歡迎,但也有一些明顯的缺點(diǎn)。愛(ài)德華·塔夫特(Edward Tufte)、利蘭·威爾金森(Leland Wilkinson)和杰拉爾德·范貝爾(Gerald van Belle)等統(tǒng)計(jì)學(xué)家都表示不愿意使用餅圖。反對(duì)餅圖的最確鑿的證據(jù)可能是由Perceptive Edge的創(chuàng)始人斯蒂芬·諾爾(Stephen Now)提供的。斯蒂芬在《視覺(jué)商業(yè)智能通訊》上發(fā)表的文章《為甜點(diǎn)留餡餅》中解釋了為什么,令同事和學(xué)生驚訝的是,他認(rèn)為餡餅圖是可視化數(shù)據(jù)的無(wú)效手段。
請(qǐng)看下面的餅圖。
在這張描繪晚上9點(diǎn)后訂購(gòu)的食品比例的圖表中,很容易估算出屬于冰淇淋的百分比——25%。然而,經(jīng)過(guò)輕微修改后,再也無(wú)法輕松確定冰淇淋訂單的百分比。
雖然冰淇淋的比例仍然保持在25%,但從上圖很難理解。在上一張圖中,很容易猜出百分比,因?yàn)楸苛艿年幱皬?點(diǎn)鐘位置開(kāi)始,一直延伸到9點(diǎn)鐘位置。由于我們的眼睛經(jīng)過(guò)訓(xùn)練,可以看到12、3、6和9的時(shí)鐘,如果餅圖的區(qū)域與4個(gè)時(shí)鐘位置一致,那么它也更容易解釋。一位熱心的餅圖支持者會(huì)站出來(lái)建議,通過(guò)使用標(biāo)簽和標(biāo)記每個(gè)區(qū)域的百分比,可以很容易地避免這個(gè)問(wèn)題。
帶有數(shù)據(jù)標(biāo)簽的餅圖。
但同樣,為了將值映射到項(xiàng)目,我們的眼睛必須不斷將焦點(diǎn)從圖表底部的圖例轉(zhuǎn)移到圖表上的標(biāo)簽上。
這
查看課程相關(guān)課程
Hadoop培訓(xùn)計(jì)劃(20門課程,14個(gè)以上項(xiàng)目,4個(gè)小測(cè)驗(yàn))
MapReduce培訓(xùn)(2門課程,4個(gè)以上項(xiàng)目)
Splunk培訓(xùn)計(jì)劃(4門課程,7個(gè)以上項(xiàng)目)
Apache Pig培訓(xùn)(2門課程,4個(gè)以上項(xiàng)目)
解決這個(gè)問(wèn)題的方法是附加項(xiàng)目名稱和值,以獲得類似的結(jié)果:
你會(huì)說(shuō),太好了。但我想問(wèn)你——既然我們已經(jīng)附上了項(xiàng)目名稱和價(jià)值,那么上面的餅圖與下表有什么不同:
使用按順序百分比排序的數(shù)據(jù)清理表。
這些信息看起來(lái)是否比散布在餅圖上的標(biāo)簽和圖例要好得多。那么,餅圖有什么用呢?視覺(jué)化是為了增加價(jià)值;它們是結(jié)論的媒介;他們應(yīng)該讓數(shù)據(jù)暴露其秘密。但在這種情況下,餅圖并沒(méi)有實(shí)現(xiàn)它的承諾。
進(jìn)入數(shù)據(jù)可視化的條形圖
與餅圖相比,柱狀圖更簡(jiǎn)潔、更優(yōu)雅,它能夠表達(dá)餅圖上所說(shuō)的一切,而不會(huì)弄亂標(biāo)簽和圖例。
條形圖描述了相同的情況——易于比較、對(duì)比和總結(jié)
這與現(xiàn)在溫和地呈現(xiàn)給觀察者的信息相同。除了顯示個(gè)別價(jià)值外,這個(gè)圖表使我們能夠快速比較每種食物的受歡迎程度,甚至比較連續(xù)食物之間價(jià)值的相對(duì)差異。同樣的數(shù)據(jù)本可以通過(guò)表格獲得,但我們的大腦在處理圖像方面比破譯文本更好。
這就是為什么餅圖的使用隨著時(shí)間的推移而減少。雖然這是媒體行業(yè)最受歡迎的視覺(jué)效果,但它已經(jīng)被更好、更復(fù)雜的表現(xiàn)形式所取代。除了折線圖、餅圖和條形圖之外,還有無(wú)數(shù)其他的圖表可以派上用場(chǎng)。一個(gè)有趣的圖是Sankey圖,但對(duì)新手來(lái)說(shuō)并不流行。這個(gè)圖表用來(lái)表示物質(zhì)的分布和流動(dòng)。問(wèn)題可能是能源、金錢,甚至是水。
典型IT員工的能量流和分布圖。
上面是一個(gè)虛構(gòu)的Sankey圖,表示IT員工的大部分精力是如何以及在哪里分配的。
更新的工具
隨著社交媒體和人們可以寫出自己的感受、評(píng)論和觀點(diǎn)的不同平臺(tái)的出現(xiàn),一個(gè)非常常見(jiàn)的數(shù)據(jù)可視化工具就是“云”。單詞云幫助我們了解人們?cè)谡務(wù)撌裁础?br />
這是一個(gè)非常真實(shí)的、實(shí)時(shí)的word cloud,展示了google play商店中用戶對(duì)PUBG的評(píng)論。
如果我們看看這里的“云”這個(gè)詞,它是根據(jù)谷歌play store對(duì)游戲PUBG的前80條評(píng)論構(gòu)建的,我們會(huì)發(fā)現(xiàn)對(duì)游戲的總體反應(yīng)是“好的”,有些人甚至稱之為“最好的”然而,似乎有些“更新”存在問(wèn)題,人們正在懇求游戲創(chuàng)作者予以糾正。事實(shí)上,當(dāng)我們?cè)谀翘觳榭磒lay store的評(píng)論時(shí),我們看到了同樣的情況。
更新的問(wèn)題。另外,看看你是否能在這里找到“請(qǐng)”這個(gè)詞。
未來(lái)
這只是冰山一角。Plotly和D3等庫(kù)將數(shù)據(jù)可視化提升到了一個(gè)不同的水平。這是因?yàn)樾枨笠舶l(fā)生了變化。你會(huì)如何在儀表盤上想象一個(gè)智能城市?一個(gè)巨大的屏幕,可以顯示整個(gè)城市的重要信息。
交通、電力使用、不同地區(qū)的健康狀況、空氣質(zhì)量和許多其他參數(shù)需要顯示在一個(gè)頁(yè)面上。這一要求要求對(duì)數(shù)據(jù)可視化提出了一種不同的方法,因此我們通過(guò)這個(gè)概念了解了什么是數(shù)據(jù)可視化。我們不能再堅(jiān)持使用圖表了。當(dāng)圖形與藝術(shù)和想象力相結(jié)合,創(chuàng)造豐富的視覺(jué)體驗(yàn)時(shí),需要一種新穎的方法,這種討論需要一篇完全不同的文章。直到下次。
推薦文章
本文是關(guān)于什么是數(shù)據(jù)可視化的有用指南。在這里,我們用圖表和圖表討論了基本概念,以便您能夠輕松理解數(shù)據(jù)可視化。您還可以閱讀以下文章了解更多信息——
- Oracle數(shù)據(jù)庫(kù)管理員的職業(yè)生涯
- 7.數(shù)據(jù)挖掘和Web挖掘之間最有用的區(qū)別
- 數(shù)據(jù)分析面試問(wèn)題
- 大數(shù)據(jù)分析示例