2017/4/27

資料視覺化的工具的選擇

在學習資料視覺化的過程中,有很多工具可以供我們做選擇,以下這篇文章 ( What I Learned Recreating One Chart Using 24 Tools) 提供了作者詳細比較各種軟體、程式語言的優勢與劣勢。

 

圖形引用來源:

What I Learned Recreating One Chart Using 24 Tools

https://source.opennews.org/articles/what-i-learned-recreating-one-chart-using-24-tools/

 

作者用了2個維度 學習成本、繪圖彈性來做各式軟體的分類。舉例來說,我們都知道 D3 非常的強大,但是的確難以學習,對於初學者若不具備撰寫前端的經驗,可能在開發環境的設定就是第一道關卡,然後還有對於基本的 JS 語言有一定的認識;而眾所皆知,應該是世界上最多人使用的視覺化工具 EXCEL,則非常易學,但是可以做到客製化的項目就不多。如果對於 EXCEL 圖形有過較深入研究的人就知道,EXCEL 要做到很多圖形,需要使用非常奇淫巧技的技術,諸如在一般程式語言可以一行指令就得到的「直方圖」,在EXCEL 2017前的版本,一樣能繪製出來,只是要經過很多道程序 …

我個人其實蠻建議資料視覺化的初學者,可以去下載 Tableau Public 來學習資料視覺化。因為 Tableau 應該是我看過在使用介面上,最具備直覺化的軟體。當然這與 Tableau 面世時的時間點也有關係,Tableau 因為是新的軟體,所以很多開發理念都針對近期的資料需求進行簡化。當然這些資料化軟體基本上,都不具備太深入的統計分析功能,要在 Tableau 進行諸如 SVM、進階的 Text Mining 都不是件簡單的事。但就算是在 R 這類專門的統計軟體中,視覺化也應該被視為是一種獨立的作業程序。

 

而在這其中,怎麼沒有見到 PowerBI 呢? 我想這是因為 PowerBI 一開始的野心太大,但操作介面真的不是那麼直覺,所以 PowerBI 的潛力被作者給忽略。

其實 PowerBI 的彈性非常強大,如果你只是個一般的使用者,在經過一定時間的練習後,我相信可以在此2維平面得到接近 Tableau 的結果。而因為 PowerBI 提供與 R 介接的方式,所以當你對於 R 有一定的瞭解,只要能夠瞭解資料流程中的限制,你就有機會往下一步移動。而如果你想要自訂自己的資料視覺化效果,還可以利用 D3 的語法(或是 R)來開發,將你個人的開發成果拓展至整個公司。

 

 

當然,我認為學習任何東西都要考慮效率。而效率的計算,不外乎是投入與投出之間的取捨。今天如果身處在一個中小企業或是新創體系,我認為將 PowerBI 妥善與 R 進行整合就能解掉近乎 95%的問題;而如果公司是國際級的大公司,努力開放了一個月的視覺化套件,可以供應給各地的子公司,那也是美事一件。

 

結論,我個人較建議的視覺化工具(排名不分先後):

(1)R + ggplot2

(2)Excel

(3)Tableau

(4)PowerBI Desktop

(5)R + Plotly

這系列的文章將先以 PowerBI 做個簡單的介紹,後續有機會再為大家介紹其他的好用的視覺化工具

沒有留言:

張貼留言