由於 PowerBI 是由Ecxcel BI 套件所衍生而後進行整合的軟體,所以初學者在第一次接觸 PowerBI 總會有不得其門而入的感覺。現在我將主要的流程整理如下:
PowerQuery 原先是在 Excel 中的外掛,主要負責的就是資料的匯入與初步的資料整理。例如:如果是單純的 HTML 表格,使用 PowerQuery 就可以直接進行捉取。若是複雜的 ajax 網頁,則使用者還是得透過其他程式語言進行處理,再將處理完後的資料整理後再匯入至 PowerBI中。又或者是各種各樣的資料庫系統(例:MySQL、Oracle、SQL Server…) 甚至就連 No SQL 都可以順利連接。當然最基本的文件檔(CSV)或是EXCEL檔都是沒有問題。
而在實際作業狀況中,我們常常不會只匯入一筆資料,我們可能同時匯入了客戶清單、客戶消費品項、歷年銷售紀錄等資料,所以我們還需要對資料進行更進一步的處理。在過去我們可以使用 EXCEL 的 vlookup 進行以上的處理,但常常會發現在資料筆數更大時,就會面臨效能低落的冏境… 而此時 PowerPivot 就可以解決這個問題。若是熟悉SQL開發工具使用者,一定會對於PowerBI 提供的工具相當熟悉,因為可以視覺化的進行 Join 等作業。而這就是 PowerPivot 主要的作用。
而在上述資料處理作業都完成後,就能順利進行資料視覺化的作業;這視覺化的本質,在過往的 Excel 套件名詞就叫做 Power View。
其實這是相當直覺的作業流程:首先我們取得資料,進行初步的整理,而在取得多筆資料後,我需要再將資料再整行一次整理,整理完後就可以畫圖。
先使用 GUI 的工具將上述的流程完整跑過一次,後續再要進階時,就可以研究 M 、R Script、DAX 這些程式語言針對上述的作業提供了更細緻的控制。例如 M 語言可以使用參數,如此一來讓使用者就可以輸入任意筆地址然後得到回傳的經緯度。(合理使用下,一般人很難超過 Google Geo API 的使用限制)
沒有留言:
張貼留言