去聽了 RR 的演講,有提到日本這幾年面對的一些困境。例如這個例子:接近4成的人年收入是在300萬日圓以下。更不用去提日本目前在職場上對於女性的歧視,附帶一提在資料中也可以找到生完小孩子後復歸職場的比例,不過暫時不做這些進階的分析。
查了一下網路資料,平成27年是西元 2015年。這類的統計資料不太可能做到即時更新。
有興趣的人,可以到這裡下載 EXCEL 資料表:
http://www.mhlw.go.jp/toukei/saikin/hw/k-tyosa/k-tyosa14/
(附帶一提:其實台灣的 OPENDATA 算是做的不錯了)
總之先將重點放在總體的狀況吧,因為原始資料用了很多合併儲存格,而一般的軟體是無法判斷這些東西。我們依照 TIDY DATA 的理念,將資料整理如下:
然後放到 POWERBI 做圖,觀察其中幾個有趣的事項:
(1) X 軸其實為了方便閱讀,所以其實是文字格式;文字格式一般比起數字要進行排序,得要經過一些處理手法,但是遇到「50萬未滿」、「1000萬以上」很容易讓軟體判斷錯誤;最簡單的方式,直接用「累積比例」做為排序的參考值
(2) 要將2個比例畫在同一張圖表中,為了視覺上的清楚,一般建議使用2個 Y 軸進行顯示。所以要到 POWERBI 的「FORMAT」中將第2個Y軸給打開。
(3) 一般而言,折線圖適合運用在時間序列等狀況中,但因為這次分析的X軸經過我們處理後,愈往右邊的是高收入家庭,所以使用折線圖並沒有違反題意
(4) 下次有時間再來把這張圖與男女就業比例等圖表做成互動圖表,應該會很有趣
(5) 日本把50萬日幣做為資料區間(BIN),其實算是區隔的很細致了。台灣似乎目前沒有給到這麼細的資料?