2013年6月2日 星期日

別讓統計圖表唬弄你


<別讓統計圖表唬弄你>書名還挺吸引人的,但是如果能夠按照英文書名"How to Lie with Charts" 翻譯成<如何用統計圖表唬弄人>的話會,更吸引邪惡的我。雖然書名看起來好像很邪惡,但作者的主要用意是要提醒大家不要被統計圖片誤導了,書名的中譯忠實地呈現了作者的寫作動機。現在市面上的統計書籍,少有完全針對統計圖表的製圖與表達作提點,這點看起來滿特別的(所以我就買了)。整本書讀下來,介紹的一些技巧與注意事項,都還算滿基本的,所以我非常推薦給剛開始要學習製作統計圖表來呈現數據的大學生或研究生。

雖然現在都有很方便的製圖軟體,最普遍的大概就是excel。但是常常看到呈現出來的統計圖表還是會讓人非常的不悅,簡直就是1-3分的囧星人動畫完全讓人不想看下去。讓人惱火的是一些懶直接用excel第一次呈現出來的預設值,但因為那個預設值做出來真的非常的醜的關係,如果製圖之後不做一些後續的調整,就會讓閱聽者相當不耐(如果閱聽者是老闆或指導教授那可不划算啊大大)。

統計圖表的缺點大致上有兩類,一個是會讓聽眾產生誤會,一個是無法呈現重點,書中主要談的是前者。而這些缺點的起因又可分成兩類,一是無心的過失,一是刻意的操弄。現在無論任何工作都有很高的機會需要呈現圖表,或聽其他人表達圖表。除了要讓自己製作圖表不要犯錯之外,也要小心他人可能刻意用某些手法,呈現毫無造假的圖表,但是卻可以讓你心裡有截然相反地結論。


舉個例子來說吧,看看賈博斯大大發蘋果的市占率(19.5%綠色那塊),明明比紫色那塊21.1%的還要低。但是綠色那塊硬是做的大一點、圓餅再躺平一點、再把綠色那塊拉出來一點,再配上三寸不爛之舌,這張圖呈現的30秒到一分鐘之間,聽眾的對蘋果市占率的印象恐怕又會提昇不少。書中所要談的就是諸如此類的手法與技巧,只能說這個社會上還是兵不厭詐,不管別人怎麼呈現,被人家誤導就只能摸摸鼻子怪自己太笨了。

不過說實話,我到不覺得運用的些手法修飾你的圖表並沒有什麼不對,只要數據是正確的,要製作圖表、解讀圖表就真的是各憑本事的事情了。維護事實底線的科學家會這麼作嗎?顆顆,當然會壓。再舉個例子吧,科學研究常常在比較對照組與實驗組之間,有沒有顯著的差異(通常以長條圖呈現)。如果做出來的結果,統計分析確實有差異,但是長條圖畫出來高度差不多,這樣審查委員、編輯或讀者,對這張圖的第一印象就會是「根本沒有顯著差異」(請相信多數人絕對是先看圖再看字)。因此,這個時候通常會調整Y軸,讓他不要從零開始,這些長條圖之間的差異就會看起來差得多了。請注意,這樣作並沒有扭曲數據,也沒有造假,只是改變讀者的視覺感受。

這本書從第1章到第10章,對各種圖表的呈現與注意事項說明得很清楚,也有適當的圖來輔助說明。相當適合初學者閱讀,以避免莫名其妙的遭老闆嫌棄。第11章關於用色的部份,我認為作者沒有很專精,色彩學我認為完全是另外一項不同的技巧與議題,所以我會建議找其他的書來看,會比較有幫助。第12章就是吧前面各章的summary放在一起,未來要回顧的時候可以只翻這章就好。無論製作的統計圖表如何,最重要吶喊的是拜託一下別再偷懶只用預設值了,只要再作一些調整就可以弄得美美的。而最重要的原則,就是「體貼讀者」,無論是寫作、製圖、表達,多花一點心思為讀者著想,通常就會做出不錯的成果。畢竟大家都不太喜歡聽課,自己講課的時候也多多少少讓聽眾愉悅一下吧。

其他的進一步資訊可以參考

博客來http://www.books.com.tw/exep/prod/booksfile.php?item=0010283649

沒有留言:

張貼留言