2020-05-01

機率思考:大數據時代,不犯錯的決斷武器 BY 貳團 Desmond Huang

本書討論(拆穿)許多生活中會遇到的機率問題,說明這些問題背後的理論及如何被大眾誤用,例如:最近後熱門的確診問題,試劑的準確度代表的不是確診,書中舉例,乳房檢測後醫生說報告呈陽性,該檢測準確度80%,並不是指有80%罹患乳癌,而是指檢測後,真正有乳癌的人有80%會呈陽性反應,因此如果要評估罹癌機率,還需要納入偽陽性的機率,因此經估算後(書中有詳細說明),呈陽性反應且確診的機率只有17%,另外書中也討論近年來很熱門的Data mining,大多數人都想用找出一個萬用模型來詮釋一切,然而都忘了使用規定,例如:常態分佈(鐘型曲線),的前提:個體現象需彼此獨立,但卻被大量應用於財務工程,結果造成2008年金融海嘯,此外,被濫用的還有相關係數(線性回歸法),也因此產生許多可笑的結論如尼可拉斯凱吉新片上檔,就會有人在泳池溺斃,許多學者喜歡用相關係數來表示兩事件的影響度,想找出彼此關聯,卻忘了線性回歸法的前提:事件彼此呈線性相關(必須先確定彼此相關)。讀完書後再來看最近的新聞真得會再讓人想到馬可吐溫的名言:“Lies, damned lies, and statistics”