我的書櫃爆炸了
2021-11-01
暗數據:被看到、被聽到、被測量到的,往往不是「真凶」 BY 壹團 Chia-Pei Lee
暗數據就是我們沒有的數據。書裡面把暗數據的類型分成15類以DD-Txx編號。暗數據形成的原因很多可能來自於資料搜集的限制、取樣的方式、統計的誤差、規則化的調整甚至是刻意的隱瞞、造假、欺騙。書裡舉了很多實際的例子來說明了各種暗數據的成因與該注意的地方最後的章節也提到面對暗數據該怎麼處理找出辨別、修正的方式。總之「對數據永遠保持懷疑」。
較新的文章
較舊的文章
首頁