這是一本有關統計初入門的書,不過雖然是初入門,也不會提到細節的計算以及各項統計檢定的細節,但是卻也把統計很基本的大觀念說得很清楚易懂。這本書不僅對初入統計的人很友善,對那些對統計有些理解,但卻在專業書籍中找不到人話;或是無法用人話把統計解釋清楚的人同樣很有幫助。
這本書一開始先說明統計的重要性,舉凡抽籤、促銷是不是有成效、醫療、智商的測驗等等,都是需要仰賴統計的。如果有統計概念的話,很多事情不需要用猜的,透過統計可以有更確實的判斷依據。說誇張一點,統計就是在人類無法掌握的世界中,透過抽樣計算、考量誤差以後,確認這件事情是確實存在的一門學科。
但是作者也提出統計分析也不該淪為一門說明學科,不管是商界、醫界,還是學界,做出的研究都應該有其成果。要能夠找到實際影響結果因素,同時這樣因素要可以被調整、改進,才能稱為有價值的統計研究。
統計說穿了是找到「因果」、「預估值的誤差」,而從統計延伸的各種學派,例如商業的資料探勘、醫療的病理研究、心理統計學、商業統計等等,其實只是對於因果或是估計值的誤差著重不同。另外,再看完這本書以後,終於知道統計理的P-value代表什麼意思。
統計基本的理念,就是透過抽樣去推估母體。但是每次的抽樣樣本不同,就有可能導致對於母體有錯誤認知,而統計的精隨就是將所有條件進行隨機抽取,讓誤差值也變成一種隨機,最後去計算因為誤差所以導致我們對母體認知有這樣的機率有多少(就是所謂的P-Value)。
因為所有的條件都有誤差,但是當樣本夠隨機之後,其實就可以在合理的範圍內去預估母體。而廣義的「迴歸分析」也可以概括大部分的統計檢定,不論是變動量(數字),或是虛擬變數(分類),其實都是在預估一個數字。另外考量群體是否有不同,或是變因對結果的影響,又可以在分成不同類的統計。這些在書裡都有很簡單的說明。