Robustness in Statistics 統計上的穩健性
零、本篇目標
1.了解統計上的穩健性以及一些量化方法
2.如何讓估計式穩健
ㄧ、什麼是穩健性?
上面這張圖看得出左邊為常態分佈,而右邊有一些離群值。 如果我們想要估計這常態分佈正確的均值,該如何估計?我們發現用樣本平均數畫出的常態分佈曲線(藍色),受到離群值得影響而有偏移;而使用中位數作為均值估計畫出的常態分佈曲線(紅色)則比較靠近沒有離群值下的樣本平均(黑色)。所以可以簡單地說,樣本平均比中位數還容易受到離群值的影響,是比較不穩健的估計量,而中位數則是相對來說比較穩健的。
那我們要如何去量化一個估計式有多穩健呢?或者換個問法,加入一個離群值會對他影響程度有多大,以及需要多少離群值才會造成影響?底下介紹三種基本量測穩健程度的方法。
1.影響函數(Influence function) (Hampel 1968)
2.Gross-error sensitivity
3.Breakdown point