マル太の『道草日記』

ほぼ毎日更新――

どれくらい低い確率のときに無視をするか

 ――再起可能の失敗

 と、

 ――再起不能の失敗

 との区別を明確につけるために――

 ――誰かの命が失われる可能性

 が十分に低いときには――

 その可能性の確率をゼロとみなすのがよい――

 ということを、きのうの『道草日記』で述べました。

 

 が――

 具体的に、どれくらいの確率のときに無視をすればよいのか、という問題は――

 そう簡単ではない――

 ということも述べました。

 

 一般には――

 確率が、

 ―― 5 %未満

 のときには無視をするのがよいとされています。

 

 つまり――

 例えば――

 確率が、

 ―― 3 %

 なら無視をするが、

 ―― 10 %

 なら無視をしない、ということです。

 

 あるいは、

 ――コインが連続 4 回以下で表が出る可能性(確率 16 分の 1 以上)は無視をしないが、連続 5 回以上で表が出る可能性(確率 32 分の 1 以下)は無視をする。

 ということです。

 

 ―― 5 %未満

 というのは、統計学の慣例です。

 

 なぜ、

 ―― 5 %未満

 なのか――

 

 実は、確かな根拠はありません。

 

 強いていえば、

 ――統計学的な計算と、それに基づく思考とが、わりと有意義に進められるから――

 です。

 

 もう少し詳しく述べますと――

 

 データが平均値に集まっているような分布を、

 ――正規分布

 といいます。

 この分布では、標準偏差――平均値からのズレの平均――の 2 倍以下に集まっているデータが全体の約 95 %を占めることがわかっています。

 このことに着目をして、

 ――標準偏差の 2 倍以下のズレで集まっているデータが本物のデータであり、標準偏差の 2 倍以上のズレで散らばっているデータは偽物とみなそう。

 との提案が統計学の始まりの頃になされたのです。

 

 では、

 ――なぜ標準偏差の 2 倍のズレに着目をするのか。

 との疑問には誰も答えられません。

 

 ――標準偏差の 1 倍や 3 倍のズレではなく、2 倍のズレに着目をすることで、統計学の計算と、それに基づく思考とが、わりと有意義に進められるから――

 ということ以外の理由は――

 なかなか挙げられないのです。

 

 よって、

 ――誰かの命が失われる可能性

 の確率を考えるときに――

 この統計学の慣例を持ち出すのは、ちょっと気が引けます。

 

 ―― 5 % 未満

 というのは――

 そんなに低い確率ではありません。

 

 もし、100 人いたら、

 ―― 3 ~ 4 人くらいの命が失われる確率

 であるからです。