bibou: 第二種の誤りを忘れない

よく、慎重な上司などと話していると、「保守的にやれば確かにミスは減るが、でも、その分、逆に失うものもあるよなぁ」とモヤモヤ感を抱くことはないだろうか？

このコンセプトは実は統計学の定番コンセプトであり、今日はそれについて少し紹介してみたい。

ここでは、オーソドックスな統計の話ではなく、統計のオハナシを枕に自分が感じた「エセ統計話」になるが、統計的仮説検定の発想が日常の意思決定の「やりすぎ」を防ぐ良いヒントになるような気がするので、少し論じてみる。

統計的仮説検定

統計における仮説検定とは、以下のような手順の議論を指す。

確認したい仮説を準備する。
例えば、「風が吹くと桶屋が儲かる」という仮説を検証したいとする。
確認したい仮説を否定するような帰無仮説を準備する。
この例では、「風と桶屋の儲けは関係ない」（桶屋の収益性に対する風の感応度がゼロである）というのが帰無仮説となる。

統計学では、この帰無仮説が成り立つ確率を確認することで、いわば二重否定的に、「風が吹くと桶屋が儲かる」というもともとの仮説（対立仮説）の確からしさを検定する。

他方、この帰無仮説を否定できないなら、「風が吹くと桶屋が儲かるかは、わからない」となり、仮説が正しいとは言えないという判断になる。
帰無仮説が統計的にどのくらいレアか計算する。
この例では、帰無仮説である「風と桶屋の儲けは関係ない」ということが、確率的にどのくらいレアなのか確認する。

データをとって、それを

・風と桶屋の儲けが関係ない確率は、びっくりするくらいレアである

のか、

・風と桶屋の儲けが関係ない確率は、言うほど低くはない

のか確かめる。
計算結果から、帰無仮説を棄却できるのかどうか判断する。

この例では、もし「風と桶屋の儲けが関係ない確率は、とても低い」ということになれば、否定したかった帰無仮説を無事否定することができたので、二重否定、裏の裏は表ということで、風が吹いても桶屋が儲からないとは限らないと結論づけることができる。

※「風が吹けば桶屋が儲かる」とまでは言い切れないのがモニョっとするところ

逆に、風と桶屋の儲けに関係がない確率がそこまで低くないのであれば、「やっぱり風と桶屋の儲けは関係ないかもしれない」ということで、当初主張したかった仮説はこの検定では支持できないという結論になる。

仮説検定につきまとう限界

仮説検定は上記の通り、仮説の確からしさについて確率的に議論するもの。

決してゼロイチで白黒はっきりできるものではなくて、あくまで「仮説が間違っている確率はかなり低い」と言うことしかできない。

また、ここで結論として述べられている「確率がかなり低い」という結論も、どこにバーを置くかで判断が変わってしまう。

すなわち、確率が何パーセントなら「かなり低い」と言えるのか（＝有意水準：ハードルレートのようなもの）の置き方次第で、仮説についての結論は白とも黒とも変わってしまう。

たとえば「風と桶屋の収益性に関係がない確率は0.6%」みたいな計算結果になったとき。

有意水準1%とすれば、確率は1%未満なので、「帰無仮説が正しい確率は相当低い＝もともとの仮説が正しい可能性は高い」と結論づけられる。

他方で、優位水準0.1%とすれば、確率は0.1%よりは大きいので、逆の結論になってしまう。

言い換えると、統計的検定では、有意水準という「恣意的な判断軸」をよりどころとして、有意水準に照らして確率が大きいか小さいかというところまでしか議論できない。

そのため、計算結果は一意になっても、その解釈は有意水準という判断軸ひとつでブレうる。

第一種の誤りと、第二種の誤り

このように、統計的検定においては確率論で議論する以上、どうしても判断を誤るリスクから逃げることができない。

しかも、そのリスクは、2種類も存在する：

第一種の誤り(First Type Error): 帰無仮説が正しいのに、間違って棄却してしまうこと。

帰無仮説が正しい＝元の仮説は間違っているということなので、間違った仮説を正しいと勘違いしてしまう誤り。

例えば、

・風と桶屋の儲けは関係ないのに、間違って「風が吹くと桶屋が儲かる」と判断してしまった。その結果、桶屋設立にあたり、一生懸命扇風機で風を送る徒労をしてしまった。

・(仮説：彼女は自分のことを好きである→)彼女は自分のことを好きではなかったのに、間違って「彼女は自分のことを好きである」と判断してしまった。その結果、彼女に馴れ馴れしい態度をとってしまい、さらに嫌われてしまった。

等がある。
第二種の誤り(Second Type Error)：帰無仮説が正しくないのに、間違って正しいと判断してしまうこと。

すなわち、元の仮説が正しかったのに間違って棄却してしまうこと。例えば

・風と桶屋の儲けは関係あったのに、間違って「風が吹いても桶屋が儲かるとは限らない」と判断してしまった。その結果、風を軽視してしまい(?)、せっかく桶屋を設立したのに儲からない。

・(仮説：彼女は自分のことを好きである→)彼女は自分のことを好きだったのに、間違って「彼女は自分のことを好きでない」と判断してしまった。その結果、彼女に話しかけられず、そうこうしているうちに彼女を別の男性に取られてしまった。

等がある。

第一種の誤りと第二種の誤りは、有意水準の設定次第でその発現リスクがトレードオフ的に相互依存している。

帰無仮説に対する有意水準を厳しく設定すれば、第二種の誤りをするリスクは減るが第一種の誤りをするリスクは高まる、逆もまたしかり。

両方の間違いをともに減らすのは、例えば仮説をより絞り込むとかすれば変わるかもしれないが、基本的には難しい。

インプリケーション

以上が統計的仮説検定およびその限界のあらまし。

この話に関し、自分は、統計的世界を超えて、以下のような拡大解釈をしている。

(1)間違いは1つではなく、基本的に2つ

統計を離れた一般的なオハナシとしても応用が利く話だと思うが、ほとんどの物事には二面性があり、「間違える方向」は基本的に2つ存在している。

桶屋の話であれば、「関係ないのに、関係あると誤解する」という間違いと、「関係あるのに、関係ないと誤解する」という間違い。
彼女の話であれば、「好かれてないのに、好かれていると誤解する」という間違いと、「好かれているのに、好かれていないと誤解する」という間違い。
投資判断の話であれば、「投資に値する会社ではなかったのに、間違って投資してしまう」という間違いと、「投資にふさわしい会社だったのに、間違って投資棄却してしまう」という間違い。
コンプライアンスの話であれば「法令的にリスキーなのに、間違って法令違反してしまう」という間違いと、「法令的にそこまで気にすることなかったのに、気にしすぎて、取引を逃す」という間違い。

(2) どちらの間違いが増えるかは、判断基準(≒有意水準)の置き方しだい

間違え方に二面性があるとして、人はどちらの間違いを犯しやすいのだろうか？
この答は、その人がその問題に対し、どのような判断基準を置いていたかによると思われる。

人は意識的あるいは無意識に、「この間違いは避けたい」と考えて、その間違いが起こりづらいような判断基準を設定する。

彼女に嫌われることをとにかく恐れる人であれば、「嫌われてるのに間違って好かれてると誤解する」ことを徹底的に恐れ、実は好かれてるのに、好かれていないと間違えることはある程度仕方ないと覚悟を決めるかもしれない。
コンプライアンスに厳しい会社であれば、法令違反することを嫌い、法令順守を気にしすぎて、取引機会を逃すことは、ある程度仕方ないと割り切っているかもしれない。

いずれにせよ、そこにはトレードオフがあり、一方のリスクを遮断すればするほど、もう一方のリスクが無視できなくなる。

(3) 問題は、間違いの二面性が見落とされがちなこと。一方しか見ないと、極端な判断になりがち

間違いには二面性があり、判断基準をどう置くか次第でどっちの間違いがどの程度発現するかも変わる。

そこにはトレードオフがあり、一方を気にするともう一方がおざなりになる。

意思決定者やルールメイカーのミッションは「その二面性を理解しつつ、どちらのリスクをどの程度とるか考慮の上、然るべき判断基準を設定する」ということになる。

どのような判断基準を置いても、他の取りえた選択肢との対比で、第一種の誤り・第二種の誤りいずれかはリスクが大きくなるので、そこには得てして最善解はない。

問題は、その二面性が無視されがちであること・どちらか一方だけしか認識されないことが多いことではないかと感じている。

得てして、2つあるうち一方の間違いだけに目が向いて、もっぱらその間違いを撲滅しようと躍起になり、その結果もう一方の間違いのリスクが結構大きくなっているようなことが散見される。たとえば、

女子に嫌われることを恐れるのはいいが、「女子に好かれていたのに、それに気づけないリスク」が視野に入っていなかったX君。積極的な態度をとれず、毎度毎度アタックすらできず撃沈している
「逃した魚は大きい」という後悔をするのが嫌いだが、「投資先がダメになる」というリスクは殆ど気にしない大胆なエンジェル投資家Yさん。「極力NOと言わない」というポリシーでもっぱら果敢に投資したはいいが、不良資産の山を築く
コンプラを気にするのはいいが、その副作用に思いが及ばない官僚的な企業Z。現場が委縮してしまい、法令違反はしないが利益率も伸びない

等。

単に一つのリスクだけしか見なければ、だれだって簡単に「そのリスクを撲滅しよう」という方向性の判断基準を設定できてしまう。

そこには意思決定の習熟など求められておらず、単なる作業になる。

意思決定が難しいのは、そこに両面性があり、何らかのバランスをとる必要があるからだ。その問題に潜む二面性、トレードオフに気づかないで行う判断は意思決定などと呼べた代物ではない。

まとめ

物事には間違いのリスクがどうしても伴うが、それは基本的に二面的であり、トレードオフが存在する。

意思決定者の仕事は、そのトレードオフのなかで最も妥当な点を見つけることであるが、一方のリスクしか気づけていない場合、トレードオフの意識なきまま、極端な意思決定がなされてしまうことが多い。

そこに潜む二面性・トレードオフに気づけているか？

気づけていない場合、あなたの判断はもう一方のリスクをまったく無視している懸念があるが、大丈夫か？それは果たして意思決定と言えるのか？

あなたのその意思決定には、「トレードオフの中で、解がないなかで勇気をもって判断する重み」が伴っているか？

「迷いなしでXXX」「誰が考えても」というような判断をするとき、そこで一回立ち止まって、もう一方の誤りを探さなくても大丈夫か？

参考文献

統計学入門(Link)・・・統計の入門的な教科書で、一周勉強した人がいつでも読み返せる永久保存版。
入門ベイズ統計(Link)・・・意思決定理論と相性の良いベイズ統計についての入門書として買ってみたが、非常に面白い（数式が多いので、元気があるときしか読み進まないが）
実証分析のための計量経済学(Link)・・・社会人では、なんらかの回帰分析の結果を目にすることで統計の重要性に改めて気づく人が多いのではないかと思うが、一連の計量経済分析教科書のなかでも、「中のつくりはさておき、まずはその使い方を学ぼう」という観点に徹している点で非常に有用。

2017-01-03

第二種の誤りを忘れない