人気記事はこちら!
どうも、てけてけです。
今日も難しい数学に関する話題です。
数学は生きていく上で使わないと言われたりしますが、生きていく人がうまい人ほど、数学が強かったりします。
騙されやすい人であったり、世間の情報などを鵜呑みにしてしまう人ほど数学が弱いのかもしれません。
特に今回は数学の中でも、「勘違いされやすい確率」に焦点を当てて解説します。
少し難しい話になるかもしれませんが、この話題は私の専門分野でもあるので、なるべくわかりやすく解説します。
特に今回は、数学の式を用いて説明する際は、数式(数学語)と日本語を訳しながら、分かりやすく説明していきたい思います。
扉は変えるべき!?モンティ・ホール問題
モンティ・ホール問題というのをご存知ですか?
■Wikipedia■
モンテイ・ホール問題
プレーヤーの前に閉じた3つのドアがあって、1つのドアの後ろには景品の新車が、2つのドアの後ろには、はずれを意味するヤギがいる。プレーヤーは新車のドアを当てると新車がもらえる。プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる。
ここでプレーヤーは、最初に選んだドアを、残っている開けられていないドアに変更してもよいと言われる。
ここでプレーヤーはドアを変更すべきだろうか?
(Wikipedia より)
陽性と判定されても病気じゃない?(条件付き確率)
「うわ~尿検査、陽性だった~、再検査だって~」とか「健康診断引っかかった~、再検査だ~」
となったときに、なぜ、陽性と判断されたのに、再検査が必要なのでしょうか。
これについて考えてみましょう。
背景知識として、仮にそのその病気の罹患者を検査しても、100%の確率で「陽性」と判断できないときがあります。
また陰性者に対しても間違えて「陽性」と判断されてしまう確率も少なからずあります。
ここで、例えば次のような確率を考えます。
「ある病気の罹患者に対して検査すると99.9%の確率で「陽性」と判断しますが、罹患していない場合でも0.1%の確率で「陽性」と判断する検査1がある。
また、この病気は全国民の0.1%がこの病気に罹患する。
この状況で自分が「陽性」と判断された。
このとき、自分は本当にその病気に罹患しているか?」
状況を整理します。
①1000人に1人の割合でこの病気に罹患している。
②検査1は、本当に病気だった場合99.9%の確率で「陽性」を示す。
③検査1は、病気でない人でも0.1%の確率で「陽性」を示してしまう。
まず、具体的な数値で考えたいため、全体の人口を100万人として考えてみます。
①の条件から1000人はこの病気を罹患しており、99万9000人はこの病気ではありません。
また②の条件より、この1000人に検査を行うと、999人は「陽性」と判断されます。
次に、病気でない人は99万9000人いますが、この人たちに対し、検査をすると、0.01%は陽性を示してしまうため、999人は「陽性」を示してしまいます。
分かりやすく、図で示すと以下の通りになります。
今、あなたは検査1を受け、ただ「陽性」と判断されています。
つまりこの情報だけでは、自分が本当に病気を罹患している999人の方なのか、病気でない方の999人に含まれているのか分からず、割合も同じであることから、99.9%で本当に病気である人を「陽性」と判断する検査でさえ、単に「陽性」と判断されただけでは、50%の確率でしか「本当に病気を罹患している」と言えないのです。
そのため、実際の検査では、検査1で陽性だった人に対して、再検査(検査2)などを行うことによって、真に「本当に病気を罹患している」と判断することになります。
これらの結果から大事なことは2つあります。
1、単に1回の検査で「陽性」を示されただけでは、そもそもの病気の罹患率も分からないため、すぐに「病気を罹患している」と判断することは早計であること。
2、いかに検査の正確性を上げることができても、間違いで陽性者を出してしまう確率が存在する以上、2回以上の検査が必要であること。
ちなみに、検査2(検査1で「陽性」を示された人のみに行う検査)で、本当に罹患していた場合の「陽性」を示す確率が95%で、罹患していない場合に「陽性」を示す確率が5%である場合、「陽性」と判断された人が実際にその病気である確率は95%になります。
なんとなく、再検査の必要性が理解できたでしょうか。
参考: 2018年 統計検定準1級 問1
ギャンブル必勝法はある?ギャンブラーの誤謬とは?(確率過程)
今日紹介する話のなかでは一番難しいと思います。
今、普通のコインに対して、コイントスを行い、表が5回連続出たとします。
あなたは、表か裏かを当てることができれば、勝ちです。
次、表と裏、どちらが出る方に賭けますか?
Aさん「表が5回連続で出る確率は低い、そろそろ裏が出そうだ。」
Bさん「いやいや、前の情報は関係ない、裏も表も確率は変わらないから次は、表(裏)だ。」
Cさん「表が5回連続でたし、この流れから次も表だ!」
など、心理的にはいろいろ考えられると思います。
もちろん、実際はBさんが正しいのですが、AさんやCさんの心理に陥らないための考え方やこういった場合の有効な考え方を紹介したい思います。
まず、状況を整理します。
①公平なコインに対してコイントスを行う。
②5回連続「表」が記録された。
③どちら(表と裏)に賭けるべきか。
もちろん、公平な賭けを行っているため、次に表も裏も出る確率は1/2なのですが、心理的に「表が5回連続で出ている」という情報が邪魔をしてしまい、一般的には(?)「裏」に賭けたくなってしまいます。
この情報について考えていきたいと思います。
今回は数式を使いながら、説明してきたいと思います。
まず、確率変数と呼ばれるXiとSnを導入します。
ここでXi とは、
i回目にコインが表であるとき1点、すなわち、Xi=1をとり、
i回目にコインが裏であるとき-1点、すなわち、Xi=-1となる変数です。
また確率を表すP(probability)を導入すると、
P(Xi=1)=1/2やP(Xi=-1)=1/2といった表現ができるようになります。
これはそれぞれ日本語に訳すと、
P(Xi = 1) = 1/2・・・i回目に表が出る確率は1/2
P(Xi = -1) = 1/2・・・i回目に裏が出る確率は1/2
となります。
また各試行は独立に行われますので、Xはiによらず、例えばP(X1=-1)=1/2ですし、P(X100=1)=1/2です。
続いて、Snを導入します。Snの定義式は、
Sn = X1+X2+・・・Xn
となります。
上記の例では、1回目が裏(-1)、2、3、4回目は表(+1)を取り、5回目が裏(-1)を取ったSnです。(本来はn回(5回以上)の試行を行う)
これは、一般の場合のnで表現すると少し難しい表現になりますが、nを具体的な数値で考えると分かりやすくなります。
例えばn=1では、S1=X1となりますので、
P(S1=-1)=P(X1=-1)=1/2や、P(S1=1)=P(X1=1)=1/2
など、瞬時に答えを導くことができます。
ではもう一つだけn=2のパターンも見てみましょう。
まずS2=X1+X2ですから、例えばP(S2=2)という確率は
P(S2=2) = P(X1+X2=2) = 1/4と表され、これは日本語に訳すと、「2回連続で表が出る確率は1/4」となります。
察し良い方ならもう気が付くかもしれませんが、nが偶数のときはSnは偶数の値しか取りません。
最後に条件付き確率というのを導入します。
条件付き確率というのは、P(A|B)のように表現される確率で、日本語に訳すと「Bが起こったうえでのAの確率」と表現されます。
具体的な式の展開は省略しますが、今回は実践例を用いて考えたいと思います。
例えば、以下のような例を考えます
①P(X2=1|X1=1)
②P(S1=1|X1=1)
③P(S2=2|S1=1)
④P(S4=0|S2=0)
まず、①を日本語に訳すと「1回目の試行が表であるとき、2回目も表である確率」と訳すことができます。
これは1回目の試行に2回目の試行の結果は左右されないので、求める確率は1/2となります。丁寧に式で表すと以下のようになります。
P(X2=1|X1=1) = P(X2=1) = 1/2
続いて、②の式である、P(S1=1|X1=1)について、
これを日本語に訳すと「1回目の試行が表であったとき、合計1回(S1)の試行したとき、表が1回出る確率」少し回りくどいですが、これはすぐに確率1であることが分かると思います。これを丁寧に式で表すと以下のようになります。
P(S1=1|X1=1) = P(X1=1|X1=1) = 1
2項目は「X1が1(表)であるときのX1が1(表)である確率」を表しているため、求める確率は1です。
続いて③のP(S2=2|S1=1)ですが、これを日本語に訳すと「合計1回の試行で表が1回出た場合のときの合計2回の試行で表が2回出る確率」となります。
1回目の試行では表という結果が得られているため、2回目の結果でもまた表を出す確率であるため、答えは1/2となります。これを丁寧に式で表すと以下のようになります。
P(S2=2|S1=1) = P(X1+X2 = 2 | X1=1) = P(X2 = 1) =1/2
最後に④のP(S4 = 0|S2 = 0)ですね。
これを日本語に訳すと「2回の試行で合計0点(表と裏が1回ずつ)が起こった上での、4回の試行で合計0点(表と裏が2回ずつ)が起こった確率」となります。
これは言い換えると、「今2回行って合計0点で、これからさらに2回行って合計0点である確率」です。
さらに言い換えれば、「今から2回行って0点を取る確率」と言い換えることができます。すなわち、もとめる確率は、2回の試行で表と裏がそれぞれ1回ずつ出ればいいので、1/2となります。丁寧に数式で表すと以下のようになります。
P(S4 = 0| S2 = 0) = P(S2 = 0) = 1/2
となります。
さぁ最後にP(S6=4| S5 =5)という確率を考えて見ましょう。
ここまで熟読したみなさんであれば、すぐに、「合計5回の試行で5回表が出た上での、次の試行(6回目)で-1点(裏)が出る確率」と訳せるはずです。
そして、これも瞬時に1/2という答えが導き出せるでしょう。
またこの式をよく考えて見ると、一番最初の問題であった、「表が5回連続したあとの次の確率」を考えており、今回は「5連続で表であった」という情報を払拭して計算できたと思います。
正確には、条件付き期待値を考えるときに用いる用語ですが、こういった法則をマルチンゲール(Martingale)といったりします。
(正確には、時間nまでの情報(確率過程)が与えられているとき、n+1時点でのSn+1の期待値E[Sn+1|Fn]はSnと同じであるといった性質です。ここでFnは時間nまでの情報のことを指しています。)
■Wikipedia■
すなわちギャンブラーの誤謬について大事なことは、
1、(各試行が独立である場合)今までの情報は次の勝負に対して関係が全くない。
2、あるギャンブルに対して、連敗しているなかで「そろそろ勝てる(勝つ確率が上がる)」という理論は存在しない。
「最近パチンコが10連敗中だけど、そろそろ確率が収斂して勝てる気がする」
「麻雀で大負けが続いているけど、そろそろ流れが変わって大勝ちしそうだよなぁ」
この「そろそろ」という感覚がギャンブラーの誤謬なのですね。
こういった感覚を無くすためにも、条件付き確率の考えを取り入れましょう。
注意として、試行が独立でない場合は、上記の例を満たしません。
例えば、トランプで1枚ランダムに抜き、スート(ハートやスペードなど)をあてるゲームをするとします。ただし使ったカードは戻さずに、別のところに置いていきます。
このゲームで、ハートという予想を10連続はずれてしまったとしても、使ったカードはもとに戻さないため、ハートを賭け続けていれば、当たる確率は高くなります。
また、理論は別として、実際問題としてに表が5連続出た場合、私(確率統計学の研究者(修士2年))はどう考えるでしょうか。
これは個人的な考えですが、「イカサマを疑うべき」だと思います。
もちろんたった5回では試行回数が少なすぎるため、すぐにイカサマと断定することはできませんし、そもそも相手がコインの表裏を操れる可能性もあるため、最終的には「勝負をしない」という選択肢を取ります。(笑)
これは、「リスクがあるから勝負をしない」というわけではなく、そもそも1/2であるはずの勝負であり、かつ、相手にイカサマの可能性があるため、自分にとって公平か不利でしかない(有利ではないが、不利の可能性がある)ギャンブルのため、「ギャンブルをしない」という選択をしという判断になります。
ある意味当たり前の結論ですが、ギャンブルで負けない方法は、
「公平以下(不利になる可能性がある)ギャンブルは一切しないことであり、かつ自分にとって公平以上(有利になる可能性がある)ギャンブルをすること」
です。
「有利なギャンブルでも負けたらマイナス」という意見もありますが、期待値がプラスであるならば、試行回数を増やせば、プラスには必ずなるので、続けるべきです。
ただし、自分が本当に有利かどうかを見極める能力は必要です。
参考までに、当たり前ですが、宝くじやパチンコ、競馬、競艇、競輪などはすべてプレイヤーの期待値は掛け金を引けばマイナスになります。
人が、汗水流して稼いだお金をどのように使おうがその人の自由ですが、こういったギャンブルを趣味の範囲なら良いですが、お金稼ぎのツールとして、利用しようというのは、数学的にはおすすめできません。
『交通事故に遭わない方法が家から出ないこと』であるならば、『ギャンブルで負けない方法はギャンブルをしないこと』です。
また、「AIを導入して、競馬で○○万稼いだ」といった情報もありますが、競馬も期待値的にはマイナスであるため、いくらAIで、その時は勝つことができても、最終的な収支は必ずマイナスになります。
なぜなら、賭けた人が全員AIだったら全員儲けることができるか?といわれたらできないのと同じ理屈です。
ただ、確かに私情がないAIならば、長期的には人間より高い精度で予想を当てることは可能であるでしょうね。
また、多くの馬券を買う人は人間の判断であるため、そういった意味では、人間が予想するよりは、AIの方がもう優れていると思います。
競馬の予想AIはまだまだ考察する価値がありそうです。
まとめ
いかがでしたか?
今回は一度では理解できなかった部分もあると思うので、何度か読み直して理解することもいいと思います。
特に賭け事が好きなギャンブラーのような人には読んで頂きたいです。(笑)
ではでは。
このブログでは、くだらない雑学から話題のニュースまで網羅していきたいと考えています。
もし興味を持ってもらえましたら、コメント、ブログのシェア、Twitterのフォローやブログリーダーの登録をお願いします。
最近では、インスタグラムも始めたのでよろしくお願いします!
Twitterは↓↓↓
インスタグラムはこちら
Facebookはこちら
ブログリーダーの登録もぜひお願いします↓↓↓
■あわせて読みたい記事■
■あわせて読みたい記事■