読者です 読者をやめる 読者になる 読者になる

日刊ゲンダイが「とんでもない確率の使い方をしている」と話題なのでお手元のExcelで計算してみよう

確率・統計 メディア

話はこのまとめから。

blog.livedoor.jp

1 :風吹けば名無し@\(^o^)/:2015/08/12(水) 15:33:42.44 id:b1siYmV2d.net[1/3]
    最短KOで今季5敗目 「10勝ノルマ」広島・黒田の“引退確率”
    日刊ゲンダイ8月12日 12時4分配信

    この日の敗戦で黒田の今季成績は7勝5敗(防御率2.89)。
    このまま中6日のローテーションで回れば、今季の先発はあと7試合になる。
    7試合で3勝を挙げれば現役続行、2勝以下で終われば引退。
    少なくとも球団内にはそう見ている関係者が多いのだ。

    7試合で2勝なら勝率は2割8分6厘。
    広島関係者の見立てが正しければ、この数字がそのまま現時点での黒田の引退確率になる。

    http://headlines.yahoo.co.jp/hl?a=20150812-00000019-nkgendai-base


   【悲報】ゲンダイ、とんでもない確率の使い方をする」より引用

 
記事の信憑性などはゲンダイなのでそもそも触れないでよいとして、これを受けてのスレの反応。


50 :風吹けば名無し@\(^o^)/ 2015/08/12(水) 15:41:01.64 id:UwyoWGrR0.net
1勝と0勝の時は引退しないんか


53 :風吹けば名無し@\(^o^)/ 2015/08/12(水) 15:41:14.85 id:l3knabDJ0.net
つまりどーいうことや


56 :風吹けば名無し@\(^o^)/ 2015/08/12(水) 15:41:41.15 id:tCuMI/Fc0.net
7試合で2勝なら勝率は2割8分6厘。 ←ぎりぎりわかる
この数字がそのまま現時点での黒田の引退確率になる。 ←?????????????????


いやマジこれ。

113 :風吹けば名無し@\(^o^)/ 2015/08/12(水) 15:46:51.56 id:RLyHqure0.net
残り0勝の確率+1勝の確率+2勝の確率


というお話しだと思うので皆さんもお手元のExcelで良いのでやってみませんか。


まず、今回はざっくり計算してみたいだけなので、「黒田の今期のこれまでの勝利確率を、二項分布のpとして扱う」ことを前提とします。

二項分布についてはこちら。

オモテ面の出る確率が p、ウラ面の出る確率が 1 - p のコインがある。このコインを n 回投げたとき、オモテ面の出る回数を確率変数とする。X = k(n 回の試行で k 回がオモテ面)のときの確率 P(X = k) は次のように計算できる。

 

https://i.gyazo.com/ad9a558634f0d75b95f7c00287c3f423.png

二項分布 | ベルヌーイ試行に従う確率変数が示す分布,確率pでn回思考したときにk回が成功する確率



このお話しでいう、「コイン投げで表が出る確率p」を「黒田投手の今季の勝利確率」としたとすると、1-pはつまり、それ以外。(勝ち負けつかないこともありますので)

今季のこれまでの勝利できなかった試合÷今季これまでの黒田投手の登板試合数ということになりますね。

そこで、今季のデータを以下から取得します。

プロ野球 - 広島東洋カープ - 黒田 博樹 - スポーツナビ



これでpをまず出す必要がありますので眺めてみますと、

https://i.gyazo.com/ea04c41a4f774b4ad89ca2c3be86fd27.png



「勝率」という項目がありますが、これはあくまでも「勝利数÷(勝利数+敗戦数)」です。
今回の目的は「残り7試合で3勝出来ない確率」を出すことだったため、必要な情報は「勝利数÷試合数」となります。

今季これまでの勝利数が7、試合数が17ですので、以下参照。

 

https://i.gyazo.com/c1680484e69bb015685084e0f022e1b2.png



つまりこの41.176%(四捨五入されています)をpとして計算に利用するため、このセルE2は後ほど計算の過程で参照させることにします。


それでは二項分布にしたがって計算する準備を整えましょう。
列(縦方向)に、7から0までの数字を並べます。

https://i.gyazo.com/0c1299b8c97aca3825bd20b32b2d1505.png


これは「残り7試合で黒田選手がn勝する確率」を分かりやすく求めるために作成しています。
なので、Excelでbinom関数の使い方を知っている人はこんなことする必要はないですね。

それでは、実際に計算してみましょう。
まず「7」という数字の右に「=binom.dist」と入力すると、この関数で入力すべき事項をExcelがガイドしてくれます。
(Excel2007以前の方は、「.」のない「=binomdist」に読み替えて入力してみる必要があるっぽいことをExcelが言っていました。)

f:id:call_me_nots:20150814132329p:plain



「成功回数」は、入力中のセルの左にある「7」が入ったセルを指定してあげましょう。
「試行回数」は残りの試合数である「7」ですね。
「成功率」は先ほどの「41.176%」が入ったセル(上図ではE2)を指定します。
今後の計算をより自動的に行いたいので、E2を指定したら、キーボードのF4を一度だけ押しましょう。(絶対参照)
あと、「関数形式」は今回、まずFALSEを選んで下さい。


これで、「成功率」が「41.176%」である事象*1を7回(試行回数)行って、7回(成功回数)すべて成功する確率を計算することになります。
つまり残り7試合で7勝する確率ですね。

ここまで入力すれば、ひとまずEnterを押してみましょう。

https://i.gyazo.com/881c2d3e8e31bf970bf6992026d4edc5.png



そりゃあ相当低いですよね。
小数点の位置などは各自調整いただくとして、上のような数値が出ていればとりあえず大丈夫です。

これが出来れば、あとは先ほど7~0の数字を縦に並べているので、このbinom関数の入ったセルを選んだ状態でこのセル右下に出来る■を下に引っ張っていくと、(カーソルが黒い+に変わるのを確認してください)



残り7試合で0~7勝する確率が各々すべて求まります。

念のため、0~7勝する確率をすべて足したものがちょうど100%になることも確認しておきましょう。
ならないようでしたら、何かが間違っていたりズレたりしていると思います。

あとは黒田投手がゲンダイの言う「ノルマ」を達成できない確率=「残り7試合で勝利数が2勝以下となる確率」を足し算で求めれば答えが出ますね。
上の画像のとおりですが、ゲンダイが思っているよりその確率は高いですよね。

改めて付言しておきますが、ゲンダイの記事内容の信憑性についてはそもそも触れる気はありません。


なお、先ほども少し触れましたが、せっかくbinom関数を使うのであれば、今回の解答は「=binom.dist(7,2,E2,TRUE)」で一発で求められます。

その理由について知りたい方は累積分布の考え方を学んでみると良いかもしれません。
(正規分布での説明ですが、イメージで捉えるならコチラを参考にしてください)

BOOK

*1:各々独立なベルヌーイ試行