二項分布とは?定義や性質・正規分布との関係も解説!
高校数学で学習する項目の一つに、「確率分布」というものがあります。この記事では、確率分布の中でも特に有名な分布の一つである「二項分布」について紹介します。
確率分布は、高校で学習する数学の中でも特に複雑な内容となっており、苦手としている人も少なくありません。「そもそも確率分布って何?」「正規分布なら聞いたことはあるけど・・・」という方や、大学で初めて確率分布を学ぶ人でも理解できるよう、丁寧に解説していきますので、最後までご覧ください!
【PR】勉強を効率的に継続して、志望校に合格したい方必見!
↓無料ダウンロードはこちら↓
▶確率の勉強に役立つ記事まとめ!確率が苦手な人必見
▶期待値を計算するには?計算方法や公式をわかりやすく解説!
▶【センター試験頻出】分散とは?求め方や意味を徹底解説!
【 目次 】
1.二項分布を勉強する前に!確率分布の基本は大丈夫?
1-1.確率変数:各値をとる確率が決まっている変数
1-2.確率分布:ある試行に対して起こる全事象の確率を表した分布
1-3.期待値・分散・標準偏差に注目しよう
2.二項分布とは?定義や性質をおさえよう!
2-1.二項分布とは?【コインをn回投げて表がk回出る確率】
2-2.二項分布の期待値と分散
3.二項分布のすごい性質
3-1.①二項分布同士で足し算できる【再生性】
3-2.②正規分布に近似できる【ラプラスの定理】
4.練習問題を解いてみよう!
4-1.練習問題① サイコロ問題
4-2.練習問題② くじ引き問題
5.まとめ
二項分布を勉強する前に!確率分布の基本は大丈夫?
二項分布の勉強を始める前に、確率分布の基本は抑えられていますか?二項分布は、確率分布のひとつであり、その基礎を理解している必要があります。ですので、二項分布の内容を取り上げる前に、まずは確率変数と確率分布について確認をしましょう。
確率変数:各値をとる確率が決まっている変数
ある試行に対し、その結果としての数値Xが出て、その値が出る確率が決まっているとき、Xを確率変数であるといいます。
この説明だけではイメージがわかないと思うので、サイコロを例に考えてみましょう。
サイコロを1個投げるとき、必ず1から6までのどれかの目が出ます。そして、それぞれの目の出る確率は各々6分の1です。
1個のさいころを投げて出る目をXとすると、
P(X=2)=1/6
P(X=3)=1/6
P(X=4)=1/6
P(X=5)=1/6
P(X=6)=1/6
※P(X=1)は、「サイコロを投げて出る目が1である確率」を意味します。
つまり、サイコロを1個投げるという試行において、結果として出る数値Xが1,2,3,4,5,6であり、各値が出る確率は1/6と決まっていることから、サイコロの目は確率変数であるといえます。
ほかにも、1枚のコインを投げて、表が出る事象を「0」、裏が出る事象を「1」とすると、
P(X=0)=1/2
P(X=1)=1/2
となります。これも表、裏を対応させた数値0,1は確率変数といえます。
確率分布:ある試行に対して起こる全事象の確率を表した分布
確率分布とは、確率変数における各々の値と、その確率を表した分布のことを意味します。
先ほどの1個のサイコロを投げるときの出る目とその確率は、次のように表にまとめられます。
またこれをヒストグラムで示すとこのようになります。
それぞれのXの値に対して、確率P(X)が対応しており、そのすべての場合を表現しています。これをこの試行におけるXの「確率分布」といい、多くの場合、このような表やヒストグラムでまとめます。
なお、この表・ヒストグラムで書かれたものが全事象となり、確率の総和が1となります。
「表やヒストグラムの読み方に自信がない!」という方は、「▶数学における度数分布表とヒストグラムとは?中央値・最頻値も」を確認しておきましょう。
期待値・分散・標準偏差に注目しよう
確率分布は、それぞれの現象が起こる分布の具合を把握するために用いられます。その状態を、期待値・分散・標準偏差を求めることにより数値化できます。では、その数値について解説します。
■期待値:E(X)
確率変数Xと、それが起こる確率P(X)の積X・P(X)の総和を期待値といい、E(X)で表します。
先ほどの1個のサイコロを投げる試行を例にとると、サイコロの目の期待値は
よって、サイコロの目の期待値は3.5となります。このように、すべてのX(この場合は1~6)に対して、その確率P(X)との積を考え、合計したものが期待値E(X)となります。
「期待値についてもっとくわしく学習したい!」という方は、「▶期待値を計算するには?計算方法や公式をわかりやすく解説!」を確認しておきましょう。
■分散:V(X)
確率変数において、各値の散らばり具合を示す指標として最も一般的なのが分散で、V(X)と表します。分散は、以下のように求めます。
この式に従ってサイコロの分散を求めると、以下のようになります。
確率変数における分散の考え方は、数Ⅰで学習する分散と極めて近いことがわかるのではないでしょうか。
「分散の考え方に自信がない」という方は、「▶【センター試験頻出】分散とは?求め方や意味を徹底解説!」を確認しておきましょう。
■標準偏差
標準偏差は、分散に√をとった数値で、σ(X)と表します。
このサイコロの例の場合、標準偏差は
となります。
二項分布とは?定義や性質をおさえよう!
ここまでが、確率変数・確率分布の基礎の確認になります。サイコロやコインなど、様々なケースにおいて確率分布が存在することがわかりますね。
ある試行を行った結果、AかBかのどちらかに必ずなるというものがあり、その試行を繰り返し行う場合があります。そのとき、この確率分布は二項分布に従います。
では、この章では「二項分布とは何か」について解説します。
二項分布とは?【コインをn回投げて表がk回出る確率】
二項分布の定義は、「確率がpとなる試行をn回行った結果、成功する回数Xが従う分布」を意味します。
コインを5回投げて、表が3回出る確率について考えてみましょう。
コインを5回投げて表が3回出る事象は全部で5C3通り、その各々に対する確率は(1/2)^5 であることから、コインを5回投げて、表が3回出る確率は5/16 となります。同様に、コインを5回投げて表が出る回数ごとにそれぞれ計算をすると、次のような結果が得られます。
この場合、1/2の確率で表が出る事象を5回試行したとき、表が出るのがX回である確率分布が上の表のとおりとなります。また、これをヒストグラムに表したものが以下になります。
このように、結果が一定の確率のもとで2つ(この場合は「表が出る」と「裏が出る」の2つ)に限られる試行を繰り返すとき、Xは二項分布にしたがうといいます。そのとき、繰り返す試行の回数nと、1回あたりで起こる確率pの2つの情報によって確率は決定するため、Xがこの二項分布にしたがうことをX~B(n,p)と表します。
先述した、コインを5回投げて、表が出る回数を考えるケースではX~B(5,1/2)となります。
二項分布を式で表す場合、次のような書き方で表します。
たとえばコインを6回投げて表が2回出る確率は
となります。やや複雑な公式のように見えますが、式の意味を理解し間違えないようにしましょう。
二項分布の期待値と分散
ここまで、二項分布の定義・公式を説明してきました。
二項定理の期待値や分散は、以下の公式で簡単に求めることができます。
期待値E(X):E(x)=np
分散V(X):V(X)=np(1-p)
先ほどの例を用いて考えてみましょう。コインを5回投げる試行において、試行回数n=5、表が出る確率p=1/2であることから、表が出る回数の期待値・分散は
期待値E(X)=5*(1/2)=5/2
分散V(X)=5*(1/2)*(1-1/2)=5/4
となることがわかりますね。二項分布を使いこなすうえで非常に大切な公式になるので、ここで必ずおさえておきましょう。
二項分布のすごい性質
ここまでの説明を聞いて、「結局二項分布を考えて何の意味があるの?」という疑問を抱いた方もいるのではないでしょうか。
実は、二項分布は確率分布の中でも特別な性質をもっています。この章では、二項分布がもつ性質を2つ紹介します。内容的には大学で学ぶ内容となるためやや高度ですが、ぜひ理解しておきましょう。
①二項分布同士で足し算できる【再生性】
二項分布について、次のことが成り立ちます。
これは、たとえば前にも挙げた「コインを投げる試行」において、5回投げる試行と10回投げる試行とがそれぞれ行われた場合、その確率分布は、それらの回数を合わせた「15回投げる試行」における確率分布と一致するということがいえます。これを二項分布における「再生性」といいます。
②正規分布に近似できる【ラプラスの定理】
二項分布の試行回数を限りなく大きくしたときの結果、分布がなめらかな曲線を描き正規分布に近似した形をとるようになります。これをラプラスの定理といいます。
これまで確率分布を知らなかった方も「正規分布」という言葉は聞いたことがあるのではないでしょうか。実は、二項分布が正規分布に近似されることで分析の幅が大きく広がります。
たとえば、「コインを10000回投げて、表が5050回以上出る確率はいくらか?」などより複雑化した問題を解く場合、二項分布では数が大きすぎて扱いづらいですが、正規分布で考えるとかなりシンプルな数式で求めることができるようになります。
二項分布について学習する上で、今回紹介した2つの性質もあわせて覚えておきましょう。
練習問題を解いてみよう!
確率分布や二項分布について述べてきましたが、高校数学において取り扱われる問題を紹介します。
練習問題① サイコロ問題
【解答・解説】
一般的な確率の問題ではありますが、今回は二項分布で学習した内容を踏まえてこの問題を解いてみましょう。
今回の問題において、試行回数はn=10・確率はp=1/6であることがわかります。以上のことを踏まえて二項分布の公式に当てはめます。
4の目が4回出る、つまりk=4となる二項分布の確率は、
となります。
練習問題② くじ引き問題
① 当たる回数の期待値を求めよ。
② 最も可能性が高い当たりの回数は何回か。
【解答・解説】
① 今回の試行において、当たりのくじが出る回数Xが二項分布に従うことを見抜くことができれば、非常に簡単に求まります。
答えは、1となります。
② Xがとる値とその時の確率について、計算してみましょう。
以上の結果から、1回の場合が確率は最大であることがわかるので、答えは1回となります。
①②より、当たりのくじが出る回数の期待値が1であること、実際に計算をした結果最も可能性の高い当たりの回数は1回であることがわかりました。
二項分布の期待値が、実際にもっとも出やすい回数であることを直感的に理解できたでしょうか。
まとめ
確率分布やその中の二項分布は、数学・統計を学んでいく上では基本的かつ重要な内容なので、きちんと学んでおく必要があります。
多少高校数学の内容を超えた内容もありますので、まずは高校の確率や統計の単元の理解を深めましょう。そして、その延長にも学ぶのに有意義な内容があることを知ることができるでしょう。
記事の内容でわからないところ、質問などあればこちらからお気軽にご質問ください。
中の人がお答えします。