![あい](http://df-learning.com/wp-content/uploads/2024/05/image-105.png)
今回は正規分布と
標準正規分布
正規分布表の
見方を説明します
[PR]※本サイトにはプロモーションが含まれています
![](https://www19.a8.net/0.gif?a8mat=3TLUXO+GAFZN6+5EP6+5Z6WX)
目次
連続確率分布とは?
測定値から作られるデータを
連続確率変数と呼ぶ
連続確率変数から
作られる確率分布が
連続確率分布である
連続確率分布の代表的なモデルは
正規分布である。
正規分布はヒストグラムから拡張できる
この記事を参照してください
平均値0ばらつき1の元の
連続変数から作られる確率分布は以下の図になります
![](https://df-learning.com/wp-content/uploads/2024/05/image-200.png)
![あい](http://df-learning.com/wp-content/uploads/2024/05/image-105.png)
正規分布の特徴を
表す統計量は
尖度と歪度です
平均値分散などです
正規分布(Normal distribution)とは?
工場でモノを作っているとき
どんなに正確にモノを
作ったとしても製品の特性
大きさに関してばらつきが生じる
工程が安定状態の時
測定回数を無限回にし
測定値から確率分布を確認すると
確率分布は「釣鐘型」になります
この曲線を正規分布(Normal Distribution)と言います
この曲線を確率密度関数 \(f(x)\)と呼ぶ
![](https://df-learning.com/wp-content/uploads/2024/05/image-201.png)
正規分布の確率密度関数は
\(\displaystyle f(x)= \frac{1}{\sqrt{2π}σ}exp[-\frac{1}{2σ^2}(x-μ)^2]\)
\((-∞<x<∞,σ>0)\)
![あい](http://df-learning.com/wp-content/uploads/2024/05/image-105.png)
記号を
説明します
記号 | 記号の名前 | 記号の種類 |
\(μ\) | 母平均 | ∞回測定したデータの平均 |
\(σ\) | 母分散 | ∞回測定したデータの分散 |
正規分布\(f(x)\)は
連続確率分布なので以下の性質が成り立つ
\(\displaystyle \int_{-∞}^∞ f(x)dx=1\)
区間(a≦x≦b)の確率Pr
\(\displaystyle P_r(a≦x≦b)=\int_{a}^b f(x)dx\)
期待値
\(E(x)=\displaystyle x\int_{-∞}^∞ f(x)dx\)
正規分布(Normal distribution)の特徴
鐘型曲線
正規分布の確率密度関数は
中心が最も高く
左右対称の滑らかな曲線を描きます
この形状から「ベルカーブ」とも呼ばれます
![](https://df-learning.com/wp-content/uploads/2024/05/image-202.png)
平均と分散
正規分布は平均(μ)と分散(σ²)で完全に決定されます
平均は分布の中心位置を示し
分散はデータのばらつき具合を示します。
\(\displaystyle f(x)= \frac{1}{\sqrt{2π}σ}exp[-\frac{1}{2σ^2}(x-μ)^2]\)
![あい](http://df-learning.com/wp-content/uploads/2024/05/image-105.png)
式を見ると
正規分布は
母平均と
母分散で
決まってることが
わかるね!
対称性
正規分布の両端は無限に伸びていますが
x軸に漸近しており
決してx軸に達しません
つまり理論的には
どんなに離れた値も存在する可能性がありますが
その確率は非常に低くなります。
![](https://df-learning.com/wp-content/uploads/2024/05/image-204.png)
正規分布の特徴を表現する統計量
平均、分散、歪度、尖度は正規分布を表す統計量です
各統計量に関してはこちらの記事を
参照ください
エンピリカルルール
正規分布では
データの約68%が平均から
±1標準偏差の範囲内に
約95%が±2標準偏差の範囲内に
約99.7%が±3標準偏差の範囲内に存在します。
![](https://df-learning.com/wp-content/uploads/2024/05/image-205.png)
中心極限定理
中心極限定理によれば
充分に大きなサンプルサイズを持つ
独立同分布のランダム変数の和は
正規分布に近似されます。
このため
正規分布は多くの実際のデータ解析で利用されます。
標準正規分布
正規分布は平均値と標準偏差が分かれば
ある区間の確率を知ることが出来る
しかしある区間の確率を求めるには
平均値と標準偏差ごとに形成される
正規分布の面積を求めなくてはならない
そこで簡単にある区間の確率を
計算するために基準となる正規分布を
標準正規分布という
統一された標準正規分布で解析を行うために
正規分布を平均値0標準偏差1の
標準正規分布に変換する
操作のことを標準化と言います
![](https://df-learning.com/wp-content/uploads/2023/12/image-10-1024x461.png)
標準化の方法
標準化は
確率変数xをuに変換する操作のことである
\( \displaystyle u=\frac{x-μ}{σ}\)
\(確率変数uはN(0,1^2)に従う\)
標準確率密度関数
\(\displaystyle f(Z)= \frac{1}{\sqrt{2π}}exp[-\frac{u^2}{2}]du\)
![あい](http://df-learning.com/wp-content/uploads/2024/05/image-105.png)
正規分布を
標準化すると
正規分布度表を
利用して
ある区間の
確率を求める
ことが出来るように
なります!
正規分布表を使って区間確率を求める
確率変数xを標準化した
確率変数uと\(N(0,1^2)\)の
正規分布表を活用して
区間確率を求めていきます
正規分布表とは
正規分布表Ⅰとは
標準化した値 uより外側の確率を表した表です。
![](https://df-learning.com/wp-content/uploads/2023/12/image-12.png)
![](https://df-learning.com/wp-content/uploads/2023/12/image-16-1024x379.png)
正規分布表Ⅰを利用してuの値から確率Pを求める
u=1.5の時の確率Pr(Z≧1.5)は?
正規分布表Ⅰからu=1.5の点を探す
![](https://df-learning.com/wp-content/uploads/2023/12/image-17.png)
u=1.5の時正規分布表よりP(Z≧1.5)=0.146
- u=1.65の時の確率Pr(Z≧1.65)は?
- u=1.96の時の確率Pr(Z≧1.96)は?
正規分布表Ⅱを利用してuの値から確率Pを求める
Pr(Z≧u)=0.05の時の確率変数uは?
Pr(Z≦u)=0.05の時の確率変数uは?
![](https://df-learning.com/wp-content/uploads/2023/12/image-18-1024x143.png)
P=0.05の時、正規分布表Ⅱより
Pr(Z≧u)=0.05の時の確率変数uはu=1.645
正規分布は左右対称の釣鐘型の分布より
Pr(Z≧u)=0.05の時の確率変数uはu=ー1.645
Pr(Z≧u)=0.05の時の確率変数uはu=1.645
Pr(Z≦u)=0.05の時の確率変数uはu=ー1.645
![](https://df-learning.com/wp-content/uploads/2023/12/image-21.png)
正規分布表を利用した実践例題
ある装置で一日に
10,000個パンを作っていました
工程が安定状態の時
この装置を利用してパンを作ると
重さが100gで
標準偏差が4の正規分布に基づいた
重さのパンが出来上がることが分かっています
この企業では90g以下のパンは規格外として
売らないようにしています。
一日に10,000個パンを作るとき
規格外品は何個できるでしょうか?
確率変数xはパンの重さ(g)です
測定値x=90(g)とします
次に確率変数xをuに標準化していきます。
\(\displaystyle u=\frac{x-μ}{σ}\)より
\(\displaystyle u=\frac{90-100}{4}\)
\(u=-2.5\)
u=-2.5の時の正規分布表を確認すると
確率分布表 | データと統計学 (df-learning.com)
Pr(Z≦-2.5)=0.006
![](https://df-learning.com/wp-content/uploads/2023/12/image-23.png)
売れないパンが出来る確率はP=0.006つまり6%
一日に10,000個パンを作るとき
規格外品の数は
=10,000×0.006=60
一日に10,000個パンを作るとき規格外品の数は60個発生する可能性が高い