確率変数 ( かくりつへんすう 、( 英 : random variable )とは、統計学 の確率論 において、起こりうることがらに割り当てている値(ふつうは実数 や整数 )を取る変数 。各事象 は確率をもち、その比重に応じて確率変数はランダム [ 1] :391 に値をとる。英 : stochastic variable 、英 : aleatory variable とも。
確率変数
X
:
Ω
→
S
{\displaystyle \textstyle X\colon \Omega \to S}
は確率空間
(
Ω
,
F
,
P
)
{\displaystyle (\Omega ,{\mathcal {F}},P)}
と可測空間
(
S
⊂
R
1
,
B
)
{\displaystyle (S\subset \mathbb {R} ^{1},{\mathcal {B}})}
に関して
(
F
,
B
)
{\displaystyle ({\mathcal {F}},{\mathcal {B}})}
-可測 であることで定義付けられる(⇒ #定義 )[ 2] 。確率変数の終域 を実数 以外へ一般化すると確率要素 、複数の確率変数を族 とみなすと確率過程 になる(⇒ #一般化と拡張 )。
確率変数はこれから行う試行の結果や既に行った試行の結果がいまだ不確かである場合(実験結果が出揃っていない場合や測定結果が不確実である場合など)の結果に割り当てられる。
確率変数は離散型確率変数 と連続型確率変数 に二分できる(⇒ #分類 )[ 3] 。離散型確率変数の場合の確率分布 は確率質量関数 で表される。連続型確率変数の場合の確率分布は、確率測度 が絶対連続 ならば確率密度関数 で表される(⇒ #分布関数と統計量 )。
定義
編集
口語的定義
編集
確率変数は次のように口語的に定義される:
「確率変数はその値が『確率分布で記述された確率法則』によって確率的に決まる変数 である。」[ 注 1] [ 4] [ 5]
測度論的定義
編集
(
Ω
,
F
,
P
)
{\displaystyle \textstyle (\Omega ,{\mathcal {F}},P)}
を確率空間 、
S
{\displaystyle \textstyle S}
を実数 全体の集合
R
{\displaystyle \textstyle \mathbb {R} }
の部分集合 、
B
{\displaystyle \textstyle {\mathcal {B}}}
を
S
{\displaystyle \textstyle S}
上のボレル集合体 とする。関数
X
:
Ω
→
S
{\displaystyle \textstyle X\colon \Omega \to S}
が次の条件、
X
{\displaystyle X}
は
(
F
,
B
)
{\displaystyle ({\mathcal {F}},{\mathcal {B}})}
-可測 である
を満たすとき、
X
{\displaystyle \textstyle X}
は「
Ω
{\displaystyle \textstyle \Omega }
上の確率変数 」である[ 2] 。
実例
編集
確率変数の値として、測定値や観測値(例えば、様々な人々の身長など)だけでなく、指示関数 値(例えば、ある回数コイントスをしたときの表が出た回数)を採用することが多い。
身長
編集
例えば、任意に抽出した人の身長を確率変数とする場合を考える。数学的には、確率変数は 対象となる人→その身長 という関数を意味する。確率変数は確率分布に対応し、妥当にあり得る範囲の確率(身長180cm以上190cm以下である確率や 150cm未満または200cm超である確率)を計算できるようになる。
子どもの数
編集
もう一つの確率変数の例は、抽出した人には何人の子供がいるかというものである。これは非負の整数値を取る離散型確率変数である。この場合、確率分布は確率質量関数の積分により表される。また、無限個の仮説を想定することも可能である。例えば、偶数人の子供がいるか、といったものである。何方の場合においても、確率値は確率質量関数の要素の和を無限に取っていくことで求めることができる。子供が0人の可能性 + 子供が2人の可能性 + 子供が4人の可能性 + … という要領である。
このような例では標本空間はしばしば有限に制限される。離散値を無限に計算していくのが数学的に困難だからである。しかしアウトカムの標本空間内で2つの確率変数が同時に測定される場合、すなわちある人について身長と子供の数とを同時に調査する場合などは、両変数に相関関係があるのか否かを知るのは容易である。
コイントス
編集
コイントス をするという試行において、標本空間は
Ω
=
{
heads
,
tails
}
{\displaystyle \Omega =\{{\text{heads}},{\text{tails}}\}}
である。表が出る回数を調べたい場合は、ここから確率変数 X を次の式で定義する:
X
(
ω
)
=
{
1
,
if
ω
=
heads
,
0
,
if
ω
=
tails
.
{\displaystyle X(\omega )={\begin{cases}1,&{\text{if}}\ \ \omega ={\text{heads}},\\\\0,&{\text{if}}\ \ \omega ={\text{tails}}.\end{cases}}}
コインの表 (head) と裏 (tail) が出る確率が等しい時、確率質量関数
f
X
{\displaystyle f_{X}}
は次式の通りである。
f
X
(
x
)
=
{
1
2
,
if
x
=
1
,
1
2
,
if
x
=
0.
{\displaystyle f_{X}(x)={\begin{cases}{\tfrac {1}{2}},&{\text{if }}x=1,\\\\{\tfrac {1}{2}},&{\text{if }}x=0.\end{cases}}}
2つのサイコロの出た目の和 S を確率変数としたときの確率分布。離散確率分布であり、短冊の高さが確率質量を表す。
2つのサイコロを振るとき、出た目の和の確率分布を調べるには、確率変数を次のように取る。
標本空間 Ω は、"2つのサイコロを振って出た目の集合"である。これを
Ω
=
{
1
,
2
,
3
,
4
,
5
,
6
}
2
{\displaystyle \Omega =\{1,2,3,4,5,6\}^{2}}
と略記する[ 注 2] 。確率変数 X は2つのサイコロの出た目に書かれた数の和を表現する、Ω から
Z
{\displaystyle \mathbb {Z} }
への写像である。これは次の式で定義される:
X
(
(
n
1
,
n
2
)
)
=
n
1
+
n
2
{\displaystyle X((n_{1},n_{2}))=n_{1}+n_{2}}
n 1 は1つ目のサイコロ、n 2 は2つ目のサイコロの出た目が表す数を表す。
このとき確率質量関数 fX は次の式になる:
f
X
(
S
)
=
min
(
S
−
1
,
13
−
S
)
36
,
for
S
∈
{
2
,
3
,
4
,
5
,
6
,
7
,
8
,
9
,
10
,
11
,
12
}
{\displaystyle f_{X}(S)={\tfrac {\min(S-1,13-S)}{36}},{\text{for }}S\in \{2,3,4,5,6,7,8,9,10,11,12\}}
連続型確率変数の例として、水平方向に回るルーレット を挙げることができる。標本空間としては「ルーレットの向き全体」を考える。この「向き」は連続的な状態を取り得るのでその標本空間の表現には実数を使うことが適切である。そこで真北方向を0(度)とし、確率変数 X を「ルーレットが真北の向きに対して取る角度」として定義すると、確率変数の値域は区間 [0, 360) (0度以上360度未満の実数)であり、ルーレットの元々の目的から各値を取る確率は等しいと考えられる。このとき区間内のあらゆる実数について、その値を取る確率は 0 であるが、ある範囲内の角度をなす確率は正の値である。例えば、[0, 180] (0度以上180度以下)となる確率は 1 / 2 である。
確率質量関数の代わりに、X の確率密度を考えると、幅1度の確率密度は 1 / 360 である。確率は幅に比例し、確率分布は連続一様分布 になる。一般に、連続型確率変数における確率は、存在すれば確率密度関数の範囲における積分値でとらえることができる。
混合タイプの確率変数としては例えば、コインを投げて表が出た時のみルーレットを回すということを考えることができる。コインが裏であれば X = −1 、表であれば X = ルーレットの角度 とすると、この確率変数は確率 1 / 2 で −1 、その他の数 [0, 360) である確率は上記の例の半分である。
性質
編集
可測関数
編集
確率変数は可測 な可測関数 である。
定義より、確率空間
(
Ω
,
F
,
P
)
{\displaystyle \textstyle (\Omega ,{\mathcal {F}},P)}
と可測空間
(
S
,
B
(
S
)
)
{\displaystyle \textstyle (S,{\mathcal {B}}(S))}
に関して、
Ω
{\displaystyle \textstyle \Omega }
上の確率変数
X
{\displaystyle \textstyle X}
は
(
F
,
B
(
S
)
)
{\displaystyle ({\mathcal {F}},{\mathcal {B}}(S))}
-可測である。
逆像が可測集合
編集
定義より、値
B
∈
E
{\displaystyle B\in {\mathcal {E}}}
の原像
X
−
1
(
B
)
=
{
ω
:
X
(
ω
)
∈
B
}
{\displaystyle X^{-1}(B)=\{\omega :X(\omega )\in B\}}
は
F
{\displaystyle {\mathcal {F}}}
の元である[ 6] 。
確率分布の誘導
編集
確率変数の導入により確率分布が自然と誘導される。
確率分布 ( かくりつぶんぷ 、( 英 : probability distribution )
P
X
{\displaystyle \textstyle P^{X}}
は確率変数の値を確率的に決めると解釈できる確率測度である[ 4] [ 7] 。
B
∈
B
{\displaystyle \textstyle B\in {\mathcal {B}}}
としたとき、
P
X
(
B
)
{\displaystyle \textstyle P^{X}(B)}
により確率変数の値が
B
{\displaystyle \textstyle B}
に含まれる確率を算出できる(例: 「
X
{\displaystyle \textstyle X}
が
2
{\displaystyle \textstyle 2}
になる確率は
P
X
(
{
2
}
)
=
10
%
{\displaystyle \textstyle P^{X}(\{2\})=10\%}
」)。
測度論の観点からみると、確率変数を導入することで可測空間
(
R
,
B
)
{\displaystyle \textstyle (\mathbb {R} ,{\mathcal {B}})}
が構成される。ボレル集合族
B
{\displaystyle \textstyle {\mathcal {B}}}
は完全加法族 であるため、この上に確率測度
P
X
:
B
→
[
0
,
1
]
{\displaystyle \textstyle P^{X}\colon {\mathcal {B}}\to [0,1]}
を設定しうる。 これを、
P
X
(
B
)
=
P
(
X
−
1
(
B
)
)
{\displaystyle P^{X}(B)=P(X^{-1}(B))}
と定義することで
P
X
{\displaystyle \textstyle P^{X}}
は確率測度の定義を満たす。この
P
X
{\displaystyle \textstyle P^{X}}
を「
X
{\displaystyle \textstyle X}
の確率分布 」という[ 7] 。確率分布を導入することで
(
R
,
B
,
P
X
)
{\displaystyle \textstyle (\mathbb {R} ,{\mathcal {B}},P^{X})}
はもうひとつの確率空間になる。この観点から、
X
{\displaystyle \textstyle X}
は
Ω
{\displaystyle \textstyle \Omega }
上での
P
{\displaystyle \textstyle P}
の測定から
R
{\displaystyle \mathbb {R} }
上での
P
X
{\displaystyle \textstyle P^{X}}
の測定に「押し進める」ものといえる。
P
X
{\displaystyle \textstyle P^{X}}
は
(
Ω
,
F
,
P
)
{\displaystyle \textstyle (\Omega ,{\mathcal {F}},P)}
を「忘れる」とも解釈できる [要出典 ] 。
P
X
{\displaystyle \textstyle P^{X}}
は実数のボレル集合族を定義域とするため、
B
=
[
−
∞
,
y
]
{\displaystyle \textstyle B=[-\infty ,y]}
のような片側無限区間での確率へ変換しやすい。これが累積分布関数 である。離散型確率変数の場合の確率は確率質量関数 および離散確率分布 を参照。連続型確率変数の場合の確率は確率密度関数 を参照。
期待値
編集
確率変数は値として実数をとり、かつ、各値が現れる確率を確率分布として持つ。よって実際に値を得なくとも「
1
{\displaystyle \textstyle 1}
が
10
%
{\displaystyle \textstyle 10\%}
、
2
{\displaystyle \textstyle 2}
が
20
%
{\displaystyle \textstyle 20\%}
...」と値/確率ペアを得ることができる。各値を対応する確率で重み付けした加重平均が期待値である。
確率変数が可測関数として可積分 ならば、期待値 が存在する。
確率空間 (Ω, F , P ) に割り当てた確率変数
X
:
Ω
→
E
{\displaystyle X:\Omega \to {\mathcal {E}}}
が可積分 であるとは、
∫
Ω
|
X
(
ω
)
|
P
(
d
ω
)
<
∞
{\displaystyle \int _{\Omega }|X(\omega )|\,P(\mathrm {d} \omega )<\infty }
を満たすことである。これは測度論 における可測関数 の可積分性と同じである。
このとき確率変数 X あるいはその確率分布の平均 は
E
[
X
]
=
∫
Ω
X
(
ω
)
P
(
d
ω
)
{\displaystyle E[X]=\int _{\Omega }X(\omega )\,P(\mathrm {d} \omega )}
で定義される。
事象
A
∈
F
{\displaystyle A\in {\mathcal {F}}}
の下での確率変数 X の条件付期待値 は
E
[
X
:
A
]
=
E
[
1
A
X
]
=
∫
A
X
(
ω
)
P
(
d
ω
)
{\displaystyle E[X:A]=E[1_{A}X]=\int _{A}X(\omega )\,P(\mathrm {d} \omega )}
で定義される。ここで 1A は指示関数 である。
モーメント
編集
確率変数の確率分布は、多くの場合少数の特性値で規定される。例えば、確率変数の期待値 (E[X ] ) は確率分布の"1次モーメント "であり、平均とも呼ばれる。一般に、E[f (X )] は f (E[X ]) と等しくない。次に、確率変数値が全体として「平均」からどれだけ散らばっているかを表す特性値として分散 (V[X ] ) および標準偏差 (σ[X ] ) がある。分散 V[X ] とは、X と平均の差の2乗の期待値 E[(X − E[X ])2 ] のことである。
数学的には、与えられた確率変数 X が所属する母集団に関する(一般化された)モーメント問題 (英語版 ) として知られ、確率変数 X の分布の性質を示す期待値 E[fi (X )] の関数のコレクション {fi } である。
モーメントは確率変数が実数関数である場合(複素数等についても)に定義できる。確率変数自身が連続であるならば、変数のモーメント自身は確率変数の恒等関数 f (X ) = X と等価である。しかし、非実数の確率変数の場合にも、モーメントをその変数の実数関数として得ることができる。例えば、名義尺度 変数 X として「赤」、「青」、「緑」がある場合、実数関数
[
X
=
green
]
{\displaystyle [X={\text{green}}]}
を考えることができる。こうしてアイバーソンの記法 を用いることで、X が「緑」の時は1、それ以外は0と記述できるので、期待値 および他のモーメントを定義できる。
確率の記法
編集
確率変数に関連した確率の記法が存在する。
(
Ω
,
F
,
P
)
{\displaystyle \textstyle (\Omega ,{\mathcal {F}},P)}
をおおもとの確率空間、
X
,
Y
{\displaystyle \textstyle X,Y}
をこれに紐づいた確率変数[ 注 3] 、
(
S
X
,
B
X
,
P
X
)
,
(
S
Y
,
B
Y
,
P
Y
)
{\displaystyle \textstyle (S_{X},{\mathcal {B}}_{X},P^{X}),(S_{Y},{\mathcal {B}}_{Y},P^{Y})}
を
X
,
Y
{\displaystyle \textstyle X,Y}
の誘導された確率空間とする。このとき
s
X
∈
S
X
,
s
Y
∈
S
Y
{\displaystyle \textstyle s_{X}\in S_{X},\ s_{Y}\in S_{Y}}
の確率を次のように表現できる:
P
(
X
=
s
X
)
=
P
(
X
−
1
(
{
s
X
}
)
)
:=
P
X
(
{
s
X
}
)
P
(
Y
=
s
Y
)
=
P
(
Y
−
1
(
{
s
Y
}
)
)
:=
P
Y
(
{
s
Y
}
)
{\displaystyle {\begin{array}{lcl}P(X=s_{X})&=&P(X^{-1}(\{s_{X}\}))&:=&P^{X}(\{s_{X}\})\\P(Y=s_{Y})&=&P(Y^{-1}(\{s_{Y}\}))&:=&P^{Y}(\{s_{Y}\})\\\end{array}}}
また、
(
−
∞
,
s
X
)
∈
B
X
,
[
s
Y
,
s
Y
′
]
∈
B
Y
{\displaystyle \textstyle (-\infty ,s_{X})\in {\mathcal {B}}_{X},\ [s_{Y},s_{Y}']\in {\mathcal {B}}_{Y}}
の確率を次のように表現できる:
P
(
X
≤
s
X
)
=
P
(
X
−
1
(
(
−
∞
,
s
X
)
)
)
:=
P
X
(
(
−
∞
,
s
X
)
)
P
(
s
Y
≤
Y
≤
s
Y
′
)
=
P
(
Y
−
1
(
[
s
Y
,
s
Y
′
]
)
)
:=
P
Y
(
[
s
Y
,
s
Y
′
]
)
{\displaystyle {\begin{array}{lcl}P(X\leq s_{X})&=&P(X^{-1}((-\infty ,s_{X})))&:=&P^{X}((-\infty ,s_{X}))\\P(s_{Y}\leq Y\leq s_{Y}')&=&P(Y^{-1}([s_{Y},s_{Y}']))&:=&P^{Y}([s_{Y},s_{Y}'])\\\end{array}}}
前提として、確率測度
P
{\displaystyle \textstyle P}
は可測集合である
F
{\displaystyle \textstyle {\mathcal {F}}}
の元しか引数に取れず、確率変数は関数であって値を代入できない。よってこの記法は記号の濫用 であり、実践的な有用さを優先してこの記法がしばしば利用される。イメージとしては「変数の値指定 + おおもとの確率への引き渡し」となる。
確率変数の関数
編集
実数のボレル可測関数
g
:
R
→
R
{\displaystyle g:\mathbb {R} \rightarrow \mathbb {R} }
を実数値 確率変数 X に適用すると、新たな確率変数 Y を定義することができる。Y の分布関数 は、
F
Y
(
y
)
=
P
(
g
(
X
)
≤
y
)
{\displaystyle F_{Y}(y)=\operatorname {P} (g(X)\leq y)}
である。
関数 g に逆関数 g −1 が定義可能であり、かつそれが増加関数かまたは減少関数である場合には、
上記の関係は以下のように展開できる。
F
Y
(
y
)
=
P
(
g
(
X
)
≤
y
)
{\displaystyle F_{Y}(y)=\operatorname {P} (g(X)\leq y)}
=
{
P
(
X
≤
g
−
1
(
y
)
)
=
F
X
(
g
−
1
(
y
)
)
,
P
(
X
≥
g
−
1
(
y
)
)
=
1
−
F
X
(
g
−
1
(
y
)
)
,
{\displaystyle ={\begin{cases}\operatorname {P} (X\leq g^{-1}(y))=F_{X}(g^{-1}(y)),&\,\\\operatorname {P} (X\geq g^{-1}(y))=1-F_{X}(g^{-1}(y)),\,\end{cases}}}
(g −1 が増加関数の場合),
(g −1 が減少関数の場合).
さらに、同じく g の可逆性に加えて微分可能性も仮定すると、両辺を y で微分することにより、確率密度関数 の関係を下記のように記述できる。
f
Y
(
y
)
=
f
X
(
g
−
1
(
y
)
)
|
d
g
−
1
(
y
)
d
y
|
{\displaystyle f_{Y}(y)=f_{X}(g^{-1}(y))\left|{\frac {dg^{-1}(y)}{dy}}\right|}
g の逆関数が存在しない場合でも、それぞれの y が高々 可算 個の根を持つ場合(すなわち、y = g (xi ) である xi の数が有限または可算無限の場合)には、上記の確率密度関数の関係は次のように一般化できる。
f
Y
(
y
)
=
∑
i
f
X
(
g
i
−
1
(
y
)
)
|
d
g
i
−
1
(
y
)
d
y
|
{\displaystyle f_{Y}(y)=\sum _{i}f_{X}(g_{i}^{-1}(y))\left|{\frac {dg_{i}^{-1}(y)}{dy}}\right|}
ただし xi = gi −1 (y )
この式は g が増加関数でなくとも成立する。
確率に対する公理的アプローチとしての測度論において、空間 Ω 上の確率変数 X およびボレル可測関数
g
:
R
→
R
{\displaystyle g:\mathbb {R} \rightarrow \mathbb {R} }
を取る。可測関数を合成したものもまた可測である(しかし、g がルベーグ可測 の場合はその限りではない)ため、Y = g (X ) もまた空間 Ω 上の確率変数である。Y の分布を知るために、確率空間 (Ω, P ) から
(
R
,
d
F
X
)
{\displaystyle (\mathbb {R} ,dF_{X})}
への移行と同じ手順を利用できる。
例1
編集
X を実数の連続確率分布 とした時、Y = X 2 とすると、
F
Y
(
y
)
=
P
(
X
2
≤
y
)
{\displaystyle F_{Y}(y)=\operatorname {P} (X^{2}\leq y)}
y < 0 の時は
P
(
X
2
≤
y
)
=
0
{\displaystyle \operatorname {P} (X^{2}\leq y)=0}
であるので、
F
Y
(
y
)
=
0
{\displaystyle F_{Y}(y)=0}
(ただし y < 0 )である。
y ≥ 0 の時は
P
(
X
2
≤
y
)
=
P
(
|
X
|
≤
y
)
=
P
(
−
y
≤
X
≤
y
)
{\displaystyle \operatorname {P} (X^{2}\leq y)=\operatorname {P} (|X|\leq {\sqrt {y}})=\operatorname {P} (-{\sqrt {y}}\leq X\leq {\sqrt {y}})}
であるので、
F
Y
(
y
)
=
F
X
(
y
)
−
F
X
(
−
y
)
{\displaystyle F_{Y}(y)=F_{X}({\sqrt {y}})-F_{X}(-{\sqrt {y}})}
(ただし y ≥ 0 )である。
例2
編集
x は、分布関数が
F
X
(
x
)
=
P
(
X
≤
x
)
=
1
(
1
+
e
−
x
)
θ
{\displaystyle F_{X}(x)=\operatorname {P} (X\leq x)={\frac {1}{(1+e^{-x})^{\theta }}}}
となる確率変数とする。ただし θ > 0 は固定されたパラメーターである。 確率変数 Y を
Y
=
log
(
1
+
e
−
X
)
{\displaystyle Y=\log(1+e^{-X})}
とすると、
F
Y
(
y
)
=
P
(
Y
≤
y
)
=
P
(
log
(
1
+
e
−
X
)
≤
y
)
=
P
(
X
>
−
log
(
e
y
−
1
)
)
.
{\displaystyle F_{Y}(y)=\operatorname {P} (Y\leq y)=\operatorname {P} (\log(1+e^{-X})\leq y)=\operatorname {P} (X>-\log(e^{y}-1)).}
最後の表現は X の分布関数で計算できる。すなわち
F
Y
(
y
)
=
1
−
F
X
(
−
log
(
e
y
−
1
)
)
{\displaystyle F_{Y}(y)=1-F_{X}(-\log(e^{y}-1))}
=
1
−
1
(
1
+
e
log
(
e
y
−
1
)
)
θ
{\displaystyle =1-{\frac {1}{(1+e^{\log(e^{y}-1)})^{\theta }}}}
=
1
−
1
(
1
+
e
y
−
1
)
θ
{\displaystyle =1-{\frac {1}{(1+e^{y}-1)^{\theta }}}}
=
1
−
e
−
y
θ
.
{\displaystyle =1-e^{-y\theta }.}
例3
編集
X を標準正規分布 に従う確率変数であるとすると、その確率密度は下記の通りである。
f
X
(
x
)
=
1
2
π
e
−
x
2
/
2
{\displaystyle f_{X}(x)={\frac {1}{\sqrt {2\pi }}}e^{-x^{2}/2}}
確率変数 Y = X 2 を考えると、上記の式を変数変換して確率密度を下記のように表すことができる。
f
Y
(
y
)
=
∑
i
f
X
(
g
i
−
1
(
y
)
)
|
d
g
i
−
1
(
y
)
d
y
|
{\displaystyle f_{Y}(y)=\sum _{i}f_{X}(g_{i}^{-1}(y))\left|{\frac {dg_{i}^{-1}(y)}{dy}}\right|}
この場合、Y の値は2つの X (正の値と負の値)に対応するので、変換は単調写像 ではない。しかし、関数が対称であるので、両半分をそれぞれ変形することができる。すなわち、
f
Y
(
y
)
=
2
f
X
(
g
−
1
(
y
)
)
|
d
g
−
1
(
y
)
d
y
|
{\displaystyle f_{Y}(y)=2f_{X}(g^{-1}(y))\left|{\frac {dg^{-1}(y)}{dy}}\right|}
である。この逆変換は、
x
=
g
−
1
(
y
)
=
y
{\displaystyle x=g^{-1}(y)={\sqrt {y}}}
であり、両辺を微分すると
d
g
−
1
(
y
)
d
y
=
1
2
y
{\displaystyle {\frac {dg^{-1}(y)}{dy}}={\frac {1}{2{\sqrt {y}}}}}
である。従って、
f
Y
(
y
)
=
2
1
2
π
e
−
y
/
2
1
2
y
=
1
2
π
y
e
−
y
/
2
{\displaystyle f_{Y}(y)=2{\frac {1}{\sqrt {2\pi }}}e^{-y/2}{\frac {1}{2{\sqrt {y}}}}={\frac {1}{\sqrt {2\pi y}}}e^{-y/2}}
これは自由度 1 のχ 2 分布 である。
確率変数の同値性
編集
確率変数が同値と見なされるには「等しい」「ほとんど確実に等しい」「分布が等しい」といった、いくつかの異なる意味がある。強さの順に並べると、これらの正確な定義は以下の通り。
分布が等しい
編集
標本空間が実数直線の部分集合の場合、確率変数 X と Y の分布が等しいとは(
X
=
d
Y
{\displaystyle X\;{\stackrel {d}{=}}\;Y}
と表記する)下記のように同じ分布関数を持つことである。
P
(
X
≤
x
)
=
P
(
Y
≤
x
)
for all
x
.
{\displaystyle \operatorname {P} (X\leq x)=\operatorname {P} (Y\leq x)\quad {\hbox{for all}}\quad x.}
2つの確率変数は同じ積率母関数 を持つ時に同じ分布になる。この事実は、例えば独立同一分布の確率変数による複数の異なった関数が同じ分布になるかどうかを調べるための便利な方法を提供する。しかしながら、積率母関数が存在するのは、ラプラス変換 が定義される分布関数に対してのみである。
ほとんど確実に等しい
編集
2つの確率変数 X と Y が「ほとんど確実に 等しい」とは、その2つが異なる確率が 0 であることと同値である[ 注 4] 。
P
(
X
≠
Y
)
=
0.
{\displaystyle \operatorname {P} (X\neq Y)=0.}
これは、以下で定義される距離 が0であることとも同値である。
d
∞
(
X
,
Y
)
=
ess
sup
ω
|
X
(
ω
)
−
Y
(
ω
)
|
,
{\displaystyle d_{\infty }(X,Y)=\operatorname {ess} \sup _{\omega }|X(\omega )-Y(\omega )|,}
(ただし、ess sup は測度論 の意味での本質的上限 )
確率論におけるすべての現実的な目的に関して、この同値性の概念は実際に等しい場合と同等の強さをもつ。
等しい
編集
最後に、2つの確率変数 X と Y が等しいとは、それらが定義される可測空間上の関数として等しいことを指す。
X
(
ω
)
=
Y
(
ω
)
for all
ω
∈
Ω
{\displaystyle X(\omega )=Y(\omega )\qquad {\hbox{for all }}\omega \in \Omega }
一般化と拡張
編集
確率変数の終域
S
{\displaystyle \textstyle S}
は実数全体の集合
R
{\displaystyle \textstyle \mathbb {R} }
の部分集合である。これを一般化して終域の種別制約をなくした概念が確率要素 である。これにより値として取る要素をブール変数 、カテゴリカル変数 (英語版 ) 、複素数ベクトル 、ベクトル 、行列 、数列 、樹形図 、コンパクト集合 、図形 、多様体 、関数 等にできる。
このような、より一般化された概念は計算機科学 や自然言語処理 といった非数的要素を扱う分野で特に有用である。これらの確率要素は実数値の確率変数(主に乱数ベクトル)として取り扱えることが多い。
下記に実例を上げる。
「ランダムな単語」は語彙集合の中で整数を添字としてパラメータ化することができる。あるいは、単語に対応する特定のベクトル要素一つのみが1で他の全ての要素が0であるような指示ベクトルとして、表現し得る。
「ランダムな文章」はランダムな単語のベクトルとしてパラメータ化することができる。
数学において V 本の辺を持つ「ランダムなグラフ」は、N 次正方行列を用いて各辺の重みならびに辺以外での値を0として表すことができる。(グラフに重み付けがない場合、辺の値は1とする)
要素の数値化は、非数的な独立した確率要素を扱う際の必須操作ではない。
もう1つの拡張は確率過程 、すなわち時間や空間などで添字 付けられた添字付き確率変数である。
分類
編集
確率変数はその終域の濃度 によって離散型と連続型に二分できる[ 3] 。
離散型確率変数
編集
離散型確率変数 ( りさんがたかくりつへんすう 、( 英 : discrete type random variable )は値域 が高々可算集合 な確率変数である[ 8] [ 1] :399 。離散確率変数 ( りさんかくりつへんすう 、( 英 : discrete random variable )とも[ 3] 。
離散型確率変数の分布(離散確率分布 )は確率変数値の確率の全てを表したものとして確率質量関数 で記述できる。
離散型確率変数
編集
連続型確率変数 ( れんぞくがたかくりつへんすう 、( 英 : continuous type random variable )は値域 が非可算集合 な確率変数である[ 1] :399 。連続確率変数 ( れんぞくかくりつへんすう 、( 英 : continuous random variable )とも[ 3] 。
確率分布 PX が絶対連続 ならば確率密度関数 が存在し、確率変数が
E
∈
E
{\displaystyle E\in {\mathcal {E}}}
(例えば区間)に属する確率が確率密度関数の E 上のルベーグ積分 で表される。注意すべき点は、絶対連続のとき連続確率分布 であるため、確率変数がある値をとる確率は全て 0 になるということである。確率分布が連続でも絶対連続とは限らない[ 9] 。混合分布 がその例である。そのような確率変数は確率密度関数または確率質量関数で記述できない。
収束
編集
数理統計学の重要なテーマは、例えば大数の法則 や中心極限定理 のように、ある確率変数の特定の列 の収束結果を得ることである。
確率変数列 (Xn ) を確率変数 X に収束させる方法は様々なものがある。詳細は確率変数の収束 で説明する。
関連項目
編集
脚注
編集
注釈
編集
^ 確率変数と確率要素を区別していない。
^ サイコロの目に書かれた数字は単なる名義尺度 であるから、この場合の
{
1
,
2
,
3
,
4
,
5
,
6
}
2
{\displaystyle \{1,2,3,4,5,6\}^{2}}
とは
Z
2
{\displaystyle \mathbb {Z} ^{2}}
の部分集合ではなく、単なる {1, 2, 3, 4, 5, 6} という「記号」の対集合に過ぎない。
^ 別の確率変数を介して定義されていてもよい
^ 測度論としての立場で考えれば、X , Y が確率測度 P でほとんど至るところ等しい 、ことと同値である。
出典
編集
^ a b c Yates, Daniel S.; Moore, David S; Starnes, Daren S. (2003). The Practice of Statistics (2nd ed.). New York: Freeman . ISBN 978-0-7167-4773-4 . http://bcs.whfreeman.com/yates2e/
^ a b 確率変数 ... の厳密な定義 ... 実数全体の集合
R
{\displaystyle R}
に対し ...
R
{\displaystyle R}
上のボレル集合体 ...
B
{\displaystyle {\mathfrak {B}}}
で表す.... 可測空間
(
Ω
,
F
)
{\displaystyle (\Omega ,{\mathfrak {F}})}
を前提として,
Ω
{\displaystyle \Omega }
上で定義された関数
X
:
Ω
→
R
{\displaystyle X\colon \Omega \to R}
が,すべての
B
∈
B
{\displaystyle B\in {\mathfrak {B}}}
について
X
−
1
(
B
)
=
{
ω
∈
Ω
:
X
(
ω
)
∈
B
}
∈
F
{\displaystyle X^{-1}(B)=\{\omega \in \Omega \colon X(\omega )\in B\}\in {\mathfrak {F}}}
を満たすとき,
X
=
X
(
ω
)
{\displaystyle X=X(\omega )}
を
(
Ω
,
F
)
{\displaystyle (\Omega ,{\mathfrak {F}})}
上で定義された確率変数 (random variable) と呼ぶ. (加藤 2009 , p. 2)
^ a b c d とることができる値が離散的であるか,連続的であるかによって,それぞれ離散(確率)変数,連続(確率)変数という。 (JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率および一般統計用語 , 1.2 確率変数)
^ a b どのような値となるかが,ある確率法則によって決まる変数。確率法則は確率分布で記述される。 (JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率および一般統計用語 , 1.2 確率変数)
^ 確率変数とは,直感的にいえば,観測を行うたびごとに不規則にとる値を変える変数のことである. (加藤 2009 , p. 2)
^ Fristedt & Gray (1996 , page 11)
^ a b
(
Ω
,
F
,
P
)
{\displaystyle (\Omega ,{\mathfrak {F}},P)}
を確率空間,
X
{\displaystyle X}
を
(
Ω
,
F
)
{\displaystyle (\Omega ,{\mathfrak {F}})}
上で定義された確率変数とする.このとき,
B
∈
B
{\displaystyle B\in {\mathfrak {B}}}
に対して
P
X
(
B
)
=
P
(
X
−
1
(
B
)
)
{\displaystyle P^{X}(B)=P(X^{-1}(B))}
と定めると,
P
X
{\displaystyle P^{X}}
は可測空間
(
R
,
B
)
{\displaystyle (R,{\mathfrak {B}})}
上の確率(測度)になる.この
P
X
{\displaystyle P^{X}}
を
X
{\displaystyle X}
の確率分布 (probability distribution) と呼ぶ. (加藤 2009 , p. 2)
^
D
=
{
a
0
,
a
1
,
…
}
{\displaystyle D=\{a_{0},a_{1},\ldots \}}
を有限集合または可算無限集合とし,
X
(
ω
)
∈
D
{\displaystyle X(\omega )\in D}
であるとき,
X
{\displaystyle X}
を離散型確率変数 (discrete type random variable) といい加藤, 剛 (2009), “2-3 確率関数と確率密度関数” , 知識の森 (電子情報通信学会 ), https://www.ieice-hbkb.org/files/ad_base/view_pdf.html?p=/files/12/12gun_03hen_02.pdf#page=5
^ L. Castañeda, V. Arunachalam, and S. Dharmaraja (2012). Introduction to Probability and Stochastic Processes with Applications . Wiley. p. 67. https://books.google.co.jp/books?id=zxXRn-Qmtk8C&pg=PA67&redir_esc=y&hl=ja
参考文献
編集
外部リンク
編集