Zmienna losowa 📖 Wikipedia

Zmienna losowa – funkcja przypisująca liczby wynikom doświadczenia losowego (zdarzeniom elementarnym)^[1]^[2].

To samo doświadczenie losowe może być opisywane przez różne zmienne losowe, zależnie od badanej cechy. Na przykład osobnikom losowanym z pewnej populacji można przypisać liczby wyrażające ich wzrost, wiek, ciężar lub liczbę potomstwa. Można też tym samym wynikom doświadczenia przypisywać liczby na wiele sposobów. Np. w rzucie monetą wypadnięciu orła można przypisać liczbę $+1$ , a wypadnięciu reszki liczbę $-1$ ; lub też wypadnięciu orła można przypisać liczbę $0$ , a wypadnięciu reszki liczbę $1$ , itd. Każdy taki wybór definiuje inną zmienną losową.

W bardziej ogólnych przypadkach wynikom doświadczenia można przypisywać nie jedną liczbę, lecz kilka liczb jednocześnie, tworząc tzw. wektory losowe. Np. w rzucie czterema monetami wynik doświadczenia można opisać uporządkowaną czwórką liczb $(x_{1},x_{2},x_{3},x_{4})$ , gdzie $x_{i},i=1,2,3,4$ przyjmują wartości $+1$ lub $-1$ w zależności od tego, czy na $i$ -tej monecie wypadł orzeł czy reszka.

Aby funkcja mogła być traktowana jako zmienna losowa, musi spełniać warunek mierzalności. W przypadku zmiennych losowych określonych na zbiorze liczb rzeczywistych oznacza to, że dla każdego przedziału zbioru liczb rzeczywistych można jednoznacznie podać prawdopodobieństwo zdarzenia, że wartości zmiennej losowej należą do tego przedziału. Ścisła definicja, oparta na teorii miary, podana jest dalej.

Oznaczenia

edytuj

Tradycyjnie zmienne losowe zapisuje się za pomocą wielkich liter z końca alfabetu, np. $S,T,U,X,Y,Z$ (odmiennie niż zwykle zapisuje się funkcje); wartości zmiennych losowych (tzw. realizacje) oznacza się małymi literami: $s,t,u,x,y,z$ , często ze wskaźnikami^[3].

Definicja formalna zmiennej losowej rzeczywistej

edytuj

Zmienną losową rzeczywistą na przestrzeni probabilistycznej $(\Omega ,{\mathcal {F}},P)$ nazywamy dowolną rzeczywistą funkcję mierzalną $X\colon \Omega \to \mathbb {R} ,$ tzn. funkcję $X$ spełniającą warunek^[4]

X^{-1}(B)\in {\mathcal {F}}

dla każdego zbioru borelowskiego

B\subseteq \mathbb {R} .

Oznacza to, że dla każdego zbioru wartości $B$ (np. dowolny przedział $(-\infty ,x)$ ), jego przeciwobraz $X^{-1}(B)$ musi być zdarzeniem losowym należącym do σ-ciała ${\mathcal {F}}$ danego modelu doświadczenia losowego. Dzięki temu każdemu takiemu zbiorowi wartości można jednoznacznie przypisać prawdopodobieństwo wystąpienia.

Mierzalność jest fundamentalnym wymogiem formalnym: gwarantuje ona, że zmienna losowa nie operuje na detalach, których dany model probabilistyczny nie potrafi zmierzyć.

Przykład (model o ograniczonej informacji)

edytuj

Rozważmy rzut symetryczną kostką, gdzie $\Omega =\{1,2,3,4,5,6\}$ . Załóżmy, że model rozróżnia jedynie kolory ścianek: ścianki z oczkami 1, 2, 3 są zielone, a 4, 5, 6 – czerwone.

$\sigma$ -ciało: ${\mathcal {F}}=\{\emptyset ,\{1,2,3\},\{4,5,6\},\Omega \}$
Zmienna mierzalna (kolor): Funkcja $X_{1}$ przypisująca wartość 0 zielonym ściankom i 1 ściankom czerwonym jest zmienną losową, ponieważ jej przeciwobrazy (np. $\{1,2,3\}$ ) należą do ${\mathcal {F}}$ .
Zmienna niemierzalna (liczba oczek): Funkcja $X_{2}(\omega )=\omega$ nie jest zmienną losową w tym modelu. Przeciwobrazem zbioru $\{6\}$ jest zdarzenie „wypadła szóstka”, które nie należy do ${\mathcal {F}}$ (model nie potrafi odróżnić szóstki od czwórki czy piątki).

Zmienne losowe w przestrzeniach rzeczywistych $\mathbb {R} ^{n}$

edytuj

Odwzorowanie mierzalne określone na przestrzeni $\Omega$ o wartościach w przestrzeni wielowymiarowej $\mathbb {R} ^{n}$ nazywa się wektorem losowym. Wektor losowy ma postać

X(\omega )=\left(X_{1}(\omega ),X_{2}(\omega ),\dots ,X_{n}(\omega )\right),

gdzie $X_{i}$ dla $i=1,\dots ,n$ są zmiennymi losowymi rzeczywistymi^[4].

Przykłady

edytuj

(1) Doświadczenie losowe polegające na rzucie kością do gry. Definiujemy zmienną losową $X$ , która przypisuje danemu wynikowi rzutu liczbę wyrzuconych oczek. Zbiór wszystkich możliwych wartości zmiennej losowej $X$ ma postać

\Omega ^{*}=\{1,2,3,4,5,6\}.

(2) Doświadczenie losowe polegające na rzucie dwiema kośćmi do gry, np. czarną i białą. Zbiór zdarzeń elementarnych składa się ze zbioru par uporządkowanych, przedstawiających możliwe wyniki rzutu dwu kostek

\Omega =\{(c_{1},b_{1}),(c_{1},b_{2}),(c_{1},b_{3}),\dots ,(c_{6},b_{5}),(c_{6},b_{6})\}.

Definiujemy zmienną losową $X$ , która przypisuje danemu wynikowi rzutu parę uporządkowaną liczb $(i,j)\in \mathbb {N} ^{2},$ przy czym pierwsza liczba pary określa liczbę oczek wyrzuconej na kostce czarnej, a druga na kostce białej. Zbiór wszystkich możliwych wartości zmiennej losowej $X$ składa się z 36 par uporządkowanych i ma postać

\Omega ^{*}=\{(1,1),(1,2),(1,3),\dots ,(6,5),(6,6)\}

,

co można zapisać skrótowo w postaci

\Omega ^{*}=\{(i,j)\!:i,j\in \{1,2,3,4,5,6\}\}

.

(3) Zmiennymi losowymi są również następujące funkcje:

a) funkcja, która wynikom rzutu przypisuje iloczyn liczby oczek $i{\cdot }j$ z obu kostek; zbiór $\Omega ^{*}$ zawiera teraz $18$ unikalnych wartości

\Omega ^{*}=\{1,2,3,4,5,6,8,9,10,12,15,16,18,20,24,25,30,36\}

b) funkcja, która wynikom rzutu przypisuje sumę liczby oczek $i+j$ z obu kostek (por. rysunek); zbiór $\Omega ^{*}$ zawiera $11$ unikalnych wartości

\Omega ^{*}=\{2,3,4,5,6,7,8,9,10,11,12\}

c) funkcja, która wynikom rzutu przypisuje liczbę oczek $i$ z czarnej kostki; zbiór $\Omega ^{*}$ zawiera $6$ unikalnych wartości

\Omega ^{*}=\{1,2,3,4,5,6\}

Powyższe trzy funkcje, pomimo że są odwzorowaniami z tego samego zbioru zbioru zdarzeń elementarnych $\Omega$ tego samego doświadczenia losowego, tworzą różne zbiory wartości, będące podzbiorami zbioru liczb naturalnych $\mathbb {N}$ .

(4) Niech dane będą: $\Omega =[0,1],$ σ-ciało ${\mathcal {F}}$ zbiorów borelowskich przedziału $[0,1]$ oraz określona na nim miara Lebesgue’a $P.$ Każda funkcja ciągła $X\colon \Omega \to \mathbb {R}$ jest zmienną losową.

Standaryzowana zmienna losowa

edytuj

Jeżeli zmienna losowa $X$ ma wartość oczekiwaną $E(X)=m$ oraz wariancję $D^{2}(X)=\sigma ^{2}$ , to zmienna losowa

Y={\frac {X-m}{\sigma }}

ma wartość oczekiwaną i wariancję równe odpowiednio

E(Y)=0,\quad D^{2}(Y)=1

.

Zmienną losową $Y$ o takich parametrach nazywa się standaryzowaną lub unormowaną^[5], zaś samo przekształcenie zmiennej $X$ w standaryzowaną zmienną $Y$ nazywa się standaryzacją^[6].

Funkcje zmiennych losowych

edytuj

Definicja funkcji zmiennej losowej^[7]

edytuj

1. Dla danej funkcji losowej $X$ o wartościach rzeczywistych definiuje się nową zmienną losową $Y=g(X)$ , która jest jej funkcją, w ten sposób, że wartości zmiennej losowej $Y$ oblicza się jako wynik działania funkcją mierzalną $g\colon \mathbb {R} \rightarrow \mathbb {R}$ na wartości zmiennej losowej $X$ . Dystrybuanta zmiennej $Y=g(X)$ jest wtedy dana wzorem:

F_{Y}(y)=\operatorname {P} (g(X)\leqslant y),

gdzie $y=g(x)$ .

2. Jeśli funkcja $g$ jest odwracalna, tj. istnieje $h=g^{-1}$ , gdzie $h$ jest funkcją odwrotną do $g$ i jest monotoniczna (czyli $g$ jest albo rosnąca albo malejąca), to powyższy wzór można zapisać bardziej szczegółowo

F_{Y}(y)=\operatorname {P} (g(X)\leqslant y)={\begin{cases}\operatorname {P} (X\leqslant h(y))=F_{X}(h(y)),&{\text{jeśli }}h=g^{-1}{\text{ rosnąca}},\\\\\operatorname {P} (X\geqslant h(y))=1-F_{X}(h(y)),&{\text{jeśli }}h=g^{-1}{\text{ malejąca}}.\end{cases}}

3. Jeżeli funkcja $g$ jest nie tylko odwracalna, ale i różniczkowalna w swojej dziedzinie, to wzór na zależność między funkcjami gęstości prawdopodobieństwa wyprowadza się, różniczkując obie strony powyższego wyrażenia względem $y$ , tj.^[8]

f_{Y}(y)=f_{X}{\bigl (}h(y){\bigr )}\left|{\frac {dh(y)}{dy}}\right|.

4. Jeżeli funkcja $g$ nie jest odwracalna, ale każda wartość $y$ ma co najwyżej przeliczalną liczbę przeciwobrazów (tzn. istnieje skończona lub przeliczalnie nieskończona liczba wartości $x_{i}$ takich, że $y=g(x_{i})$ ), to poprzednią zależność między funkcjami gęstości prawdopodobieństwa można uogólnić do postaci

f_{Y}(y)=\sum _{i=1}^{m(y)}f_{X}(h_{i}(y))\left|{\frac {dh_{i}(y)}{dy}}\right|

przy czym sumowanie obejmuje wszystkie wartości $x_{i}$ takie że $x_{i}=h_{i}(y)$ ; liczba składników $m(y)$ w tej sumie nie jest stała, zależy od wartości $y$ ; dla ustalonego $y$ liczba $m(y)$ jest liczbą rozwiązań równania $y=g(x)$ ^[9].

Uwaga: Wzory na gęstości $f_{Y}(y)$ nie wymagają, aby funkcja $g(x)$ była rosnąca.

Przykłady funkcji zmiennych losowych

edytuj

Przykład 1: Kwadrat zmiennej losowej obliczony metodą dystrybuanty.

edytuj

Niech $X$ będzie zmienną losową o wartościach rzeczywistych i niech $Y=X^{2}$ . Wtedy mamy^[10]

F_{Y}(y)=\operatorname {P} (X^{2}\leqslant y).

1) Jeżeli $y<0$ , to $\operatorname {P} (X^{2}\leqslant y)=0$ , więc

F_{Y}(y)=0\qquad {\hbox{jeśli}}\quad y<0.

2) Jeżeli $y\geqslant 0$ , to $\operatorname {P} (X^{2}\leqslant y)=\operatorname {P} (|X|\leqslant {\sqrt {y}})=\operatorname {P} (-{\sqrt {y}}\leqslant X\leqslant {\sqrt {y}}),$

więc

F_{Y}(y)=F_{X}({\sqrt {y}})-F_{X}(-{\sqrt {y}})\qquad {\hbox{jeśli}}\quad y\geqslant 0.

cd. Przykład 1: Kwadrat zmiennej losowej normalnej

edytuj

Niech $X$ ma standardowy rozkład normalny $X\sim N(0,1)$ . Dystrybuanta zmiennej $Y=X^{2}$ dla $y\geqslant 0$ wynosi

F_{Y}(y)=F_{X}({\sqrt {y}})-F_{X}(-{\sqrt {y}})

=\Phi ({\sqrt {y}})-\Phi (-{\sqrt {y}}),

gdzie $\Phi$ oznacza dystrybuantę standardowego rozkładu normalnego.

Korzystając z własności $\Phi (-t)=1-\Phi (t)$ dostajemy

F_{Y}(y)=2\Phi ({\sqrt {y}})-1,\qquad y\geqslant 0.

Mamy też

F_{Y}(y)=0,\qquad y<0.

Różniczkując dystrybuantę względem $y$ otrzymujemy gęstość

f_{Y}(y)={\frac {d}{dy}}{\bigl (}2\Phi ({\sqrt {y}})-1{\bigr )}

=2\varphi ({\sqrt {y}}){\frac {1}{2{\sqrt {y}}}},

gdzie

\varphi (x)={\frac {1}{\sqrt {2\pi }}}e^{-x^{2}/2}

jest gęstością rozkładu normalnego standardowego.

Po podstawieniu otrzymujemy

f_{Y}(y)={\frac {1}{\sqrt {2\pi y}}}e^{-y/2},\qquad y>0.

Jest to gęstość rozkładu chi-kwadrat z jednym stopniem swobody, czyli $Y=X^{2}\sim \chi ^{2}(1).$

Przykład 2

edytuj

Załóżmy, że $X$ jest zmienną losową o funkcji dystrybuanty

F_{X}(x)=P(X\leqslant x)={\frac {1}{(1+e^{-x})^{\theta }}}

gdzie $\theta >0$ jest stałym parametrem. Rozważmy zmienną losową $Y=\mathrm {ln} (1+e^{-X}).$ Wówczas

F_{Y}(y)=P(Y\leqslant y)=P(\mathrm {ln} (1+e^{-X})\leqslant y)=P(X\geqslant -\mathrm {ln} (e^{y}-1)).\,

Ostatnie wyrażenie można obliczyć na podstawie dystrybuanty zmiennej $X$ :

{\begin{aligned}F_{Y}(y)&=1-F_{X}(-\ln(e^{y}-1))\\[5pt]&=1-{\frac {1}{(1+e^{\ln(e^{y}-1)})^{\theta }}}\\[5pt]&=1-{\frac {1}{(1+e^{y}-1)^{\theta }}}\end{aligned}}

Po uproszczeniu ostatecznie otrzymamy:

F_{Y}(y)=1-e^{-y\theta }

Funkcja ta jest dystrybuantą rozkładu wykładniczego.

Przykład 3 Kwadrat zmiennej losowej, metoda gęstości.

edytuj

Załóżmy, że $X$ jest zmienną losową o standardowym rozkładzie normalnym, której gęstość ma postać:

f_{X}(x)={\frac {1}{\sqrt {2\pi }}}e^{-x^{2}/2}.

Rozważmy zmienną losową $Y=X^{2}$ . Jej gęstość możemy obliczyć, stosując podany wyżej wzór na zamianę zmiennych:

f_{Y}(y)=\sum _{i=1}^{2}f_{X}[h_{i}(y)]\left|{\frac {dh_{i}(y)}{dy}}\right|.

W tym przypadku funkcja nie jest monotoniczna, ponieważ każda wartość $Y$ ma dwie odpowiadające jej wartości $X$ (jedną dodatnią i jedną ujemną). Jednak ze względu na symetrię obie połowy ulegną identycznej transformacji, tj.

f_{Y}(y)=2f_{X}[h(y)]\left|{\frac {dh(y)}{dy}}\right|.

Odwrotnością funkcji $y=g(x)=x^{2}$ jest funkcja

x=h(y)={\sqrt {y}}

,

a jej pochodna ma postać

{\frac {dh(y)}{dy}}={\frac {1}{2{\sqrt {y}}}}.

Stąd mamy:

f_{Y}(y)=2{\frac {1}{\sqrt {2\pi }}}e^{-y/2}{\frac {1}{2{\sqrt {y}}}}={\frac {1}{\sqrt {2\pi y}}}e^{-y/2}.

Funkcja ta jest gęstością prawdopodobieństwa rozkładu chi-kwadrat o jednym stopniu swobody.

Przykład 4

edytuj

Załóżmy, że $X$ jest zmienną losową o rozkładzie normalnym, której gęstość wynosi:

f_{X}(x)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-(x-\mu )^{2}/(2\sigma ^{2})}.

Rozważmy zmienną losową $Y=X^{2}.$ Gęstość możemy obliczyć, stosując powyższy wzór na zamianę zmiennych:

f_{Y}(y)=\sum _{i}f_{X}(h_{i}(y))\left|{\frac {dh_{i}(y)}{dy}}\right|.

W tym przypadku zmiana nie jest monotoniczna, ponieważ każda wartość $Y$ ma dwie odpowiadające jej wartości $X$ (jedną dodatnią i jedną ujemną). W odróżnieniu od poprzedniego przykładu, w tym przypadku nie ma jednak symetrii i musimy obliczyć dwa odrębne wyrażenia:

f_{Y}(y)=f_{X}(h_{1}(y))\left|{\frac {dh_{1}(y)}{dy}}\right|+f_{X}(h_{2}(y))\left|{\frac {dh_{2}(y)}{dy}}\right|.

Transformacja odwrotna wynosi

x=h_{1,2}(y)=\pm {\sqrt {y}}

a jej pochodna wynosi

{\frac {dh_{1,2}(y)}{dy}}=\pm {\frac {1}{2{\sqrt {y}}}}.

Wówczas

f_{Y}(y)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}{\frac {1}{2{\sqrt {y}}}}(e^{-({\sqrt {y}}-\mu )^{2}/(2\sigma ^{2})}+e^{-(-{\sqrt {y}}-\mu )^{2}/(2\sigma ^{2})}).

Funkcja ta jest gęstością prawdopodobieństwa niecentralnego rozkładu chi-kwadrat(inne języki) o jednym stopniu swobody.

Przykład 5 Funkcja sinus zmiennej losowej^[11]

edytuj

Załóżmy, że $X$ jest zmienną losową o rozkładzie jednostajnym ciągłym w przedziale ${\big (}\!-\!{\tfrac {\pi }{2}},\pi {\big )}$ , a zmienna losowa $Y$ dana jest zależnością funkcyjną $Y=\sin(X)$ .

Aby wyznaczyć gęstość zmiennej $Y$ dzielimy przedział ${\big (}\!-\!{\tfrac {\pi }{2}},\pi {\big )}$ na przedziały ${\big (}\!-\!{\tfrac {\pi }{2}},{\tfrac {\pi }{2}}{\big \rangle }$ , ${\big (}{\tfrac {\pi }{2}},\pi {\big )}$ , w których funkcja $y=\sin(x)$ jest ściśle monotoniczna i wyznaczamy w nich funkcje odwrotne:

(1) dla $-{\tfrac {\pi }{2}}<x\leqslant {\tfrac {\pi }{2}}$ funkcją odwrotną do $y=\sin(x)$ jest $x=\arcsin(y)$ dla $-1\leqslant y\leqslant 1;$ jej pochodna $x'={\frac {1}{\sqrt {1-y^{2}}}}$ ;

(2) dla ${\tfrac {\pi }{2}}<x<\pi$ funkcja $y=\sin(x)$ przyjmuje wartości identyczne jak funkcja $y=-\sin(x)$ dla $-{\tfrac {\pi }{2}}<x<0$ ; skąd $x=\arcsin(-y)$ oraz $x'=-{\frac {1}{\sqrt {1-y^{2}}}}$ dla $0<y<1$ .

Zmienna losowa $X$ ma rozkład o gęstości

f_{X}(x)={\begin{cases}{\frac {2}{3\pi }}&{\text{dla }}\ -{\frac {\pi }{2}}<x<\pi ,\\0&{\text{dla pozostałych }}x.\end{cases}}

Stąd gęstość zmiennej losowej $Y$ jest określona wzorem

f_{Y}(y)={\begin{cases}{\frac {2}{3\pi }}{\frac {1}{\sqrt {1-y^{2}}}}&{\text{dla }}\ -1<y\leqslant 0,\\{\frac {2}{3\pi }}{\bigg (}{\frac {1}{\sqrt {1-y^{2}}}}+{\frac {1}{\sqrt {1-y^{2}}}}{\bigg )}={\frac {4}{3\pi }}{\frac {1}{\sqrt {1-y^{2}}}}&{\text{dla }}\ 0<y<1,\\0&{\text{dla pozostałych }}y.\end{cases}}

Funkcja zmiennych losowych - symulacja numeryczna

edytuj

Poniżej pokazano kod programu w Python, który realizuje numerycznie sumę kwadratów funkcję zmiennych losowych $Y=\sum _{i=1}^{5}X_{i}^{2}$ , gdzie $X_{i}$ są niezależnymi zmiennymi o standardowym rozkładzie normalnym $N(0,1)$ . Wynik symulacji przedstawiono na histogramie, który został uzyskany na podstawie 100 000 symulacji metodą Monte Carlo; linia ciągła na wykresie przedstawia teoretyczną funkcję gęstości rozkładu chi-kwadrat z 5 stopniami swobody, $\chi ^{2}(5)$ . Zgodność histogramu z krzywą teoretyczną ilustruje fakt, iż rozkład chi-kwadrat o $k$ stopniach swobody jest zdefiniowany jako suma $k$ kwadratów niezależnych zmiennych losowych normalnych.

Na końcu programu obliczane są wartości teoretyczne i z symulacji średniej i wariancji zmiennej losowej $Y\sim \chi ^{2}(5)$ .

Najważniejsze do obliczania funkcji zmiennych losowych są trzy linie kodu:

(1) Instrukcja

X = np.random.normal(0, 1, (n, k))

tworzy macierz o $n=100\,000$ wierszach i $k=5$ kolumnach, zawierającą liczby losowe o rozkładzie normalnym $N(0,1)$ , np.

{\begin{bmatrix}0.5&-1.2&0.8&1.1&-0.7\\-0.4&0.3&0.2&-1.5&0.6\\1.8&-0.9&0.4&0.1&-0.3\\\dots &\dots &\dots &\dots &\dots \end{bmatrix}}

(2) Instrukcja

Y = np.sum(X**2, axis=1)

najpierw oblicza kwadraty poszczególnych elementów macierzy $X$

{\begin{bmatrix}0.25&1.44&0.64&1.21&0.49\\0.16&0.09&0.04&2.25&0.36\\3.24&0.81&0.16&0.01&0.09\\\dots &\dots &\dots &\dots &\dots \end{bmatrix}}

a następnie sumuje je wierszami (parametr axis = 1):

{\begin{bmatrix}4.03\\2.90\\4.31\\\vdots \end{bmatrix}}

i ostatecznie zapisuje w postaci wiersza o $n=100\,000$ elementach ${\begin{bmatrix}4.03,2.90,4.31,\dots \end{bmatrix}}$ .

(3) Instrukcja

plt.hist(Y, bins=60, density=True, alpha=0.6, label='simulation')

tworzy histogram na podstawie zawartości $Y$ , grupując uzyskane z symulacji dane w ${\text{bins=60}}$ przedziałach oraz normuje całość do 1 (argument density = True). Dzięki temu pole powierzchni histogramu wynosi 1, co pozwala porównywać histogram z teoretyczną funkcją gęstości. Przy czym wysokość słupków histogramu jest obliczana ze wzoru:

h_{i}={\frac {n_{i}}{n\cdot \Delta y}}

gdzie:

$\Delta y={\text{max(Y)}}/{\text{bins}}$ – szerokość pojedynczego przedziału, gdzie ${\text{max(Y)}}$ – wartość maksymalna zmiennej losowej uzyskana w symulacji,
$n$ – liczba wszystkich symulacji,
$n_{i}$ – liczba wyników symulacji zawarta w przedziale liczbowym $\langle \Delta y\cdot i,\Delta y\cdot (i+1)),$ $i=0,1,\dots ,{\text{bins}}-1$ .

W linii 7 kodu można zmieniać stałą $k$ , która określa liczbę sumowanych kwadratów rozkładów normalnych $k=1,2,3,\dots$ Im większe $k$ , tym rozkład $\chi ^{2}(k)$ staje się coraz bardziej symetryczny i dla dużych $k$ zaczyna przypominać rozkład normalny.

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import chi2

# Parametry
n = 100_000  # liczba symulacji
k = 5        # liczba składników sumy kwadratów zmienych normalnych

# Generowanie n wektorów po k zmiennych N(0,1)
X = np.random.normal(0, 1, (n, k))

# Suma kwadratów
Y = np.sum(X**2, axis=1)

# Histogram symulacji
plt.hist(Y, bins=60, density=True, alpha=0.6, label='simulation')

# Krzywa teoretyczna
x = np.linspace(0, np.max(Y), 1000)
y = chi2.pdf(x, df=k)
plt.plot(x,y,linewidth=2,label='theory')
plt.title(f'χ²({k})' , fontsize=20)
plt.xlabel(rf'$\sum_{{i=1}}^{{{k}}} X_i^2$', fontsize=20)
plt.ylabel("density function", fontsize=18)
plt.xticks(fontsize=16)    # liczby na osi x
plt.yticks(np.arange(0, 0.16, 0.05), fontsize=16) # liczby na osi y
plt.legend()
plt.grid(True)
plt.savefig("Chi-2 simulation and theory.svg", format="svg", bbox_inches="tight")
plt.show()

print(f"Średnia symulowana    = {np.mean(Y):.4f}")
print( "Średnia teoretyczna   =", k)
print(f"Wariancja symulowana  = {np.var(Y):.4f}")
print( "Wariancja teoretyczna =", 2*k)

Uogólnienia

edytuj

Rozważa się także zmienne losowe o wartościach w dowolnych, abstrakcyjnych przestrzeniach mierzalnych, np. w przestrzeniach funkcyjnych^[12].

Przykład^[12]

edytuj

I. Przestrzeń zdarzeń elementarnych tworzonych przez funkcje ciągłe

Niech przestrzenią zdarzeń elementarnych $\Omega$ będzie zbiór wszystkich funkcji ciągłych $x(\cdot )$ określonych na przedziale $[a,b]$ . Niech $A$ oznacza zdarzenie składające się z tych zdarzeń elementarnych, a więc funkcji ciągłych, które w ustalonym punkcie $t_{1}$ odcinka $[a,b]$ mają wartość mniejszą od ustalonej liczby $c$ :

A=\{x(\cdot )\in \Omega \colon x(t_{1})<c\}

Niech $B$ oznacza zdarzenie składające się z funkcji ciągłych, które w ustalonym punkcie $t_{2}(t_{2}\neq t_{1})$ odcinka $[a,b]$ mają wartość mniejszą od ustalonej liczby $c$ :

B=\{\omega \in \Omega \colon \omega (t_{2})<c\}

Koniunkcją zdarzeń $A$ i $B$ jest zdarzenie składające się z funkcji ciągłych, które w obu punktach $t_{1}$ i $t_{2}$ odcinka $[a,b]$ mają wartość mniejszą od ustalonej liczby $c$ :

A\cap B=\{x(\cdot )\in \Omega \colon x(t_{1})<c,x(t_{2})<c\}

Podany tu zbiór $\Omega$ jest przestrzenią zdarzeń elementarnych doświadczenia losowego polegającego np. na zapisie na termografie zmieniającej się temperatury w ciągu doby. Wynikiem (zdarzeniem elementarnym) takiego doświadczenia jest wykres temperatury, czyli funkcja. Jeśli $a=0,b=24,c=0,t_{1}=6,t_{2}=18$ to sens zdarzeń $A,B$ jest następujący: zdarzenie $A$ polega na tym, że temperatura o godzinie $6$ spadła poniżej zera, zdarzenie $B$ polega na tym, że temperatura o godzinie $24$ spadła poniżej zera; koniunkcja tych zdarzeń oznacza zdarzenie, że w obu godzinach temperatura była poniżej zera.

II. Zmienne losowe

Zmienną losową na tej przestrzeni jest każda funkcja przypisująca przebiegowi temperatury $x(\cdot )$ konkretną liczbę rzeczywistą. Np.

(a) Temperatura w wybranej chwili (zmienna losowa punktowa)

X_{1}(x)=x(t_{1})

Za pomocą tej zmiennej losowej zdarzenie $A$ można zapisać w klasyczny sposób za pomocą wyrażenia $A=\{x\in \Omega :X_{1}(x)<c\}$ lub krócej $A=\{X_{1}<c\}$ .

(b) Temperatura maksymalna w ciągu doby

Y(x)=\max _{t\in [a,b]}x(t)

(c) Temperatura minimalna w ciągu doby

Z(x)=\min _{t\in [a,b]}x(t)

(d) Średnia temperatura dobowa (zdefiniowana za pomocą całki)

S(x)={\frac {1}{b-a}}\int _{a}^{b}x(t)\,dt

(e) Łączny czas trwania mrozu w ciągu doby (gdzie $\mathbf {I}$ to funkcja wskaźnikowa)

T(x)=\int _{a}^{b}\mathbf {I} _{\{x(t)<0\}}\,dt

Dzięki temu formalizmowi badanie procesu ciągłego sprowadza się do analizy zmiennych losowych i ich rozkładów.

Zobacz też

edytuj

Przypisy

edytuj

↑ losowa zmienna, [w:] Encyklopedia PWN [online], Wydawnictwo Naukowe PWN [dostęp 2026-03-08] [zarchiwizowane 2022-07-06] .
↑ Kubik i Krupowicz 1982 ↓, s. 125-127.
↑ Krysicki i inni 1998 ↓, s. 48.
↑ ^a ^b Kubik i Krupowicz 1982 ↓, s. 125.
↑ Kubik i Krupowicz 1982 ↓, s. 140.
↑ JacekJ. Koronacki JacekJ., JanJ. Mielniczuk JanJ., Statystyka dla studentów kierunków technicznych i przyrodniczych, Warszawa: Wydawnictwa Naukowo-Techniczne, 2009, s. 117, ISBN 978-83-204-3242-8 (pol.).
↑ Kubik i Krupowicz 1982 ↓, s. 137.
↑ Kubik i Krupowicz 1982 ↓, s. 138-139.
↑ Krysicki i inni 1998 ↓, s. 62.
↑ Kubik i Krupowicz 1982 ↓, s. 138.
↑ Krysicki i inni 1998 ↓, s. 63-64.
↑ ^a ^b Kubik i Krupowicz 1982 ↓, s. 30.

Bibliografia

edytuj

Jacek Jakubowski, Rafał Sztencel: Wstęp do teorii prawdopodobieństwa. Warszawa: Script, 2004, s. 59. ISBN 83-89716-01-1.
W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski, Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach, Wydawnictwo Naukowe PWN, Warszawa 1998, cz. I Rachunek prawdopodobieństwa, str. 58-66.
Lech T. Kubik, Andrzej Krupowicz, Wprowadzenie do rachunku prawdopodobieństwa i jego zastosowań, Warszawa: Państwowe Wydawnictwo Naukowe, 1982, str. 125-167 .

Linki zewnętrzne

edytuj

Piotr Stachura, Co to jest zmienna losowa, kanał Khan Academy na YouTube, 26 maja 2015 [dostęp 2025-10-27].
Anita Dąbrowicz-Tlałka, Hanna Guze i Magdalena Musielak, Jednowymiarowa zmienna losowa, Open AGH – Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie, epodreczniki.open.agh.edu.pl [dostęp 2025-10-12].

[1] losowa zmienna, [w:] Encyklopedia PWN [online], Wydawnictwo Naukowe PWN [dostęp 2026-03-08] [zarchiwizowane 2022-07-06] .

[CITEREFKubikKrupowicz1982125-127-2] Kubik i Krupowicz 1982 ↓, s. 125-127.

[CITEREFKrysicki_i_inni199848-3] Krysicki i inni 1998 ↓, s. 48.

[CITEREFKubikKrupowicz1982125-4] Kubik i Krupowicz 1982 ↓, s. 125.

[CITEREFKubikKrupowicz1982140-5] Kubik i Krupowicz 1982 ↓, s. 140.

[6] JacekJ. Koronacki JacekJ., JanJ. Mielniczuk JanJ., Statystyka dla studentów kierunków technicznych i przyrodniczych, Warszawa: Wydawnictwa Naukowo-Techniczne, 2009, s. 117, ISBN 978-83-204-3242-8 (pol.).

[CITEREFKubikKrupowicz1982137-7] Kubik i Krupowicz 1982 ↓, s. 137.

[CITEREFKubikKrupowicz1982138-139-8] Kubik i Krupowicz 1982 ↓, s. 138-139.

[CITEREFKrysicki_i_inni199862-9] Krysicki i inni 1998 ↓, s. 62.

[CITEREFKubikKrupowicz1982138-10] Kubik i Krupowicz 1982 ↓, s. 138.

[CITEREFKrysicki_i_inni199863-64-11] Krysicki i inni 1998 ↓, s. 63-64.

[CITEREFKubikKrupowicz198230-12] Kubik i Krupowicz 1982 ↓, s. 30.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

Zmienna losowa 📖 Wikipedia

Spis treści

Oznaczenia

Definicja formalna zmiennej losowej rzeczywistej

Przykład (model o ograniczonej informacji)

Zmienne losowe w przestrzeniach rzeczywistych $\mathbb {R} ^{n}$

Przykłady

Standaryzowana zmienna losowa

Funkcje zmiennych losowych

Definicja funkcji zmiennej losowej^[7]

Przykłady funkcji zmiennych losowych

Przykład 1: Kwadrat zmiennej losowej obliczony metodą dystrybuanty.

cd. Przykład 1: Kwadrat zmiennej losowej normalnej

Przykład 2

Przykład 3 Kwadrat zmiennej losowej, metoda gęstości.

Przykład 4

Przykład 5 Funkcja sinus zmiennej losowej^[11]

Funkcja zmiennych losowych - symulacja numeryczna

Uogólnienia

Przykład^[12]

Zobacz też

Przypisy

Bibliografia

Linki zewnętrzne

📚 Artikel Terkait di Wikipedia

Łączny rozkład prawdopodobieństwa

DBSCAN

Szpak (zwyczajny)

Funkcja logistyczna

Miasto

Choroba Alzheimera

Obszar metropolitalny

Apolipoproteina A-I

Zmienna losowa 📖 Wikipedia

Oznaczenia

Definicja formalna zmiennej losowej rzeczywistej

Przykład (model o ograniczonej informacji)

Zmienne losowe w przestrzeniach rzeczywistych R n {\displaystyle \mathbb {R} ^{n}}

Przykłady

Standaryzowana zmienna losowa

Funkcje zmiennych losowych

Definicja funkcji zmiennej losowej[7]

Przykłady funkcji zmiennych losowych

Przykład 1: Kwadrat zmiennej losowej obliczony metodą dystrybuanty.

cd. Przykład 1: Kwadrat zmiennej losowej normalnej

Przykład 2

Przykład 3 Kwadrat zmiennej losowej, metoda gęstości.

Przykład 4

Przykład 5 Funkcja sinus zmiennej losowej[11]

Funkcja zmiennych losowych - symulacja numeryczna

Uogólnienia

Przykład[12]

Zobacz też

Przypisy

Bibliografia

Linki zewnętrzne

📚 Artikel Terkait di Wikipedia

Zmienne losowe w przestrzeniach rzeczywistych $\mathbb {R} ^{n}$

Definicja funkcji zmiennej losowej^[7]

Przykład 5 Funkcja sinus zmiennej losowej^[11]

Przykład^[12]