
Zmienna losowa – funkcja przypisująca liczby wynikom doświadczenia losowego (zdarzeniom elementarnym)[1][2].
To samo doświadczenie losowe może być opisywane przez różne zmienne losowe, zależnie od badanej cechy. Na przykład osobnikom losowanym z pewnej populacji można przypisać liczby wyrażające ich wzrost, wiek, ciężar lub liczbę potomstwa. Można też tym samym wynikom doświadczenia przypisywać liczby na wiele sposobów. Np. w rzucie monetą wypadnięciu orła można przypisać liczbę , a wypadnięciu reszki liczbę ; lub też wypadnięciu orła można przypisać liczbę , a wypadnięciu reszki liczbę , itd. Każdy taki wybór definiuje inną zmienną losową.
W bardziej ogólnych przypadkach wynikom doświadczenia można przypisywać nie jedną liczbę, lecz kilka liczb jednocześnie, tworząc tzw. wektory losowe. Np. w rzucie czterema monetami wynik doświadczenia można opisać uporządkowaną czwórką liczb , gdzie przyjmują wartości lub w zależności od tego, czy na -tej monecie wypadł orzeł czy reszka.
Aby funkcja mogła być traktowana jako zmienna losowa, musi spełniać warunek mierzalności. W przypadku zmiennych losowych określonych na zbiorze liczb rzeczywistych oznacza to, że dla każdego przedziału zbioru liczb rzeczywistych można jednoznacznie podać prawdopodobieństwo zdarzenia, że wartości zmiennej losowej należą do tego przedziału. Ścisła definicja, oparta na teorii miary, podana jest dalej.
Oznaczenia
edytujTradycyjnie zmienne losowe zapisuje się za pomocą wielkich liter z końca alfabetu, np. (odmiennie niż zwykle zapisuje się funkcje); wartości zmiennych losowych (tzw. realizacje) oznacza się małymi literami: , często ze wskaźnikami[3].
Definicja formalna zmiennej losowej rzeczywistej
edytujZmienną losową rzeczywistą na przestrzeni probabilistycznej nazywamy dowolną rzeczywistą funkcję mierzalną tzn. funkcję spełniającą warunek[4]
- dla każdego zbioru borelowskiego
Oznacza to, że dla każdego zbioru wartości (np. dowolny przedział ), jego przeciwobraz musi być zdarzeniem losowym należącym do σ-ciała danego modelu doświadczenia losowego. Dzięki temu każdemu takiemu zbiorowi wartości można jednoznacznie przypisać prawdopodobieństwo wystąpienia.
Mierzalność jest fundamentalnym wymogiem formalnym: gwarantuje ona, że zmienna losowa nie operuje na detalach, których dany model probabilistyczny nie potrafi zmierzyć.
Przykład (model o ograniczonej informacji)
edytujRozważmy rzut symetryczną kostką, gdzie . Załóżmy, że model rozróżnia jedynie kolory ścianek: ścianki z oczkami 1, 2, 3 są zielone, a 4, 5, 6 – czerwone.
- -ciało:
- Zmienna mierzalna (kolor): Funkcja przypisująca wartość 0 zielonym ściankom i 1 ściankom czerwonym jest zmienną losową, ponieważ jej przeciwobrazy (np. ) należą do .
- Zmienna niemierzalna (liczba oczek): Funkcja nie jest zmienną losową w tym modelu. Przeciwobrazem zbioru jest zdarzenie „wypadła szóstka”, które nie należy do (model nie potrafi odróżnić szóstki od czwórki czy piątki).
Zmienne losowe w przestrzeniach rzeczywistych
edytujOdwzorowanie mierzalne określone na przestrzeni o wartościach w przestrzeni wielowymiarowej nazywa się wektorem losowym. Wektor losowy ma postać
gdzie dla są zmiennymi losowymi rzeczywistymi[4].
Przykłady
edytuj
(1) Doświadczenie losowe polegające na rzucie kością do gry. Definiujemy zmienną losową , która przypisuje danemu wynikowi rzutu liczbę wyrzuconych oczek. Zbiór wszystkich możliwych wartości zmiennej losowej ma postać
(2) Doświadczenie losowe polegające na rzucie dwiema kośćmi do gry, np. czarną i białą. Zbiór zdarzeń elementarnych składa się ze zbioru par uporządkowanych, przedstawiających możliwe wyniki rzutu dwu kostek
Definiujemy zmienną losową , która przypisuje danemu wynikowi rzutu parę uporządkowaną liczb przy czym pierwsza liczba pary określa liczbę oczek wyrzuconej na kostce czarnej, a druga na kostce białej. Zbiór wszystkich możliwych wartości zmiennej losowej składa się z 36 par uporządkowanych i ma postać
- ,
co można zapisać skrótowo w postaci
- .
(3) Zmiennymi losowymi są również następujące funkcje:
a) funkcja, która wynikom rzutu przypisuje iloczyn liczby oczek z obu kostek; zbiór zawiera teraz unikalnych wartości
b) funkcja, która wynikom rzutu przypisuje sumę liczby oczek z obu kostek (por. rysunek); zbiór zawiera unikalnych wartości
c) funkcja, która wynikom rzutu przypisuje liczbę oczek z czarnej kostki; zbiór zawiera unikalnych wartości
Powyższe trzy funkcje, pomimo że są odwzorowaniami z tego samego zbioru zbioru zdarzeń elementarnych tego samego doświadczenia losowego, tworzą różne zbiory wartości, będące podzbiorami zbioru liczb naturalnych .
(4) Niech dane będą: σ-ciało zbiorów borelowskich przedziału oraz określona na nim miara Lebesgue’a Każda funkcja ciągła jest zmienną losową.
Standaryzowana zmienna losowa
edytujJeżeli zmienna losowa ma wartość oczekiwaną oraz wariancję , to zmienna losowa
ma wartość oczekiwaną i wariancję równe odpowiednio
- .
Zmienną losową o takich parametrach nazywa się standaryzowaną lub unormowaną[5], zaś samo przekształcenie zmiennej w standaryzowaną zmienną nazywa się standaryzacją[6].
Funkcje zmiennych losowych
edytujDefinicja funkcji zmiennej losowej[7]
edytuj1. Dla danej funkcji losowej o wartościach rzeczywistych definiuje się nową zmienną losową , która jest jej funkcją, w ten sposób, że wartości zmiennej losowej oblicza się jako wynik działania funkcją mierzalną na wartości zmiennej losowej . Dystrybuanta zmiennej jest wtedy dana wzorem:
gdzie .
2. Jeśli funkcja jest odwracalna, tj. istnieje , gdzie jest funkcją odwrotną do i jest monotoniczna (czyli jest albo rosnąca albo malejąca), to powyższy wzór można zapisać bardziej szczegółowo
3. Jeżeli funkcja jest nie tylko odwracalna, ale i różniczkowalna w swojej dziedzinie, to wzór na zależność między funkcjami gęstości prawdopodobieństwa wyprowadza się, różniczkując obie strony powyższego wyrażenia względem , tj.[8]
4. Jeżeli funkcja nie jest odwracalna, ale każda wartość ma co najwyżej przeliczalną liczbę przeciwobrazów (tzn. istnieje skończona lub przeliczalnie nieskończona liczba wartości takich, że ), to poprzednią zależność między funkcjami gęstości prawdopodobieństwa można uogólnić do postaci
przy czym sumowanie obejmuje wszystkie wartości takie że ; liczba składników w tej sumie nie jest stała, zależy od wartości ; dla ustalonego liczba jest liczbą rozwiązań równania [9].
Uwaga: Wzory na gęstości nie wymagają, aby funkcja była rosnąca.
Przykłady funkcji zmiennych losowych
edytujPrzykład 1: Kwadrat zmiennej losowej obliczony metodą dystrybuanty.
edytujNiech będzie zmienną losową o wartościach rzeczywistych i niech . Wtedy mamy[10]
1) Jeżeli , to , więc
2) Jeżeli , to
więc
cd. Przykład 1: Kwadrat zmiennej losowej normalnej
edytujNiech ma standardowy rozkład normalny . Dystrybuanta zmiennej dla wynosi
gdzie oznacza dystrybuantę standardowego rozkładu normalnego.
Korzystając z własności dostajemy
Mamy też
Różniczkując dystrybuantę względem otrzymujemy gęstość
gdzie
jest gęstością rozkładu normalnego standardowego.
Po podstawieniu otrzymujemy
Jest to gęstość rozkładu chi-kwadrat z jednym stopniem swobody, czyli
Przykład 2
edytujZałóżmy, że jest zmienną losową o funkcji dystrybuanty
gdzie jest stałym parametrem. Rozważmy zmienną losową Wówczas
Ostatnie wyrażenie można obliczyć na podstawie dystrybuanty zmiennej :
Po uproszczeniu ostatecznie otrzymamy:
Funkcja ta jest dystrybuantą rozkładu wykładniczego.
Przykład 3 Kwadrat zmiennej losowej, metoda gęstości.
edytujZałóżmy, że jest zmienną losową o standardowym rozkładzie normalnym, której gęstość ma postać:
Rozważmy zmienną losową . Jej gęstość możemy obliczyć, stosując podany wyżej wzór na zamianę zmiennych:
W tym przypadku funkcja nie jest monotoniczna, ponieważ każda wartość ma dwie odpowiadające jej wartości (jedną dodatnią i jedną ujemną). Jednak ze względu na symetrię obie połowy ulegną identycznej transformacji, tj.
Odwrotnością funkcji jest funkcja
- ,
a jej pochodna ma postać
Stąd mamy:
Funkcja ta jest gęstością prawdopodobieństwa rozkładu chi-kwadrat o jednym stopniu swobody.
Przykład 4
edytujZałóżmy, że jest zmienną losową o rozkładzie normalnym, której gęstość wynosi:
Rozważmy zmienną losową Gęstość możemy obliczyć, stosując powyższy wzór na zamianę zmiennych:
W tym przypadku zmiana nie jest monotoniczna, ponieważ każda wartość ma dwie odpowiadające jej wartości (jedną dodatnią i jedną ujemną). W odróżnieniu od poprzedniego przykładu, w tym przypadku nie ma jednak symetrii i musimy obliczyć dwa odrębne wyrażenia:
Transformacja odwrotna wynosi
a jej pochodna wynosi
Wówczas
Funkcja ta jest gęstością prawdopodobieństwa niecentralnego rozkładu chi-kwadrat o jednym stopniu swobody.
Przykład 5 Funkcja sinus zmiennej losowej[11]
edytuj
Załóżmy, że jest zmienną losową o rozkładzie jednostajnym ciągłym w przedziale , a zmienna losowa dana jest zależnością funkcyjną .
Aby wyznaczyć gęstość zmiennej dzielimy przedział na przedziały , , w których funkcja jest ściśle monotoniczna i wyznaczamy w nich funkcje odwrotne:
(1) dla funkcją odwrotną do jest dla jej pochodna ;
(2) dla funkcja przyjmuje wartości identyczne jak funkcja dla ; skąd oraz dla .
Zmienna losowa ma rozkład o gęstości
Stąd gęstość zmiennej losowej jest określona wzorem
Funkcja zmiennych losowych - symulacja numeryczna
edytuj
Poniżej pokazano kod programu w Python, który realizuje numerycznie sumę kwadratów funkcję zmiennych losowych , gdzie są niezależnymi zmiennymi o standardowym rozkładzie normalnym . Wynik symulacji przedstawiono na histogramie, który został uzyskany na podstawie 100 000 symulacji metodą Monte Carlo; linia ciągła na wykresie przedstawia teoretyczną funkcję gęstości rozkładu chi-kwadrat z 5 stopniami swobody, . Zgodność histogramu z krzywą teoretyczną ilustruje fakt, iż rozkład chi-kwadrat o stopniach swobody jest zdefiniowany jako suma kwadratów niezależnych zmiennych losowych normalnych.
Na końcu programu obliczane są wartości teoretyczne i z symulacji średniej i wariancji zmiennej losowej .
Najważniejsze do obliczania funkcji zmiennych losowych są trzy linie kodu:
(1) Instrukcja
X = np.random.normal(0, 1, (n, k))
tworzy macierz o wierszach i kolumnach, zawierającą liczby losowe o rozkładzie normalnym , np.
(2) Instrukcja
Y = np.sum(X**2, axis=1)
najpierw oblicza kwadraty poszczególnych elementów macierzy
a następnie sumuje je wierszami (parametr axis = 1):
i ostatecznie zapisuje w postaci wiersza o elementach .
(3) Instrukcja
plt.hist(Y, bins=60, density=True, alpha=0.6, label='simulation')
tworzy histogram na podstawie zawartości , grupując uzyskane z symulacji dane w przedziałach oraz normuje całość do 1 (argument density = True). Dzięki temu pole powierzchni histogramu wynosi 1, co pozwala porównywać histogram z teoretyczną funkcją gęstości. Przy czym wysokość słupków histogramu jest obliczana ze wzoru:
gdzie:
- – szerokość pojedynczego przedziału, gdzie – wartość maksymalna zmiennej losowej uzyskana w symulacji,
- – liczba wszystkich symulacji,
- – liczba wyników symulacji zawarta w przedziale liczbowym .
W linii 7 kodu można zmieniać stałą , która określa liczbę sumowanych kwadratów rozkładów normalnych Im większe , tym rozkład staje się coraz bardziej symetryczny i dla dużych zaczyna przypominać rozkład normalny.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import chi2
# Parametry
n = 100_000 # liczba symulacji
k = 5 # liczba składników sumy kwadratów zmienych normalnych
# Generowanie n wektorów po k zmiennych N(0,1)
X = np.random.normal(0, 1, (n, k))
# Suma kwadratów
Y = np.sum(X**2, axis=1)
# Histogram symulacji
plt.hist(Y, bins=60, density=True, alpha=0.6, label='simulation')
# Krzywa teoretyczna
x = np.linspace(0, np.max(Y), 1000)
y = chi2.pdf(x, df=k)
plt.plot(x,y,linewidth=2,label='theory')
plt.title(f'χ²({k})' , fontsize=20)
plt.xlabel(rf'$\sum_{{i=1}}^{{{k}}} X_i^2$', fontsize=20)
plt.ylabel("density function", fontsize=18)
plt.xticks(fontsize=16) # liczby na osi x
plt.yticks(np.arange(0, 0.16, 0.05), fontsize=16) # liczby na osi y
plt.legend()
plt.grid(True)
plt.savefig("Chi-2 simulation and theory.svg", format="svg", bbox_inches="tight")
plt.show()
print(f"Średnia symulowana = {np.mean(Y):.4f}")
print( "Średnia teoretyczna =", k)
print(f"Wariancja symulowana = {np.var(Y):.4f}")
print( "Wariancja teoretyczna =", 2*k)
Uogólnienia
edytujRozważa się także zmienne losowe o wartościach w dowolnych, abstrakcyjnych przestrzeniach mierzalnych, np. w przestrzeniach funkcyjnych[12].
Przykład[12]
edytujI. Przestrzeń zdarzeń elementarnych tworzonych przez funkcje ciągłe
Niech przestrzenią zdarzeń elementarnych będzie zbiór wszystkich funkcji ciągłych określonych na przedziale . Niech oznacza zdarzenie składające się z tych zdarzeń elementarnych, a więc funkcji ciągłych, które w ustalonym punkcie odcinka mają wartość mniejszą od ustalonej liczby :
Niech oznacza zdarzenie składające się z funkcji ciągłych, które w ustalonym punkcie odcinka mają wartość mniejszą od ustalonej liczby :
Koniunkcją zdarzeń i jest zdarzenie składające się z funkcji ciągłych, które w obu punktach i odcinka mają wartość mniejszą od ustalonej liczby :
Podany tu zbiór jest przestrzenią zdarzeń elementarnych doświadczenia losowego polegającego np. na zapisie na termografie zmieniającej się temperatury w ciągu doby. Wynikiem (zdarzeniem elementarnym) takiego doświadczenia jest wykres temperatury, czyli funkcja. Jeśli to sens zdarzeń jest następujący: zdarzenie polega na tym, że temperatura o godzinie spadła poniżej zera, zdarzenie polega na tym, że temperatura o godzinie spadła poniżej zera; koniunkcja tych zdarzeń oznacza zdarzenie, że w obu godzinach temperatura była poniżej zera.
II. Zmienne losowe
Zmienną losową na tej przestrzeni jest każda funkcja przypisująca przebiegowi temperatury konkretną liczbę rzeczywistą. Np.
(a) Temperatura w wybranej chwili (zmienna losowa punktowa)
Za pomocą tej zmiennej losowej zdarzenie można zapisać w klasyczny sposób za pomocą wyrażenia lub krócej .
(b) Temperatura maksymalna w ciągu doby
(c) Temperatura minimalna w ciągu doby
(d) Średnia temperatura dobowa (zdefiniowana za pomocą całki)
(e) Łączny czas trwania mrozu w ciągu doby (gdzie to funkcja wskaźnikowa)
Dzięki temu formalizmowi badanie procesu ciągłego sprowadza się do analizy zmiennych losowych i ich rozkładów.
Zobacz też
edytuj- ciągły rozkład prawdopodobieństwa
- dyskretny rozkład prawdopodobieństwa
- dystrybuanta
- gęstość zmiennej losowej
- rozkład zmiennej losowej
- wariancja
- wartość oczekiwana
- zależność zmiennych losowych
- Paradoksy Zenona z Elei
- Paradoks petersburski
- Teoria oczekiwanej użyteczności
- Teoria użyteczności
Przypisy
edytuj- ↑ losowa zmienna, [w:] Encyklopedia PWN [online], Wydawnictwo Naukowe PWN [dostęp 2026-03-08] [zarchiwizowane 2022-07-06].
- ↑ Kubik i Krupowicz 1982 ↓, s. 125-127.
- ↑ Krysicki i inni 1998 ↓, s. 48.
- ↑ a b Kubik i Krupowicz 1982 ↓, s. 125.
- ↑ Kubik i Krupowicz 1982 ↓, s. 140.
- ↑ Jacek Koronacki, Jan Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, Warszawa: Wydawnictwa Naukowo-Techniczne, 2009, s. 117, ISBN 978-83-204-3242-8 (pol.).
- ↑ Kubik i Krupowicz 1982 ↓, s. 137.
- ↑ Kubik i Krupowicz 1982 ↓, s. 138-139.
- ↑ Krysicki i inni 1998 ↓, s. 62.
- ↑ Kubik i Krupowicz 1982 ↓, s. 138.
- ↑ Krysicki i inni 1998 ↓, s. 63-64.
- ↑ a b Kubik i Krupowicz 1982 ↓, s. 30.
Bibliografia
edytuj- Jacek Jakubowski, Rafał Sztencel: Wstęp do teorii prawdopodobieństwa. Warszawa: Script, 2004, s. 59. ISBN 83-89716-01-1.
- W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski, Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach, Wydawnictwo Naukowe PWN, Warszawa 1998, cz. I Rachunek prawdopodobieństwa, str. 58-66.
- Lech T. Kubik, Andrzej Krupowicz, Wprowadzenie do rachunku prawdopodobieństwa i jego zastosowań, Warszawa: Państwowe Wydawnictwo Naukowe, 1982, str. 125-167.
Linki zewnętrzne
edytuj
Piotr Stachura, Co to jest zmienna losowa, kanał Khan Academy na YouTube, 26 maja 2015 [dostęp 2025-10-27].
Anita Dąbrowicz-Tlałka, Hanna Guze i Magdalena Musielak, Jednowymiarowa zmienna losowa, Open AGH – Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie, epodreczniki.open.agh.edu.pl [dostęp 2025-10-12].