Zmienna losowa jest funkcją, która przypisuje liczbę każdemu możliwemu wynikowi doświadczenia losowego. Tu: w rzucie monetą orłowi przypisuje +1, reszce -1. Następnie wartościom zmiennej losowej przypisuje się prawdopodobieństwa i w ten sposób określa się funkcję masy prawdopodobieństwa.

Zmienna losowa – funkcja przypisująca liczby wynikom doświadczenia losowego (zdarzeniom elementarnym)[1][2].

To samo doświadczenie losowe może być opisywane przez różne zmienne losowe, zależnie od badanej cechy. Na przykład osobnikom losowanym z pewnej populacji można przypisać liczby wyrażające ich wzrost, wiek, ciężar lub liczbę potomstwa. Można też tym samym wynikom doświadczenia przypisywać liczby na wiele sposobów. Np. w rzucie monetą wypadnięciu orła można przypisać liczbę , a wypadnięciu reszki liczbę ; lub też wypadnięciu orła można przypisać liczbę , a wypadnięciu reszki liczbę , itd. Każdy taki wybór definiuje inną zmienną losową.

W bardziej ogólnych przypadkach wynikom doświadczenia można przypisywać nie jedną liczbę, lecz kilka liczb jednocześnie, tworząc tzw. wektory losowe. Np. w rzucie czterema monetami wynik doświadczenia można opisać uporządkowaną czwórką liczb , gdzie przyjmują wartości lub w zależności od tego, czy na -tej monecie wypadł orzeł czy reszka.

Aby funkcja mogła być traktowana jako zmienna losowa, musi spełniać warunek mierzalności. W przypadku zmiennych losowych określonych na zbiorze liczb rzeczywistych oznacza to, że dla każdego przedziału zbioru liczb rzeczywistych można jednoznacznie podać prawdopodobieństwo zdarzenia, że wartości zmiennej losowej należą do tego przedziału. Ścisła definicja, oparta na teorii miary, podana jest dalej.

Oznaczenia

edytuj

Tradycyjnie zmienne losowe zapisuje się za pomocą wielkich liter z końca alfabetu, np. (odmiennie niż zwykle zapisuje się funkcje); wartości zmiennych losowych (tzw. realizacje) oznacza się małymi literami: , często ze wskaźnikami[3].

Definicja formalna zmiennej losowej rzeczywistej

edytuj

Zmienną losową rzeczywistą na przestrzeni probabilistycznej nazywamy dowolną rzeczywistą funkcję mierzalną tzn. funkcję spełniającą warunek[4]

dla każdego zbioru borelowskiego

Oznacza to, że dla każdego zbioru wartości (np. dowolny przedział ), jego przeciwobraz musi być zdarzeniem losowym należącym do σ-ciała danego modelu doświadczenia losowego. Dzięki temu każdemu takiemu zbiorowi wartości można jednoznacznie przypisać prawdopodobieństwo wystąpienia.

Mierzalność jest fundamentalnym wymogiem formalnym: gwarantuje ona, że zmienna losowa nie operuje na detalach, których dany model probabilistyczny nie potrafi zmierzyć.

Przykład (model o ograniczonej informacji)

edytuj

Rozważmy rzut symetryczną kostką, gdzie . Załóżmy, że model rozróżnia jedynie kolory ścianek: ścianki z oczkami 1, 2, 3 są zielone, a 4, 5, 6 – czerwone.

  • -ciało:
  • Zmienna mierzalna (kolor): Funkcja ​ przypisująca wartość 0 zielonym ściankom i 1 ściankom czerwonym jest zmienną losową, ponieważ jej przeciwobrazy (np. ) należą do .
  • Zmienna niemierzalna (liczba oczek): Funkcja nie jest zmienną losową w tym modelu. Przeciwobrazem zbioru jest zdarzenie „wypadła szóstka”, które nie należy do (model nie potrafi odróżnić szóstki od czwórki czy piątki).

Zmienne losowe w przestrzeniach rzeczywistych

edytuj

Odwzorowanie mierzalne określone na przestrzeni o wartościach w przestrzeni wielowymiarowej nazywa się wektorem losowym. Wektor losowy ma postać

gdzie dla są zmiennymi losowymi rzeczywistymi[4].

Przykłady

edytuj
W doświadczeniu losowym polegającym na rzucie dwiema kośćmi do gry (białą i czarną) przestrzenią zdarzeń elementarnych jest zbiór możliwych par wyników rzutu. Obrazek przedstawia rozkład prawdopodobieństwa zmiennej losowej, która każdej możliwej parze wyrzuconych kostek przypisuje sumę liczb ich oczek. Prawdopodobieństwa odpowiadające danej sumie S są równe wysokościom słupków.

(1) Doświadczenie losowe polegające na rzucie kością do gry. Definiujemy zmienną losową , która przypisuje danemu wynikowi rzutu liczbę wyrzuconych oczek. Zbiór wszystkich możliwych wartości zmiennej losowej ma postać

(2) Doświadczenie losowe polegające na rzucie dwiema kośćmi do gry, np. czarną i białą. Zbiór zdarzeń elementarnych składa się ze zbioru par uporządkowanych, przedstawiających możliwe wyniki rzutu dwu kostek

Definiujemy zmienną losową , która przypisuje danemu wynikowi rzutu parę uporządkowaną liczb przy czym pierwsza liczba pary określa liczbę oczek wyrzuconej na kostce czarnej, a druga na kostce białej. Zbiór wszystkich możliwych wartości zmiennej losowej składa się z 36 par uporządkowanych i ma postać

,

co można zapisać skrótowo w postaci

.

(3) Zmiennymi losowymi są również następujące funkcje:

a) funkcja, która wynikom rzutu przypisuje iloczyn liczby oczek z obu kostek; zbiór zawiera teraz unikalnych wartości

b) funkcja, która wynikom rzutu przypisuje sumę liczby oczek z obu kostek (por. rysunek); zbiór zawiera unikalnych wartości

c) funkcja, która wynikom rzutu przypisuje liczbę oczek z czarnej kostki; zbiór zawiera unikalnych wartości

Powyższe trzy funkcje, pomimo że są odwzorowaniami z tego samego zbioru zbioru zdarzeń elementarnych tego samego doświadczenia losowego, tworzą różne zbiory wartości, będące podzbiorami zbioru liczb naturalnych .

(4) Niech dane będą: σ-ciało zbiorów borelowskich przedziału oraz określona na nim miara Lebesgue’a Każda funkcja ciągła jest zmienną losową.

Standaryzowana zmienna losowa

edytuj

Jeżeli zmienna losowa ma wartość oczekiwaną oraz wariancję , to zmienna losowa

ma wartość oczekiwaną i wariancję równe odpowiednio

.

Zmienną losową o takich parametrach nazywa się standaryzowaną lub unormowaną[5], zaś samo przekształcenie zmiennej w standaryzowaną zmienną nazywa się standaryzacją[6].

Funkcje zmiennych losowych

edytuj

Definicja funkcji zmiennej losowej[7]

edytuj

1. Dla danej funkcji losowej o wartościach rzeczywistych definiuje się nową zmienną losową , która jest jej funkcją, w ten sposób, że wartości zmiennej losowej oblicza się jako wynik działania funkcją mierzalną na wartości zmiennej losowej . Dystrybuanta zmiennej jest wtedy dana wzorem:

gdzie .

2. Jeśli funkcja jest odwracalna, tj. istnieje , gdzie jest funkcją odwrotną do i jest monotoniczna (czyli jest albo rosnąca albo malejąca), to powyższy wzór można zapisać bardziej szczegółowo

3. Jeżeli funkcja jest nie tylko odwracalna, ale i różniczkowalna w swojej dziedzinie, to wzór na zależność między funkcjami gęstości prawdopodobieństwa wyprowadza się, różniczkując obie strony powyższego wyrażenia względem , tj.[8]

4. Jeżeli funkcja nie jest odwracalna, ale każda wartość ma co najwyżej przeliczalną liczbę przeciwobrazów (tzn. istnieje skończona lub przeliczalnie nieskończona liczba wartości takich, że ), to poprzednią zależność między funkcjami gęstości prawdopodobieństwa można uogólnić do postaci

przy czym sumowanie obejmuje wszystkie wartości takie że ; liczba składników w tej sumie nie jest stała, zależy od wartości ; dla ustalonego liczba jest liczbą rozwiązań równania [9].

Uwaga: Wzory na gęstości nie wymagają, aby funkcja była rosnąca.

Przykłady funkcji zmiennych losowych

edytuj

Przykład 1: Kwadrat zmiennej losowej obliczony metodą dystrybuanty.

edytuj

Niech będzie zmienną losową o wartościach rzeczywistych i niech . Wtedy mamy[10]

1) Jeżeli , to , więc

2) Jeżeli , to

więc

cd. Przykład 1: Kwadrat zmiennej losowej normalnej

edytuj

Niech ma standardowy rozkład normalny . Dystrybuanta zmiennej dla wynosi

gdzie oznacza dystrybuantę standardowego rozkładu normalnego.

Korzystając z własności dostajemy

Mamy też

Różniczkując dystrybuantę względem otrzymujemy gęstość

gdzie

jest gęstością rozkładu normalnego standardowego.

Po podstawieniu otrzymujemy

Jest to gęstość rozkładu chi-kwadrat z jednym stopniem swobody, czyli

Przykład 2

edytuj

Załóżmy, że jest zmienną losową o funkcji dystrybuanty

gdzie jest stałym parametrem. Rozważmy zmienną losową Wówczas

Ostatnie wyrażenie można obliczyć na podstawie dystrybuanty zmiennej :

Po uproszczeniu ostatecznie otrzymamy:

Funkcja ta jest dystrybuantą rozkładu wykładniczego.

Przykład 3 Kwadrat zmiennej losowej, metoda gęstości.

edytuj

Załóżmy, że jest zmienną losową o standardowym rozkładzie normalnym, której gęstość ma postać:

Rozważmy zmienną losową . Jej gęstość możemy obliczyć, stosując podany wyżej wzór na zamianę zmiennych:

W tym przypadku funkcja nie jest monotoniczna, ponieważ każda wartość ma dwie odpowiadające jej wartości (jedną dodatnią i jedną ujemną). Jednak ze względu na symetrię obie połowy ulegną identycznej transformacji, tj.

Odwrotnością funkcji jest funkcja

,

a jej pochodna ma postać

Stąd mamy:

Funkcja ta jest gęstością prawdopodobieństwa rozkładu chi-kwadrat o jednym stopniu swobody.

Przykład 4

edytuj

Załóżmy, że jest zmienną losową o rozkładzie normalnym, której gęstość wynosi:

Rozważmy zmienną losową Gęstość możemy obliczyć, stosując powyższy wzór na zamianę zmiennych:

W tym przypadku zmiana nie jest monotoniczna, ponieważ każda wartość ma dwie odpowiadające jej wartości (jedną dodatnią i jedną ujemną). W odróżnieniu od poprzedniego przykładu, w tym przypadku nie ma jednak symetrii i musimy obliczyć dwa odrębne wyrażenia:

Transformacja odwrotna wynosi

a jej pochodna wynosi

Wówczas

Funkcja ta jest gęstością prawdopodobieństwa niecentralnego rozkładu chi-kwadrat(inne języki) o jednym stopniu swobody.

Przykład 5 Funkcja sinus zmiennej losowej[11]

edytuj
Wykres funkcji dla .

Załóżmy, że jest zmienną losową o rozkładzie jednostajnym ciągłym w przedziale , a zmienna losowa dana jest zależnością funkcyjną .

Aby wyznaczyć gęstość zmiennej dzielimy przedział na przedziały , , w których funkcja jest ściśle monotoniczna i wyznaczamy w nich funkcje odwrotne:

(1) dla funkcją odwrotną do jest dla jej pochodna ;

(2) dla funkcja przyjmuje wartości identyczne jak funkcja dla ; skąd oraz dla .

Zmienna losowa ma rozkład o gęstości

Stąd gęstość zmiennej losowej jest określona wzorem

Funkcja zmiennych losowych - symulacja numeryczna

edytuj
Przykład realizacji funkcji zmiennych losowych: histogram przedstawia rozkład zmiennej , gdzie są zmiennymi losowymi o rozkładach normalnych. Rozkład jest zgodny z rozkładem chi-kwadrat z 5 stopniami swobody.

Poniżej pokazano kod programu w Python, który realizuje numerycznie sumę kwadratów funkcję zmiennych losowych , gdzie są niezależnymi zmiennymi o standardowym rozkładzie normalnym . Wynik symulacji przedstawiono na histogramie, który został uzyskany na podstawie 100 000 symulacji metodą Monte Carlo; linia ciągła na wykresie przedstawia teoretyczną funkcję gęstości rozkładu chi-kwadrat z 5 stopniami swobody, . Zgodność histogramu z krzywą teoretyczną ilustruje fakt, iż rozkład chi-kwadrat o stopniach swobody jest zdefiniowany jako suma kwadratów niezależnych zmiennych losowych normalnych.

Na końcu programu obliczane są wartości teoretyczne i z symulacji średniej i wariancji zmiennej losowej .

Najważniejsze do obliczania funkcji zmiennych losowych są trzy linie kodu:

(1) Instrukcja

X = np.random.normal(0, 1, (n, k))

tworzy macierz o wierszach i kolumnach, zawierającą liczby losowe o rozkładzie normalnym , np.

(2) Instrukcja

Y = np.sum(X**2, axis=1)

najpierw oblicza kwadraty poszczególnych elementów macierzy

a następnie sumuje je wierszami (parametr axis = 1):

i ostatecznie zapisuje w postaci wiersza o elementach .

(3) Instrukcja

plt.hist(Y, bins=60, density=True, alpha=0.6, label='simulation')

tworzy histogram na podstawie zawartości , grupując uzyskane z symulacji dane w przedziałach oraz normuje całość do 1 (argument density = True). Dzięki temu pole powierzchni histogramu wynosi 1, co pozwala porównywać histogram z teoretyczną funkcją gęstości. Przy czym wysokość słupków histogramu jest obliczana ze wzoru:

gdzie:

  • – szerokość pojedynczego przedziału, gdzie – wartość maksymalna zmiennej losowej uzyskana w symulacji,
  • – liczba wszystkich symulacji,
  • – liczba wyników symulacji zawarta w przedziale liczbowym .

W linii 7 kodu można zmieniać stałą , która określa liczbę sumowanych kwadratów rozkładów normalnych Im większe , tym rozkład staje się coraz bardziej symetryczny i dla dużych zaczyna przypominać rozkład normalny.

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import chi2

# Parametry
n = 100_000  # liczba symulacji
k = 5        # liczba składników sumy kwadratów zmienych normalnych

# Generowanie n wektorów po k zmiennych N(0,1)
X = np.random.normal(0, 1, (n, k))

# Suma kwadratów
Y = np.sum(X**2, axis=1)

# Histogram symulacji
plt.hist(Y, bins=60, density=True, alpha=0.6, label='simulation')

# Krzywa teoretyczna
x = np.linspace(0, np.max(Y), 1000)
y = chi2.pdf(x, df=k)
plt.plot(x,y,linewidth=2,label='theory')
plt.title(f'χ²({k})' , fontsize=20)
plt.xlabel(rf'$\sum_{{i=1}}^{{{k}}} X_i^2$', fontsize=20)
plt.ylabel("density function", fontsize=18)
plt.xticks(fontsize=16)    # liczby na osi x
plt.yticks(np.arange(0, 0.16, 0.05), fontsize=16) # liczby na osi y
plt.legend()
plt.grid(True)
plt.savefig("Chi-2 simulation and theory.svg", format="svg", bbox_inches="tight")
plt.show()

print(f"Średnia symulowana    = {np.mean(Y):.4f}")
print( "Średnia teoretyczna   =", k)
print(f"Wariancja symulowana  = {np.var(Y):.4f}")
print( "Wariancja teoretyczna =", 2*k)

Uogólnienia

edytuj

Rozważa się także zmienne losowe o wartościach w dowolnych, abstrakcyjnych przestrzeniach mierzalnych, np. w przestrzeniach funkcyjnych[12].

Przykład[12]

edytuj

I. Przestrzeń zdarzeń elementarnych tworzonych przez funkcje ciągłe

Niech przestrzenią zdarzeń elementarnych będzie zbiór wszystkich funkcji ciągłych określonych na przedziale . Niech oznacza zdarzenie składające się z tych zdarzeń elementarnych, a więc funkcji ciągłych, które w ustalonym punkcie odcinka mają wartość mniejszą od ustalonej liczby :

Niech oznacza zdarzenie składające się z funkcji ciągłych, które w ustalonym punkcie odcinka mają wartość mniejszą od ustalonej liczby :

Koniunkcją zdarzeń i jest zdarzenie składające się z funkcji ciągłych, które w obu punktach i odcinka mają wartość mniejszą od ustalonej liczby :

Podany tu zbiór jest przestrzenią zdarzeń elementarnych doświadczenia losowego polegającego np. na zapisie na termografie zmieniającej się temperatury w ciągu doby. Wynikiem (zdarzeniem elementarnym) takiego doświadczenia jest wykres temperatury, czyli funkcja. Jeśli to sens zdarzeń jest następujący: zdarzenie polega na tym, że temperatura o godzinie spadła poniżej zera, zdarzenie polega na tym, że temperatura o godzinie spadła poniżej zera; koniunkcja tych zdarzeń oznacza zdarzenie, że w obu godzinach temperatura była poniżej zera.

II. Zmienne losowe

Zmienną losową na tej przestrzeni jest każda funkcja przypisująca przebiegowi temperatury konkretną liczbę rzeczywistą. Np.

(a) Temperatura w wybranej chwili (zmienna losowa punktowa)

Za pomocą tej zmiennej losowej zdarzenie można zapisać w klasyczny sposób za pomocą wyrażenia lub krócej .

(b) Temperatura maksymalna w ciągu doby

(c) Temperatura minimalna w ciągu doby

(d) Średnia temperatura dobowa (zdefiniowana za pomocą całki)

(e) Łączny czas trwania mrozu w ciągu doby (gdzie to funkcja wskaźnikowa)

Dzięki temu formalizmowi badanie procesu ciągłego sprowadza się do analizy zmiennych losowych i ich rozkładów.

Zobacz też

edytuj

Przypisy

edytuj
  1. losowa zmienna, [w:] Encyklopedia PWN [online], Wydawnictwo Naukowe PWN [dostęp 2026-03-08] [zarchiwizowane 2022-07-06].
  2. Kubik i Krupowicz 1982 ↓, s. 125-127.
  3. Krysicki i inni 1998 ↓, s. 48.
  4. a b Kubik i Krupowicz 1982 ↓, s. 125.
  5. Kubik i Krupowicz 1982 ↓, s. 140.
  6. Jacek Koronacki, Jan Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, Warszawa: Wydawnictwa Naukowo-Techniczne, 2009, s. 117, ISBN 978-83-204-3242-8 (pol.).
  7. Kubik i Krupowicz 1982 ↓, s. 137.
  8. Kubik i Krupowicz 1982 ↓, s. 138-139.
  9. Krysicki i inni 1998 ↓, s. 62.
  10. Kubik i Krupowicz 1982 ↓, s. 138.
  11. Krysicki i inni 1998 ↓, s. 63-64.
  12. a b Kubik i Krupowicz 1982 ↓, s. 30.

Bibliografia

edytuj
  • Jacek Jakubowski, Rafał Sztencel: Wstęp do teorii prawdopodobieństwa. Warszawa: Script, 2004, s. 59. ISBN 83-89716-01-1.
  • W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski, Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach, Wydawnictwo Naukowe PWN, Warszawa 1998, cz. I Rachunek prawdopodobieństwa, str. 58-66.
  • Lech T. Kubik, Andrzej Krupowicz, Wprowadzenie do rachunku prawdopodobieństwa i jego zastosowań, Warszawa: Państwowe Wydawnictwo Naukowe, 1982, str. 125-167.

Linki zewnętrzne

edytuj

📚 Artikel Terkait di Wikipedia

Łączny rozkład prawdopodobieństwa

ISBN 978-1-55608-010-4. Joint continuous density function Eric W.E.W. Weisstein Eric W.E.W., Joint Distribution Function, [w:] MathWorld, Wolfram Research [dostęp

DBSCAN

DBSCAN (od ang. Density-Based Spatial Clustering of Applications with Noise) – algorytm grupowania danych (klasteryzacji) oparty na gęstości. Jego pierwsza

Szpak (zwyczajny)

Academy of Sciences”. 94 (16), s. 8618–8621, 1997.  Gwinner, Helga. The function of green plants in nests of European Starlings (Sturnus vulgaris). „Behaviour”

Funkcja logistyczna

[dostęp 2024-06-14] . expit: Inverse logistic link function in locfit: Local Regression, Likelihood and Density Estimation [online], rdrr.io [dostęp 2024-06-14] 

Miasto

of the two functional areas of 1) Core Districts of Capital Function and 2) Urban Function Extended Districts, including eight fully urban districts. The

Choroba Alzheimera

PMID: 18569251.  Frank EM. Effect of Alzheimer’s disease on communication function. „J S C Med Assoc”. 90 (9), s. 417–423, 09 1994. PMID: 7967534.  Volicer

Obszar metropolitalny

inhabited at urban levels of residential density and additional surrounding areas of lower settlement density that are also under the direct influence

Apolipoproteina A-I

(ang.). Emiel P.C. van derE.P.C. Vorst Emiel P.C. van derE.P.C., High-Density Lipoproteins and Apolipoprotein A1, „Sub-Cellular Biochemistry”, 94, 2020