Rozkład Poissona 📖 Wikipedia

Rozkład Poissona
	Funkcja masy prawdopodobieństwa; ; Na osi poziomej jest k, czyli liczba wystąpień zdarzeń losowych. jest oczekiwaną liczbą wystąpień w zadanym przedziale czasu (lub w zadanym obszarze przestrzeni). Na osi pionowej jest prawdopodobieństwo P wystąpienia k zdarzeń przy danym . Funkcja prawdopodobieństwa jest zdefiniowana wyłącznie dla całkowitych wartości k; linie łączące służą jedynie jako pomoc wizualna.
	Dystrybuanta; ; Na osi poziomej jest k. Dystrybuanta jest nieciągła w punktach odpowiadających całkowitym wartościom k i stała (płaska) pomiędzy nimi, ponieważ zmienna losowa o rozkładzie Poissona przyjmuje wyłącznie wartości całkowite.
Parametry
Nośnik
Funkcja masy prawdopodobieństwa
Dystrybuanta	(gdzie to niekompletna funkcja gamma)
Wartość oczekiwana (średnia)
Mediana
Moda	i gdzie jest całkowite
Wariancja
Współczynnik skośności
Kurtoza nadwyżkowa (eksces)
Entropia	; dla dużych ;
Funkcja tworząca momenty
Funkcja charakterystyczna
Odkrywca	Siméon Denis Poisson; (rozkład pierwszy raz pod tą nazwą wystąpił u H.E. Sopera)

Rozkład Poissona (czytaj [p w a s ɔ n a], także prawo Poissona małych liczb^[1]) – dyskretny rozkład prawdopodobieństwa zmiennej losowej $X$ , która przyjmuje wartości nieujemne całkowite $k=0,1,2,\dots$ i opisuje liczbę zdarzeń zachodzących w ustalonym przedziale czasu lub określonym obszarze przestrzeni^[2]^[3] . Rozkład Poissona jest scharakteryzowany przez jeden dodatni parametr $\lambda$ , który określa wartość oczekiwaną (średnią liczbę zdarzeń) oraz wariancję w danym przedziale^[2]. Model ten opiera się na tzw. postulatach Poissona, zgodnie z którymi liczba zdarzeń w rozłącznych podprzedziałach jest niezależna, a prawdopodobieństwo ich wystąpienia w małym podprzedziale jest proporcjonalne do jego długości^[4].

Rozkład ten znajduje zastosowanie wszędzie tam, gdzie zlicza się wystąpienia zdarzeń w identycznych jednostkach czasu $\Delta t$ , powierzchni ( $\Delta S$ ) lub objętości ( $\Delta V$ ), przy zachowaniu założeń o niezależności i stałej intensywności^[4]. Stosuje się go w szczególności do opisu zdarzeń rzadkich, wykazujących charakterystyczne fluktuacje, których klasycznym przykładem jest rozpad promieniotwórczy jąder atomowych.

Rozkład Poissona można otrzymać jako graniczny przypadek rozkładu dwumianowego przy dużej liczbie prób i małym prawdopodobieństwie sukcesu.

Wraz ze wzrostem parametru $\lambda$ (duża liczba zliczeń), rozkład Poissona wykazuje tendencję do symetrii i staje się zbieżny z rozkładem normalnym.

Rozkład ten został wprowadzony przez Siméona-Denisa Poissona (1781–1840) wraz z jego teorią prawdopodobieństwa w 1838 roku i opublikowany w 1838 roku w pracy Recherches sur la probabilité des jugements en matière criminelle et en matière civile („Badania nad prawdopodobieństwem orzeczeń sądowych w sprawach cywilnych i karnych”)^[5]. W pracy tej analizowano m.in. zmienne losowe opisujące liczbę dyskretnych zdarzeń zachodzących w przedziale czasu o ustalonej długości.

Funkcja masy prawdopodobieństwa

edytuj

Funkcja masy prawdopodobieństwa rozkładu Poissona ma postać^[6]:

p(k,\lambda )={\frac {\lambda ^{k}e^{-\lambda }}{k!}},

gdzie:

$\lambda >0$ – wartość oczekiwana, średnia liczba zdarzeń w danym przedziale czasu lub przestrzeni (liczba rzeczywista dodatnia),
$k$ – liczba zdarzeń w tym przedziale; $k=0,1,2,\dots ,$
$k!$ – silnia liczby $k,$
$e=2{,}71828\dots$ – podstawa logarytmu naturalnego

Oznaczenia

edytuj

Jeżeli zmienna losowa $X$ ma rozkład Poissona z parametrem $\lambda$ , można zastosować zapis symboliczny^[7]:

X\sim \mathrm {Pois} (\lambda )

Testowanie zgodności z rozkładem Poissona

edytuj

Testowanie zgodności z rozkładem Poissona służy zweryfikowaniu hipotezy zerowej zakładającej, że obserwowane dane (zliczenia zdarzeń) pochodzą z populacji o takim właśnie rozkładzie. Najpowszechniej stosowany test chi-kwadrat polega na porównaniu liczebności zaobserwowanych $O_{k}$ z liczebnościami oczekiwanymi $E_{k}$ , wyznaczonymi teoretycznie dla każdej kategorii zliczeń. W przypadku rozkładu Poissona wartości teoretyczne oblicza się mnożąc sumaryczną liczbę obserwowanych zdarzeń przez prawdopodobieństwa rozkładu Poissona.

Klasyczny przykład pomiaru rozkładu Poissona związanego z procesami losowymi zachodzącymi w czasie pokazano poniżej dla zjawiska emisji cząstek $\alpha$ . Przykład rozkładu Poissona dla zjawisk o rozkładzie losowym na małych fragmentach $\Delta S$ powierzchni, na jakie podzielono $1{\text{mm}}^{2}$ obserwowanej zawiesiny komórek drożdży omawia tekst test chi-kwadrat-Przykład 4.

Można również wykorzystać statystykę opartą na indeksie dyspersji, która weryfikuje charakterystyczną dla tego modelu równość średniej i wariancji^[8].

Przykład: Pomiar rozkładu prawdopodobieństwa emisji cząstek $\alpha$

edytuj

Dźwięki licznika Geigera, rejestrującego kolejne cząstki

\alpha

, wskazują na losowość ich emisji

Jeżeli substancja promieniotwórcza emituje cząstki $\alpha$ , to liczba cząstek wpadających do licznika Geigera w ustalonym, krótkim przedziale czasu $\Delta t$ jest losowa i może przybierać różne wartości w kolejnych pomiarach. Jednak powtarzając pomiary okaże się, że częstości zdarzenia polegającego na wpadnięciu k cząstek $\alpha$ do licznika w przedziale czasu $\Delta t$ stabilizują się^[9].

Ernest Rutherford oraz Hans Geiger w 1910 roku wykonali doświadczenie, w którym rejestrowali liczbę cząstek $\alpha$ emitowanych przez substancję promieniotwórczą. Wyniki tego eksperymentu posłużyły za empiryczny dowód na to, że rozpad jądrowy podlega prawom rozkładu Poissona. Badacze rejestrowali liczbę cząstek w $N=2608$ przedziałach czasowych, z których każdy trwał dokładnie $\Delta t=7{,}5$ sekundy. Całkowity czas pomiaru wynosił więc $t=19560s\approx 5{,}4$ godziny. Poniższa tabela zestawia liczby rejestrowanych cząstek $k$ , odpowiadającą im obserwowaną częstość ich wystąpienia $O_{k}$ oraz teoretyczną częstość wystąpienia $E_{k}$ , wynikającą z dopasowania matematycznego do rozkładu Poissona^[3]:

E_{k}=P(X=k,\lambda )\cdot N

Wartości $E_{k}$ można obliczyć dopiero po obliczeniu parametru $\lambda$ , co pokazano dalej.

Tabela: Częstości $O_{k}$ obserwowania $k$ cząstek $\alpha$ w okresach 7,5 sekundy. $\,E_{k}$ – częstości oczekiwane wg rozkładu Poissona
$k$	0	1	2	3	4	5	6	7	8	9	10
$O_{k}$	57	203	383	525	532	408	273	139	45	27	16
$E_{k}$	54,6	211	408	526	508	393	253	140	67,7	29,1	17

Estymacja parametru rozkładu

edytuj

Do opisu zjawiska stosuje się rozkład Poissona. Estymatorem parametru $\lambda$ , reprezentującego średnią liczbę cząstek przypadających na jeden przedział czasu, jest średnia ważona z próby empirycznej:

\lambda ={\tfrac {\displaystyle \sum _{k=0}^{10}k\,O_{k}}{\displaystyle \sum _{k=0}^{10}O_{k}}}

Na podstawie tabeli obliczamy $\sum _{k=0}^{10}O_{k}=2608,\,\sum _{k=0}^{10}k\cdot O_{k}=10086$ . Stąd:

\lambda ={\frac {10086}{2608}}\approx 3{,}8673

Funkcja masy prawdopodobieństwa dla dopasowanego modelu przyjmuje postać:

P(X=k)={\frac {e^{-3{,}8673}\cdot 3{,}8673^{k}}{k!}}

Prawdopodobieństwo zdarzenia skumulowanego

edytuj

W celu określenia prawdopodobieństwa zaobserwowania maksymalnie 5 cząstek $\alpha$ w przedziale czasowym, należy obliczyć prawdopodobieństwo skumulowane dla $X\leqslant 5$ :

P(X\leqslant 5)=\sum _{k=0}^{5}{\frac {e^{-3{,}8673}\cdot 3{,}8673^{k}}{k!}}

Po zsumowaniu teoretyczne prawdopodobieństwo wynosi:

P(X\leqslant 5)\approx 0{,}8088

Oznacza to, że w około $80{,}88\%$ badanych przedziałach czasowych $\Delta t=7{,}5$ sekundy aparatura pomiarowa zarejestruje 5 lub mniej cząstek $\alpha$ .

Test zgodności Pearsona

edytuj

Test zgodności Pearsona $\chi ^{2}$ wykonujemy dla hipotezy, że dane pomiarowe mają rozkład Poissona. Statystyka testowa ma postać:

\chi ^{2}=\sum _{k=0}^{10}{\frac {(O_{k}-E_{k})^{2}}{E_{k}}}

Częstości teoretyczne $E_{k}$ dla modelu Poissona obliczono ze wzoru^[3].

E_{k}=P(X=k,\lambda )\cdot N={\frac {\lambda ^{k}e^{-\lambda }}{k!}}\cdot N

używając estymowanej wartość średniej $\lambda \approx 3{,}8673$ . Np.

E_{0}=P(X=0,\lambda =3{,}876)\cdot 2608=0{,}020921\cdot 2608=54{,}6.

Wszystkie wartości $E_{k}$ zestawiono w tabeli powyżej. Po podstawieniu danych z tabeli otrzymamy:

\chi _{emp}^{2}={\frac {(57-54,6)^{2}}{54{,}6}}+{\frac {(203-211,0)^{2}}{211,0}}+\dots +{\frac {(27-29,1)^{2}}{29{,}1}}+{\frac {(16-17,0)^{2}}{17{,}0}}

i ostatecznie

\chi _{emp}^{2}\approx 13,06

Liczba stopni swobody: $\nu =11-1-1=9$ ( $11$ — liczba klas, $1$ — warunek normalizacji, $1$ — liczba estymowanych parametrów rozkładu Poissona). Dla poziomu istotności $\alpha =0,05$ wartość krytyczna wynosi $\chi _{0,95;9}^{2}\approx 16,92$ .

Wniosek: Ponieważ $\chi _{emp}^{2}=13,06<16,92$ , więc nie ma podstaw do odrzucenia hipotezy zerowej. Dane są zgodne z rozkładem Poissona na poziomie istotności $\alpha =0,05$ .

Stała rozpadu promieniotwórczego a stała $\lambda$ rozkładu Poissona. Wnioski dotyczące zjawisk losowych

edytuj

Parametru $\lambda$ rozkładu Poissona nie należy utożsamiać z stałą rozpadu promieniotwórczego. Choć obie wielkości często oznacza się tym samym symbolem, to jednak stała rozpadu oznacza prawdopodobieństwo rozpadu pojedynczego jadra atomu w czasie 1 sekundy; ma więc wymiar 1/sekunda. Stała w rozkładzie Poissona jest zaś bezwymiarowa i określa średnią liczbę cząstek rejestrowanych w przyjętym oknie czasowym $\Delta t$ i jest tym większa, im więcej jąder promieniotwórczych $N_{J}$ ma badana próbka oraz zależy od geometrii detektora $\epsilon$ (która określa, jaka część emitowanych przez substancję cząstek wpada przez okno pomiarowe detektora) i jego wydajności $\eta$ (określa, jaką część z cząstek wchodzących do detektora jest on w stanie zarejestrować), tj.

\lambda =\lambda _{R}\ N_{J}\epsilon \,\eta \,\Delta t

Oznaczając $\lambda _{I}=\lambda _{R}\ N_{J}\epsilon \,\eta$ średnią liczbę cząstek rejestrowanych przez detektor w czasie jednej sekundzie otrzymamy

\lambda =\lambda _{I}\cdot \Delta t

Prawdopodobieństwo rejestracji $k$ cząstek w czasie $\Delta t$ można więc wyrazić za pomocą średniej intensywności $\lambda _{I}$ wzorem^[10]

P(k,\lambda _{I}\Delta t)={\frac {(\lambda _{I}\Delta t)^{k}e^{-\lambda _{I}\Delta t}}{k!}}

Dla małych $x$ mamy $e^{-x}\approx 1-x$ . Stosując to przybliżenie do wzoru na $P(k,\lambda _{I})$ dla odpowiednio małych wartości $\lambda _{I}\Delta t$ otrzymuje się

a) Brak rozpadu ( $k=0$ )

$P(0,\lambda _{I})=e^{-\lambda _{I}\Delta t}\approx 1-\lambda _{I}\Delta t$

b) Jeden rozpad ( $k=1$ )

P(1,\lambda _{I})=\lambda _{I}\Delta e^{-\lambda _{I}\Delta t}\approx \lambda _{I}\Delta t

(bo iloczyn

(\lambda _{I}\Delta t)^{2}

jest pomijalnie mały.

c) Dwa i więcej rozpadów ( $k>1$ )

P(k\geqslant ,\lambda _{I})\approx O((\lambda _{I}\Delta )^{2})\approx 0

Interpretacja fizyczna

edytuj

W bardzo krótkim czasie $\Delta t$ :

albo nic się nie dzieje,
albo zachodzi pojedynczy rozpad,
zdarzenia wielokrotne są praktycznie niemożliwe.

To prowadzi do liniowej zależności:

P(1\,\,rozpad)\approx \lambda _{I}\cdot \Delta t

i stanowi fundament przejścia do prawa rozpadu.

Założenia teoretyczne

edytuj

Jeśli więc obserwuje się w eksperymentach zjawiska losowe zgodne z rozkładem Poissona, to muszą one wynikać z wyżej sformułowanych prawidłowości, tj.^[3]:

Liczba zdarzeń losowych występujących w rozłącznych przedziałach czasu jest od siebie niezależna.
Prawdopodobieństwo wystąpienia dokładnie jednego zdarzenia w bardzo małym przedziale $\Delta t$ jest równe $\Delta t\cdot \lambda _{I}$ , gdzie $\lambda _{I}>0$ reprezentuje średnią intensywność (liczbę zdarzeń na jednostkę).
Jest niemal niemożliwe (prawdopodobieństwo jest pomijalnie małe), aby dwa lub więcej zdarzeń wystąpiło w wystarczająco małym przedziale czasu.
Prawdopodobieństwo zaobserwowania określonej liczby zdarzeń w przedziale $\Delta t$ zależy wyłącznie od długości tego przedziału, a nie od momentu lub miejsca, w którym się on rozpoczyna.

Przykłady innych zjawisk modelowanych rozkładem Poissona

edytuj

Przykłady procesów losowych, które mogą być modelowane rozkładem Poissona:

Liczba żołnierzy zabitych każdego roku przez kopnięcie konia w pruskich korpusach kawalerii. Przykład ten zyskał sławę dzięki publikacji Władysława Józefowicza Bortkiewicza z 1898^[11].
Liczba połączeń telefonicznych przychodzących do centrali w ciągu minuty^[12]^[13].
Liczba wypadków samochodowych dziennie na konkretnym odcinku drogi.
Liczba błędów typograficznych na stronie książki^[3].
Liczba mutacji w danym odcinku DNA po ekspozycji na pewną dawkę promieniowania^[14].
Liczba cząstek wirusa lub bakterii, które trafiają do pojedynczej komórki^[15].

Własności

edytuj

Tw. 1 Rozkład prawdopodobieństwa $f(k,\lambda )={\tfrac {\lambda ^{k}e^{-\lambda }}{k!}}$ jest unormowany do 1.

Dowód (unormowanie do 1)

$\sum _{k=0}^{\infty }{\frac {\lambda ^{k}e^{-\lambda }}{k!}}=e^{-\lambda }\sum _{k=0}^{\infty }{\frac {\lambda ^{k}}{k!}}=e^{-\lambda }e^{\lambda }=1$ , cnd.

W przedostatnim kroku skorzystano z rozwinięcia funkcji wykładniczej $f(x)=e^{x}$ w szereg potęgowy, tj. $e^{x}=\sum _{k=0}^{\infty }{\tfrac {x^{k}}{k!}}$ .

Tw. 2 Wartość oczekiwana zmiennej losowej o rozkładzie Poissona^[16]

E(X)=\lambda

Dowód

{\begin{aligned}E(X)=\sum _{k=0}^{\infty }k\,P(X=k)=\sum _{k=0}^{\infty }k{\frac {e^{-\lambda }\lambda ^{k}}{k!}}=\\=e^{-\lambda }\sum _{k=0}^{\infty }{\frac {k\lambda ^{k}}{k!}}=e^{-\lambda }\sum _{k=1}^{\infty }{\frac {\lambda ^{k}}{(k-1)!}}=\\=e^{-\lambda }\lambda \sum _{k=1}^{\infty }{\frac {\lambda ^{k-1}}{(k-1)!}}=e^{-\lambda }\lambda \sum _{k=0}^{\infty }{\frac {\lambda ^{k}}{k!}}=\\=e^{-\lambda }\lambda e^{\lambda }=\lambda e^{\lambda -\lambda }=\lambda \end{aligned}}

Tw. 3 Wariancja zmiennej losowej o rozkładzie Poissona^[17]

\operatorname {Var} (X)=\lambda

Dowód

Wariancję wyznaczamy ze wzoru:

\operatorname {Var} (X)=\sum _{i}x_{i}^{2}p_{i}-[E(X)]^{2}=\sum _{i}x_{i}^{2}p_{i}-\lambda ^{2}

Obliczamy brakującą do końcowego wyniku sumę:

\sum _{i}x_{i}^{2}p_{i}=\sum _{i=0}^{\infty }i^{2}e^{-\lambda }{\frac {\lambda ^{i}}{i!}}=

=\sum _{i=1}^{\infty }i\,(i-1)\,e^{-\lambda }{\frac {\lambda ^{i}}{i!}}+\sum _{i=0}^{\infty }i\,e^{-\lambda }{\frac {\lambda ^{i}}{i!}}=

=e^{-\lambda }\lambda ^{2}\sum _{i=2}^{\infty }{\frac {\lambda ^{i-2}}{(i-2)!}}+\lambda =

=e^{-\lambda }\lambda ^{2}\sum _{k=0}^{\infty }{\frac {\lambda ^{k}}{k!}}+\lambda =

=e^{-\lambda }\lambda ^{2}e^{\lambda }+\lambda =

\lambda ^{2}+\lambda

W konsekwencji:

\operatorname {Var} (X)=(\lambda ^{2}+\lambda )-\lambda ^{2}=\lambda

, cnd.

Tw. 4 Wyższe momenty rozkładu Poissona są wielomianami Toucharda z parametrem $\lambda ,$ których współczynniki mają kombinatoryczne znaczenie.

Tw. 5 Gdy wartość oczekiwana rozkładu Poissona jest równa 1, to wzór Dobińskiego mówi, że $n$ -ty moment jest równy liczbie podziałów zbioru $n$ -elementowego.

Tw. 6 Dominanta:

gdy $\lambda$ jest liczbą całkowitą, to dominanta ma wartości równe $\lambda$ i $\lambda -1$ ;
gdy $\lambda$ nie jest liczbą całkowitą, to dominanta jest równa $\lfloor \lambda \rfloor$ , czyli jest największą liczbą całkowitą mniejszą lub równą $\lambda$ (jest to tzw. funkcja podłoga).

Tw. 7 Rozkład sumy zmiennych losowych o rozkładach Poissona:

Jeśli niezależne zmienne losowe

X_{i}\sim \mathrm {Pois} (\lambda _{i})

,

i=1,2,\dots ,N

mają rozkład Poissona z parametrami

\lambda _{i}

, to suma tych zmiennych losowych również ma rozkład Poissona, którego parametr

\lambda

jest sumą parametrów składowych, tj. ^[18]

\lambda =\lambda _{1}+\lambda _{2}\dots +\lambda _{N}

oraz

Y=\sum _{i=1}^{N}X_{i}\sim \mathrm {Pois} \left(\sum _{i=1}^{N}\lambda _{i}\right)

Dowód

1. Dla dwóch zmiennych losowych $X_{1}=X,X_{2}=Y$ mamy

${\begin{aligned}P(Z=k)&=P(X+Y=k)\\&=P{\Big (}\bigcup _{i=0}^{k}(X=i,\;Y=k-i){\Big )}\\&=\sum _{i=0}^{k}P(X=i)P(Y=k-i)\\&=\sum _{i=0}^{k}e^{-\lambda }{\frac {\lambda ^{i}}{i!}}e^{-\mu }{\frac {\mu ^{k-i}}{(k-i)!}}\\&=e^{-(\lambda +\mu )}\sum _{i=0}^{k}{\frac {\lambda ^{i}\mu ^{k-i}}{i!(k-i)!}}\\&=e^{-(\lambda +\mu )}{\frac {1}{k!}}\sum _{i=0}^{k}{\binom {k}{i}}\lambda ^{i}\mu ^{k-i}\\&=e^{-(\lambda +\mu )}{\frac {(\lambda +\mu )^{k}}{k!}}\end{aligned}}$

przy czym w przedostatniej linii dowodu wykorzystano wzór dwumianowy $(\lambda +\mu )^{k}=\sum _{i=0}^{k}{\binom {k}{i}}\lambda ^{i}\mu ^{k-i}$ .

Zatem $X+Y\sim \operatorname {Poisson} (\lambda +\mu )$ , cnd.

2. Dla większej liczby zmiennych losowych dowodzimy tego twierdzenia posługując się metodą dowodzenia przez indukcję.

Tw. 8 (odwrotne do podanego powyżej):

Jeśli suma dwóch niezależnych zmiennych losowych ma rozkład Poissona, to ma go również każda z tych dwóch niezależnych zmiennych losowych^[19].

Tw. 9 Jeśli $X_{1},\dots ,X_{N}$ są obserwacjami z niezależnych rozkładów Poissona ze średnimi $\lambda _{1},\dots ,\lambda _{N}$ , przy czym $\lambda _{i}$ są umiarkowanej wielkości (zalecane jest $\lambda _{i}>5$ ) to suma znormalizowanych odchyleń kwadratowych ${\tfrac {(X_{i}-\lambda _{i})^{2}}{\lambda _{i}}}$ tych zmiennych losowych ma w przybliżeniu rozkład chi kwadrat^[20], tj.

\sum _{i=1}^{N}{\frac {(X_{i}-\lambda _{i})^{2}}{\lambda _{i}}}\sim \chi ^{2}

Tw. 10 Funkcja generująca momenty rozkładu Poissona z wartością oczekiwaną $\lambda$ ma postać

E\left(e^{tX}\right)=\sum _{k=0}^{\infty }e^{tk}p(k;\lambda )=\sum _{k=0}^{\infty }e^{tk}{\frac {\lambda ^{k}e^{-\lambda }}{k!}}=e^{\lambda (e^{t}-1)}

Tw. 11 Wszystkie kumulanty rozkładu Poissona są równe $\lambda .$

Tw. 12 $n$ -ty moment silni rozkładu Poissona jest równy $\lambda n.$

Tw. 13 Rozkład Poissona jest nieskończenie podzielnym rozkładem prawdopodobieństwa.

Tw. 14 Bezpośrednia dywergencja Kullbacka-Leiblera pomiędzy $\mathrm {Pois} (\lambda )$ i $\mathrm {Pois} (\lambda _{0})$ jest dana przez

D_{\mathrm {KL} }(\lambda \|\lambda _{0})=\lambda _{0}-\lambda +\lambda \log {\frac {\lambda }{\lambda _{0}}}

Powiązania z innymi rozkładami

edytuj

Jeśli dwie zmienne $X_{1}\sim \mathrm {Pois} (\lambda _{1})$ i $X_{2}\sim \mathrm {Pois} (\lambda _{2})$ są niezależne, a $Y=X_{1}+X_{2},$ to rozkład $X_{1}$ pod warunkiem $Y=y$ jest dwumianowy, tj^[3].

X_{1}|(Y=y)\sim \mathrm {Binom} \left(y,{\frac {\lambda _{1}}{\lambda _{1}+\lambda _{2}}}\right)

Ogólnie: Jeśli $X_{1},X_{2},\dots ,X_{n}$ są niezależnymi zmiennymi losowymi Poissona z parametrami $\lambda _{1},\lambda _{2},\dots ,\lambda _{n},$ to

X_{i}\left|\sum _{j=1}^{n}X_{j}\right.\sim \mathrm {Binom} \left(\sum _{j=1}^{n}X_{j},{\frac {\lambda _{i}}{\sum _{j=1}^{n}\lambda _{j}}}\right).

Jeśli $X_{1},X_{2},\dots ,X_{m}$ są niezależnymi zmiennymi losowymi o jednakowym rozkładzie Poissona z parametrem $\lambda$ , to warunkowy rozkład wektora zmiennych pod warunkiem $\sum _{j=1}^{m}X_{j}=n$ jest rozkładem wielomianowym z liczbą prób równą $n$ i prawdopodobieństwami poszczególnych kategorii równymi $p_{1}=\dots =p_{m}={\frac {1}{m}}$ ^[3].
Jeśli $X_{1}\sim \mathrm {Pois} (\lambda _{1}),$ i $X_{2}\sim \mathrm {Pois} (\lambda _{2}),$ to różnica $Y=X_{1}-X_{2}$ ma rozkład Skellama^[21].

Rozkład Poissona może zostać wyprowadzony jako graniczna postać rozkładu dwumianowego w specyficznych warunkach, gdy liczba prób dąży do nieskończoności ( $n\to \infty$ ), a prawdopodobieństwo sukcesu dąży do zera ( $p\to 0$ ). Kluczowym założeniem tego przejścia granicznego jest to, aby wartość oczekiwana liczby sukcesów $\lambda =np$ pozostawała stała (zob. Prawo rzadkich zdarzeń). Rozkład Poissona może być zatem stosowany jako użyteczne przybliżenie rozkładu dwumianowego, gdy liczba $n$ jest wystarczająco duża, a prawdopodobieństwo $p$ jest dostatecznie małe. Wskazuje się, że przybliżenie to można bezpiecznie stosować dla populacji liczących około 5000 lub więcej jednostek^[3]. Inni autorzy wskazują, że rozkład Poissona jest dobrym przybliżeniem rozkładu dwumianowego, jeśli $n\geqslant 20$ i $p\leqslant 0{,}05$ , zaś bardzo dobrym, jeśli $n\geqslant 100$ i $np\leqslant 10$ ^[22].
Rozkład Poissona można przybliżać, wykorzystując rozkład normalny ze średnią $\lambda$ i wariancją $\lambda$ . Przybliżenie jest użyteczne dla dużych wartości $\lambda$ ze względu na fakt, że skośność rozkładu Poissona maleje ze wzrostem $\lambda$ (wynosząca $1/\lambda$ ), a kształt wykresu rozkładu staje się coraz bardziej symetryczny i dzwonowaty^[3]. Wykorzystywanie poprawki na ciągłość zwiększa dokładność tego przybliżenia. Polega ona na dodaniu lub odjęciu wartości 0,5 od liczby całkowitej k przed dokonaniem standaryzacji. Na przykład jeżeli $X\sim \mathrm {Pois} (\lambda )$ , to

P(X\leqslant x)\approx \Phi \left({\frac {x-\lambda +0{,}5}{\sqrt {\lambda }}}\right)

,

gdzie

\Phi

jest dystrybuantą standardowego rozkładu normalnego^[23].

Transformacja stabilizująca wariancję: gdy zmienna ma rozkład Poissona, jej pierwiastek kwadratowy ma w przybliżeniu rozkład normalny z wartością oczekiwaną około ${\sqrt {\lambda }}$ i wariancją około 1/4^[24]. W ramach tej transformacji, zbieżność do normalności jest znacznie szybsza niż zmiennej przed transformacją. Są dostępne inne, nieco bardziej skomplikowane transformacje stabilizujące wariancję^[25], np. transformację Anscombe'a(inne języki).
Jeśli rozkład liczby zdarzeń losowych zachodzących w danym przedziale czasu $[0,t]$ jest zgodny z rozkładem Poissona o średniej średnią $\lambda =\lambda _{w}t,$ wtedy długość czasu oczekiwania $\Delta t$ na zajście kolejnego zdarzenia ma rozkład wykładniczy ze średnią $\Delta t_{srednie}=1/\lambda _{w}.$

Prawo rzadkich zdarzeń

edytuj

Prawo rzadkich zdarzeń (znane również jako prawo małych liczb) to termin statystyczny odnoszony do rozkładu Poissona postrzeganego jako graniczna postać rozkładu dwumianowego. Nazwa ta odzwierciedla fakt, że rozkład ten modeluje zjawiska, w których prawdopodobieństwo wystąpienia pojedynczego zdarzenia jest niskie, ale liczba prób lub wielkość populacji jest duża^[26].

Prawo rzadkich zdarzeń opiera się na przejściu granicznym wyprowadzonym przez Siméona Denisa Poissona w 1837 roku. Wykazał on, że rozkład dwumianowy dąży do rozkładu Poissona, gdy liczba prób $n$ dąży do nieskończoności, a prawdopodobieństwo sukcesu $p$ dąży do zera w taki sposób, aby ich iloczyn $np=\lambda$ pozostawał stały. Parametr $\lambda$ reprezentuje średnią liczbę wystąpień zdarzenia w danym przedziale czasu lub przestrzeni^[26].

Termin „prawo małych liczb” został spopularyzowany przez Władysława Bortkiewicza w jego pracy Das Gesetz der kleinen Zahlen (Prawo małych liczb) z 1898 roku. Bortkiewicz był pierwszym statystykiem, który zauważył, że zdarzenia o niskiej częstotliwości w dużych populacjach wykazują zaskakującą stabilność statystyczną i podlegają rozkładowi Poissona, nawet jeśli prawdopodobieństwo sukcesu różni się nieco w poszczególnych podgrupach^[27]. Ze względu na kluczowy wkład Bortkiewicza w popularyzację tego modelu, który przez 60 lat od publikacji pracy Poissona pozostawał niemal zapomniany, niektórzy historycy nauki twierdzą, że rozkład ten powinien być nazywany rozkładem Bortkiewicza^[28].

Choć Bortkiewicz był pierwszym, który na dużą skalę udowodnił praktyczną użyteczność rozkładu Poissona (klasycznie zilustrowaną badaniem liczby zgonów pruskich żołnierzy wskutek kopnięcia przez konia), sama nazwa „prawo małych liczb” uznawana jest za niefortunną. Krytycy wskazywali, że sugeruje ona nieistniejący kontrast z prawem wielkich liczb; wskazywano, że merytorycznie lepiej byłoby mówić o „prawie rzadkich zdarzeń”^[27].

Nazwa „prawo rzadkich zdarzeń” również może być myląca: zdarzenia są rzadkie z punktu widzenia prawdopodobieństwa jednostkowego, lecz całkowita liczba zajść wcale nie musi być mała, jeśli parametr intensywności λ jest wysoki^[26].

Tw. (o zbieżności rozkładu dwumianowego do rozkładu Poissona)^[29]

Niech dany będzie ciąg zmiennych losowych o rozkładzie dwumianowym z prawdopodobieństwem sukcesu równym $p=\lambda /n$ $X_{n}\sim \mathrm {Binom} (n,p)$ oraz zmienna losowa o rozkładzie Poissona z parametrem $\lambda$ , tj. $Y\sim \mathrm {Pois} (\lambda )$

Wtedy ciąg $X_{n}$ dla liczby prób $n$ dążących do nieskończoności zmierza do rozkładu Poissona $Y$ , tj.

\lim _{n\to \infty }P(X_{n}=k)=P(Y=k).

Dowód

Dla każdej zmiennej losowej o rozkładzie dwumianowym o dużym $n$ i małym $p$ ustalmy $\lambda =np.$ Wartość oczekiwania $E(X_{n})=\lambda$ nie zależy od $n.$ Korzystając z zależności

\lim _{n\to \infty }\left(1-{\frac {\lambda }{n}}\right)^{n}=e^{-\lambda }

oraz podstawiając $p=\lambda /n$ otrzymamy

{\begin{aligned}\lim _{n\to \infty }\mathbb {P} (X_{n}=k)&=\lim _{n\to \infty }{n \choose k}p^{k}(1-p)^{n-k}\\&=\lim _{n\to \infty }{\frac {n!}{(n-k)!k!}}\left({\frac {\lambda }{n}}\right)^{k}\left(1-{\frac {\lambda }{n}}\right)^{n-k}\\&=\lim _{n\to \infty }\underbrace {\left[{\frac {n!}{n^{k}(n-k)!}}\right]} _{A_{n}}\left({\frac {\lambda ^{k}}{k!}}\right)\underbrace {\left(1-{\frac {\lambda }{n}}\right)^{n}} _{\to \exp(-\lambda )}\underbrace {\left(1-{\frac {\lambda }{n}}\right)^{-k}} _{\to 1}\\&=\left[\lim _{n\to \infty }A_{n}\right]\left({\frac {\lambda ^{k}}{k!}}\right)\exp(-\lambda )\end{aligned}}

Obliczenie granicy czynników $A_{n}$ przeprowadza się dokonując rozkładu na poszczególne czynniki i licząc granicę każdego z nich oddzielanie (można to zrobić, ponieważ liczba członów zależnych od $n$ jest stała, tj. jest ich $k$ , a każdy z członów jest ciągiem zbieżnym; korzystamy tu z twierdzenia, że iloczyn ciągów zbieżnych ma granicę równą iloczynowi granic każdego z członów tego iloczynu

{\begin{aligned}A_{n}&={\frac {n!}{n^{k}(n-k)!}}\\&={\frac {n\cdot (n-1)\ldots {\big (}n-(k-1){\big )}}{n^{k}}}\\&=1\cdot (1-{\tfrac {1}{n}})\ldots (1-{\tfrac {k-1}{n}})\\&\to 1\cdot 1\ldots 1=1,\end{aligned}}

Ostatecznie otrzymamy:

\lim _{n\to \infty }\mathbb {P} (X_{n}=k)={\frac {\lambda ^{k}\exp(-\lambda )}{k!}}=\mathbb {P} (Y=k),

cnd.

Uogólnienie

edytuj

Wykazaliśmy, że jeżeli

X_{n}\sim \mathrm {Binom} (n,p_{n});\qquad Y\sim \mathrm {Pois} (\lambda ),

gdzie $p_{n}=\lambda /n,$ a następnie $X_{n}\to Y$ w rozkładzie. Odnosi się to w bardziej ogólnej sytuacji, że $p_{n}$ jest dowolny ciąg taki, że

\lim _{n\to \infty }np_{n}=\lambda .

Szum Poissona i jego zastosowania

edytuj

Parametr $\lambda$ jest średnią liczbą wystąpień zdarzeń losowych $E[k]$ i jednocześnie ich wariancją, tj. $\sigma _{k}^{2}\equiv E[k^{2}]-E[k]^{2}=\lambda$ . W konsekwencji liczba zaobserwowanych zdarzeń losowych oscyluje wokół średniej $\lambda$ z odchyleniem standardowym wynoszącym $\sigma _{k}={\sqrt {\lambda }}.$ W literaturze statystycznej zjawisko to, polegające na ścisłej zależności wariancji od średniej, określane jest mianem „dyspersji normalnej”^[27]. Wahania te są nazywane szumem Poissona, szumem śrutowym lub szumem fotonowym^[30].

Ścisły związek między średnią a odchyleniem standardowym przy zliczaniu niezależnych zdarzeń dyskretnych jest niezwykle użyteczny w badaniach i pomiarach naukowych Dzięki monitorowaniu, jak zaobserwowane wahania różnią się od średniej sygnału, można ocenić, czy dany proces jest „doskonale losowy”. Jeśli wariancja jest znacznie większa od średniej, sugeruje to, że zdarzenia nie są niezależne, lecz wykazują tendencję do skupiania się (tzw. clumping), co podważa model Poissona^[31]. Relacja pomiędzy wahaniami a średnią sygnału pozwala również na wyciąganie wniosków o naturze zjawisk, w tym wkładzie pojedynczego zdarzenia, nawet jeśli ten wkład jest zbyt mały do wykrycia bezpośrednio, np.

(a) Ładunek e elektronu może być określony poprzez powiązanie wielkości prądu elektrycznego z jego szumem śrutowym. Jeżeli przez punkt przechodzi w czasie $t$ średnio $N$ elektronów, średni prąd jest równy $I=eN/t,$ ponieważ wahania prądu powinny być rzędu $\sigma _{I}=e{\sqrt {N}}/t$ (tj. standardowe odchylenie procesu Poissona), ładunek $e$ może być oszacowany ze współczynnika $\sigma _{I}^{2}/I.$

(b) Ziarnistość, która pojawia się przy powiększeniach fotografii, powstaje w związku z wahaniami Poissona w ograniczonej liczbie ziaren srebra (a nie w związku z pojedynczymi ziarnami). Korelując ziarnistość ze stopniem powiększenia, można oszacować udział indywidualnych ziaren (które są zbyt małe, aby je inaczej postrzegać samodzielnie).

(c) Molekularny szum Poissona pozwala szacować gęstość liczby cząsteczek receptora w błonie komórkowej

P(N_{t}=k)=p(k;\lambda t)={\frac {e^{-\lambda t}(\lambda t)^{k}}{k!}}.

Estymacja parametru $\lambda$ rozkładu Poissona. Przedziały ufności

edytuj

Metoda największej wiarygodności

edytuj

Niech $k_{1},k_{2},\dots ,k_{n}$ będzie próbką $n$ obserwacji pochodzących z rozkładu Poissona z nieznanym parametrem $\lambda$ . Celem jest wyznaczenie estymatora największej wiarygodności (MLE) parametru $\lambda$ . Funkcja wiarygodności ma postać:

{\mathcal {L}}(\lambda )=\prod _{i=1}^{n}p(k_{i}\mid \lambda )=\prod _{i=1}^{n}{\frac {e^{-\lambda }\lambda ^{k_{i}}}{k_{i}!}}

Aby uprościć proces optymalizacji, stosuje się funkcję log-wiarygodności, która jest logarytmem naturalnym funkcji wiarygodności (logarytm naturalny jest funkcją ściśle rosnącą; logarytm funkcji posiada ekstremum w tym samym punkcie co funkcja pierwotna):

{\begin{aligned}\ell (\lambda )&=\ln {\mathcal {L}}(\lambda )=\ln \prod _{i=1}^{n}p(k_{i}\mid \lambda )=\sum _{i=1}^{n}\ln {\frac {e^{-\lambda }\lambda ^{k_{i}}}{k_{i}!}}\\&=-n\lambda +\left(\sum _{i=1}^{n}k_{i}\right)\ln \lambda -\sum _{i=1}^{n}\ln(k_{i}!)\end{aligned}}

Maksimum wyznacza się, obliczając pierwszą pochodną względem $\lambda$ i przyrównując ją do zera:

{\frac {\mathrm {d} }{\mathrm {d} \lambda }}\ell (\lambda )=0\iff -n+\left(\sum _{i=1}^{n}k_{i}\right){\frac {1}{\lambda }}=0

Rozwiązanie tego równania daje estymator największej wiarygodności (MLE), którym jest średnia z próby:

{\widehat {\lambda }}_{\mathrm {MLE} }={\bar {k}}={\frac {1}{n}}\sum _{i=1}^{n}k_{i}

Weryfikacja warunku na pochodną drugiego rzędu potwierdza, że znaleziony punkt stacjonarny jest maksimum globalnym, ponieważ druga pochodna funkcji log-wiarygodności jest zawsze ujemna dla nieujemnych wartości $\lambda$ (przy założeniu $\textstyle \sum k_{i}>0$ )

{\frac {\partial ^{2}\ell }{\partial \lambda ^{2}}}=-\lambda ^{-2}\sum _{i=1}^{n}k_{i}.

Wariancja estymatora wynosi ${\text{Var}}({\bar {k}})=\lambda /n$ . Osiąga ona dolną granicę nierówności Rao-Craméra, co czyni ${\bar {k}}$ estymatorem nieobciążonym o minimalnej wariancji (ang. MVUE). Wartość oczekiwana estymatora ${\bar {k}}$ jest równa parametrowi $\lambda$ , $E({\bar {k}})=\lambda ,$ więc średnia z próby ${\bar {k}}$ jest nieobciążonym estymatorem parametru $\lambda$ o minimalnej wariancji.

Rozkład Poissona należy do rodziny rozkładów wykładniczych. Z tego faktu wynika, że średnia z próby jest statystyką dostateczną (tj. zawiera wszystkie informacje o parametrze $\lambda$ dostępne w próbie) oraz statystyką zupełną.

Dla dużych prób rozkład estymatora ${\bar {k}}$ dąży do rozkładu normalnego ${\mathcal {N}}(\mu ,\sigma ^{2})$ o średniej $\mu =\lambda$ i wariancji $\sigma ^{2}={\tfrac {\lambda }{n}}$ (por. centralne twierdzenia graniczne). Własność ta pozwala na konstruowanie przybliżonych przedziałów ufności^[4].

Statystyka bayesowska

edytuj

W statystyce bayesowskiej, sprzężony rozkład a priori dla parametru skali $\lambda$ rozkładu Poissona jest rozkładem gamma. Niech

\lambda \sim \mathrm {Gamma} (\alpha ,\beta )

oznacza, że $\lambda$ ma rozkład zgodnie z gęstością Gamma $g$ parametryzowaną ze względu na parametr kształtu $\alpha$ i odwrotny parametrem skali: $\beta$

g(\lambda \mid \alpha ,\beta )={\frac {\beta ^{\alpha }}{\Gamma (\alpha )}}\;\lambda ^{\alpha -1}\;e^{-\beta \,\lambda }\qquad {\text{ dla }}\lambda >0.

Następnie biorąc tę samą próbkę $n$ zmierzonych wartości $k_{i}$ jak poprzednio, i a priori Gamma $(\alpha ,\beta ),$ rozkład a posteriori jest

\lambda \sim \mathrm {Gamma} (\alpha +\sum _{i=1}^{n}k_{i},\beta +n).

Średnia a posteriori $E[\lambda ]$ zbliża się do oszacowania maksymalnego prawdopodobieństwa ${\widehat {\lambda }}_{\mathrm {MLE} }$ w granicy, jako $\alpha \to 0,\ \beta \to 0.$

Przewidujący rozkład a posteriori dodatkowych danych jest rozkładem Gamma-Poissona (tj. ujemnym dwumianowym).

Przedział ufności

edytuj

Przedział ufności dla $\mu$ (średniej rozkładu Poissona) można wyrazić za pomocą zależności między dystrybuantami rozkładu Poissona i rozkładu chi-kwadrat (oraz ściśle z nim powiązanego rozkładu gamma).

Jeżeli zaobserwowano $k$ zdarzeń w danym przedziale czasu i można założyć, że zostały one wygenerowane z rozkładu Poissona, zaś poziom ufności wynosi $1-\alpha$ , to przedział ufności dla $\mu$ ma postać

{\frac {1}{2}}\chi ^{2}\left({\frac {\alpha }{2}};2k\right)\leqslant \mu \leqslant {\frac {1}{2}}\chi ^{2}\left(1-{\frac {\alpha }{2}};2k+2\right)

lub, alternatywnie,

F^{-1}\left({\frac {\alpha }{2}};k,1\right)\leqslant \mu \leqslant F^{-1}\left(1-{\frac {\alpha }{2}};k+1,1\right)

,

gdzie $\chi ^{2}(p;n)$ to funkcja kwantylowa (odwrotna dystrybuanta) rozkładu chi-kwadrat, rozkładu chi-kwadrat z prawdopodobieństwem wejściowym (lewostronnym) $p$ i $n$ stopniami swobody, a $F^{-1}(p;n,1)$ to funkcja kwantylowa rozkładu gamma o parametrach kształtu równym $n$ i skali równym 1.

Przedział ten jest „dokładny” w tym sensie, że jego rzeczywiste pokrycie nigdy nie jest mniejsze niż nominalne $1-\alpha$ ^[32]^[33].

Zaproponowano również przybliżenie tego przedziału (oparte na transformacji Wilsona–Hilferty’ego), przydatne gdy kwantyle rozkładu gamma nie są dostępne^[34]:

k\left(1-{\frac {1}{9k}}-{\frac {z_{\alpha /2}}{3{\sqrt {k}}}}\right)^{3}\leqslant \mu \leqslant (k+1)\left(1-{\frac {1}{9(k+1)}}+{\frac {z_{\alpha /2}}{3{\sqrt {k+1}}}}\right)^{3}

gdzie $z_{\alpha /2}$ oznacza kwantyl standardowego rozkładu normalnego odpowiadający prawdopodobieństwu w górnym ogonie równemu $\alpha /2$ .

Aby zastosować te wzory w praktyce (we wspomnianym wyżej kontekście próby $n$ obserwacji $k_{i}$ , z których każda pochodzi z rozkładu Poissona o średniej $\lambda$ ), należy obliczyć łączną wartość $k$ :

k=\sum _{i=1}^{n}k_{i}

,

a następnie wyznaczyć przedział dla $\mu =n\lambda$ i przekształcić go do przedziału dla $\lambda$ .

Rozkład Poissona w językach programowania i arkuszach kalkulacyjnych

edytuj

Języki programowania

edytuj

Python (biblioteka scipy.stats)

funkcja masy prawdopodobieństwa: poisson.pmf(k, lambda) – zwraca prawdopodobieństwo $\mathbb {P} (X=k)$ dla $X\sim \mathrm {Pois} (\lambda )$ ,
dystrybuanta: poisson.cdf(k, lambda) – zwraca prawdopodobieństwo $\mathbb {P} (X\leqslant k)$ ,
generowanie N_losowych wartości z rozkładu $X\sim {\mathcal {B}}(n,p)$ : poisson.rvs(lambda, size = N_losowych)

R

funkcja masy prawdopodobieństwa: dpois(k, lambda)
dystrybuanta: ppois(k, lambda)
generowanie N_losowych wartości: rpois(N_losowych, lambda)

Arkusze kalkulacyjne

edytuj

Arkusze Google

funkcja masy prawdopodobieństwa: POISSON.DIST(k; lambda; FALSE)
dystrybuanta: POISSON.DIST(k; lambda; TRUE)

Microsoft Excel

funkcja masy prawdopodobieństwa: ROZKŁ.POISSON(k; lambda; FAŁSZ)
dystrybuanta: ROZKŁ.POISSON(k; lambda; PRAWDA)

Implementacja rozkładu Poissona w Pythonie bez użycia bibliotek

edytuj

Poniższy program w języku Python oblicza wartości funkcji masy prawdopodobieństwa rozkładu Poissona dla zadanej wartości $\lambda$ i wartości $k$ z zadanego zakresu. Kod nie korzysta z biblioteki scipy. Z tej racji może być łatwo uruchomiony w licznie dostępnych kompilatorach Pythona w Internecie.

import math
def poisson(lam, k):
    return math.exp(k * math.log(lam) - lam - math.lgamma(k + 1))

lam=5 # tu można zmieniać wartość parametru lambda
# nagłówek i tabela rozkładu Poissona
print(f"{'λ':>5} {'k':>5} {'P(λ, k)':>12}")
print("-" * 24)

for k in range(0, 15):# tu można zmienić zakres k - liczby 0 i 15
    print(f"{lam:>5} {k:>5} {poisson(lam, k):>12.3f}")

W obliczeniach stosuje się numerycznie stabilną postać: $f(k,\lambda )=\exp \left(k\ln \lambda -\lambda -\operatorname {lgamma} (k+1)\right),$ zamiast bezpośredniego wzoru $f(k,\lambda )={\frac {\lambda ^{k}e^{-\lambda }}{k!}},$ który dla dużych $k$ lub $\lambda$ może prowadzić do utraty precyzji.

Generowanie zmiennych losowych o rozkładzie Poissona

edytuj

Prosty sposób na generowanie losowych liczb o rozkładzie Poissona, jest podany przez Knutha, zobacz odniesienia poniżej.

algorytm poisson random number (Knuth):
 init:
  Let L ← e^-λ, k ← 0 i p ← 1.
 do:
  k ← k + 1.
  Wygeneruj losową liczbę u z przedziału [0,1] i przypisz p ← p × u.
 while p > L.
 return k – 1.

Podczas gdy jest prosty, złożoność jest liniowa względem $\lambda .$ Istnieje wiele innych algorytmów na przezwyciężenie tego. Niektóre z nich są podane w Ahrens & Dieter, patrz odniesienia poniżej. Ponadto dla dużych wartości $\lambda ,$ mogą być problemy ze stabilnością numeryczną ze względu na człon $\exp(-\lambda ).$ Jednym z rozwiązań dla dużych wartości $\lambda$ jest Pobieranie z odrzuceniem, innym jest wykorzystanie przybliżenia Poissona przez Gaussa.

Metoda odwrotnej transformacji jest prosta i skuteczna dla małych wartości $\lambda$ i wymaga tylko jednej jednolitej losowej liczby $u$ na próbkę. Skumulowane prawdopodobieństwa badane są z kolei, aż jedno przekracza $u.$

2-wymiarowy rozkład Poissona

edytuj

P(k,\lambda _{I}\Delta S)={\frac {(\lambda _{I}\Delta S)^{k}e^{-\lambda _{I}\Delta S}}{k!}},

gdzie:

\Delta S

– wielkość elementów powierzchni, na których zalicza się zdarzenia losowe,

k=0,1,2,\dots

– możliwe liczby zdarzeń losowych, zliczone na elemencie powierzchni

\Delta S

\lambda _{I}

– średnia intensywność zdarzeń losowych na jednostkę powierzchni

Zobacz też

edytuj

Przypisy

edytuj

↑ Jan Gullberg: Mathematics from the birth of numbers. New York: W.W. Norton, 1997, s. 963–965. ISBN 0-393-04002-X.
↑ ^a ^b Poisson distribution, [w:] BrianB. Everitt BrianB., AndersA. Skrondal AndersA., The Cambridge dictionary of statistics, wyd. 4th ed, Cambridge, UK ; New York: Cambridge University Press, 2010, ISBN 978-0-521-76699-9 .
↑ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ KalimuthuK. Krishnamoorthy KalimuthuK., Handbook of statistical distributions with applications, Second edition, Boca Raton, Florida London New York: Chapman & Hall, CRC Press, imprint of Taylor & Francis Group, 2016, s. 89-93, ISBN 978-1-4987-4150-7 .
↑ ^a ^b ^c GeorgeG. Casella GeorgeG., Roger W.R.W. Berger Roger W.R.W., Statistical inference, Second edition, CRC texts in statistical science series, Boca Raton: CRC Press, 2024, ISBN 978-1-032-59303-6 .
↑ Siméon-DenisS.D. Poisson Siméon-DenisS.D., Recherches sur la probabilité des jugements en matière criminelle et en matière civile: précédées des règles générales du calcul des probabilités, Bachelier, 1837, ISBN 978-0-608-35646-4 (fr.).
↑ Krysicki i inni 1998 ↓, s. 85.
↑ Ćwiczenia 4: Dyskretne zmienne losowe | Informatyka MIMUW [online], smurf.mimuw.edu.pl [dostęp 2026-03-10] .
↑ Index of dispersion, [w:] BrianB. Everitt BrianB., AndersA. Skrondal AndersA., The Cambridge dictionary of statistics, wyd. 4th ed, Cambridge, UK ; New York: Cambridge University Press, 2010, ISBN 978-0-521-76699-9 .
↑ Kubik i Krupowicz 1982 ↓, s. 15.
↑ McQuarrie 2006 ↓, s. 168.
↑ Ladislaus vonL. Bortkiewicz Ladislaus vonL., Das Gesetz der kleinen Zahlen, Leipzig : B.G. Teubner, 1898 [dostęp 2026-03-10] .
↑ GeorgeG. Rasch GeorgeG., The Poisson process as a model for a diversity of behavioral phenomena: (685262012-108), 1963, DOI: 10.1037/e685262012-108 [dostęp 2026-03-10] (ang.).
↑ A.K.A.K. Erlang A.K.A.K., Sandsynlighedsregning og Telefonsamtaler, „Nyt tidsskrift for matematik”, 20, 1909, s. 33–39, ISSN 0909-3524, JSTOR: 24528622 [dostęp 2026-03-10] .
↑ Edith AE.A. Leonhardt Edith AE.A., MaxineM. Trinh MaxineM., KennethK. Chu KennethK., William CW.C. Dewey William CW.C., Evidence that most radiation-induced HPRT mutants are generated directly by the initial radiation exposure, „Mutation Research - Fundamental and Molecular Mechanisms of Mutagenesis”, 426 (1), 1999, s. 23–30, DOI: 10.1016/S0027-5107(99)00080-9, ISSN 1386-1964 [dostęp 2026-03-10] .
↑ Emory L.E.L. Ellis Emory L.E.L., MaxM. Delbrück MaxM., The Growth of Bacteriophage, „Journal of General Physiology”, 22 (3), 1939, s. 365–384, DOI: 10.1085/jgp.22.3.365, ISSN 1540-7748 [dostęp 2026-03-10] (ang.).
↑ Kubik i Krupowicz 1982 ↓, s. 45.
↑ Kubik i Krupowicz 1982 ↓, s. 47-48.
↑ Kubik i Krupowicz 1982 ↓, s. 146.
↑ Д. А. Райков, “О разложении законов Гаусса и Пуассона”, Изв. АН СССР. Сер. матем., 2:1 (1938), 91–124 [online], www.mathnet.ru [dostęp 2026-03-11] .
↑ Box, Hunter and Hunter: Statistics for experimenters. Wiley, s. 57.
↑ J.G.J.G. Skellam J.G.J.G., The Frequency Distribution of the Difference Between Two Poisson Variates Belonging to Different Populations, „Journal of the Royal Statistical Society”, 109 (3), 1946, s. 296–296, DOI: 10.2307/2981372, ISSN 0952-8385, JSTOR: 2981372 [dostęp 2026-03-10] .
↑ NIST/SEMATECH, '6.3.3.1. Counts Control Charts', e-Handbook of Statistical Methods, accessed 25 October 2006.
↑ Norman LloydN.L. Johnson Norman LloydN.L., Statistical distributions. Approximations to distributions, [w:] WilliamW. Kruskal, Judith M.J.M. Tanur (red.), International encyclopedia of statistics, New York: Free Press, 1978, s. 172, ISBN 978-0-02-917960-4 [dostęp 2026-03-12] (ang.).
↑ P.P. McCullagh P.P., John A.J.A. Nelder John A.J.A., Generalized linear models, wyd. 2nd ed, Monographs on statistics and applied probability, London ; New York: Chapman and Hall, 1989 (37), s. 196, ISBN 978-0-412-31760-6 (ang.).
↑ N.L. Johnson, S. Kotz, A.W. Kemp, Univariate Discrete distributions (2nd edition), Wiley, 1993, ISBN 0-471-54897-9, s. 163.
↑ ^a ^b ^c R.R. Feron R.R., Poisson, Simeon Denis, [w:] William H.W.H. Kruskal (red.), International encyclopedia of statistics, London: Collier Macmillan, 1978, s. 704–706, ISBN 978-0-02-917960-4 .
↑ ^a ^b ^c E.J.E.J. Gumbel E.J.E.J., Ladislaus von Bortkiewicz, [w:] WilliamW. Kruskal, Judith M.J.M. Tanur (red.), International encyclopedia of statistics, New York: Free Press, 1978, s. 24–27, ISBN 978-0-02-917960-4 .
↑ I.J. Good. Some statistical applications of Poisson’s work. „Statistical Science”. 1 (2), s. 157–180, 1986. DOI: 10.1214/ss/1177013690.
↑ Kubik i Krupowicz 1982 ↓, s. 441-442.
↑ Samuel W.S.W. Hasinoff Samuel W.S.W., Photon, Poisson Noise, Springer, Boston, MA, 2014, s. 608–610, DOI: 10.1007/978-0-387-31439-6_482, ISBN 978-0-387-31439-6 (ang.).
↑ GeorgeG. Casella GeorgeG., Roger L.R.L. Berger Roger L.R.L., Statistical Inference, Second edition, CRC texts in statistical science series, Boca Raton: CRC Press, Taylor & Francis Group, 2024, s. 203–204, ISBN 978-1-032-59303-6 .
↑ Norman L.N.L. Johnson Norman L.N.L., Adrienne W.A.W. Kemp Adrienne W.A.W., SamuelS. Kotz SamuelS., Univariate Discrete Distributions, wyd. 1, Wiley Series in Probability and Statistics, Wiley, 19 sierpnia 2005, DOI: 10.1002/0471715816, ISBN 978-0-471-27246-5 (ang.).
↑ F.F. Garwood F.F., (i) Fiducial Limits for the Poisson Distribution, „Biometrika”, 28 (3-4), 1936, s. 437–442, DOI: 10.1093/biomet/28.3-4.437, ISSN 0006-3444 [dostęp 2026-04-23] (ang.).
↑ Norman E.N.E. Breslow Norman E.N.E., Nicholas E.N.E. Day Nicholas E.N.E., Statistical methods in cancer research. Vol. 2: The design and analysis of cohort studies, wyd. Reprinted, IARC scientific publications, Lyon: International Agency for Research on Cancer, 1996 (82), ISBN 978-92-832-0182-3 .

Bibliografia

edytuj

W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski, Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach, Wydawnictwo Naukowe PWN, Warszawa 1998, cz. I Rachunek prawdopodobieństwa.
Lech T. Kubik, Andrzej Krupowicz, Wprowadzenie do rachunku prawdopodobieństwa i jego zastosowań, Warszawa 1982, Państwowe Wydawnictwo Naukowe.
Dawid A. McQuarrie, Matematyka dla przyrodników i inżynierów, tom 3, Wydawnictwo Naukowe PWN, Warszawa 2006, str. 164 i 168.
Herbert Edward Soper. Tables of Poisson’s exponential binomial limit. „Biometrika”. 10, s. 25–35, 1914. - rozkład po raz pierwszy nazwany rozkładem Poissona w tej pracy.

Referencje

edytuj

J. Wawrzynek: Metody opisu i wnioskowania statystycznego. Wrocław: Wydawnictwo Akademii Ekonomicznej im. Oskara Langego we Wrocławiu, 2007, s. 56–57. ISBN 978-83-7011-859-4.
V. Guerriero, S. Vitale, S. Ciarcia, S. Mazzoli. Improved statistical multi-scale analysis of fractures in carbonate reservoir analogues. „Tectonophysics”, 2011. Elsevier. DOI: 10.1016/j.tecto.2011.01.003.
V. Guerriero, A. Iannace, S. Mazzoli, M. Parente, S. Vitale, M. Giorgioni. Quantifying uncertainties in multi-scale studies of fractured reservoir analogues: Implemented statistical analysis of scan line data from carbonate rocks. „Journal of Structural Geology”, 2009. Elsevier. DOI: 10.1016/j.jsg.2009.04.016.
Donald E. Knuth: Seminumerical Algorithms. Addison Wesley, 1969, seria: The Art of Computer Programming, Volume 2.
Joachim H. Ahrens, Ulrich Dieter. Computer Methods for Sampling from Gamma, Beta, Poisson and Binomial Distributions. „Computing”. 12 (3), s. 223–246, 1974. DOI: 10.1007/BF02293108.
Joachim H. Ahrens, Ulrich Dieter. Computer Generation of Poisson Deviates. „ACM Transactions on Mathematical Software”. 8 (2), s. 163–179, 1982. DOI: 10.1145/355993.355997.
Ronald J. Evans, J. Boersma, N.M. Blachman, A.A. Jagers. The Entropy of a Poisson Distribution: Problem 87-6. „SIAM Review”. 30 (2), s. 314–317, 1988. DOI: 10.1137/1030059.

Linki zewnętrzne

edytuj

Piotr Stachura, Rozkład Poissona, część 1, kanał Khan Academy na YouTube, 3 października 2025 [dostęp 2025-10-27].
POISSON () w najbardziej popularnych arkuszach kalkulacyjnych
Kalkulator online – Rozkład Poissona

[1] Jan Gullberg: Mathematics from the birth of numbers. New York: W.W. Norton, 1997, s. 963–965. ISBN 0-393-04002-X.

[:4-2] Poisson distribution, [w:] BrianB. Everitt BrianB., AndersA. Skrondal AndersA., The Cambridge dictionary of statistics, wyd. 4th ed, Cambridge, UK ; New York: Cambridge University Press, 2010, ISBN 978-0-521-76699-9 .

[:1-3] ↑ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ KalimuthuK. Krishnamoorthy KalimuthuK., Handbook of statistical distributions with applications, Second edition, Boca Raton, Florida London New York: Chapman & Hall, CRC Press, imprint of Taylor & Francis Group, 2016, s. 89-93, ISBN 978-1-4987-4150-7 .

[:5-4] GeorgeG. Casella GeorgeG., Roger W.R.W. Berger Roger W.R.W., Statistical inference, Second edition, CRC texts in statistical science series, Boca Raton: CRC Press, 2024, ISBN 978-1-032-59303-6 .

[5] Siméon-DenisS.D. Poisson Siméon-DenisS.D., Recherches sur la probabilité des jugements en matière criminelle et en matière civile: précédées des règles générales du calcul des probabilités, Bachelier, 1837, ISBN 978-0-608-35646-4 (fr.).

[CITEREFKrysicki_i_inni199885-6] Krysicki i inni 1998 ↓, s. 85.

[7] Ćwiczenia 4: Dyskretne zmienne losowe | Informatyka MIMUW [online], smurf.mimuw.edu.pl [dostęp 2026-03-10] .

[8] Index of dispersion, [w:] BrianB. Everitt BrianB., AndersA. Skrondal AndersA., The Cambridge dictionary of statistics, wyd. 4th ed, Cambridge, UK ; New York: Cambridge University Press, 2010, ISBN 978-0-521-76699-9 .

[CITEREFKubikKrupowicz198215-9] Kubik i Krupowicz 1982 ↓, s. 15.

[CITEREFMcQuarrie2006168-10] McQuarrie 2006 ↓, s. 168.

[11] Ladislaus vonL. Bortkiewicz Ladislaus vonL., Das Gesetz der kleinen Zahlen, Leipzig : B.G. Teubner, 1898 [dostęp 2026-03-10] .

[12] GeorgeG. Rasch GeorgeG., The Poisson process as a model for a diversity of behavioral phenomena: (685262012-108), 1963, DOI: 10.1037/e685262012-108 [dostęp 2026-03-10] (ang.).

[13] A.K.A.K. Erlang A.K.A.K., Sandsynlighedsregning og Telefonsamtaler, „Nyt tidsskrift for matematik”, 20, 1909, s. 33–39, ISSN 0909-3524, JSTOR: 24528622 [dostęp 2026-03-10] .

[14] Edith AE.A. Leonhardt Edith AE.A., MaxineM. Trinh MaxineM., KennethK. Chu KennethK., William CW.C. Dewey William CW.C., Evidence that most radiation-induced HPRT mutants are generated directly by the initial radiation exposure, „Mutation Research - Fundamental and Molecular Mechanisms of Mutagenesis”, 426 (1), 1999, s. 23–30, DOI: 10.1016/S0027-5107(99)00080-9, ISSN 1386-1964 [dostęp 2026-03-10] .

[15] Emory L.E.L. Ellis Emory L.E.L., MaxM. Delbrück MaxM., The Growth of Bacteriophage, „Journal of General Physiology”, 22 (3), 1939, s. 365–384, DOI: 10.1085/jgp.22.3.365, ISSN 1540-7748 [dostęp 2026-03-10] (ang.).

[CITEREFKubikKrupowicz198245-16] Kubik i Krupowicz 1982 ↓, s. 45.

[CITEREFKubikKrupowicz198247-48-17] Kubik i Krupowicz 1982 ↓, s. 47-48.

[CITEREFKubikKrupowicz1982146-18] Kubik i Krupowicz 1982 ↓, s. 146.

[19] Д. А. Райков, “О разложении законов Гаусса и Пуассона”, Изв. АН СССР. Сер. матем., 2:1 (1938), 91–124 [online], www.mathnet.ru [dostęp 2026-03-11] .

[20] Box, Hunter and Hunter: Statistics for experimenters. Wiley, s. 57.

[21] J.G.J.G. Skellam J.G.J.G., The Frequency Distribution of the Difference Between Two Poisson Variates Belonging to Different Populations, „Journal of the Royal Statistical Society”, 109 (3), 1946, s. 296–296, DOI: 10.2307/2981372, ISSN 0952-8385, JSTOR: 2981372 [dostęp 2026-03-10] .

[:0-22] NIST/SEMATECH, '6.3.3.1. Counts Control Charts', e-Handbook of Statistical Methods, accessed 25 October 2006.

[23] Norman LloydN.L. Johnson Norman LloydN.L., Statistical distributions. Approximations to distributions, [w:] WilliamW. Kruskal, Judith M.J.M. Tanur (red.), International encyclopedia of statistics, New York: Free Press, 1978, s. 172, ISBN 978-0-02-917960-4 [dostęp 2026-03-12] (ang.).

[24] P.P. McCullagh P.P., John A.J.A. Nelder John A.J.A., Generalized linear models, wyd. 2nd ed, Monographs on statistics and applied probability, London ; New York: Chapman and Hall, 1989 (37), s. 196, ISBN 978-0-412-31760-6 (ang.).

[25] N.L. Johnson, S. Kotz, A.W. Kemp, Univariate Discrete distributions (2nd edition), Wiley, 1993, ISBN 0-471-54897-9, s. 163.

[:2-26] R.R. Feron R.R., Poisson, Simeon Denis, [w:] William H.W.H. Kruskal (red.), International encyclopedia of statistics, London: Collier Macmillan, 1978, s. 704–706, ISBN 978-0-02-917960-4 .

[:3-27] E.J.E.J. Gumbel E.J.E.J., Ladislaus von Bortkiewicz, [w:] WilliamW. Kruskal, Judith M.J.M. Tanur (red.), International encyclopedia of statistics, New York: Free Press, 1978, s. 24–27, ISBN 978-0-02-917960-4 .

[28] I.J. Good. Some statistical applications of Poisson’s work. „Statistical Science”. 1 (2), s. 157–180, 1986. DOI: 10.1214/ss/1177013690.

[CITEREFKubikKrupowicz1982441-442-29] Kubik i Krupowicz 1982 ↓, s. 441-442.

[30] Samuel W.S.W. Hasinoff Samuel W.S.W., Photon, Poisson Noise, Springer, Boston, MA, 2014, s. 608–610, DOI: 10.1007/978-0-387-31439-6_482, ISBN 978-0-387-31439-6 (ang.).

[31] GeorgeG. Casella GeorgeG., Roger L.R.L. Berger Roger L.R.L., Statistical Inference, Second edition, CRC texts in statistical science series, Boca Raton: CRC Press, Taylor & Francis Group, 2024, s. 203–204, ISBN 978-1-032-59303-6 .

[32] Norman L.N.L. Johnson Norman L.N.L., Adrienne W.A.W. Kemp Adrienne W.A.W., SamuelS. Kotz SamuelS., Univariate Discrete Distributions, wyd. 1, Wiley Series in Probability and Statistics, Wiley, 19 sierpnia 2005, DOI: 10.1002/0471715816, ISBN 978-0-471-27246-5 (ang.).

[33] F.F. Garwood F.F., (i) Fiducial Limits for the Poisson Distribution, „Biometrika”, 28 (3-4), 1936, s. 437–442, DOI: 10.1093/biomet/28.3-4.437, ISSN 0006-3444 [dostęp 2026-04-23] (ang.).

[34] Norman E.N.E. Breslow Norman E.N.E., Nicholas E.N.E. Day Nicholas E.N.E., Statistical methods in cancer research. Vol. 2: The design and analysis of cohort studies, wyd. Reprinted, IARC scientific publications, Lyon: International Agency for Research on Cancer, 1996 (82), ISBN 978-92-832-0182-3 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

Funkcja masy prawdopodobieństwa Na osi poziomej jest k, czyli liczba wystąpień zdarzeń losowych. $\lambda$ jest oczekiwaną liczbą wystąpień w zadanym przedziale czasu (lub w zadanym obszarze przestrzeni). Na osi pionowej jest prawdopodobieństwo P wystąpienia k zdarzeń przy danym $\lambda$ . Funkcja prawdopodobieństwa jest zdefiniowana wyłącznie dla całkowitych wartości k; linie łączące służą jedynie jako pomoc wizualna.
Dystrybuanta Na osi poziomej jest k. Dystrybuanta jest nieciągła w punktach odpowiadających całkowitym wartościom k i stała (płaska) pomiędzy nimi, ponieważ zmienna losowa o rozkładzie Poissona przyjmuje wyłącznie wartości całkowite.
Parametry	$\lambda \in (0,\infty )$
Nośnik	$\{0,1,2,\dots \}$
Funkcja masy prawdopodobieństwa	${\tfrac {e^{-\lambda }\lambda ^{k}}{k!}}$
Dystrybuanta	${\tfrac {\Gamma (\lfloor k+1\rfloor ,\lambda )}{\lfloor k\rfloor !}}\!{\text{ dla }}k\geqslant 0$ (gdzie $\Gamma (x,y)$ to niekompletna funkcja gamma)
Wartość oczekiwana (średnia)	$\lambda$
Mediana	$\approx \lfloor \lambda +{\tfrac {1}{3}}-{\tfrac {0{,}02}{\lambda }}\rfloor$
Moda	$\lfloor \lambda \rfloor$ i $\lambda -1,$ gdzie $\lambda$ jest całkowite
Wariancja	$\lambda$
Współczynnik skośności	$\lambda ^{-1/2}$
Kurtoza nadwyżkowa (eksces)	$\lambda ^{-1}$
Entropia	$\lambda [1\!-\!\ln(\lambda )]\!+\!e^{-\lambda }\sum _{k=0}^{\infty }{\tfrac {\lambda ^{k}\ln(k!)}{k!}}$ dla dużych $\lambda {:}$ ${\tfrac {1}{2}}\log(2\pi e\lambda )$ $-{\tfrac {1}{12\lambda }}$ $-{\tfrac {1}{24\lambda ^{2}}}$ $-{\tfrac {19}{360\lambda ^{3}}}$ $+O({\tfrac {1}{\lambda ^{4}}})$
Funkcja tworząca momenty	$\exp(\lambda (e^{t}-1))$
Funkcja charakterystyczna	$\exp(\lambda (e^{it}-1))$
Odkrywca	Siméon Denis Poisson (rozkład pierwszy raz pod tą nazwą wystąpił u H.E. Sopera)

Rozkład Poissona 📖 Wikipedia

Funkcja masy prawdopodobieństwa

Oznaczenia

Testowanie zgodności z rozkładem Poissona

Przykład: Pomiar rozkładu prawdopodobieństwa emisji cząstek α {\displaystyle \alpha }

Estymacja parametru rozkładu

Prawdopodobieństwo zdarzenia skumulowanego

Test zgodności Pearsona

Stała rozpadu promieniotwórczego a stała λ {\displaystyle \lambda } rozkładu Poissona. Wnioski dotyczące zjawisk losowych

Interpretacja fizyczna

Założenia teoretyczne

Przykłady innych zjawisk modelowanych rozkładem Poissona

Własności

Powiązania z innymi rozkładami

Prawo rzadkich zdarzeń

Uogólnienie

Szum Poissona i jego zastosowania

Estymacja parametru λ {\displaystyle \lambda } rozkładu Poissona. Przedziały ufności

Metoda największej wiarygodności

Statystyka bayesowska

Przedział ufności

Rozkład Poissona w językach programowania i arkuszach kalkulacyjnych

Języki programowania

Arkusze kalkulacyjne

Implementacja rozkładu Poissona w Pythonie bez użycia bibliotek

Generowanie zmiennych losowych o rozkładzie Poissona

2-wymiarowy rozkład Poissona

Zobacz też

Przypisy

Bibliografia

Referencje

Linki zewnętrzne

📚 Artikel Terkait di Wikipedia

Przykład: Pomiar rozkładu prawdopodobieństwa emisji cząstek $\alpha$

Stała rozpadu promieniotwórczego a stała $\lambda$ rozkładu Poissona. Wnioski dotyczące zjawisk losowych

Estymacja parametru $\lambda$ rozkładu Poissona. Przedziały ufności