Fonction caractéristique (probabilités) 📖 Wikipedia

En mathématiques et plus particulièrement en théorie des probabilités et en statistique, la fonction caractéristique d'une variable aléatoire réelle $X$ est une quantité qui détermine de façon unique sa loi de probabilité. Si cette variable aléatoire a une densité, alors la fonction caractéristique est la transformée de Fourier inverse de la densité. Les valeurs en zéro des dérivées successives de la fonction caractéristique permettent de calculer les moments de la variable aléatoire.

La fonction caractéristique est parfois appelée première fonction caractéristique alors que la seconde fonction caractéristique (ou encore deuxième fonction caractéristique) en est la transformée logarithmique.

Le théorème de Bochner et le théorème de Khintchine donnent des conditions nécessaires et suffisantes pour qu’une fonction soit la fonction caractéristique d’une variable aléatoire.

Définitions

modifier

Pour une variable réelle

modifier

La fonction caractéristique d'une variable aléatoire réelle $X$ est la fonction à valeurs complexes définie sur $\mathbb {R}$ par

{\begin{aligned}\varphi _{X}(t)&=\mathbb {E} \left[\operatorname {e} ^{\mathrm {i} tX}\right]\\&=\mathbb {E} \left[\cos(tX)\right]+\mathrm {i} \ \mathbb {E} \left[\sin(tX)\right].\end{aligned}}

Si cette variable aléatoire possède une densité, disons $f X$ , alors

\varphi _{X}(t)=\int _{\mathbb {R} }f_{X}(x)\operatorname {e} ^{\mathrm {i} tx}\,\mathrm {d} x.

Ainsi, dans le cas d'une variable aléatoire à densité, la fonction caractéristique est la transformée de Fourier (probabiliste) inverse (à un facteur

2π

près dans l'exponentielle suivant la convention) de la densité. Probablement pour cette raison, il arrive que l'on choisisse une convention différente^[1], à savoir

\varphi _{X}(t)=\mathbb {E} [\operatorname {e} ^{2\mathrm {i} \pi tX}]

. On notera que bien que l'usage dans la communauté des probabilistes soit de parler de transformée de Fourier, il s'agit en toute rigueur de la transformation de Fourier inverse.

On peut aussi remarquer qu'on a :

\varphi _{X}(t)=\int _{0}^{1}\operatorname {e} ^{\mathrm {i} tQ_{X}(p)}\,\mathrm {d} p,

où $Q X (p)$ est la fonction quantile^[2].

Si cette variable est à valeurs dans l'ensemble des entiers naturels alors

\varphi _{X}(t)=\sum _{k=0}^{\infty }\mathbb {P} (X=k){\rm {e}}^{\mathrm {i} tk}=G_{X}({\rm {e}}^{\mathrm {i} t})

où

G X

désigne sa fonction génératrice des probabilités généralisée à un paramètre complexe.

Pour une variable d'un espace euclidien

modifier

Plus généralement, la fonction caractéristique d'une variable aléatoire $X$ à valeurs dans $\mathbb {R} ^{d}$ est la fonction à valeurs complexes définie sur $\mathbb {R} ^{d}$ par

\varphi _{X}(u)=\mathbb {E} \left[\operatorname {e} ^{\mathrm {i} \langle u,X\rangle }\right]

où $\langle u,X\rangle$ est le produit scalaire de $u$ avec $X$ .

Pour une fonction de répartition

modifier

La fonction caractéristique d'une fonction de répartition $F$ est la fonction à valeurs complexes définie sur $\mathbb {R}$ par

\varphi _{F}(t)=\int _{-\infty }^{+\infty }{\textrm {e}}^{\mathrm {i} tz}\,\mathrm {d} F(z)

où l'intégrale est une intégrale de Stieltjes.

Interprétation

modifier

La fonction caractéristique est une manière de décrire une variable aléatoire. La fonction caractéristique détermine complètement le comportement et les propriétés de la distribution de probabilité de la variable aléatoire $X$ .

Relation avec la fonction de répartition

modifier

La fonction caractéristique est similaire à la fonction de répartition : $F_{X}(x)=\operatorname {E} \left[\mathbf {1} _{\{X\leq x\}}\right]$ (où $1 {X \leq x}$ est la fonction indicatrice — elle est égale à 1 lorsque X ≤ x, et zéro sinon), qui détermine également complètement le comportement et les propriétés de la distribution de probabilité de la variable aléatoire $X$ .

Les deux approches sont équivalentes dans le sens où connaissant l’une des fonctions, il est toujours possible de trouver l’autre, mais elles fournissent des informations différentes pour comprendre les caractéristiques de la variable aléatoire. De plus, dans des cas particuliers, il peut y avoir des différences quant à savoir si ces fonctions peuvent être représentées comme des expressions impliquant des fonctions standards simples.

Comme il existe une relation bijective entre une loi de probabilités et sa fonction caractéristique, on peut retrouver la fonction de densité $f$ ou la fonction de répartition $F$ d'une loi à partir de sa fonction caractéristique $φ$ , de la même façon que la connaissance de $F$ ou $f$ permet de construire $φ$ . Il existe ainsi plusieurs théorèmes d'inversion pour retrouver $F$ à partir de $φ$

Théorème — Si la fonction caractéristique $φ X$ d'une variable aléatoire $X$ est intégrable, alors $F X$ est absolument continue, et $X$ admet donc une fonction de densité. Dans le cas où $X$ est une variable scalaire, la fonction de densité est donnée par $f_{X}(x)=F_{X}'(x)={\frac {1}{2\pi }}\int _{\mathbf {R} }\operatorname {e} ^{-\mathrm {i} tx}\varphi _{X}(t)\,\mathrm {d} t.$

Dans le cas multivarié, on a $f_{X}(x)={\frac {1}{(2\pi )^{n}}}\int _{\mathbf {R} ^{n}}\operatorname {e} ^{-\mathrm {i} (t\cdot x)}\varphi _{X}(t)\lambda (\mathrm {d} t)$

où ${\textstyle t\cdot x}$ désigne le produit scalaire. La fonction de densité est la dérivée de Radon-Nikodym de la loi $μ X$ par rapport à la mesure de Lebesgue $λ$ : $f_{X}(x)={\frac {\mathrm {d} \mu _{X}}{\mathrm {d} \lambda }}(x).$

Théorème (Paul Lévy) — Si $φ X$ est la fonction caractéristique d'une loi de fonction de répartition $F X$ , soit deux points $a < b$ sont tels que $x | a < x < b$ est un ensemble de continuité de $μ X$ (dans le cas scalaire, cela revient à dire que $F X$ est continue en $a$ et $b$ ), alors

Si $X$ est scalaire : $F_{X}(b)-F_{X}(a)={\frac {1}{2\pi }}\lim _{T\to \infty }\int _{-T}^{+T}{\frac {\operatorname {e} ^{-\mathrm {i} ta}-\operatorname {e} ^{-\mathrm {i} tb}}{\mathrm {i} t}}\,\varphi _{X}(t)\,\mathrm {d} t.$

On peut réécrire cette formule sous une forme plus simple pour le calcul numérique^[3]: ${\frac {F_{X}(x+h)-F_{X}(x-h)}{2h}}={\frac {1}{2\pi }}\int _{-\infty }^{\infty }{\frac {\sin ht}{ht}}\operatorname {e} ^{-\mathrm {i} tx}\varphi _{X}(t)\,\mathrm {d} t.$ Pour une variable aléatoire minorée, on peut obtenir $F(b)$ en choisissant $a$ tel que $F(a)=0.$ Sinon, une variable n'est pas minorée, la limite pour $a\to -\infty$ donne $F(b)$ , mais n'est pas utile numériquement^[3].

Si $X$ est un vecteur aléatoire de taille $n$ :

$\mu _{X}\left(\{a<x<b\}\right)={\frac {1}{(2\pi )^{n}}}\lim _{T_{1}\to \infty }\cdots \lim _{T_{n}\to \infty }\int \limits _{-T_{1}\leq t_{1}\leq T_{1}}\cdots \int \limits _{-T_{n}\leq t_{n}\leq T_{n}}\prod _{k=1}^{n}\left({\frac {\operatorname {e} ^{-\mathrm {i} t_{k}a_{k}}-\operatorname {e} ^{-\mathrm {i} t_{k}b_{k}}}{it_{k}}}\right)\varphi _{X}(t)\lambda (\mathrm {d} t_{1}\times \cdots \times \mathrm {d} t_{n})$

Théorème — Si $a$ est un atome (éventuel) de $X$ (dans le cas scalaire, un point de discontinuité de $F X$ ) alors

si $X$ est scalaire : $F_{X}(a)-F_{X}(a-0)=\lim _{T\to \infty }{\frac {1}{2T}}\int _{-T}^{+T}\operatorname {e} ^{-\mathrm {i} ta}\varphi _{X}(t)\,\mathrm {d} t$
si $X$ est un vecteur aléatoire^[4]: $\mu _{X}(\{a\})=\lim _{T_{1}\to \infty }\cdots \lim _{T_{n}\to \infty }\left(\prod _{k=1}^{n}{\frac {1}{2T_{k}}}\right)\int \limits _{[-T_{1},T_{1}]\times \dots \times [-T_{n},T_{n}]}\operatorname {e} ^{-\mathrm {i} (t\cdot a)}\varphi _{X}(t)\lambda (\mathrm {d} t)$

Théorème — Pour une variable aléatoire univariée $X$ , si $x$ est continue en $F X$ alors

F_{X}(x)={\frac {1}{2}}-{\frac {1}{\pi }}\int _{0}^{\infty }{\frac {\operatorname {Im} [\operatorname {e} ^{-\mathrm {i} tx}\varphi _{X}(t)]}{t}}\,\mathrm {d} t

et:

f_{X}(x)={\frac {1}{\pi }}\int _{0}^{\infty }\operatorname {Re} [\operatorname {e} ^{-\mathrm {i} tx}\varphi _{X}(t)]\,\mathrm {d} t

L'intégrale peut ne pas être Lebesgue-integrable ; par exemple, si $X$ est une variable aléatoire discrète constante égale à 0, on retrouve l'intégrale de Dirichlet.

Il existe également des formules d'inversion pour les lois multivariées^[3]^,^[5].

Propriétés

modifier

La fonction caractéristique détermine de façon unique la loi d'une variable aléatoire au sens où « $φ X = φ Y$ » (égalité de fonctions) équivaut à « $X$ et $Y$ ont la même loi ».
Si $X$ et $Y$ sont deux variables aléatoires indépendantes, $φ X + Y = φ X φ Y$ . Plus généralement, si $X 1,..., X n$ sont des variables aléatoires mutuellement indépendantes, alors $φ X 1 +...+ X n = φ X 1 ...φ X n$ . En appliquant alors la transformée de Fourier à $φ X + Y$ , cela permet de retrouver la loi de $X + Y$ .
Il y a une relation entre les moments et la fonction caractéristique d'une variable aléatoire. Lorsque les moments de tout ordre existent et que leur série génératrice exponentielle a un rayon de convergence non nul $R$ alors :
$\varphi _{X}(t)=\sum _{k=0}^{\infty }{\frac {\mathrm {i} ^{k}\mathbb {E} [X^{k}]}{k!}}t^{k}~~~\forall t\in \left]-R,R\right[$ .

Démonstration

Soit $t\in [0,R[$ , on a $\varphi _{X}(t)=\mathbb {E} \left[\operatorname {e} ^{\mathrm {i} tX}\right]=\mathbb {E} \left[\sum _{k=0}^{\infty }{\frac {(\mathrm {i} tX)^{k}}{k!}}\right]=\sum _{k=0}^{\infty }{\frac {\mathrm {i} ^{k}}{k!}}t^{k}\mathbb {E} \left[X^{k}\right]$ .

Pour justifier l'inversion entre la somme et l'espérance il suffit de montrer que $\sum _{k=0}^{\infty }{\frac {\mathbb {E} [|X|^{k}]}{k!}}t^{k}$ est finie et d'appliquer le théorème de Fubini. On remarque que pour tout $k\geq 0$ :

\mathbb {E} [|X|^{2k+1}]=\mathbb {E} [|X|^{2k+1}\mathbf {1} _{|X|\leq 1}]+\mathbb {E} [|X|^{2k+1}\mathbf {1} _{|X|>1}]\leq 1+\mathbb {E} [X^{2k+2}]

.

Ainsi on a pour tout $t\in \left[0,R\right[$ :

\sum _{k=0}^{\infty }{\frac {\mathbb {E} [|X|^{k}]}{k!}}t^{k}\leq \mathrm {e} ^{t}+2\sum _{k=0}^{\infty }{\frac {\mathbb {E} [X^{2k}]}{(2k)!}}t^{2k}\leq \mathrm {e} ^{t}+2\sum _{k=0}^{\infty }{\frac {|\mathbb {E} [X^{k}]|}{k!}}t^{k}<+\infty

.

La dernière somme est bien convergente car on sait qu'une série entière est absolument convergente dans l'intérieur de son disque de convergence. On procède ensuite de même pour $t\in \left]-R,0\right]$ .

Cette relation sert parfois à calculer l'espérance (moment d'ordre 1) et la variance d'une variable aléatoire. Plus explicitement, en évaluant en 0 :
$\varphi _{X}^{(k)}(0)=\mathrm {i} ^{k}\mathbb {E} [X^{k}]$

donc :
$\mathbb {E} [X]=-\mathrm {i} \varphi _{X}^{\prime }(0)$

$\mathbb {E} \left[X^{2}\right]=-\,\varphi _{X}^{\prime \prime }(0)$

${\textrm {Var}}(X)=-\,\varphi _{X}^{\prime \prime }(0)+\left(\varphi _{X}^{\prime }(0)\right)^{2}$ .
La relation suivante sert, par exemple, à calculer la fonction caractéristique d'une variable centrée réduite, à partir de la fonction caractéristique de la variable de départ :
$\varphi _{aX+b}(t)=\varphi _{X}(at)\,\operatorname {e} ^{\mathrm {i} tb}$ .
Le théorème de convergence de Lévy dit que la convergence en loi est équivalente à la convergence simple de la fonction caractéristique en tout point.

Seconde fonction caractéristique

modifier

Définition

modifier

La seconde fonction caractéristique d'une variable aléatoire réelle $X$ est la fonction à valeurs complexes définie par

\psi _{X}(t)={\text{Log }}\varphi _{X}(t)={\text{Log }}\mathbb {E} [e^{\mathrm {i} tX}]

où Log désigne la branche principale du logarithme qui est définie et holomorphe sur le plan complexe privé de la demi-droite des réels négatifs ou nuls et qui vaut 0 en 1.

Puisque la fonction caractéristique est toujours continue et vaut 1 en 0 la seconde fonction caractéristique est toujours bien définie sur un voisinage de 0.

Lien avec la fonction génératrice des cumulants

modifier

La seconde fonction caractéristique est parfois appelée la fonction génératrice des cumulants. Le mathématicien Eugène Lukacz, dans son livre Characteristic functions^[6], observe l'utilisation malheureuse du terme « fonction génératrice des cumulants » car la seconde fonction génératrice existe toujours au voisinage de 0 tandis que les cumulants et les moments de $X$ pourraient très bien ne pas exister. Il ajoute également que le terme « seconde fonction caractéristique » vient de la littérature mathématique française.
La fonction génératrice des cumulants peut également désigner le logarithme népérien de la fonction génératrice des moments.

Références

modifier

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Characteristic function (probability theory) » (voir la liste des auteurs).

↑ (en) Salomon Bochner, Harmonic analysis and the theory of probability, University of California Press, 1955
↑ (en) W. T. Shaw et J. McCabe, « Monte Carlo sampling given a Characteristic Function: Quantile Mechanics in Momentum Space », 2009.
↑ ^{a b et c} (en) N.G. Shephard, « From characteristic function to distribution function: A simple framework for the theory », Econometric Theory, vol. 7, n^o 4,‎ 1991, p. 519–529 (DOI 10.1017/s0266466600004746, S2CID 14668369, lire en ligne)
↑ (en) R. Cuppens, Decomposition of multivariate probabilities, Academic Press, 1975 (ISBN 9780121994501), Theorem 2.3.2.
↑ (en) N.G. Shephard, « Numerical integration rules for multivariate inversions », Journal of Statistical Computation and Simulation, vol. 39, n^os 1–2,‎ 1991, p. 37–46 (DOI 10.1080/00949659108811337, lire en ligne)
↑ (en) Eugene Lukacz, Characteristic functions, London, Griffin, 1970, p. 27.

Articles connexes

modifier

Fonction génératrice des moments

Liens externes

modifier

(en) Eric W. Weisstein, « Characteristic Function », sur MathWorld

Portail des probabilités et de la statistique

[1] (en) Salomon Bochner, Harmonic analysis and the theory of probability, University of California Press, 1955

[2] (en) W. T. Shaw et J. McCabe, « Monte Carlo sampling given a Characteristic Function: Quantile Mechanics in Momentum Space », 2009.

[Shephard1991a-3] {a b et c} (en) N.G. Shephard, « From characteristic function to distribution function: A simple framework for the theory », Econometric Theory, vol. 7, n^o 4,‎ 1991, p. 519–529 (DOI 10.1017/s0266466600004746, S2CID 14668369, lire en ligne)

[4] (en) R. Cuppens, Decomposition of multivariate probabilities, Academic Press, 1975 (ISBN 9780121994501), Theorem 2.3.2.

[Shephard1991b-5] (en) N.G. Shephard, « Numerical integration rules for multivariate inversions », Journal of Statistical Computation and Simulation, vol. 39, n^os 1–2,‎ 1991, p. 37–46 (DOI 10.1080/00949659108811337, lire en ligne)

[6] (en) Eugene Lukacz, Characteristic functions, London, Griffin, 1970, p. 27.

[1]

[2]

[3]

[4]

[5]

[6]

Fonction caractéristique (probabilités) 📖 Wikipedia

Sommaire

Définitions

Pour une variable réelle

Pour une variable d'un espace euclidien

Pour une fonction de répartition

Interprétation

Relation avec la fonction de répartition

Propriétés

Seconde fonction caractéristique

Définition

Lien avec la fonction génératrice des cumulants

Références

Articles connexes

Liens externes

📚 Artikel Terkait di Wikipedia

Métabolisme

Noyau (statistiques)

Régression logistique

Oyat

Transformation de Fourier rapide

Kératocône

Association stellaire

Modèle de cointégration