En mathématiques et plus particulièrement en théorie des probabilités et en statistique, la fonction caractéristique d'une variable aléatoire réelle X est une quantité qui détermine de façon unique sa loi de probabilité. Si cette variable aléatoire a une densité, alors la fonction caractéristique est la transformée de Fourier inverse de la densité. Les valeurs en zéro des dérivées successives de la fonction caractéristique permettent de calculer les moments de la variable aléatoire.
La fonction caractéristique est parfois appelée première fonction caractéristique alors que la seconde fonction caractéristique (ou encore deuxième fonction caractéristique) en est la transformée logarithmique.
Le théorème de Bochner et le théorème de Khintchine donnent des conditions nécessaires et suffisantes pour qu’une fonction soit la fonction caractéristique d’une variable aléatoire.
Définitions
modifierPour une variable réelle
modifierLa fonction caractéristique d'une variable aléatoire réelle X est la fonction à valeurs complexes définie sur par
- Si cette variable aléatoire possède une densité, disons fX, alors
- Ainsi, dans le cas d'une variable aléatoire à densité, la fonction caractéristique est la transformée de Fourier (probabiliste) inverse (à un facteur 2π près dans l'exponentielle suivant la convention) de la densité. Probablement pour cette raison, il arrive que l'on choisisse une convention différente[1], à savoir . On notera que bien que l'usage dans la communauté des probabilistes soit de parler de transformée de Fourier, il s'agit en toute rigueur de la transformation de Fourier inverse.
On peut aussi remarquer qu'on a :
où QX(p) est la fonction quantile[2].
- Si cette variable est à valeurs dans l'ensemble des entiers naturels alors
- où GX désigne sa fonction génératrice des probabilités généralisée à un paramètre complexe.
Pour une variable d'un espace euclidien
modifierPlus généralement, la fonction caractéristique d'une variable aléatoire X à valeurs dans est la fonction à valeurs complexes définie sur par
où est le produit scalaire de u avec X.
Pour une fonction de répartition
modifierLa fonction caractéristique d'une fonction de répartition F est la fonction à valeurs complexes définie sur par
où l'intégrale est une intégrale de Stieltjes.
Interprétation
modifierLa fonction caractéristique est une manière de décrire une variable aléatoire. La fonction caractéristique détermine complètement le comportement et les propriétés de la distribution de probabilité de la variable aléatoire X.
Relation avec la fonction de répartition
modifierLa fonction caractéristique est similaire à la fonction de répartition : (où 1{X ≤ x} est la fonction indicatrice — elle est égale à 1 lorsque X ≤ x, et zéro sinon), qui détermine également complètement le comportement et les propriétés de la distribution de probabilité de la variable aléatoire X.
Les deux approches sont équivalentes dans le sens où connaissant l’une des fonctions, il est toujours possible de trouver l’autre, mais elles fournissent des informations différentes pour comprendre les caractéristiques de la variable aléatoire. De plus, dans des cas particuliers, il peut y avoir des différences quant à savoir si ces fonctions peuvent être représentées comme des expressions impliquant des fonctions standards simples.
Comme il existe une relation bijective entre une loi de probabilités et sa fonction caractéristique, on peut retrouver la fonction de densité f ou la fonction de répartition F d'une loi à partir de sa fonction caractéristique φ, de la même façon que la connaissance de F ou f permet de construire φ. Il existe ainsi plusieurs théorèmes d'inversion pour retrouver F à partir de φ
Théorème — Si la fonction caractéristique φX d'une variable aléatoire X est intégrable, alors FX est absolument continue, et X admet donc une fonction de densité. Dans le cas où X est une variable scalaire, la fonction de densité est donnée par
Dans le cas multivarié, on a
où désigne le produit scalaire. La fonction de densité est la dérivée de Radon-Nikodym de la loi μX par rapport à la mesure de Lebesgue λ:
Théorème (Paul Lévy) — Si φX est la fonction caractéristique d'une loi de fonction de répartition FX, soit deux points a < b sont tels que x | a < x < b est un ensemble de continuité de μX (dans le cas scalaire, cela revient à dire que FX est continue en a et b), alors
- Si X est scalaire :
On peut réécrire cette formule sous une forme plus simple pour le calcul numérique[3]: Pour une variable aléatoire minorée, on peut obtenir en choisissant tel que Sinon, une variable n'est pas minorée, la limite pour donne , mais n'est pas utile numériquement[3].
- Si X est un vecteur aléatoire de taille n :
Théorème — Si a est un atome (éventuel) de X (dans le cas scalaire, un point de discontinuité de FX) alors
- si X est scalaire :
- si X est un vecteur aléatoire[4]:
Théorème — Pour une variable aléatoire univariée X, si x est continue en FX alors
et:
L'intégrale peut ne pas être Lebesgue-integrable ; par exemple, si X est une variable aléatoire discrète constante égale à 0, on retrouve l'intégrale de Dirichlet.
Il existe également des formules d'inversion pour les lois multivariées[3],[5].
Propriétés
modifier- La fonction caractéristique détermine de façon unique la loi d'une variable aléatoire au sens où « φX = φY » (égalité de fonctions) équivaut à « X et Y ont la même loi ».
- Si X et Y sont deux variables aléatoires indépendantes, φX+Y = φXφY. Plus généralement, si X1,...,Xn sont des variables aléatoires mutuellement indépendantes, alors φX1+...+Xn = φX1...φXn. En appliquant alors la transformée de Fourier à φX+Y, cela permet de retrouver la loi de X+Y.
- Il y a une relation entre les moments et la fonction caractéristique d'une variable aléatoire. Lorsque les moments de tout ordre existent et que leur série génératrice exponentielle a un rayon de convergence non nul R alors :
- .
- Cette relation sert parfois à calculer l'espérance (moment d'ordre 1) et la variance d'une variable aléatoire. Plus explicitement, en évaluant en 0 :
- donc :
- .
- La relation suivante sert, par exemple, à calculer la fonction caractéristique d'une variable centrée réduite, à partir de la fonction caractéristique de la variable de départ :
- .
- Le théorème de convergence de Lévy dit que la convergence en loi est équivalente à la convergence simple de la fonction caractéristique en tout point.
Seconde fonction caractéristique
modifierDéfinition
modifierLa seconde fonction caractéristique d'une variable aléatoire réelle X est la fonction à valeurs complexes définie par
où Log désigne la branche principale du logarithme qui est définie et holomorphe sur le plan complexe privé de la demi-droite des réels négatifs ou nuls et qui vaut 0 en 1.
Puisque la fonction caractéristique est toujours continue et vaut 1 en 0 la seconde fonction caractéristique est toujours bien définie sur un voisinage de 0.
Lien avec la fonction génératrice des cumulants
modifier- La seconde fonction caractéristique est parfois appelée la fonction génératrice des cumulants. Le mathématicien Eugène Lukacz, dans son livre Characteristic functions[6], observe l'utilisation malheureuse du terme « fonction génératrice des cumulants » car la seconde fonction génératrice existe toujours au voisinage de 0 tandis que les cumulants et les moments de X pourraient très bien ne pas exister. Il ajoute également que le terme « seconde fonction caractéristique » vient de la littérature mathématique française.
- La fonction génératrice des cumulants peut également désigner le logarithme népérien de la fonction génératrice des moments.
Références
modifier- ↑ (en) Salomon Bochner, Harmonic analysis and the theory of probability, University of California Press, 1955
- ↑ (en) W. T. Shaw et J. McCabe, « Monte Carlo sampling given a Characteristic Function: Quantile Mechanics in Momentum Space », 2009.
- (en) N.G. Shephard, « From characteristic function to distribution function: A simple framework for the theory », Econometric Theory, vol. 7, no 4, 1991, p. 519–529 (DOI 10.1017/s0266466600004746, S2CID 14668369, lire en ligne)
- ↑ (en) R. Cuppens, Decomposition of multivariate probabilities, Academic Press, 1975 (ISBN 9780121994501), Theorem 2.3.2.
- ↑ (en) N.G. Shephard, « Numerical integration rules for multivariate inversions », Journal of Statistical Computation and Simulation, vol. 39, nos 1–2, 1991, p. 37–46 (DOI 10.1080/00949659108811337, lire en ligne)
- ↑ (en) Eugene Lukacz, Characteristic functions, London, Griffin, 1970, p. 27.
Articles connexes
modifierLiens externes
modifier(en) Eric W. Weisstein, « Characteristic Function », sur MathWorld