Voici quelques notes autour de la distance de Wasserstein et du test d'ajustement de Wasserstein.
Définition de la distance de Wasserstein :
: l’ensemble des mesures de probabilité sur
ayant un moment d’ordre 2 fini.
La distance de Wasserstein entre deux éléments
et
de
est définie par :
,
où signifie : la loi de
, et
: l’espérance mathématique.
Expression en fonction des fonctions de répartition inverses de et
:
Définition du test de Wasserstein : (cf. [2])
une mesure de probabilité de fonction de distribution inverse
.
Test de Wasserstein d’ajustement à la loi P : une version empirique de la distance de Wasserstein.
Statistique de test pour un échantillon :
,
où respectivement
et
si
sont la mesure empirique et la fonction quantile empirique associée à l’échantillon, définie pour .
désigne la statistique d'ordre. Pour des grandes valeurs de
, rejet de l’hypothèse d’ajustement à P (pour les valeurs critiques : cf. [2], [3]).
Ajustement à une famille de localisation et changement d’échelle :
Distance de Wasserstein : bien adaptée au problème de l’ajustement à une famille de localisation et changement d’échelle.
Raison : manière simple dont se traduit un changement dans la localisation et l’échelle sur la fonction quantile.
Si :
et
, pour
.
F la fonction de répartition d'une loi de moyenne 0 et de variance 1. Famille de localisation et changement d'échelle associée :
où a pour fonction de répartition inverse :
.
Soit avec fonction de répartition inverse
, moyenne
et variance
.
Distance de Wasserstein de à
: la distance minimale entre
et un élément de la famille:
.
Infimum atteint en ; la valeur de l'infimum :
Test de Wasserstein d'ajustement à la famille :
une version empirique normalisée de cette distance (cf [2], [3]) :
,
où est la variance empirique.
Propriétés connues du test de Wasserstein :
- Distribution asymptotique sous hypothèse nulle pour le test de normalité : cf. [2].
- Distribution asymptotique sous hypothèse nulle pour d'autres familles de localisation et changement d'échelle : cf. [3]. Les différents comportement sont liés au type d'extrêmes de la famille de distributions.
Mes travaux liés au test de Wasserstein :
- Distribution asymptotique sous hypothèse alternative contiguë. Deux méthodes : approximation par une intégrale double par rapport au processus empirique (cf. [1]), et méthode directe pour des alternatives du type suivant : l'échantillon
a pour fonction de répartition inverse
, telle que pour une certaine fonction
de carré intégrable :
- Etudes d'efficacité locale asymptotique : cf. [1]. La courbure (au sens de Janssen, cf. [4]) permet de mettre en relief les alternatives qui sont le mieux détectées par le test en exhibant les directions d'alternative selon lesquelles la puissance est la plus importante.
Bibliographie :
[1] Boistard (2007), Efficacité asymptotique de tests liés à la statistique de Wasserstein. Thèse.
[2] E. del Barrio, J.A. Cuesta Albertos, C. Matrán et J.M. Rodríguez Rodríguez (1999). Tests of goodness of fit based on the -Wasserstein distance. Ann. Statist., 27(4):1230–1239.
[3] E. del Barrio, J.A. Cuesta Albertos et C. Matrán (2000). Contributions of empirical and quantile processes to the asymptotic theory of goodness-of-fit tests. Test,9(1): 1–96.
[4] A. Janssen (1995). Principal component decomposition of non-parametric tests. Probab. Theory Related Fields, 101(2): 193–209.