Publications

Théorèmes de la limite centrale fonctionnels pour les plans de sondages à une phase

H. Boistard, H.P. Lopuhaä et A. Ruiz-Gazen,

article paru dans Annals of Statistics, vol. 45, n. 4, p. 1728-1758, 2017.

Télécharger une version.

Pour une inférence jointe sous le modèle et le plan de sondage, nous établissons des théorèmes de la limite centrale pour le processus empirique de Horvitz-Thompson et le processus empirique de Hájek centrés par leur moyenne sous la population finie et par leur moyenne sous le modèle de super-population, dans le cadre des sondages. Les résultats peuvent s’appliquer à des plans de sondage génériques et nécessitent uniquement des conditions sur les corrélations à certains ordres. Nous appliquons nos résultats à une fonctionnelle statistique différentiable au sens de Hadamard et nous illustrons son comportement asymptotique par des simulations.

Approximation des probabilités d’inclusion en échantillonnage réjectif et applications à des corrélations d’ordre supérieur

H. Boistard, H.P. Lopuhaä et A. Ruiz-Gazen,

Article paru dans Electronic Journal of Statistics, vol. 6, p. 1967–1983, 2012.
Télécharger une version.

Cet article est consacré à l’échantillonnage réjectif. Nous donnons un développement des probabilités d’inclusion jointes d’ordre quelconque en termes de probabilités d’inclusion d’ordre un, étendant des résultats de Hájek (1964) et Hájek (1981) et rendant plus précis le terme de reste. Utilisant la même méthode que Hájek (1981), la preuve est basée sur les développements de Edgeworth. Le résultat principal est appliqué pour déduire des bornes sur les corrélations d’ordre supérieur, nécessaires à la consistance et à la normalité asymptotique de plusieurs estimateurs complexes.

Comportement d’estimateurs robustes connus en longue mémoire pour de grands échantillons

C. Lévy-Leduc, H. Boistard, E. Moulines, M. S. Taqqu et V. A. Reisen.

Article publié dans Statistics, vol. 45, n. 1, p. 59–71, 2011.
Télécharger une version.

Cet article est consacré aux estimateurs robustes de localisation et échelle en longue mémoire, en particulier l’estimateur de localisation de Hodges-Lehman, l’estimateur d’échelle de Shamos-Bickel et l’estimateur d’échelle de Rousseeuw-Croux. Les propriétés de ces estimateurs pour des échantillons de grande taille sont revues en détail. L’article inclut des simulations pour examiner le comportement des estimateurs pour des tailles d’échantillon finies.

Estimation robuste de l’échelle et de la fonction d’autocovariance de processus gaussiens en courte et longue mémoire

C. Lévy-Leduc, H. Boistard, E. Moulines, M. S. Taqqu et V. A. Reisen.

Article paru dans Journal of Time Series Analysis, vol. 32, n. 2, p. 135-156, 2011. Télécharger une version de l’article.

Une propriété intéressante d’un estimateur d’autocovariance est la robustesse à la présence de données atypiques additives. Il est connu que l’autocovariance empirique, basée sur des moments, ne possède pas cette propriété. Il est donc très utile de disposer d’un estimateur d’autocovariance robuste pour la modélisation des séries temporelles. Dans cet article, les propriétés asymptotiques des estimateurs d’échelle et d’autocovariance robustes proposés par Rousseeuw et Croux (1993) et Ma et Genton (2000) sont établies pour les processus gaussiens, en courte et longue mémoire. Nous montrons que dans le cadre de la courte mémoire, l’estimateur robuste est asymptotiquement normal avec la vitesse $$\sqrt{n}$$, où n est le nombre d’observations. Une expression explicite de la variance asymptotique est donnée et comparée avec la variance asymptotique de l’estimateur d’autocovariance classique. Dans le cadre de la longue mémoire, la distribution limite a le même comportement que celle de l’estimateur d’autocovariance classique, avec une limite gaussienne à la vitesse $$\sqrt{n}$$ quand le paramètre de Hurst H est inférieur ou égal à 3/4 et avec une limite non gaussienne, appartenant au deuxième chaos de Wiener, à une vitesse qui dépend du paramètre de Hurst, quand $$H\in (3/4, 1)$$. Des simulations par la méthode de Monte Carlo sont présentées pour illustrer nos propositions et les données du Nil sont analysées à titre d’application. Les résultats théoriques et empiriques suggèrent fortement d’utiliser les estimateurs robustes comme une alternative pour estimer la structure de dépendance des processus gaussiens.

Propriétés asymptotiques de U-processus en longue mémoire

C. Lévy-Leduc, H. Boistard, E. Moulines, M. S. Taqqu and V. A. Reisen.

Article paru dans Annals of Statistics, vol. 39, n. 3, p. 1399-1426, 2011. Télécharger une version.

Soit $$(X_i)_{i\geq1}$$ un processus gaussien centré de covariance $$\rho(k) = E(X_1X_{k+1})$$ qui satisfait :
$$\rho(0=1$$ et $$\rho(k)=k^{-D}L(k)$$ où D appartient à (0,1) et L est une fonction à variations lentes à l’infini. Considérons le U-processus $$\{U_n(r), r \in I\}$$ défini par
$$U_n(r)=\frac{1}{n(n-1)}\sum_{1\leq i\neq j \leq n}\mathbb{1}_{\{G(X_i,X_j\leq r\}},$$
où I est un intervalle de $$\mathbb{R}$$ et G est une fonction symétrique. Dans cet article, nous donnons des théorèmes de la limite centrale de la limite non centrale pour $$U_n$$. Ils sont utilisés pour déduire dans le cadre de la longue mémoire, de nouvelles propriétés de nombreux estimateurs connus comme l’estimateur de localisation robuste de Hodges-Lehmann, la statistique de rang de Wilcoxon, l’intégrale de corrélation empirique et un estimateur d’échelle associé. On observe que ces estimateurs robustes ont la même distribution asymptotique que les estimateurs de localisation et d’échelle classiques. Les distributions limites sont exprimées en termes d’intégrales de Wiener-Itô multiples.

Théorème de la limite centrale pour des intégrales multiples par rapport au processus empirique

Travail en collaboration avec Eustasio del Barrio.

Article paru dans Statistics and Probability Letters, vol. 79(2), p. 188-195, 2009. Télécharger une version de l’article.

Dans cet article, nous donnons des résultats de convergence faible d’intégrales multiples par rapport au processus empirique. Nous considérons des objets du type
$$J_{n,m}(h)=\int’h(x_1, \dots, x_m)d\mathbb{G}_n(x_1)\dots \mathbb{G}_n(x_m),$$
où h est une fonction réelle symétrique de carré intégrable de m variables, l’échantillon $$X_1, \dots, X_n$$ est supposé i.i.d. de loi P, $$\mathbb{P}_n=\frac{1}{n}\sum_{i=1}^n\delta_{X_i}$$ et $$\mathbb{G}_n=\sqrt{n}(\mathbb{P}_n-P)$$ sont respectivement la mesure empirique et le processus empirique. $$\int’$$ est l’intégrale en dehors de la diagonale. Nous incluons le cas de noyaux non dégénérés par rapport à la distribution sous-jacente. Nos résultats sont reliés à des résultats antérieurs sur les U-statistiques. Nous introduisons une intégrale stochastique par rapport au pont brownien qui nous permet d’exprimer la limite de manière unifiée dans les cas dégénéré et non dégénéré. L’utilisation de l’intégrale multiple par rapport au processus empirique présente un avantage par rapport aux U-statistiques : le Théorème de la Limite Centrale que nous obtenons est plus simple. Il ne met pas en jeu la dégénération du noyau et la limite est exprimée de façon précise.

Thèse : efficacité asymptotique de tests liés à la statistique de Wasserstein

Thèse sous la direction de Eustasio del Barrio et Fabrice Gamboa, soutenue le 16 juillet 2007 à Valladolid, devant le jury composé de MM. Jean-Marc Azaïs, Bernard Bercu, Eustasio del Barrio, Fabrice Gamboa et Carlos Matrán.
Cette thèse comporte trois parties. Dans une première partie, nous étudions certaines propriétés asymptotiques des intégrales multiples par rapport au processus empirique. La seconde partie est consacrée à l’étude de l’efficacité asymptotique du test de Wasserstein. L’équivalence de la statistique de Wasserstein avec une intégrale double par rapport au processus empirique permet d’appliquer les résultats asymptotiques de la première partie. Une étude de simulation complète l’étude de la puissance asymptotique. La troisième partie aborde les grandes déviations des L-statistiques. Un théorème de grandes déviations est obtenu en utilisant la topologie de la distance de Wasserstein sur l’espace des mesures, sous des conditions d’extrêmes.

Grandes déviations pour des L-statistiques

Paru dans Statistics and Decisions, 25(2), pp89-125, 2007. Télécharger une version de l’article.

Le but de cet article est d’établir un principe de grandes déviations (PGD) fonctionnel pour les L-statistiques sous des conditions d’extrêmes. La méthode est basée sur le théorème de Sanov et utilise les outils habituels de la théorie des grandes déviations. Nous prouvons d’abord un PGD sous une condition d’extrêmes assez forte. Notre étude comprend le traitement complet du cas de la loi uniforme et un exemple dans lequel la fonction de taux peut être calculée avec une grande précision. Ensuite nous obtenons un PGD sous des conditions d’extrêmes plus faibles. Le cas de la distribution exponentielle, qui ne satisfait pas les conditions précédentes d’intégrabilité, est traité entièrement grâce à une autre méthode : nous donnons un PGD fonctionnel fondé sur le théorème de Gärtner-Ellis. Nous étendons notre étude à des L-statistiques normalisées sous des conditions fortes d’extrêmes.