Validity of the parametric bootstrap for goodness-of-fit testing in semiparametric models
Annales de l'I.H.P. Probabilités et statistiques, Volume 44 (2008) no. 6, pp. 1096-1127.

In testing that a given distribution $P$ belongs to a parameterized family $𝒫$, one is often led to compare a nonparametric estimate ${A}_{n}$ of some functional $A$ of $P$ with an element ${A}_{{\theta }_{n}}$ corresponding to an estimate ${\theta }_{n}$ of $\theta$. In many cases, the asymptotic distribution of goodness-of-fit statistics derived from the process ${n}^{1/2}\left({A}_{n}-{A}_{{\theta }_{n}}\right)$ depends on the unknown distribution $P$. It is shown here that if the sequences ${A}_{n}$ and ${\theta }_{n}$ of estimators are regular in some sense, a parametric bootstrap approach yields valid approximations for the $P$-values of the tests. In other words if ${A}_{n}^{*}$ and ${\theta }_{n}^{*}$ are analogs of ${A}_{n}$ and ${\theta }_{n}$ computed from a sample from ${P}_{{\theta }_{n}}$, the empirical processes ${n}^{1/2}\left({A}_{n}-{A}_{{\theta }_{n}}\right)$ and ${n}^{1/2}\left({A}_{n}^{*}-{A}_{{\theta }_{n}^{*}}\right)$ then converge jointly in distribution to independent copies of the same limit. This result is used to establish the validity of the parametric bootstrap method when testing the goodness-of-fit of families of multivariate distributions and copulas. Two types of tests are considered: certain procedures compare the empirical version of a distribution function or copula and its parametric estimation under the null hypothesis; others measure the distance between a parametric and a nonparametric estimation of the distribution associated with the classical probability integral transform. The validity of a two-level bootstrap is also proved in cases where the parametric estimate cannot be computed easily. The methodology is illustrated using a new goodness-of-fit test statistic for copulas based on a Cramér-von Mises functional of the empirical copula process.

Pour tester qu’une loi $P$ donnée provient d’une famille paramétrique $𝒫$, on est souvent amené à comparer une estimation non paramétrique ${A}_{n}$ d’une fonctionnelle $A$ de $P$ à un élément ${A}_{{\theta }_{n}}$ correspondant à une estimation ${\theta }_{n}$ de $\theta$. Dans bien des cas, la loi asymptotique de statistiques de tests bâties à partir du processus ${n}^{1/2}\left({A}_{n}-{A}_{{\theta }_{n}}\right)$ dépend de la loi inconnue $P$. On montre ici que si les suites ${A}_{n}$ et ${\theta }_{n}$ d’estimateurs sont régulières dans un sens précis, le recours au rééchantillonnage paramétrique conduit à des approximations valides des seuils des tests. Autrement dit si ${A}_{n}^{*}$ et ${\theta }_{n}^{*}$ sont des analogues de ${A}_{n}$ et ${\theta }_{n}$ déduits d’un échantillon de loi ${P}_{{\theta }_{n}}$, les processus empiriques ${n}^{1/2}\left({A}_{n}-{A}_{{\theta }_{n}}\right)$ et ${n}^{1/2}\left({A}_{n}^{*}-{A}_{{\theta }_{n}^{*}}\right)$ convergent alors conjointement en loi vers des copies indépendantes de la même limite. Ce résultat est employé pour valider l’approche par rééchantillonnage paramétrique dans le cadre de tests d’adéquation pour des familles de lois et de copules multivariées. Deux types de tests sont envisagés : les uns comparent la version empirique d’une loi ou d’une copule et son estimation paramétrique sous l’hypothèse nulle ; les autres mesurent la distance entre les estimations paramétrique et non paramétrique de la loi associée à la transformation intégrale de probabilité classique. La validité du rééchantillonnage à deux degrés est aussi démontrée dans les cas où l’estimation paramétrique est difficile à calculer. La méthodologie est illustrée au moyen d’un nouveau test d’adéquation de copules fondé sur une fonctionnelle de Cramér-von Mises du processus de copule empirique.

DOI: 10.1214/07-AIHP148
Classification: 62F05, 62F40, 62H15
Keywords: copula, goodness-of-fit test, Monte Carlo simulation, parametric bootstrap, P-values, semiparametric estimation
