Liens entre discrépance et estimation non-paramétrique, méthodologie de sélection de points selon les données disponibles
Journal de la société française de statistique, Volume 149 (2008) no. 1, p. 53-80

This article aims at evaluating the quality of a data base by checking that the data, with respect to our objectives, “ best fill ” the space. This work provides some algorithmic and mathematical tools to achieve such a purpose. Extraction and importation techniques to improve the global quality of the data are proposed. An illustration of its application is exposed in the context of functional estimation with orthogonal functions.

L'objectif de cet article est d'évaluer la qualité d'une base de données représentant la manière dont celle-ci occupe au mieux son domaine de variation. Le travail réalisé ici propose des outils mathématiques et algorithmiques permettant de réaliser une telle opération. Des techniques d'extraction et d'importation de nouvelles observations sont étudiées. Leurs applications seront illustrées dans le cadre de l'évaluation de paramètres fonctionnels dans un contexte d'estimation par fonctions orthogonales.

Keywords: space filling design, discrepancy, functional estimation
@article{JSFS_2008__149_1_53_0,
     author = {Feuillard, Vincent},
     title = {Liens entre discr\'epance et estimation non-param\'etrique, m\'ethodologie de s\'election de points selon les donn\'ees disponibles},
     journal = {Journal de la soci\'et\'e fran\c caise de statistique},
     publisher = {Soci\'et\'e fran\c caise de statistique},
     volume = {149},
     number = {1},
     year = {2008},
     pages = {53-80},
     language = {fr},
     url = {http://www.numdam.org/item/JSFS_2008__149_1_53_0}
}
Feuillard, Vincent. Liens entre discrépance et estimation non-paramétrique, méthodologie de sélection de points selon les données disponibles. Journal de la société française de statistique, Volume 149 (2008) no. 1, pp. 53-80. http://www.numdam.org/item/JSFS_2008__149_1_53_0/

[1] J. B. Aubin. Estimation fonctionnelle par projection adaptative et applications. Thèse de doctorat, Université Pierre et Marie Curie, Paris VI, 2005.

[2] D. Bosq. Sur l'estimation d'une densité multivariée par une série de fonctions orthogonales. Comptes Rendus de l'Académie des Sciences de Paris, 268 : 555-557, 1969. | MR 247700 | Zbl 0184.42504

[3] D. Bosq et J. Bluez. Etude d'une classe d'estimateurs non-paramétriques de la densité. Annales de l'institut Henri Poincaré, 14 : 479-498, 1978. | Numdam | MR 523224 | Zbl 0392.62029

[4] D. Bosq et J. Lecoutre. Théorie de l'estimation fonctionnelle. Economica, 1987.

[5] M. Cencov. Evaluation of an unknown distribution density from observations. Soviet Mathematics, 3 : 1559-1562, 1962. | Zbl 0133.11801

[6] C. Cervellera et M. Muselli. Deterministic design for neural network learning : An approach based on discrepancy. IEEE Transactions on Neural Networks, 15 : 533-544, 2004.

[7] L. Devroye et L. Győrfi. Nonparametric Density Estimation The L 1 view. John Wiley & Sons, Inc., 1985. | MR 780746 | Zbl 0546.62015

[8] J. Droesbeke, J. Fine et G. Saporta. Plans d'expériences, Applications à l'entreprise. Technip, 1997. | Zbl 0947.62504

[9] A. Dvoretzky, J. Kiefer et J. Wolfowitz. Asymptotic minimax character of the sample distribution function and of a classical multinomial estimator. Annals of Mathematical Statistics, 33 : 642-669, 1956. | MR 83864 | Zbl 0073.14603

[10] V. Feuillard, N. Devictor et R. Phan-Tan-Luu. Liens entre discrépance et estimation non-paramétrique, méthodologie de sélection de points selon les données disponibles. 38e journées de Statistiques, 2006.

[11] F. Hickernell. The mean square discrepancy of randomized nets. Modeling and Computer Simulation, 6(4) : 274-296, 1996. | Zbl 0887.65030

[12] F. Hickernell. A generalized discrepancy and quadrature error bound. Mathematics of computation, 67(221) : 299-322, 1998. | MR 1433265 | Zbl 0889.41025

[13] F. Hickernell. Goodness-of-fit statistics, discrepancies and robust designs. Statistics and Probability Letters, 44 : 73-78, 1999. | MR 1706366 | Zbl 0940.62067

[14] E. Hlwaka. Funktionen von beschränkter Variation in der Theorie der Gleichverteilung. Annali di Matematica Pura ed Applicata, 54 : 325-333, 1961. | MR 139597 | Zbl 0103.27604

[15] W. Härdle. Applied nonparametric regression. Cambridge University Press, 1989. | MR 1161622 | Zbl 0714.62030

[16] J. Marry. Étude de l'Apprentissage Actif : Application à la conduite d'experience. Thèse de doctorat, Université Paris Sud, 2005.

[17] C. Lemieux et P. L'Ecuyer. On selection criteria for lattice rules and other quasi-monte carlo point sets. Mathematics and Computers in Simulation, 55 : 139-148, 2001. | MR 1823111 | Zbl 0981.65007

[18] P. Massart. The tight constant in the dvoretzky-kiefer-wolfowitz inequality. Annals of Probability, 18(3) : 1269-1283, 1990. | MR 1062069 | Zbl 0713.62021

[19] H. Niederreiter. Monte Carlo and Quasi-Monte Carlo Methods. Springer, 1998. | MR 1644508

[20] B. L. S. Prakasa Rao. Nonparametric functional estimation. Probability and Mathematical Statistics. Academic Press Inc.[Harcourt Brace Jovanovich Publishers], 1983. | MR 740865 | Zbl 0542.62025

[21] E. Rafajlowicz et R. Schwabe. Halton and Hammersley sequences in multivariate nonparametric regression. Statistics and probability letters, 76(8) : 803-812, 2006. | MR 2266094 | Zbl 1089.62045

[22] F. Riesz et B. S. Nagy. Functional Analysis. Ungar Publishing Co., 1955. | MR 71727 | Zbl 0070.10902

[23] G. Sansone. Orthogonal Functions. Krieger, 1977. | MR 422943 | Zbl 0341.42010

[24] C. Stone. Optimal global rate of convergence for nonparametric regression. Annals of Statistics, 10 : 1040-1053, 1982. | MR 673642 | Zbl 0511.62048

[25] E. Thiémard. Sur le calcul et la majoration de la discrépance à l'origine. Thèse de doctorat, Ecole Polytechnique Fédérale de Lausanne, 2000.