Utilisation d'une fonction de perte quadratique pondérée dans les approches bayésiennes : application à la cartographie d'indicateur de santé
Journal de la société française de statistique, Tome 148 (2007) no. 3, p. 71-86
Position du problème Dans le cadre des modèles écologiques, nous comparons différents estimateurs bayésiens des risques relatifs en utilisant un modèle de cartographie hiérarchique bayésien. Méthodes Les estimateurs ponctuels bayésiens dépendent du choix de la fonction de perte. La plus « classique » est la fonction de perte quadratique et sa minimisation amène à l'estimation par moyenne a posteriori. Une discussion est menée sur les avantages de cette approche, notamment en envisageant différents objectifs comme l'intérêt particulier porté sur les valeurs extrêmes des risques relatifs lors de cartographie. Ces objectifs guident le choix de la fonction de perte. Trois fonctions sont envisagées : la fonction de perte quadratique, la fonction de perte en valeur absolue et une fonction de perte quadratique pondérée avec des poids de type exponentiel. La dernière fonction correspond à un choix moins fréquent avec une pondération importante sur les risques relatifs extrêmes. Résultats Une étude par simulations a été réalisée en considérant trois modèles de risques relatifs. Les deux premiers correspondent à des surfaces de risques discontinues alors que le dernier cas présente une décroissance du risque sur le territoire selon un gradient géographique. Les performances des estimateurs sont évaluées par l'erreur quadratique et le biais relatif ainsi que la capacité à détecter les zones à risques élevés. Les résultats montrent que de manière générale, les différents estimateurs des risques relatifs sont convergents avec de bonnes performances. Néanmoins, cette étude permet de montrer que dans le cas de risques relatifs discontinus, le choix d'une fonction de perte de type exponentiel permet d'obtenir une amélioration souvent significative de l'estimation des risques relatifs. Conclusion Le choix d'une fonction de perte et l'étude de l'estimateur qui en découle constituent une démarche rarement utilisée et pourtant prometteuse dans les approches bayésiennes. Ce choix peut être guidé par l'objectif recherché comme ici, la mise en valeur des risques relatifs extrêmes. Cette étude a montré de légères différences entre les estimateurs, prouvant dans ce sens leur robustesse mais avec une amélioration souvent significative de l'estimateur pondéré. D'autres configurations de risques relatifs et/ou de nombre de cas attendus pourraient peut-être mettre à jour des différences plus importantes.
Background In the context of ecological model, we compare different Bayes estimates of relative risks by disease mapping model. Methods Bayesian estimates are based on the choice of loss function. A usual choice is the quadratic loss function and its minimization leads to the posterior mean. In this study, a discussion is done on the advantages of this choice, in particular by considering different objectives as focussing on extreme relative risks in disease mapping. These objectives determine the choice of the loss function. Three different loss functions are considered: the quadratic loss, the absolute loss and a weigthed quadratic loss function with weights having an exponential shape. The last one corresponds to an unusual choice with important weights on extreme relative risks. Results A study based on simulations is done with three different cases of relative risks in France: two first cases correspond to discontinuous risk surfaces while the last case presents continuous risk decrease following a geographic gradient. Estimates performances are evaluated by mean quadratic error and bias as well as ability of units detection with high relative risks. Results show that the different bayesian estimates are coherent with good performances. Nevertheless, often significative improvements of estimates based on exponential loss function are found in the case of discontinuous risk surface. Conclusion The choice of loss function and the study of the associated estimate are rarely done and nevertheless interesting in bayesian approach. This choice is based on a specific objective as, in geographical analyse, a particular attention on extreme relative risks. In this study, slight differences between the three considered loss functions are found showing in this sense their robustness but with often significant improvements of weighted estimate. Different configurations of relative risks and/or expected number of cases could give more important differences.
Mots clés: modèle bayésien hiérarchique, fonctions de perte, risques relatifs, modèle écologique de Poisson
@article{JSFS_2007__148_3_71_0,
     author = {Fortunato, L\'ea and Liverneaux, Adeline and H\'emon, Denis and Guihenneuc-Jouyaux, Chantal},
     title = {Utilisation d'une fonction de perte quadratique pond\'er\'ee dans les approches bay\'esiennes : application \`a la cartographie d'indicateur de sant\'e},
     journal = {Journal de la soci\'et\'e fran\c caise de statistique},
     publisher = {Soci\'et\'e fran\c caise de statistique},
     volume = {148},
     number = {3},
     year = {2007},
     pages = {71-86},
     language = {fr},
     url = {http://http://www.numdam.org/item/JSFS_2007__148_3_71_0}
}
Fortunato, Léa; Liverneaux, Adeline; Hémon, Denis; Guihenneuc-Jouyaux, Chantal. Utilisation d'une fonction de perte quadratique pondérée dans les approches bayésiennes : application à la cartographie d'indicateur de santé. Journal de la société française de statistique, Tome 148 (2007) no. 3, pp. 71-86. http://www.numdam.org/item/JSFS_2007__148_3_71_0/

[1] Besag J., York J. & Mollie A. (1991). Bayesian image restoration, with two applications in spatial statistics. Ann. I. Stat. Math. 1991 ; 43 : 1-59. | MR 1105822 | Zbl 0760.62029

[2] Clavel J., Goubin A., Auclerc M.F., Auvrignon A., Waterkeyn C., Patte C. et al. (2004). Incidence of childhood leukemia and non-Hodgkin's lymphoma in France - national registry of childhood leukemia and lymphoma, 1990-1999, Eur J Cancer Prev ; 13 : 97-103.

[3] Elliott P., Cuzick J., English D. and Stern R. (1992). Geographical and Environmental Epidemiology : Methods for Small-Area Studies, Oxford University Press, Oxford.

[4] Elliott P., Wakefield J., Best N.G. & Briggs D. (2000). Spatial Epidemiology, methods and applications. Oxford : Oxford University Press.

[5] Evrard A.S., Hemon D., Billon S., Laurier D., Jougla E., Tirmarche M. & Clavel J. (2005). Ecological association between indoor Radon concentration and childhood leukemia incidence in France, 1990-1998. Eur. J. Cancer Prev. ; 14 : 147-57.

[6] Ghosh M. (1992). Constrained Bayes estimation with applications. J. Am. Stat. Assoc. ; 87 : 533-540. | MR 1173817 | Zbl 0781.62040

[7] Green P.J., Richardson S. (2002). Hidden Markov models and disease mapping. J. Am. Stat. Assoc. ; 97 : 1055-1070. | MR 1951259 | Zbl 1046.62117

[8] Kelsall J.E. & Wakefield J. (1999). Discussion of « Bayesian models for spatially correlated disease and exposure data » by Best et al. (1999). In Bayesian Statistics 6, eds J.M. Bernardo, J.O. Berger, A.P. Dawid, A.F.M. Smith. Oxford : Oxford University Press.

[9] Lawson A., Bigerri A., Bohning D., Lesaffre E., Viel J. F., Bertollini R. (1999). Disease Mapping and risk assessment for public health. John Wiley & Sons, UK. | Zbl 0942.00010

[10] Louis T. (1984). Estimating a population of parameter values using Bayes and empirical Bayes methods. J. Am. Stat. Assoc ; 79 : 393-398. | MR 755093

[11] Marshall E.C. and Spiegelhalter D.J. (2003). Approximate cross-validatory predictive checks in disease mapping models. Stat. Med. ; 22 : 1649-1660.

[12] Mollié A. (1996). Bayesian mapping of disease. In : Markov Chain Monte Carlo in Practice, Gilks W.R., Richardson S., Spiegelhalter D.J. Eds., Chapman & Hall ; Chapter 20, 359-380. | MR 1397966 | Zbl 0849.62060

[13] Spiegelhalter D.J., Thomas A. & Best N.G. (2001). WinBUGS Version 1.4, User Manual.. Medical Research Council Biostatistics Unit, Cambridge, and Imperial College School of Medicine, London, UK.

[14] Stern H. S. et N. Cressie N. (2000). Posterior predictive model checks for disease mapping models. Stat. Med. ; 19 : 2377-2397.

[15] Wright D. L., Stern H. S., and Cressie N. (2003). Loss functions for estimation of extrema with an application to disease mapping. Can. J. Stat. ; 31 : 251-266. | MR 2030123 | Zbl 1042.62029