ACPVI multibloc. Application en épidémiologie animale
Journal de la société française de statistique, Tome 148 (2007) no. 4, pp. 77-94.

Des analyses factorielles permettant l’étude conjointe de (K+1) tableaux de données sont proposées pour le cas où un tableau Y est prédit à l’aide de K tableaux X k (k=1,,K). Ces méthodes factorielles sont basées sur une extension de l’Analyse en Composantes Principales sur Variables Instrumentales (ACPVI), appelée aussi analyse des redondances. Une discussion sur le positionnement des méthodes développées par rapport aux méthodes existantes est présentée. La démarche est illustrée sur la base d’une étude de cas en épidémiologie animale.

We discuss factor analytic methods to study a set of (K+1) data tables where we wish to predict a data set Y from K other data sets X k (k=1,,K). The methods of analysis are based on an extension of Principal Component Analysis on Instrumental Variables, also called Redundancy Analysis. We outline the general approach and show its relationships to existing methods. The method of analysis is illustrated on the basis of a case study in animal epidemiology.

Mots clés : analyse en composantes principales sur variables instrumentales, analyse des redondances, analyse multibloc
@article{JSFS_2007__148_4_77_0,
     author = {Bougeard, St\'ephanie and Hanafi, Mohamed and Qannari, El Mostapha},
     title = {ACPVI multibloc. Application en \'epid\'emiologie animale},
     journal = {Journal de la soci\'et\'e fran\c caise de statistique},
     pages = {77--94},
     publisher = {Soci\'et\'e fran\c caise de statistique},
     volume = {148},
     number = {4},
     year = {2007},
     language = {fr},
     url = {archive.numdam.org/item/JSFS_2007__148_4_77_0/}
}
Bougeard, Stéphanie; Hanafi, Mohamed; Qannari, El Mostapha. ACPVI multibloc. Application en épidémiologie animale. Journal de la société française de statistique, Tome 148 (2007) no. 4, pp. 77-94. http://archive.numdam.org/item/JSFS_2007__148_4_77_0/

[1] A.J. Burnham, R. Viveros et J.F. Macgregor (1996), Framework for latent variable multivariate regression. Journal of chemometrics, 10 :31-45.

[2] J.D. Carroll (1968), A generalization of canonical correlation analysis to three or more sets of variables. In 76th annual convention of the American psychological association, pages 227-228.

[3] P. Cazes (1975), Protection de la régression par utilisation de contraintes linéaires et non linéaires. Revue de statistique appliquée, XXIII(3) :37-57. | Numdam | MR 415904

[4] D. Chessel et P. Mercier (1993), Couplage de triplets statistiques et liaisons espèces environnement. In LEBRETON J.D. et ASSELAIN B., éditeur : Biométrie et environnement, pages 15-44. MASSON, Paris.

[5] P.T. Davies et M. K.S. Tso (1982), Procedures for reduced-rank regression. Appl. Statist., 31 :244-255. | MR 694919

[6] A.E. Hoerl et R.W. Kennard (1970), Ridge regression : biaised estimation for nonorthogonal problems. Technometrics, 12 :55-67. | Zbl 0202.17205

[7] G. Kissita (2003), Les analyses canoniques généralisées avec tableau de référence généralisé : éléments théoriques et appliqués. Thèse de doctorat, Université Paris Dauphine

[8] G. Kissita, P. Cazes, M. Hanafi et R. Lafosse (2004), Deux méthodes d'analyse factorielle du lien entre deux tableaux de variables partitionnés. Revue de statistique appliquée, LII(3) :73-92. | Numdam

[9] R. Lafosse et M. Hanafi (1997), Concordance d'un tableau avec K tableaux : définition de K+1uples synthétiques. Revue de statistique appliquée, XLV (4) :111-126. | Numdam

[10] K.E. Muller (1981), Relationships between redundancy analysis, canonical correlation and multivariate regression. Psychometrika, 46(2) :139-142. | MR 649218 | Zbl 0505.62035

[11] H. Nocairi, M. Hanafi et E.M. Qannari (2005), Approche continuum de la discrimination de type ridge. Revue de statistique appliquée, LIII(2) :29-41. | EuDML 106563

[12] C.R. Rao (1964), The use and interpretation of principal component analysis in applied research. Sankhya, A., 26 :329-358. | MR 184375 | Zbl 0137.37207

[13] N. Rose, G. Larour, G. Le Digherher, E. Eveno, J.P. Jolly, P. Blanchard, A. Oger, M. Le Dinma, A. Jestin et F. Madec (2003), Risk factors for porcine post-weaning multisystemic wasting syndrome (PMWS) in 149 french farrow-to-finish herds. Preventive Veterinary Medicine, 61 :209-225.

[14] R. Sabatier (1987a), Analyse factorielle de données structurées et métriques. Statistique et analyse des données, 12(3) :75-96. | EuDML 108955 | Numdam | MR 984840

[15] R. Sabatier (1987b), Méthodes factorielles en analyse de données : approximations et prise en compte de variables concomitantes. Thèse de doctorat, Université des sciences et techniques du Languedoc.

[16] G. Saporta (2006), Probabilités, analyse des données et statistique (2nd édition). Technip, Paris. | Zbl 0703.62003

[17] M. Stone (1974), Cross-validatory choice and assessment of statistical predictions. Journal of the Royal Statistical Society, 36(1) :111-147. | MR 356377 | Zbl 0308.62063

[18] M. Tenenhaus (1998), La régression PLS. Théorie et pratique. Technip, Paris. | MR 1645125 | Zbl 0923.62058

[19] M. Tenenhaus (1999), L'approche PLS. Revue de statistique appliquée, 47(2) :5-40. | EuDML 106459 | Numdam

[20] M. Tenenhaus, J. Pages, L. Ambroisine et C. Guinot (2005a), PLS methodology to study relationships between hedonic judgements and product characteristics. Food quality and preference, 16 :315-325.

[21] M. Tenenhaus, V.E. Vinzi, Y.M. Chatelin et C. Lauro (2005b), PLS path modeling. Computational statistics and data analysis, 48 :159-205. | MR 2134489 | Zbl pre05374099

[22] J.P. Van De Geer (1984), Linear relations among K sets of variables. Psychometrika, 49 (1) :79-94.

[23] A. Van Den Wollenberg (1977), Redundancy analysis : an alternative for canonical correlation analysis. Psychometrika, 42(2) :207-219. | Zbl 0354.92050

[24] M. Vivien (2002), Approches PLS linéaires et non-linéaires pour la modélisation de multi-tableaux : théorie et applications. Thèse de doctorat, Université de Montpellier 1.

[25] J.A. Westerhuis et P.M.J. Coenegracht (1997), Multivariate modelling of the pharmaceutical two-step process of wet granulation and tableting with multiblock partial least squares. Journal of chemometrics, 11(5) :379-392.

[26] J.A. Westerhuis, T. Kourti et J.F. Macgregor (1998), Analysis of multiblock and hierarchical PCA and PLS model. Journal of chemometrics, 12 :301-321.

[27] H. Wold (1982), Soft modelling : the basic design and some extensions. In K.G JÖRESKOG et H. WOLD, éditeurs : System under indirect observation. Part 2, pages 1-54. North-Holland, Amsterdam. | MR 692219 | Zbl 0517.62065

[28] S. Wold (1984), Three PLS algorithms according to SW. In S. WOLD, éditeur : Symposium MULDAST (multivariate analysis in science and technology), pages 26-30, Umea University, Sweden.

[29] S. Wold, N. Kettaneh et K. Tjessem (1996), Hierarchical multiblock PLS and PC models for easier model interpretation and as an alternative to variable selection. Journal of chemometrics, 10 :463-482.

[30] S. Wold, H. Martens et H. Wold (1983), The multivariate calibration problem in chemistry solved by the PLS method. In Ruhe A. B. et KASTROM, éditeurs : Proceedings of the Conference on Matrix Pencils, pages 286-293. Springer Verlag, Heidelberg. | MR 697741 | Zbl 0499.65065