Modélisation factorielle des interactions entre deux ensembles d'observations : la méthode PLS-FILM
Journal de la société française de statistique, Volume 149 (2008) no. 2, p. 3-43

In this work, we consider a data array encoding interactions between two sets of observations respectively referred to as “subjects” and “objects”. Besides, descriptions of subjects and objects are available through two variable sets. We propose a geometrically grounded exploratory technique to analyze the interactions using descriptions of subjects and objects: interactions are modelled using a hierarchy of subject-factors and object-factors built up from these descriptions. Our method bridges the gap between those of Chessel (RLQ analysis) and Martens (L-PLS), although it only has rank 1 components in common with them.

On considère un tableau codant numériquement des interactions entre deux ensembles d'observations respectivement dénommés « sujets » et « objets ». Par ailleurs, on dispose de descriptions des sujets et des objets à l'aide de variables. Nous proposons ici une technique d'analyse exploratoire des interactions. Cette technique géométrique utilise une modélisation factorielle hiérarchique des interactions sujets-objets à partir de descriptions structurelles respectives des uns et des autres. Elle fournit un pont entre les méthodes RLQ de Chessel et L-PLS de Martens, avec lesquelles elle n'a cependant de commun que les composantes de rang 1.

Keywords: interactions, latent variables, linear model, linear regression, L-PLS, PLS, PLS-FILM, RLQ, structural equation modelling
@article{JSFS_2008__149_2_3_0,
     author = {Bry, Xavier and Verron, Thomas},
     title = {Mod\'elisation factorielle des interactions entre deux ensembles d'observations : la m\'ethode PLS-FILM},
     journal = {Journal de la soci\'et\'e fran\c caise de statistique},
     publisher = {Soci\'et\'e fran\c caise de statistique},
     volume = {149},
     number = {2},
     year = {2008},
     pages = {3-43},
     language = {fr},
     url = {http://www.numdam.org/item/JSFS_2008__149_2_3_0}
}
Bry, Xavier; Verron, Thomas. Modélisation factorielle des interactions entre deux ensembles d'observations : la méthode PLS-FILM. Journal de la société française de statistique, Volume 149 (2008) no. 2, pp. 3-43. http://www.numdam.org/item/JSFS_2008__149_2_3_0/

[Bry (2004)-a] Bry X. (2004)-a. Une méthodologie exploratoire pour l'analyse et la synthèse d'un modèle explicatif, Thèse de doctorat, Université de Paris IX Dauphine.

[Bry X. (2004)-b] Bry X. (2004)-b. Estimation empirique d'un modèle à variables latentes comportant des interactions, RSA vol. 52, no 3. | Numdam

[Bry X. (2003)] Bry X. (2003). Une méthode d'estimation empirique d'un modèle à variables latentes : l'Analyse en Composantes Thématiques, RSA vol. 51, no 2, pp. 5-45. | Numdam

[Bry X. (2001)] Bry X. (2001). Une autre approche de l'Analyse Factorielle : l'Analyse en Résultantes Covariantes, RSA vol. 49, no 3, pp. 5-38. | Numdam

[Cazes P. (1997)] Cazes P. (1997). Adaptation de la régression PLS au cas de la régression après Analyse des Correspondances Multiples, RSA vol. 45, no 2, pp. 89-99. | Numdam

[Chessel D. & Mercier, P. (1993)] Chessel D. & Mercier P. (1993). Couplage de triplets statistiques et liaisons espèces-environnement. In : Biométrie et Environment. Lebreton, J.D. & Asselain, B. (Eds.) Masson, Paris. 15-44.

[Dolédec S. et al. (1994)] Dolédec S., Chessel D. & Champely S. (1994). Using species distribution for matching species traits to environmental variables : a new three-table ordination method. Communication orale, 6th international congress of ecology (INTECOL) on ecological progress to meet the challenge of environmental change, 20-26 août 1994, Manchester (Royaume-Uni).

[Dolédec S. et al. (1996)] Dolédec S., Chessel D., Ter Braak, C.J.F. & Champely S. (1996). Matching species traits to environmental variables : a new three-table ordination method. Environmental and Ecological Statistics : 3, 143-166.

[Esposito-Vinzi V. et al. (2007)] Esposito-Vinzi V., Guinot C., Squillacciotti S. (2007). Two-step PLS regression for L-structured data : an application in the cosmetic industry, Stat. Meth. & Appl. 16(2), 263-278. | MR 2408667

[Lohmöller J.-B. (1989)] Lohmöller J.-B. (1989). Latent Variables Path Modelling with Partial Least Squares, Physica-Verlag, Heidelberg. | MR 1014472

[Martens H. et al. (2005)] Martens H., Anderssen E., Flatberg A., Gidskehaug L.H., Høy M., Westad F., Thybo A., Martens M. (2005). Regression of a data matrix on descriptors of both its rows and of its columns via latent variables : L-PLSR, CSDA 48, 103-123, Elsevier. | MR 2133604 | Zbl pre05374095

[Takane H. & Shibayama T. (1991)] Takane Y., Shibayama T. (1991). Principal Component Analysis with external information on both subjects and variables, Psychometrika 56, 97-120. | MR 1115297 | Zbl 0725.62055

[Tenenhaus M. (1998)] Tenenhaus M. (1998). La régression PLS, théorie et pratique, Technip. | MR 1645125 | Zbl 0923.62058

[Verron T. (2005)] Verron T. (2005) ; Traitement du signal et généralisation de la régression PLS pour la modélisation des spectres PIR, Thèse de doctorat, Université de Montpellier I.

[Verron T. et al. (2004)] Verron T., Sabatier R., Joffre R. (2004). Some theoretical properties of the OPLS method, Journal of Chemometrics, 18(2), pp. 62-68.

[Vivien M. (2002)] Vivien M. (2002). Approches PLS linéaires et non linéaires pour la modélisation de multi-tableaux : théorie et applications, Thèse de doctorat, Université Montpellier I.

[Wold H. (1985)] Wold H. (1985). Partial Least Squares, Encyclopedia of Statistical Sciences, John Wiley & Sons, pp. 581-591.