Analyses factorielles de données structurées en groupes d’individus
[Multivariate data analysis of multi-group datasets]
Journal de la société française de statistique, Volume 154 (2013) no. 3, pp. 44-57.

An outline of the methods of analysis of a dataset where individuals are partitioned into groups is given. Thereafter, the paper focuses on multi-group principal components analysis (Krzanowski, 1984). A new optimization criterion which characterizes this method is discussed. An extension of the strategy of analysis to the case of multi-block datasets is presented. The particular case where the various blocks pertain to the same variables is also discussed. The methods are illustrated on the basis of case studies.

Après une brève discussion des méthodes d’analyse d’un tableau de données où les individus sont partitionnés en groupes connus a priori, l’analyse en composantes principales multi-groupes (Krzanowski, 1984) est plus particulièrement étudiée. Un nouveau critère d’optimisation qui caractérise cette méthode est proposé. Par la suite, la méthode est étendue au cas des données structurées en multi-groupes et multi-tableaux. Le cas particulier où les différents tableaux portent sur les mêmes variables est également considéré. Les démarches d’analyse sont illustrées sur la base d’études de cas.

Mot clés : analyse en composantes principales multi-groupes, analyse multi-groupes et multi-tableaux
Keywords: multi-group principal components analysis, multi-block multi-group data analysis
@article{JSFS_2013__154_3_44_0,
     author = {Aida, Aida and Qannari, El Mostafa and Kohler, Achim and Bougeard, St\'ephanie},
     title = {Analyses factorielles de donn\'ees structur\'ees en groupes d{\textquoteright}individus},
     journal = {Journal de la soci\'et\'e fran\c{c}aise de statistique},
     pages = {44--57},
     publisher = {Soci\'et\'e fran\c{c}aise de statistique},
     volume = {154},
     number = {3},
     year = {2013},
     mrnumber = {3147065},
     zbl = {1316.62004},
     language = {fr},
     url = {http://archive.numdam.org/item/JSFS_2013__154_3_44_0/}
}
TY  - JOUR
AU  - Aida, Aida
AU  - Qannari, El Mostafa
AU  - Kohler, Achim
AU  - Bougeard, Stéphanie
TI  - Analyses factorielles de données structurées en groupes d’individus
JO  - Journal de la société française de statistique
PY  - 2013
SP  - 44
EP  - 57
VL  - 154
IS  - 3
PB  - Société française de statistique
UR  - http://archive.numdam.org/item/JSFS_2013__154_3_44_0/
LA  - fr
ID  - JSFS_2013__154_3_44_0
ER  - 
%0 Journal Article
%A Aida, Aida
%A Qannari, El Mostafa
%A Kohler, Achim
%A Bougeard, Stéphanie
%T Analyses factorielles de données structurées en groupes d’individus
%J Journal de la société française de statistique
%D 2013
%P 44-57
%V 154
%N 3
%I Société française de statistique
%U http://archive.numdam.org/item/JSFS_2013__154_3_44_0/
%G fr
%F JSFS_2013__154_3_44_0
Aida, Aida; Qannari, El Mostafa; Kohler, Achim; Bougeard, Stéphanie. Analyses factorielles de données structurées en groupes d’individus. Journal de la société française de statistique, Volume 154 (2013) no. 3, pp. 44-57. http://archive.numdam.org/item/JSFS_2013__154_3_44_0/

[1] Cazes, P. Quelques méthodes d’analyse factorielle d’une série de tableaux de données, Revue Modulad, Volume 31 (2004), pp. 1-31

[2] Cortez, P.; Cerdeira, A.; Almeida, F.; Matos, T.; Reis, J. Modeling wine preferences by data mining from physicochemical properties, Decision Support Systems, Elsevier, Volume 47 (2009) no. 4, pp. 547-553

[3] Chessel, D.; Hanafi, M. Analyse de la co-inertie de K nuages de points, Revue de Statistique Appliquée, Volume 44 (1996), pp. 35-60

[4] Eslami, A.; Qannari, E. M.; Kohler, A.; Bougeard, S. General overview of methods of analysis of multi-group datasets, Revue des Nouvelles Technologies de l’Information (sous presse)

[5] Flury, B. N. Common principal components in k groups, Journal of the American Statistical Association, Volume 79 (1984), pp. 892-898 | MR

[6] Krzanowski, W. J. Between-groups comparison of principal components, Journal of the American Statistical Association, Volume 74 (1979), pp. 703-707 | MR | Zbl

[7] Krzanowski, W. J. Principal Component Analysis in the Presence of Group Structure, Applied Statistics, Volume 33 (1984) no. 2, pp. 164-168

[8] Lavit, C. Analyse conjointe de tableaux quantitatifs, Masson, Masson, 1988, 260 pages

[9] Lavit, C.; Escoufier, Y.; Sabatier, R.; Traissac, P. The ACT (STATIS method), Computational Statistics & Data Analysis, Volume 18 (1994), pp. 97-117 | MR | Zbl

[10] Lê, S.; Husson, F.; Pagès, J. DMFA : Dual Multiple Factor Analysis, Communication in Statistics-Theory and Methods, Volume 39 (2010) no. 3, pp. 483-492 | MR | Zbl

[11] Massart, D. L.; Vandeginste, B. G. M.; Buydens, L. M. C.; de Jong, S.; Lewi, P. J.; Smeyers-Verbeke; Pagès, J. Handbook of Chemometrics and Qualimetrics, B, Elsevier, 1998

[12] Mevik, B.; Wehrens, R. The pls Package : Principal Component and Partial Least Squares Regression in R, Journal of Statistical Software, Volume 18 (2007) no. 2, pp. 1-24

[13] Robert, P.; Escoufier, Y. A Unifying Tool for Linear Multivariate Statistical Methods : The RV-Coefficient, Applied Statistics, Volume 25 (1976) no. 3, pp. 257-265 | MR

[14] Saporta, G. probabilités analyse des données et statistique, Technip, Paris, 2006, 622 pages | Zbl

[15] Sabatier, R.; Vivien, M. A new linear method for analyzing four-way multiblock tables : STATIS-4, Journal of Chemometrics, Volume 22 (2008) no. 6, pp. 399-407

[16] Vivien, M.; Sabatier, R. A generalization of STATIS-ACT strategy : DO-ACT for two multiblocks tables, Computational Statistics & Data Analysis, Volume 46 (2004) no. 1, pp. 155 -171 | MR | Zbl

[17] Westerhuis, J. A.; Kourti, T.; MacGregor, J. F. Analysis of multiblock and hierarchical PCA and PLS model, Journal of Chemometrics, Volume 12 (1998), pp. 301-321