Classification factorielle hiérarchique optimisée des lignes et des colonnes d'un tableau de contingence
Journal de la Société française de statistique & Revue de statistique appliquée, Tome 148 (2007) no. 3, pp. 37-70.

Etant donné un tableau de contingence kIJ, deux classifications hiérarchiques sont construites indépendamment sur I et J selon un algorithme particulier où chaque nœud obtenu est issu d’une analyse des correspondances particulière. Un algorithme d’optimisation du type de celui des nuées dynamiques est ensuite appliqué aux classes de chacune des deux hiérarchies. Enfin, une procédure d’élagage des branches permet de se séparer des nœuds non significatifs. Les deux hiérarchies optimisées et élaguées sont ensuite interprétées mutuellement, chaque association significative étant révelée par un test conditionnel exact basé sur un modèle hypergéométrique. Un exemple d’application au tableau de contingence croisant départements et candidats à l’élection présidentielle de 1995 est ensuite mené.

Two hierarchical classifications are built on the sets I et J of a two-way contingency table kIJ, using a new algorithm building each node from a particular correspondence analysis. In a second step, the classes of these two hierarchies are optimized through a type k-means procedure. Then, a pruning algorithm allows us to restrict the optimized trees to their significant nodes. Finally, the optimized and pruned hierarchies are mutually interpreted, each significant association being revealed through an exact conditional test based on the hypergeometric model. The methodogogy is then applied to the contingency table crossing departements and candidates to the 1995 presidential election.

Mot clés : tableau de contingence, classification hiérarchique, analyse des correspondances, test conditionnel exact, optimisation, élagage
Mots-clés : contingency table, hierarchical classification, correspondence analysis, exact conditional test, optimization, pruning techniques
Denimal, Jean-Jacques. Classification factorielle hiérarchique optimisée des lignes et des colonnes d'un tableau de contingence. Journal de la Société française de statistique & Revue de statistique appliquée, Tome 148 (2007) no. 3, pp. 37-70.

