Approximations par arbre d'une distance partielle
Mathématiques informatique et sciences humaines, Tome 146 (1999), pp. 51-64.

En classification par arbre, on cherche à ajuster une dissimilarité donnée par une distance d'arbre. Mais bien souvent, surtout par comparaison de séquences biologiques, les valeurs obtenues sont peu fiables, voire indéterminées. On a alors une distance partielle qui n'est pas définie pour toute paire. Dans ce cas, on peut soit développer une méthode spécifique qui n'utilise que les valeurs disponibles, soit estimer les valeurs manquantes et utiliser une méthode classique pour reconstruire l'arbre. Cet article présente deux méthodes de ce type et les compare à l'aide de simulations sur des distances d'arbre partielles et bruitées.

In tree clustering, we try to approximate a given dissimilarity matrice by a tree distance. In some cases, especially when comparing biological séquences, some dissimilarity values cannot be evaluated and we get some partial dissimilarity with undefined values. In that case one can develop a sequential method to reconstruct a valued tree or evaluate the missing values using a tree model. This paper introduces two methods of this kind and compare them simulating noisy partial tree dissimilarities.

Mot clés : reconstruction d'arbre, distance partielle, méthode séquentielle
Mots clés : tree reconstruction, partial distance, sequential method
@article{MSH_1999__146__51_0,
     author = {Gu\'enoche, Alain and Grandcolas, St\'ephane},
     title = {Approximations par arbre d'une distance partielle},
     journal = {Math\'ematiques informatique et sciences humaines},
     pages = {51--64},
     publisher = {Ecole des hautes-\'etudes en sciences sociales},
     volume = {146},
     year = {1999},
     mrnumber = {1707210},
     language = {fr},
     url = {http://archive.numdam.org/item/MSH_1999__146__51_0/}
}
TY  - JOUR
AU  - Guénoche, Alain
AU  - Grandcolas, Stéphane
TI  - Approximations par arbre d'une distance partielle
JO  - Mathématiques informatique et sciences humaines
PY  - 1999
SP  - 51
EP  - 64
VL  - 146
PB  - Ecole des hautes-études en sciences sociales
UR  - http://archive.numdam.org/item/MSH_1999__146__51_0/
LA  - fr
ID  - MSH_1999__146__51_0
ER  - 
%0 Journal Article
%A Guénoche, Alain
%A Grandcolas, Stéphane
%T Approximations par arbre d'une distance partielle
%J Mathématiques informatique et sciences humaines
%D 1999
%P 51-64
%V 146
%I Ecole des hautes-études en sciences sociales
%U http://archive.numdam.org/item/MSH_1999__146__51_0/
%G fr
%F MSH_1999__146__51_0
Guénoche, Alain; Grandcolas, Stéphane. Approximations par arbre d'une distance partielle. Mathématiques informatique et sciences humaines, Tome 146 (1999), pp. 51-64. http://archive.numdam.org/item/MSH_1999__146__51_0/

Barthélemy, J.P., Guénoche, A., Les arbres et les représentations des proximités, Collection "Méthodes et Programmes", Masson, 1988, Trees and Proximity Representations, J. Wiley,1991.

Buneman, P., "The recovery of trees from measures of dissimilarity", Mathematics in Archaeological and Historical Sciences, F.H. Hodson, D.G. Kendall, P. Tautu (Eds.), Edimburg University Press, (1971), 387-395.

De Soete, G., "Ultrametric tree representations of incomplete dissimilarity data ", J. of Classification, 1, (1984), 235-242.

De Soete, G., "Additive-tree representations of incomplete dissimilarity data", Qual. Quantity, 18, (1984), 387-393.

Duret, L., Mouchiroud, D., Gouy, M., "Hovergen : a database of homologous vertebrate genes", Nucleic Acids Res., 22, (1994), 2360-2365.

Gascuel, O., "Concerning the NJ Algorithm and its Unweighted Version, UNJ", Mathematical Hierarchies and Biology, B. Mirkin et al. (Eds.), DIMACS Series Discrete Mathematics and Theoretical Computer Science 37, AMS, (1997), 149-170. | MR | Zbl

Guénoche, A., Leclerc, B., "La méthode des triangles pour reconstruire un arbre à partir de distances incomplètes", Actes des Journées de la Société Francophone de Classification, Agro-Montpellier, (1998), 117-120.

Guénoche, A., Leclerc, B., "The triangles method to build phylogenetic trees from incomplete distance matrices", soumis à publication, (1998), 18 p.

Lapointe, F.J., Kirsch, J.A.W., "Estimating phylogenies from lacunose distances matrices : Additive is superior to Ultrametric estimation", Molecular Biology Evolution, 13(6), (1996), 266-284.

Leclerc, B., "La méthode de dispersion", communication personnelle (1986). Voir Barthélemy, J.-P. & Guénoche, A., p. 74 (1988) & p. 73 (1991).

Leclerc, B., "Minimum spanning trees for tree metrics : abridgements and adjustments ", J. of Classification, 12, (1995), 207-241. | MR | Zbl

Leclerc, B., Makarenkov, V., "On some relations between 2-trees and tree metrics", Discrete Math., 192, (1998), 223-249. | MR | Zbl

Makarenkov, V., Leclerc, B., "The fitting of a tree metric to a given dissimilarity with the weighted least squares crterion", Journal of Classification, (1999), 223-249. | MR

Robinson, D.R., Foulds, L.R., "Comparison of phylogenetic trees", Mathematical Biosciences, 53, (1981), 131-147. | MR | Zbl

Saitou, N., Nei, M., "The neighbor-joining method: a new method for reconstructing phylogenetic trees", Molecular Biology Evolution, 4, (1987), 406-425.

Studier, J.A., Keppler, K.J., "A note on the neighbor-joining method of Saitou and Nei", Molecular Biology Evolution, 5, (1988), 729-731.

Zaretskii, K., "Construction d'un arbre sur la base d'un ensemble de distances entre ses feuilles" (en russe), Uspekhi Mat. Nauk., 20, (1965), 90-92. | Zbl

Waterman, M.S., Smith, T.F., Singh, M., Beyer, W.A., "Additive Evolutionary Trees", Journal of Theoretical Biology, 64, (1977), 199-213. | MR