L’objectif d’un algorithme de classification est de prédire au mieux la classe d’un objet à partir d’observations de cet objet. Un exemple typique est le filtre à spam des messageries électroniques qui prédisent (plus ou moins bien) si un courriel est un spam ou non. Nous introduisons dans ces notes les principaux concepts fondamentaux de la théorie de la classification statistique supervisée et quelques uns des algorithmes de classification les plus populaires. Nous soulignons chemin faisant l’importance de certains concepts mathématiques, parmi lesquels la symétrisation, la convexification, les inégalités de concentration, le principe de contraction et les espaces de Hilbert à noyau reproduisant.
@incollection{XUPS_2013____59_0, author = {Giraud, Christophe}, title = {Fondements math\'ematiques de~l{\textquoteright}apprentissage statistique}, booktitle = {Al\'eatoire}, series = {Journ\'ees math\'ematiques X-UPS}, pages = {59--92}, publisher = {Les \'Editions de l{\textquoteright}\'Ecole polytechnique}, year = {2013}, doi = {10.5802/xups.2013-02}, language = {fr}, url = {http://archive.numdam.org/articles/10.5802/xups.2013-02/} }
TY - JOUR AU - Giraud, Christophe TI - Fondements mathématiques de l’apprentissage statistique JO - Journées mathématiques X-UPS PY - 2013 SP - 59 EP - 92 PB - Les Éditions de l’École polytechnique UR - http://archive.numdam.org/articles/10.5802/xups.2013-02/ DO - 10.5802/xups.2013-02 LA - fr ID - XUPS_2013____59_0 ER -
%0 Journal Article %A Giraud, Christophe %T Fondements mathématiques de l’apprentissage statistique %J Journées mathématiques X-UPS %D 2013 %P 59-92 %I Les Éditions de l’École polytechnique %U http://archive.numdam.org/articles/10.5802/xups.2013-02/ %R 10.5802/xups.2013-02 %G fr %F XUPS_2013____59_0
Giraud, Christophe. Fondements mathématiques de l’apprentissage statistique. Journées mathématiques X-UPS, Aléatoire (2013), pp. 59-92. doi : 10.5802/xups.2013-02. http://archive.numdam.org/articles/10.5802/xups.2013-02/
[1] Theory of classification : a survey of some recent advances, ESAIM Probab. Stat., Volume 9 (2005), pp. 323-375 | DOI | MR | Zbl
[2] Concentration inequalities. A nonasymptotic theory of independence, Oxford University Press, Oxford, 2013 | DOI | MR | Zbl
[3] Ranking and empirical minimization of U-statistics, The Annals of Statistics, Volume 36 (2008) no. 2, pp. 844-874 http://www.jstor.org/stable/25464648 | DOI | MR | Zbl
[4] A probabilistic theory of pattern recognition, Applications of Math., 31, Springer-Verlag, New York, 1996 | DOI | MR | Zbl
[5] The elements of statistical learning. Data mining, inference, and prediction, Springer Series in Statistics, Springer, New York, 2009 | DOI | MR | Zbl
[6] On the method of bounded differences, Surveys in combinatorics, 1989 (Norwich, 1989) (London Math. Soc. Lecture Note Ser.), Volume 141, Cambridge University Press, Cambridge, 1989, pp. 148-188 | DOI | MR | Zbl
Cité par Sources :