RI101A-ADM : Analyse des données et modélisations stochastiques

Retour

Imprimer la fiche programme

Code analytique: EMMRIR101

Responsable : Laurent TOUTAIN

English

Programmé en UVF2RMRIR101, MR2AMRIR701, MR2ARIR101

Présentation :

Responsable : Annie Morin (amorin@irisa.fr)
Équipe pédagogique : Annie Morin, Guillaume Gravier

Dans ce module, nous faisons un rappel (une mise à niveau) des principales notions de statistique et de probabilités utiles, quelles que soient les directions de recherche choisies par la suite. Ce module se décompose en deux parties. La première intitulée, statistique et analyse de données, recouvre la statistique exploratoire, les méthodes de visualisations de données, les méthodes d'analyse factorielle et de classification hiérarchique et non hiérarchique (ces méthodes font aussi partie des outils en apprentissage non supervisé) puis l'estimation et les tests d'hypothèses. La seconde partie, intitulée modélisations stochastiques, vise à étudier quelques modèles classiques, couramment utilisés en reconnaissance des formes, et les problèmes associés comme l'estimation des paramètres. Nous y étudions les lois de probabilités classiques et les mélanges ainsi que les algorithmes d'estimation des paramètres, notamment l'algorithme EM. Enfin, nous voyons les modèles de Markov cachés (HMM), à la base de nombreux domaines applicatifs, et les techniques de programmation dynamique associées à la segmentation par HMM. Dans les deux parties, nous donnons des exemples d'applications directes dans des domaines variés comme le traitement de la parole et des images, la bioinformatique, les communications numériques, le diagnostic, etc.

Pré-requis :

Quelques connaissances en algèbre linéaire et en théorie d'optimisation seraient utiles.

Liens :

http://master.irisa.fr/master/live/modules/tc1_fr.html

Volume horaire : 20h

Contenu détaillé :

Partie 1
Statistique descriptive : variables, données, observations, caractéristiques dans une dimension, deux et plus.
Probabilités : définitions et axiomes, théorème de Bayes, variables aléatoires, lois discrètes : Bernoulli, Binomiale, Poisson ; lois continues : exponentielle, normale à une et plusieurs dimensions.
Quelques méthodes de visualisation des données
Méthodes de réduction de dimension : analyses factorielles
Clustering non hiérarchique : K-means etc..,puis hiérarchique (ultramétiques, arbres de classification).
Estimation (moyenne, variance, écart-type, proportion)
Test d’hypothèses : hypothèse nulle, hypothèse alternative, risques de première et deuxième espèce.

Partie 2
Rappel sur l’estimation pour les lois continus multivariées : compromis biais/variance, critères d’estimation, etc.
Modèles de mélanges et algorithme EM
Critères d’estimation dans les modèles de mélanges, apprentissage discriminant
Modèles de Markov cachés : principe, programmation dynamique, estimation des paramètres, applications

Année 2016/2017
Dernière mise à jour le 08-FEB-16
Validation par le responsable de programme le

IMT Atlantique

Campus de Brest
Technopôle Brest-Iroise
CS 83818
29238 Brest Cedex 3
France

Tél +33 (0)2 29 00 11 11
Fax +33 (0)2 29 00 10 00

Autres sites

Institut Mines-Télécom