INF 434 A : Analyse des données


Retour
Imprimer la fiche programme
Code analytique: EDOINFMA2
Responsable  :    
Programmé en UV2 MAJ INF

Présentation :

"La statistique classique s'est axée sur l'étude d'un nombre restreint de caractères
mesurés sur un petit ensemble d'individus. Elle a développé les notions d'estimation et de tests fondées sur des hypothèses propabilistes très restrictives.
Cependant, dans la pratique, les individus observés sont fréquemment décrits par un
grand nombre de caractères. Les méthodes d'analyse des données permettent une
étude globale des individus et des variables en utilisant généralement des représentations graphiques suggestives".
(Jean-Marie Bouroche et Gilbert Saporta, "L'analyse des données")

Objectifs (obsolète):

Le but de ce module est de donner aux élèves un aperçu des
différentes méthodes employées classiquement en analyse des
données. Ceci tant au niveau thÈorique (les bases mathématiques et
les différents algorithmes mis en oeuvres dans les différentes
méthodes) qu'au niveau pratique (utilisation et compréhension de
logiciels permettant d'effectuer les différentes analyses).

Pré-requis :

aucun

Volume horaire : 18h


Contenu détaillé :

Chaque cours de 3 heures peut être vu comme un séance de travaux dirigés, chaque
notion vue étant accompagnée d'exemples et d'exercices visant à une compréhention
plus fine d'icelle.


Cours + Travaux Dirigés 1 (3h) : Statistiques descriptives à une ou deux variables
On présentera les notions suivantes :
- notion d'espace de représentation des données,
- statistiques descriptives sur les données lorsque l'espace de
représentation est R ou R^2,
- la régression linéaire,
- notion de tests d'hypothèses et application au test du chi^2
d'indépendance.

Cours + Travaux Dirigés 2 (3h) : Analyse en composantes principales
L'analyse en composantes principales (A.C.P.) étant à la base de toutes
les méthodes factorielles en analyse des données, ce cours lui sera
exclusivement consacré.

On présentera en particuliers les notions d'inertie,
de plans principaux ainsi que leur lien avec la régression
linéaire.

Travaux Pratiques 1 (3h) :
Présentation du logiciel R ainsi que son utilisation pour calculer
des statistiques descriptives (cours 1) et des A.C.P. (cours 2).


Cours +Travaux Dirigés 3 (3h) : Classification automatique des données
Cette méthode d'analyse des données à pour but de produire des
classes ``homogènes'' d'objets.

Après une prÈsentation de différents modèles utilisables et utilisés
en classification automatique, le cours sera séparé en deux grandes
parties, la première consacrée aux méthodes de partitionnements
(comme les k-means, les centres mobiles, ...) et la seconde aux
méthodes ``hiérarchiques''.

Cours + Travaux Dirigés 4 (3h) : Méthodes factorielles
On utilisera les notions vues dans le cours 2 pour présenter deux
grandes méthodes d'analyse des données factorielles :
- l'analyse discriminante,
- l'analyse factorielle des correspondances.

Travaux Pratiques 2 (3h) :
Utilisation du logiciel R pour la résolution d'un problème liant les
notions vues en cours 3 et 4.

Travaux personnels encadrés :

aucun


Année 2006/2007
Dernière mise à jour le 20-MAR-06
Validation par le responsable de programme le


IMT Atlantique
Campus de Brest
Technopôle Brest-Iroise
CS 83818
29238 Brest Cedex 3
France

Tél  +33 (0)2 29 00 11 11
Fax +33 (0)2 29 00 10 00