Programmé en UVF3B301, UVF3B923
Présentation :
Poussée par le secteur industriel, fondée historiquement sur l'analyse de données et l'apprentissage, l'extraction de connaissances à partir des données (ECD) est un processus complexe et interactif. Pour fournir des connaissances utiles (au sens d'un utilisateur métier) dans un contexte de données extrêmement volumineuses, les méthodes et les technologies de bases de données doivent s'adapter à des contraintes nouvelles. Nous examinerons dans ce cours les principaux algorithmes de fouilles dans les données, leurs apports et leurs limites. L'évaluation de la qualité des connaissances produites sera étudiée en profondeur, en particulier dans le contexte de l'apprentissge non supervisé.
Objectifs (obsolète):
L'objectif de ce module est double: d'une part comprendre l'extraction de connaissances à partir des données, d'examiner les approches existantes et les limites qui sont actuellement constatées ; d'autre part mettre de en oeuvre des algorithmes étudiées sur des données à l'aide de Sas Entreprise Miner (SEM) et de la méthodologie SEMMA.
Pré-requis :
Quelques notions d'Analyse de données et de Statistiques sont souhaitables. Si nécessaire elles feront l'objet d'un rappel.
Liens :
Aide à la décision
Apprentissage
Bases de données
Recherche opérationnelle
Volume horaire :
21h
Contenu détaillé :
1) Cours (11 h.)
- Introduction à l'ECD : problématique, qualité des données (3h)
- Arbres de décision, règles d'association (3h)
- Mesures de qualités (2h)
- Fouille interactive de données (3h)
2) Travaux pratiques et projets (10 h.)
- Prise en main de SAS, Etude de cas jouets (2h30)
- Sas Entreprise Miner, Etude de cas (3h)
- WebHound - Webmining (1h30)
- Projets - Présentation - Début d'analyse (3h)
Année 2006/2007
Dernière mise à jour le 12-SEP-06
Validation par le responsable de programme le
|