UVF3B403 : Fouille de données - Automne 2016/2017


Retour
Programmé en FIP 3A IR Automne
MS IADBA Automne
MSC 2A CSDS Automne
IG 3A Automne
EDF03B403
  Présentation
 
L'informatique décisionnelle (en anglais : DSS pour Decision Support System ou encore BI pour Business Intelligence) désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser, restituer et explorer les données recueillies ponctuellement ou accumulées au fil du temps au sein d'une organisation en vue d'offrir une aide à la décision.

Cette aide à la décision peut avoir différents d'objectifs, par exemple :
- l'identification d'une population particulière (des patients présentant une certaine pathologie)
- la segmentation d'une population (identifier les usages qui sont faits d'un service comme un site web, déterminer des profils d'investisseurs)
- la description de comportement (déterminer des règles du style « les gens achetant de la bière achètent également des chips »)
- la prévision par régression (prévoir la consommation d'électricité, le montant moyen des achats réalisés par un client) ou par classification (prévoir la classe de risque d'un emprunteur)

Des données à la décision, le chemin est long : la mise en place d'un projet d'informatique décisionnelle nécessite de respecter un processus découpé en plusieurs étapes (récupération et préparation des données, constitution d'un entrepôt de données, fouille des données, évaluation des résultats, etc). Cette UV permet de présenter les différentes approches et méthodes qui forment le socle théorique de l'informatique décisionnelle. Après avoir suivi l'UV, l'étudiant disposera d'une variété de méthodes et d'outils qui doivent lui permettre de résoudre la plupart des problèmes relevant de l'analyse de données et de l'informatique décisionnelle.
La discipline connaît depuis plusieurs années une forte expansion. Face aux besoins qualitatifs des entreprises, à la variété des méthodes disponibles, à la diversité des données (voix, image, etc.) et au rythme d'augmentation de leur volume, le domaine draine une large palette d'emplois allant de l'ingénieur d'études ou du chercheur en décisionnel (qui participe à la conception et au développement de systèmes décisionnels), du consultant décisionnel (qui participe aux différentes phases d'un projet : spécifications, conception, modélisation, alimentation, restitution et maintenance) jusqu'au manager (qui contrôle la mise en œuvre des projets). Les emplois sont nombreux et variés tant chez les SSII que chez les éditeurs et les grands comptes. Les compétences scientifiques recherchées sont variées et fortement liées au processus : analyse de données, apprentissage et bases de données, mais aussi les compétences métier du client final.

Les différentes étapes d'un projet décisionnel seront présentées. Un accent particulier sera porté sur l'étape d'exploration des données (la fouille des données) pour des objectifs de classification, de description, de prédiction et de régression. On s'intéressera également à la validité des résultats et aux méthodes de comparaisons des algorithmes.
Les travaux pratiques permettront aux étudiants de s'approprier les différentes méthodes d'analyse et solutions logicielles. En particulier on présentera la méthodologie CRISP-DM, la solution SAS Entreprise Miner et la méthodologie SEMMA associée mais aussi les langages R et Python.


Modalités d'évaluation
L'U.V. est évaluée par un projet avec remise d'un rapport et soutenance.
 
Conditions d'accès  : - UV labellisée dans la/les filière(s) : ISA
- UV ouverte aux autres filières : oui
- UV ouverte sous conditions : non

Eléments de statistiques, d'analyse de données et de bases de données.
 
Objectifs pédagogiques :
  • Savoir mettre en œuvre une méthodologie d'analyse de données
  • Connaître et comprendre les techniques de la fouille de données
  • Savoir appliquer ces techniques sur des problèmes réels à l'aide de logiciels de référence
  • Savoir évaluer, comparer et combiner ces techniques
  • Savoir proposer une solution argumentée
  • Connaître et comprendre les problématiques de l'analyse de données
  • Savoir concevoir une solution décisionnelle
Localisation  : BREST
Responsable  : Philippe LENCA
Co-responsable  : Sorin MOGA
Filière(s)  : F3B
Credits FIP 3A IR  : 6
Credits IG 3A  : 6
Dernière màj le 13-JUL-16 par LENCA
  Modules
 
Code Intitulé
Title
Responsable
Coordinator
Co-resp. Etat
State
Date màj
Last update
F3B403A Fouille de données P.Lenca   Validée 13-07-16

IMT Atlantique
Campus de Brest
Technopôle Brest-Iroise
CS 83818
29238 Brest Cedex 3
France

Tél  +33 (0)2 29 00 11 11
Fax +33 (0)2 29 00 10 00