UVF3B308 : Big Data, de l'architecture à la valorisation - Automne 2016/2017


Retour
Programmé en IG 3A Automne
FIP 3A IR Automne
EDF03B308
  Présentation
 
L'objectif de cette UV est de fournir aux étudiants les connaissances et compétences pour pratiquer le métier de Data Scientist en environnement Big Data. La Data Science est vue ici sous un angle pratique : architecture informatique distribuée permettant le passage à l'échelle, usage d'un environnement Big Data Hadoop, compréhension de l'écosystème économique et juridique et réalisation d'un projet de Data Analytics en partant de la définition d'une problématique et en allant jusqu'à la restitution d'analyse sous forme de pitch de quelques minutes ou l'écriture d'un article de blog.

L'UV s'articule autour de 3 modules.

- Le module informatique sera axé sur la mise en place d'un Cluster Big Data à partir de RaspberryPi : branchement du cluster, configuration, et initiation au système de fichiers réparti HDFS avec un focus sur l'architecture technique et logicielle.
- Le module d'analyse de données mettra les élèves en situation réelle où le Data Scientist conçoit une solution à une question posée. Ce module est centré sur un projet, et sera l'occasion d'appliquer les techniques d'analyse (big data ou non, selon les tâches) pour comprendre, décrire un jeu de données et en extraire les informations nécessaires pour répondre au problème métier posé.
- En parallèle, le module d'économie et de droit de la donnée fera prendre le recul nécessaire pour bien comprendre les enjeux métiers (économiques, organisation, business) et juridiques (droit des données, vie privée) autour de l'exploitation de données et pour mettre en place une procédure pour définir la question posée dans le module ci-dessus et comment les données peuvent y répondre.

A l'issue de cette UV, les étudiants auront pratiqué l'analyse données en environnement Big Data tout en se posant des questions de valorisation.

La méthode CRISP-DM:
-présentation: https://en.wikipedia.org/wiki/Cross_Industry_Standard_Process_for_Data_Mining
- documentation: ftp://ftp.software.ibm.com/software/analytics/spss/support/Modeler/Documentation/14/UserManual/CRISP-DM.pdf
 
Conditions d'accès  : Statistiques descriptives
Commandes de base Linux (cd, ls, chmod, mkdir, etc.)
Editeur de texte type vim, nano
Accès en SSH (Putty sous Windows)
 
Mode d'évaluation  :
Cette UV est évaluée essentiellement sur le projet fil rouge :
- Evaluation technique en salle de TP.
- Pitchs de vulgarisation pour convaincre le grand décideur de la stratégie à adopter.
- Présentation de poster en forum
- Vulgarisation écrite en 1 article de blog pour https://datascience.wp.mines-telecom.fr/
Localisation  : BREST
Responsable  : Cécile BOTHOREL
Co-responsable  : Laurent LECORNU
Filière(s)  : F3B
Credits IG 3A  : 6
Credits FIP 3A IR  : 6
Dernière màj le 22-NOV-16 par CBOTHORE
  Modules
 
Code Intitulé
Title
Responsable
Coordinator
Co-resp. Etat
State
Date màj
Last update
F3B308A Architecture Big Data L.Lecornu C.Bothorel Validée 13-07-16
F3B308B Data Analytics C.Bothorel L.Brisson Validée 13-07-16
F3B308C Economie et droit des données N.Jullien V.Lethiais Validée 13-07-16

IMT Atlantique
Campus de Brest
Technopôle Brest-Iroise
CS 83818
29238 Brest Cedex 3
France

Tél  +33 (0)2 29 00 11 11
Fax +33 (0)2 29 00 10 00