UVF3B308 : Big Data, de l'architecture à la valorisation - Automne 2019/2020


Retour
Programmé en IG 3A Automne
EDF03B308
  Présentation
 
L'objectif de cette UV est de fournir aux étudiants les connaissances et compétences pour pratiquer le métier de Data Scientist en environnement Big Data. La Data Science est vue ici sous un angle pratique : architecture informatique distribuée permettant le passage à l'échelle, usage d'un environnement Big Data Hadoop, compréhension de l'écosystème économique et juridique et réalisation d'un projet de Data Analytics en partant de la définition d'une problématique et en allant jusqu'à la restitution d'analyse sous forme de pitch de quelques minutes ou l'écriture d'un article de blog.

L'UV s'articule autour de 3 modules.

- Le module informatique sera axé sur la mise en place d'un Cluster Big Data à partir de RaspberryPi : branchement du cluster, configuration, et initiation au système de fichiers réparti HDFS avec un focus sur l'architecture technique et logicielle.
- Le module d'analyse de données mettra les élèves en situation réelle où le Data Scientist conçoit une solution à une question posée. Ce module est centré sur un projet, et sera l'occasion d'appliquer les techniques d'analyse (big data ou non, selon les tâches) pour comprendre, décrire un jeu de données et en extraire les informations nécessaires pour répondre au problème métier posé.
- En parallèle, le module d'économie et de droit de la donnée fera prendre le recul nécessaire pour bien comprendre les enjeux métiers (économiques, organisation, business) et juridiques (droit des données, vie privée) autour de l'exploitation de données et pour mettre en place une procédure pour définir la question posée dans le module ci-dessus et comment les données peuvent y répondre.

A l'issue de cette UV, les étudiants auront pratiqué l'analyse données en environnement Big Data tout en se posant des questions de valorisation.

La méthode CRISP-DM:
-présentation: https://en.wikipedia.org/wiki/Cross_Industry_Standard_Process_for_Data_Mining
- documentation: ftp://ftp.software.ibm.com/software/analytics/spss/support/Modeler/Documentation/14/UserManual/CRISP-DM.pdf
 
Conditions d'accès  : Statistiques descriptives
Commandes de base Linux (cd, ls, chmod, mkdir, etc.)
Editeur de texte type vim, nano
Accès en SSH (Putty sous Windows)
 
Localisation  : BREST
Responsable  : Cécile BOTHOREL
Co-responsable  : Laurent LECORNU
Filière(s)  : F3B
Credits IG 3A  : 6
Dernière màj le 11-JAN-19 par VALEGOFF
  Modules
 
Code Intitulé
Title
Responsable
Coordinator
Co-resp. Etat
State
Date màj
Last update
F3B308A Architecture Big Data L.Lecornu C.Bothorel Incomplète 11-01-19
F3B308B Data Analytics C.Bothorel L.Brisson Incomplète 11-01-19
F3B308C Economie et droit des données N.Jullien V.Lethiais Incomplète 11-01-19

IMT Atlantique
Campus de Brest
Technopôle Brest-Iroise
CS 83818
29238 Brest Cedex 3
France

Tél  +33 (0)2 29 00 11 11
Fax +33 (0)2 29 00 10 00