Retour |
Programmé en
IG 3A Automne
FIP 3A IR Automne |
EDF03B308 | |
Présentation | |
L'objectif de cette UV est de fournir aux étudiants les connaissances et compétences pour pratiquer le métier de Data Scientist en environnement Big Data. La Data Science est vue ici sous un angle pratique : architecture informatique distribuée permettant le passage à l'échelle, usage d'un environnement Big Data Hadoop, compréhension de l'écosystème économique et juridique et réalisation d'un projet de Data Analytics en partant de la définition d'une problématique et en allant jusqu'à la restitution d'analyse sous forme de pitch de quelques minutes ou l'écriture d'un article de blog. L'UV s'articule autour de 3 modules. - Le module informatique sera axé sur la mise en place d'un Cluster Big Data à partir de RaspberryPi : branchement du cluster, configuration, et initiation au système de fichiers réparti HDFS avec un focus sur l'architecture technique et logicielle. - Le module d'analyse de données mettra les élèves en situation réelle où le Data Scientist conçoit une solution à une question posée. Ce module est centré sur un projet, et sera l'occasion d'appliquer les techniques d'analyse (big data ou non, selon les tâches) pour comprendre, décrire un jeu de données et en extraire les informations nécessaires pour répondre au problème métier posé. - En parallèle, le module d'économie et de droit de la donnée fera prendre le recul nécessaire pour bien comprendre les enjeux métiers (économiques, organisation, business) et juridiques (droit des données, vie privée) autour de l'exploitation de données et pour mettre en place une procédure pour définir la question posée dans le module ci-dessus et comment les données peuvent y répondre. A l'issue de cette UV, les étudiants auront pratiqué l'analyse données en environnement Big Data tout en se posant des questions de valorisation. La méthode CRISP-DM: -présentation: https://en.wikipedia.org/wiki/Cross_Industry_Standard_Process_for_Data_Mining - documentation: ftp://ftp.software.ibm.com/software/analytics/spss/support/Modeler/Documentation/14/UserManual/CRISP-DM.pdf | |
Conditions d'accès : Statistiques descriptives Commandes de base Linux (cd, ls, chmod, mkdir, etc.) Editeur de texte type vim, nano Accès en SSH (Putty sous Windows) | |
Mode d'évaluation : Cette UV est évaluée essentiellement sur le projet fil rouge : - Evaluation technique en salle de TP. - Pitchs de vulgarisation pour convaincre le grand décideur de la stratégie à adopter. - Présentation de poster en forum - Vulgarisation écrite en 1 article de blog pour https://datascience.wp.mines-telecom.fr/ | |
Localisation : BREST | |
Responsable : Cécile BOTHOREL | |
Co-responsable : Laurent LECORNU | |
Filière(s) : F3B | |
Credits IG 3A : 6 | |
Credits FIP 3A IR : 6 | |
Dernière màj le 22-NOV-16 par CBOTHORE | |
Modules | |
Code | Intitulé Title |
Responsable Coordinator |
Co-resp. | Etat State |
Date màj Last update |
---|---|---|---|---|---|
F3B308A | Architecture Big Data | L.Lecornu | C.Bothorel | 13-07-16 | |
F3B308B | Data Analytics | C.Bothorel | L.Brisson | 13-07-16 | |
F3B308C | Economie et droit des données | N.Jullien | V.Lethiais | 13-07-16 |