F3B101F : Introduction au Big Data


Retour
Imprimer la fiche programme
Code analytique: EDF03B102
Responsable  : Cécile BOTHOREL
Co-responsable  : Laurent LECORNU
   
Programmé en UVF3B102

Présentation :

Ce cours d'introduction au Big Data permet d'aborder d'un point de vue pratique l'utilisation d'une architecture BigData pour réaliser des analyses de données.

Le cours commence par une introduction sur le data mining à l'ère du Big Data, mettant en avant les problématiques de volumétrie, variété, vélocité (les fameux "V" du BigData).

La suite du module plus pragmatique présente l'environnement Hadoop, un des frameworks open source de stockage et de traitement distribués. Seront abordés le système de fichier distribué HDFS, les principes de traitement distribué Map/Reduce, mais aussi, brièvement l'écosystème d'outils autour de Hadoop. L'accent sera mis sur l'architecture technique, les composants tels que les noeuds d'un cluster, les flux de données entre noeuds, etc de sorte à comprendre les mécanismes de base de Hadoop.

Enfin, les étudiants manipuleront le système de fichier HDFS, réaliseront en Python des Mappers et des Reducers pour procéder à des analyses simples de jeux de données tels que des logs d'achat ou des cours de bourses. Des exercices permettront également d'utiliser la librairie de Machine Learning Mahout, fournissant ainsi aux étudiants les bases de la manipulation avancée de données sous Hadoop avec la réutilisation des outils de développement connus tels que Python ou Java déployés sous Hadoop.

Pré-requis :

Savoir manipuler linux et programmer en python.

Liens :

https://formations.telecom-bretagne.eu/fad/course/view.php?id=23934

Volume horaire : 6h



Année 2016/2017
Dernière mise à jour le 08-FEB-16
Validation par le responsable de programme le


IMT Atlantique
Campus de Brest
Technopôle Brest-Iroise
CS 83818
29238 Brest Cedex 3
France

Tél  +33 (0)2 29 00 11 11
Fax +33 (0)2 29 00 10 00