Introduction

PLAN

  • Historique sur les serveurs de gestion de base de données

  • Enjeux du big data

  • Cycle de vie des données. Solutions sur la collecte, consolidation, analyse et visualisation

  • Complémentarité avec les solutions BI, Business Analytics, DatawareHouse, Data Lake, Data Mesh, Data Fabric

  • Collecte de données : les architectures temps réel

  • Solutions de stockage : HDFS, BDD NoSQL, Hadoop, HBase, MongoDB, Cassandra...

  • Manipulation des données, Pig, Hive...

  • Open Data

  • DataScience

  • Les Data Scientists au cœur du décisionnel

  • Crawling et scraping