HADOOP

Hadoop se compose de :

  • HFS pour le stockage

  • MapReduce : manipuler, en parallèle, de très gros volumes de données distibués

HDFS

Définition

Un fichier HDF est un conteneur de fichiers

  • Framework libre et open source pour gérer de des collections de données de toute taille et complexité

    suite open source pour gérer des collections de données de toute taille et complexité

  • Technologie associée à Hadoop

  • Adapté aux BDD NoSQL

Eléments

  • Créé au National Center for Supercomputing Applications

  • Format

    • HDF4

      HDF5

  • Bibliothèques

  • Outils (l'outil de navigation et de manipulation HDFView,…)

  • Utilisable avec langages tels que : java, python