Le cours présentera des algorithmes pour l'analyse et l'exploration des données, en se focalisant sur les aspects pratiques et théoriques de l'exploration des grands volumes de données.
Pendant le cours, les élèves se familiariseront avec les algorithmes les plus efficaces pour le partitionnement de données, ranking, règles d'association, systèmes de recommandation, ainsi qu'avec les algorithmes pour la détection des communautés et des événements intéressants dans les réseaux sociaux. Les élèves travailleront dans un projet où ils implémenteront certains algorithmes précédemment mentionnés dans un cluster Hadoop (l'un des systèmes les plus efficaces pour traiter des grands volumes de données), et analyseront des données du monde réel.