This course presents the main concepts and algorithms of reinforcement learning:

  • Markov decision process
  • Dynamic programming (policy iteration, value iteration)
  • Online control (Q-learning, Monte-Carlo Tree Search)
  • Bandit algorithms

Teacher: Thomas Bonald

References:

  • Course of Olivier Sigaud
  • Course of David Silver
  • Book of Richard Sutton and Andrew Barto

Cours INF344

L'objectif de cet enseignement très pratique est de présenter comment installer et configurer Hadoop, d’initier au modèle de programmation MapReduce et à l’utilisation de technologies NoSQL, dans la perspective du projet Fil Rouge démarrant en P2. Parmi les points abordés : aspects théoriques du calcul distribué (verrous distribués, algorithmes d'élection, paradigmes de calcul distribué, problème de consensus, tolérance à la panne, etc.), utilisation des machines virtuelles AWS, installation du framework Hadoop (Zookeeper + HDFS + MapReduce), administration du framework Hadoop (taux de réplication HDFS, copie distribuée inter-cluster), utilisation du framework Hadoop pour la mise en œuvre d'opérations MapReduce, utilisation de la bibliothèque Hadoop streaming, installation de la base de données orientée documents MongoDB.