This course is part of the Master of Science and Technology in Artificial Intelligence. It treats the automated processing of natural language - in the form of text and speech. The course is given by Chloé Clavel and Fabian Suchanek.

The course consists of 4 parts, each with a morning session (9:15-12:30 with 15min break) and an afternoon session (13:30-16:45). The afternoon session is lab work. The final grade of the course is computed as the average of the grades of the labs. Labs are done alone. Plagiarism is sanctioned by a grade of 0/20.

The lab material is intended only for the participants of this course, and may not be shared publicly.


Le traitement automatique des langues est un domaine en pleine expansion. Par exemple, beaucoup d'efforts ont été récemment consacrés au développement de méthodes capables d'analyser les données d'opinion disponibles sur le Web social. Le premier objectif de ce cours est d'aborder les différentes méthodes de traitement de la langue et d'apprentissage automatique sous-jacentes à l'analyse des textes. Au cours de ce cours, les étudiants acquerront des compétences théoriques et techniques sur les méthodes avancées d'apprentissage automatique et le traitement du langage naturel.

Les techniques et concepts qui seront étudiés comprennent:
-processus de langage naturel: tokenisation, marquage de partie de discours, représentation de document et word embeddings
ressources linguistiques : les lexiques, wordnet
-classement de texte et catégorisation de texte: méthodes avancées d'apprentissage automatique telles que les réseaux de neurones, les modèles markov cachés, etc.