Le traitement automatique des langues est un domaine en pleine expansion. Par exemple, beaucoup d'efforts ont été récemment consacrés au développement de méthodes capables d'analyser les données d'opinion disponibles sur le Web social. Le premier objectif de ce cours est d'aborder les différentes méthodes de traitement de la langue et d'apprentissage automatique sous-jacentes à l'analyse des textes. Au cours de ce cours, les étudiants acquerront des compétences théoriques et techniques sur les méthodes avancées d'apprentissage automatique et le traitement du langage naturel.

Les techniques et concepts qui seront étudiés comprennent:
-processus de langage naturel: tokenisation, marquage de partie de discours, représentation de document et word embeddings
ressources linguistiques : les lexiques, wordnet
-classement de texte et catégorisation de texte: méthodes avancées d'apprentissage automatique telles que les réseaux de neurones, les modèles markov cachés, etc.