Traitement de la langue naturelle
Code APOGÉE : IFKCY060 | 6 ECTS | Enseignants : Marie Candito, Benoit Crabbé, Ewan Dunbar
Validation : CC + examen | Horaires hebdomadaires : 2h | Durée : 10 semaines
Mutualisé avec : M2 MIDS
Objectifs
- Familiarisation avec les principales méthodes du traitement automatique des langues (TAL)
- Appliquer des notions d’apprentissage à la modélisation du langage. Cas de l’apprentissage structuré (séquences et arbres)
- Présentation / utilisation des principales librairies incluant des modules de TAL prêts à l’emploi (Spacy, NLTK)
- Présentation / utilisation de librairies génériques d’apprentissage profond pour le TAL (pytorch)
Programme
- Linguistique 101
- Segmentation du texte, notion de mot, lexique, entités nommées
- Représentations sémantiques lexicales et sémantique distributionnelle
- Étiquetage morphosyntaxique
- Modélisation de séquences de mots
- Analyse syntaxique automatique de la langue naturelle
- Traduction automatique
- Quelques applications à l’analyse textuelle (résumé, analyse de sentiment, anaphore, cartographie de texte, …)
Modalités
Cours en présentiel avec liens vers le site officiel et Moodle du cours.
Bibliographie
- Eisenstein, J. (2019). Natural Language Processing. Cambridge : MIT Press.
- Jurafsky, D. & Martin, J. (2019). Speech and Language Processing. London : Pearson.
- Russell, S. & Norvig, P. (2016). Artificial Intelligence: A Modern Approach. London : Pearson.