CSC 8614 – Modèles de langage

Portail informatique

Présentation

Dans ce cours, nous allons aborder ce que sont les modèles de langage. Nous parlerons de comment ils sont conçus et entraînés, ainsi que diverses applications.

  • Sujet
    Contenu
    Notions clefs
  • CI1
    Introduction aux modèles de langage
    • Modélisation du langage avec des probabilités
    • Word2Vec
    • Transformers
    • Génération de texte
  • CI2
    Training Large Language Models
    • Pre-processing
    • Pre-training
    • Fine-tuning for Classification
    • Knowledge Distillation
  • CI3
    Post-training and Evaluation
    • Post-training (SFT and alignment)
    • Evaluating LLMs
    • Parameter-Efficient Fine-tuning (PEFT)
  • CI4
    RAG
    • Retrieval-Augmented Generation (RAG)
    • Embeddings & recherche vectorielle
    • Chunking & indexation (Chroma)
    • Prompting “grounded” avec citations
    • Évaluation : Recall@k et groundedness
  • CI5
    Agents
CM : Cours Magistral (lecture only)       CI : Cours Intégré (lecture and lab)