CSC 8609 – Introduction au machine learning

Portail informatique

Présentation

Le Cours CSC8609 – Introduction au machine learning est un cours de troisième année de la VAP MAIA à Télécom SudParis.

  • Sujet
    Contenu
    Notions clefs
  • CI1 et CI2
    Programmation
    • Présentation du cours : slides
    • Programmation en Python : Introduction à Python de CSC4538
    • Programmation Python : Faire 10 exercices sur LeetCode
    • Les bases de la programmation Python
  • CI3 et CI4
    Introduction au machine learning
    • S'inscrire sur le MOOC Machine learning in Python with scikit-learn
    • Écouter la section Welcome du Mooc.
    • Écouter la section Introduction: Machine Learning Concepts du Mooc.
    • Faire le Module 1. The Predictive Modeling Pipeline
    • Apprentissage supervisé vs. non supervisé
    • Régression vs. classification
    • Variables d'entrée et de sortie
    • Analyse de données
    • Features numériques et catégoriques
    • Utilisation d'un modèle dans scikit-learn
    • Transformation de données numériques et catégoriques
    • Train/validation/test split
    • Cross-validation
  • CI5
    Sélectionner le meilleur modèle
    • Faire le Module 2. Selecting the best model
    • Overfitting et underfitting
    • Erreur sur le train vs test
    • Dilemme Biais-Variance
  • CI6
    Les hyperparamètres
    • Faire le Module 3. Hyperparameter tuning
    • Définition hyperparamètre
    • Grid search
    • Randomized search
  • CI7 et CI8
    Modèles linéaires
    • Faire le Module 4. Linear Models
    • Régression Linéaire
    • Régression logistique
    • Erreur quadratique
    • Feature Engineering
    • Features polynomiales
    • Nystroem
    • Discretization
    • Spline
    • Regularisation
    • Ridge
  • CI9
    Arbres de décision
    • Faire le Module 5. Decision tree models
    • Arbre de décision
    • Profondeur maximale
    • Classification
    • Régression
    • Hyperparamètres feuilles
  • CI10 et CI11
    Méthodes Ensemblistes
    • Faire le Module 6. Ensemble of models
    • Modèles ensemblistes
    • Bagging
    • Boosting
  • CI12 - CI13
    Évaluer les performance d'un modèle
    • Faire le Module 6. Evaluating model performance
    • Stratification
    • Sample grouping
    • Dépendance de données
    • Nested Cross-validation
    • Métriques de classification
    • Métriques de régression
CM : Cours Magistral (lecture only)       CI : Cours Intégré (lecture and lab)