Data Science et Machine Learning (08_DAT)
- Coefficient : 6
- Volume Horaire: 106.0h estimées de travail (dont 84.0h EdT)
- CTD : 9h encadrées
- Labo : 63h encadrées (et 12h de séances d'études dirigées)
- Travail personnel hors EdT : 22h
- Dont projet : 21h encadrées et 7h projet personnel
Liste des AATs
Description
- Introduction au data science
- Définition et champ d'application.
- Aperçu de l'écosystème data science et machine learning.
- Exploration de données
- Techniques de visualisation de données.
- Statistiques descriptives et inférentielles pour comprendre les ensembles de données.
- Préparation des données
- Nettoyage et prétraitement des données.
- Gestion des données manquantes et catégorielles.
- Introduction au Machine Learning
- Concepts de base et distinction entre apprentissage supervisé et non supervisé.
- Modèles de base : Régression linéaire, régression logistique, et k-means clustering.
- Évaluation des modèles
- Méthodes de validation croisée.
- Métriques d'évaluation pour les modèles de classification et de régression.
- Ateliers pratiques avec Python
- Utilisation de pandas pour l'exploration et le nettoyage des données.
- Introduction à scikit-learn pour la construction et l'évaluation de modèles simples.
Acquis d'Apprentissage visés (AAv)
AAv1 [heures: 0,B2,D3] : A l'issue du semestre S8, l'étudiant est capable d'appliquer un modèle de machine learning, de l'adapter à un contexte donné, de l'implémenter avec un framework de machine learning Python (scikit-learn ou PyTorch) et d'évaluer ses performances avec des métriques pertinentes.
AAv2 [heures: 0,B3,D3] : A l'issue du semestre S8, à partir d'un jeu de données, l'étudiant est capable de choisir un modèle de machine learning adapté pour résoudre un problème de régression ou de classification et d'argumenter son choix à partir d'une comparaison de performances.
AAv3 [heures: 0,B2,B3,D3] : A l'issue du semestre S8, l'étudiant est capable d'utiliser des techniques de prétraitement de données pour améliorer les performances des modèles de machine learning. Il est capable d'argumenter son choix en présentant des comparaisons de performances.