Données10:00 -> 10:1510:15 -> 10:28

Questions essentiels- Apprentissage supervisé vs non supervisé- Qu'est-ce que l'overfitting et l'underfitting ?- Comment définir et détecter l'overfitting ?- Qu'est-ce que le biais et la variance ?- Impact sur la performance du modèle

Les données- Traitement des données qualitatives (encodage, catégorisation)- Techniques d'équilibrage : SMOTE, upsampling, downsampling- Modèles avec données homogènes vs hétérogènes- Importance des différentes sources de données- Validation croisée : principes et fonctionnement

Les valeurs aberrantes- Méthodes de détection : IQR, Z-score, visualisation- Traitement : suppression, transformation, imputation- Impact sur la qualité du modèle

Les valeurs manquantes- Identification des données manquantes- Méthodes de traitement : suppression, imputation moyenne/médiane, modèles prédictifs- Statistiques descriptives : moyenne, médiane, variance, écart-type

L'évaluation du modèleClassification :- AUC, ROC- Accuracy, Précision, Rappel, F1-scoreRégression :- MAE, MSE, RMSE, MAPE- Choix des métriques selon le contexte

Feature Engineering- Encodage : One-hot, Label encoding- Transformations mathématiques : logarithme, racine carrée- Normalisation et standardisation des données- Réduction de dimension : PCA, sélection de variables

datascience