Livoa LogoLivoa
Données

10:00 -> 10:15

10:15 -> 10:28

Questions essentiels

- Apprentissage supervisé vs non supervisé

- Qu'est-ce que l'overfitting et l'underfitting ?

- Comment définir et détecter l'overfitting ?

- Qu'est-ce que le biais et la variance ?

- Impact sur la performance du modèle

Les données

- Traitement des données qualitatives (encodage, catégorisation)

- Techniques d'équilibrage : SMOTE, upsampling, downsampling

- Modèles avec données homogènes vs hétérogènes

- Importance des différentes sources de données

- Validation croisée : principes et fonctionnement

Les valeurs aberrantes

- Méthodes de détection : IQR, Z-score, visualisation

- Traitement : suppression, transformation, imputation

- Impact sur la qualité du modèle

Les valeurs manquantes

- Identification des données manquantes

- Méthodes de traitement : suppression, imputation moyenne/médiane, modèles prédictifs

- Statistiques descriptives : moyenne, médiane, variance, écart-type

L'évaluation du modèle

Classification :

- AUC, ROC

- Accuracy, Précision, Rappel, F1-score

Régression :

- MAE, MSE, RMSE, MAPE

- Choix des métriques selon le contexte

Feature Engineering

- Encodage : One-hot, Label encoding

- Transformations mathématiques : logarithme, racine carrée

- Normalisation et standardisation des données

- Réduction de dimension : PCA, sélection de variables

datascience

by maha

0
0 uses