TP 4 ML Classification Partie 2 2022 2023
TP 4 ML Classification Partie 2 2022 2023
TP 4 ML Classification Partie 2 2022 2023
Pr. N. Daoudi
Machine learning TP 4 2022/2023
l’ingénierie des features pour trouver les valeurs optimales des paramètres. Ceci est qui
faisable par plusieurs manières notamment GridSearchCV.
GridSearchCV est le processus qui consiste à effectuer un réglage hyper paramétrique pour
déterminer les valeurs optimales des paramètres d’un modèle. Cette technique est nécessaire
parce qu’elle permet d’augmenter la performance d’un modèle puisque la précision est basée
sur les valeurs des hyperparamètre spécifiées.
1.1 Appliquer le GridSearchcv sur l’arle modèle SVM pour trouver les paramètres du
best model et afficher les meilleurs hyperparamètres :
1.2 Appliquer le GridSearchcv sur le modèle de régression logistique pour trouver les
paramètres du best model et afficher les meilleurs hyperparamètres :
1.3 Appliquer le GridSearchcv sur l’arbre de décision pour trouver les paramètres du
best model et afficher les meilleurs hyperparamètres.
Pr. N. Daoudi
Machine learning TP 4 2022/2023
6. Choisir les variables qui vous semblent les plus importantes selon un modèle de
votre choix et calculer sa performance avant et après. Comparer et interpréter les
résultats.
7. Proposer d’autres manières pour sélectionner les variables les plus importantes.
D. Random Forest
1. Créer le modèle de Random Forest classifier : model_RF :
Pr. N. Daoudi
Machine learning TP 4 2022/2023
4. Est-ce que c’est possible de trouver les features les plus importants sans appliquer le
modèle random forest au préalable ?
5. Utiliser SelectFromModel pour trouver les features les plus importantes et agir sur le
paramètre threshold (seuil qui donne l’importance relative des différentes features
dans les différents arbres (de la foret).
6. Recréer le modèle RF avec les nouvelles variables.
7. Comparer les performances et si possible la durée d’exécution des deux cas.
E. Chercher d’autre algorithme pour l’ensemble learning (tels que
AdaBoostClassifier) et refaire le travail d’utilisation des meilleures
features. Evaluer le modèle et comparer avec Randomforest.
Pr. N. Daoudi