Oualid Idriss Soufian

Télécharger au format pptx, pdf ou txt
Télécharger au format pptx, pdf ou txt
Vous êtes sur la page 1sur 19

Présentation de

trois Algorithmes
d'Apprentissage
Non Supervisé
Dans cette présentation, nous explorerons deux algorithmes
d'apprentissage non supervisé: K-means ,DBSCAN et apriori.s

Fait par:
Oualid Regragui
Idriss Anif
Soufiane El Azzouzi
Introduction
L'apprentissage non supervisé est une branche de l'intelligence
artificielle qui permet aux machines de découvrir des modèles et
des structures dans les données sans l'aide d'étiquettes
préexistantes.
Définition de
l'Apprentissage Non
Supervisé
L'apprentissage non supervisé consiste à explorer les données
pour trouver des structures, des motifs et des relations cachés,
sans la présence d'une variable cible. Il permet de découvrir des
informations précieuses sans préjugés.
Explication de
l'Algorithme K-means

K-means est un algorithme d'apprentissage non supervisé


largement utilisé pour la classification et la segmentation de
données. Il regroupe les données en k groupes distincts en se
basant sur leurs similarités.
Fonctionnement de k-means

1 Initialisation 2 Affectation des 3 Mise à jour des 4 Répétition des


points aux centres étapes 2 et 3
Choisissez
clusters
Assignez chaque point de
Calculez la nouvelle
aléatoirement k points données au cluster dont le On répète les étapes 2 et
position de chaque centre
dans l'ensemble de centroïde est le plus 3 jusqu'à ce que les
comme la moyenne des
données comme proche. centres ne changent plus
points qui lui sont affectés.
centre des clusters. de position.
Avantages de K-means
1 Facilité d'Utilisation 2 Efficacité
K-means est relativement facile à Cet algorithme est efficace et
comprendre et à mettre en peut être utilisé pour analyser de
œuvre, en particulier pour des grands ensembles de données en
ensembles de données de petite peu de temps.
à moyenne taille.

3 Interprétation des Résultats


Les clusters générés par K-means peuvent être facilement interprétés et
utilisés pour prendre des décisions éclairées.
Inconvénients de K-means

1 Nombre de 2 Sensibilité aux 3 Dépendant des


Clusters Valeurs Conditions
Spécifié Aberrantes Initiales

Les valeurs aberrantes L'algorithme K-means


Il est nécessaire de
peuvent avoir un peut produire des
spécifier à l'avance le
impact significatif sur résultats différents
nombre de clusters, ce
les résultats de K- selon les conditions
qui peut être difficile si
means et affecter la initiales, ce qui peut
l'on ne connaît pas
précision des clusters. mener à des solutions
bien les données.
suboptimales.
Apllications de k-means

La La classification La compression
segmentation de documents de données
d'images
Explication de
l'Algorithme DBSCAN
DBSCAN (Density-Based Spatial Clustering of Applications with
Noise) est un algorithme d'apprentissage non supervisé qui
identifie les régions de densité élevée dans l'espace des données.
Fonctionnement de DBSCAN

1 Définir les Grouper les


voisinages
2 points en
clusters
pour chaque point de On commence par un point non visité et on crée un cluster en
données, on recherche regroupant tous les points de son voisinage ε. On continue
tous les points qui se ensuite en parcourant les points non visités du voisinage et en
trouvent dans un les ajoutant au cluster s'ils se trouvent à une distance
rayon ε de ce point. inférieure à ε d'un point déjà dans le cluster. Si un point n'a pas
Ces points forment le de voisin ε dans un cluster existant, il est considéré comme un
voisinage ε du point. point de bruit.
Avantages de DBSCAN
1 Détection de Formes 2 Robuste aux Valeurs
Complexes Aberrantes
DBSCAN peut identifier des Cet algorithme est relativement
clusters de formes arbitraires et robuste aux valeurs aberrantes,
n'est pas limité à la structure car il utilise la densité des points
sphérique des clusters comme K- pour former des clusters, plutôt
means. que la distance.

3 Auto-Détermination des Clusters


DBSCAN détermine automatiquement le nombre de clusters et ne nécessite
pas de spécification préalable.
Inconvenients de DBSCAN

1 Sensibilité aux 2 Difficulté avec les


Paramètres Densités Variables
Epsilon (eps) et Nombre Min. DBSCAN peut avoir des difficultés
d'Échantillons (min_samples) : La avec des clusters de densités
performance de DBSCAN est variables., il pourrait être difficile
sensible au choix des de définir des paramètres qui
paramètres, en particulier fonctionnent bien pour
eps et min_samples tous les clusters.

3 Ambiguïté des Points de Bordure


Les points à la frontière de deux clusters peuvent être attribués à l'un ou
l'autre cluster, et le résultat peut être sensible à l'ordre des
données en entrée.
Apllications de DBSCAN

La L'analyse de La détection de
segmentation données fraude
d'images textuelles
Explication de
l'Algorithme Apriori

L'algorithme Apriori est une technique fondamentale en exploration


de données permettant d'identifier les règles d'association entre
différents éléments dans un ensemble de transactions. Il est
largement utilisé pour l'analyse du panier d'achat et la
recommandation de produits.
Fonctionnement de Apriori

Génération des Génération des


1 Itemsets Fréquents
2 3 Filtrage des Règles
Règles Pertinentes
d'Association
L'algorithme commence Enfin, il applique des
par identifier les items À partir de ces itemsets seuils de support et de
individuels qui fréquents, il génère confiance pour ne garder
apparaissent ensuite des règles que les règles les plus
fréquemment dans les d'association qui significatives.
transactions, appelés indiquent les relations
itemsets fréquents de entre les différents items.
taille 1.
Avantages de Apriori
1 Efficacité Élevée 2 Facilité d'Implémentation

Apriori est un algorithme très Sa logique est relativement simple à


performant qui peut traiter de grandes comprendre et à mettre en œuvre.
quantités de données.

3 Interprétabilité des Résultats

Les règles d'association générées sont


faciles à interpréter et à exploiter
Inconvenients de Apriori

1 Sensibilité au Seuil 2 Coût Élevé en Mémoire

Les résultats dépendent fortement des L'algorithme nécessite de stocker tous


seuils de support et de confiance les itemsets fréquents, ce qui peut être
choisis. très coûteux en mémoire.

3 Lenteur pour les Gros Volumes


Pour de très grandes quantités de données, Apriori peut devenir lent et peu efficace.
Apllications du Apriori

Analyse du Panier Recommandation Diagnostic Médical


d'Achat de Produits
Conclusion
Les algorithmes d'apprentissage non supervisé, tels que K-means
et DBSCAN et Apriori , offrent des méthodes puissantes pour
découvrir des structures et des motifs cachés dans les données.
Comprenez leurs avantages et inconvénients pour sélectionner le
meilleur algorithme en fonction de vos besoins.

Vous aimerez peut-être aussi