Oualid Idriss Soufian

Présentation de
trois Algorithmes
d'Apprentissage
Non Supervisé
Dans cette présentation, nous explorerons deux algorithmes
d'apprentissage non supervisé: K-means ,DBSCAN et apriori.s
Fait par:
Oualid Regragui
Idriss Anif
Soufiane El Azzouzi
Introduction
L'apprentissage non supervisé est une branche de l'intelligence
artificielle qui permet aux machines de découvrir des modèles et
des structures dans les données sans l'aide d'étiquettes
préexistantes.
Définition de
l'Apprentissage Non
Supervisé
L'apprentissage non supervisé consiste à explorer les données
pour trouver des structures, des motifs et des relations cachés,
sans la présence d'une variable cible. Il permet de découvrir des
informations précieuses sans préjugés.
Explication de
l'Algorithme K-means
K-means est un algorithme d'apprentissage non supervisé

largement utilisé pour la classification et la segmentation de
données. Il regroupe les données en k groupes distincts en se
basant sur leurs similarités.
Fonctionnement de k-means
1 Initialisation 2 Affectation des 3 Mise à jour des 4 Répétition des

points aux centres étapes 2 et 3
Choisissez
clusters
Assignez chaque point de
Calculez la nouvelle
aléatoirement k points données au cluster dont le On répète les étapes 2 et
position de chaque centre
dans l'ensemble de centroïde est le plus 3 jusqu'à ce que les
comme la moyenne des
données comme proche. centres ne changent plus
points qui lui sont affectés.
centre des clusters. de position.
Avantages de K-means
1 Facilité d'Utilisation 2 Efficacité
K-means est relativement facile à Cet algorithme est efficace et
comprendre et à mettre en peut être utilisé pour analyser de
œuvre, en particulier pour des grands ensembles de données en
ensembles de données de petite peu de temps.
à moyenne taille.
3 Interprétation des Résultats

Les clusters générés par K-means peuvent être facilement interprétés et
utilisés pour prendre des décisions éclairées.
Inconvénients de K-means
1 Nombre de 2 Sensibilité aux 3 Dépendant des

Clusters Valeurs Conditions
Spécifié Aberrantes Initiales
Les valeurs aberrantes L'algorithme K-means

Il est nécessaire de
peuvent avoir un peut produire des
spécifier à l'avance le
impact significatif sur résultats différents
nombre de clusters, ce
les résultats de K- selon les conditions
qui peut être difficile si
means et affecter la initiales, ce qui peut
l'on ne connaît pas
précision des clusters. mener à des solutions
bien les données.
suboptimales.
Apllications de k-means
La La classification La compression
segmentation de documents de données
d'images
Explication de
l'Algorithme DBSCAN
DBSCAN (Density-Based Spatial Clustering of Applications with
Noise) est un algorithme d'apprentissage non supervisé qui
identifie les régions de densité élevée dans l'espace des données.
Fonctionnement de DBSCAN
1 Définir les Grouper les

voisinages
2 points en
clusters
pour chaque point de On commence par un point non visité et on crée un cluster en
données, on recherche regroupant tous les points de son voisinage ε. On continue
tous les points qui se ensuite en parcourant les points non visités du voisinage et en
trouvent dans un les ajoutant au cluster s'ils se trouvent à une distance
rayon ε de ce point. inférieure à ε d'un point déjà dans le cluster. Si un point n'a pas
Ces points forment le de voisin ε dans un cluster existant, il est considéré comme un
voisinage ε du point. point de bruit.
Avantages de DBSCAN
1 Détection de Formes 2 Robuste aux Valeurs
Complexes Aberrantes
DBSCAN peut identifier des Cet algorithme est relativement
clusters de formes arbitraires et robuste aux valeurs aberrantes,
n'est pas limité à la structure car il utilise la densité des points
sphérique des clusters comme K- pour former des clusters, plutôt
means. que la distance.
3 Auto-Détermination des Clusters

DBSCAN détermine automatiquement le nombre de clusters et ne nécessite
pas de spécification préalable.
Inconvenients de DBSCAN
1 Sensibilité aux 2 Difficulté avec les

Paramètres Densités Variables
Epsilon (eps) et Nombre Min. DBSCAN peut avoir des difficultés
d'Échantillons (min_samples) : La avec des clusters de densités
performance de DBSCAN est variables., il pourrait être difficile
sensible au choix des de définir des paramètres qui
paramètres, en particulier fonctionnent bien pour
eps et min_samples tous les clusters.
3 Ambiguïté des Points de Bordure

Les points à la frontière de deux clusters peuvent être attribués à l'un ou
l'autre cluster, et le résultat peut être sensible à l'ordre des
données en entrée.
Apllications de DBSCAN
La L'analyse de La détection de
segmentation données fraude
d'images textuelles
Explication de
l'Algorithme Apriori
L'algorithme Apriori est une technique fondamentale en exploration

de données permettant d'identifier les règles d'association entre
différents éléments dans un ensemble de transactions. Il est
largement utilisé pour l'analyse du panier d'achat et la
recommandation de produits.
Fonctionnement de Apriori
Génération des Génération des

1 Itemsets Fréquents
2 3 Filtrage des Règles
Règles Pertinentes
d'Association
L'algorithme commence Enfin, il applique des
par identifier les items À partir de ces itemsets seuils de support et de
individuels qui fréquents, il génère confiance pour ne garder
apparaissent ensuite des règles que les règles les plus
fréquemment dans les d'association qui significatives.
transactions, appelés indiquent les relations
itemsets fréquents de entre les différents items.
taille 1.
Avantages de Apriori
1 Efficacité Élevée 2 Facilité d'Implémentation
Apriori est un algorithme très Sa logique est relativement simple à

performant qui peut traiter de grandes comprendre et à mettre en œuvre.
quantités de données.
3 Interprétabilité des Résultats
Les règles d'association générées sont

faciles à interpréter et à exploiter
Inconvenients de Apriori
1 Sensibilité au Seuil 2 Coût Élevé en Mémoire
Les résultats dépendent fortement des L'algorithme nécessite de stocker tous

seuils de support et de confiance les itemsets fréquents, ce qui peut être
choisis. très coûteux en mémoire.
3 Lenteur pour les Gros Volumes

Pour de très grandes quantités de données, Apriori peut devenir lent et peu efficace.
Apllications du Apriori
Analyse du Panier Recommandation Diagnostic Médical

d'Achat de Produits
Conclusion
Les algorithmes d'apprentissage non supervisé, tels que K-means
et DBSCAN et Apriori , offrent des méthodes puissantes pour
découvrir des structures et des motifs cachés dans les données.
Comprenez leurs avantages et inconvénients pour sélectionner le
meilleur algorithme en fonction de vos besoins.

Oualid Idriss Soufian

Transféré par

Droits d'auteur :

Formats disponibles

Oualid Idriss Soufian

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Oualid Idriss Soufian

Transféré par

Droits d'auteur :

Formats disponibles

Présentation de

K-means est un algorithme d'apprentissage non supervisé

1 Initialisation 2 Affectation des 3 Mise à jour des 4 Répétition des

3 Interprétation des Résultats

1 Nombre de 2 Sensibilité aux 3 Dépendant des

Les valeurs aberrantes L'algorithme K-means

1 Définir les Grouper les

3 Auto-Détermination des Clusters

1 Sensibilité aux 2 Difficulté avec les

3 Ambiguïté des Points de Bordure

L'algorithme Apriori est une technique fondamentale en exploration

Génération des Génération des

Apriori est un algorithme très Sa logique est relativement simple à

3 Interprétabilité des Résultats

Les règles d'association générées sont

1 Sensibilité au Seuil 2 Coût Élevé en Mémoire

Les résultats dépendent fortement des L'algorithme nécessite de stocker tous

3 Lenteur pour les Gros Volumes

Analyse du Panier Recommandation Diagnostic Médical

Vous aimerez peut-être aussi