Data Mining
Data Mining
Data Mining
Le Data mining
ZOUAIRI Saim
De quoi s’agit il ?
• Une masse importante d’informations et en données Vs des
difficultés d’accés et de traitement à cette informations disponibles
• C'est pourquoi nous abordons aujourd'hui la question de l'exploration
des données. Nous explorerons tous les aspects du data mining, y
compris sa signification, ses étapes, ses techniques, les avantages qu'il
offre, les outils de data mining, etc. Commençons par une définition
du data mining, puis abordons les concepts et les techniques du data
mining.
Avant Propos
• La fouille de données (Data mining in English) consiste à trouver des anomalies,
des modèles et des corrélations dans de vastes ensembles de données afin de
prédire les résultats.
• Grâce à un large éventail de techniques, on peut utiliser ces informations pour
augmenter les revenus, réduire les coûts, améliorer les relations avec les clients,
réduire les risques, etc.
LE DATA MINING-- définition
• Le terme de data mining signifie littéralement forage de données. Comme dans
tout forage, son but est de pouvoir extraire un élément : ici, la connaissance. Ces
concepts s’appuient sur le constat qu’il existe au sein de chaque entreprise des
informations cachées dans le gisement de données.
• une définition philosophique qui explique que le data mining permet de “ trouver
des réponses aux questions que l’on ne pose pas ! ”.
• Le data mining peut ainsi être défini comme l’ensemble des procédés visant à
analyser de grands ensembles de données pour y découvrir des relations et des
structures utiles dans un processus de décision.
• Le data mining est un processus vaste et varié qui comprend de
nombreux composants différents, dont certains sont même
confondus avec le data mining lui-même. Par exemple, les statistiques
sont une partie du processus global de data mining
• Les règles d'association sont des énoncés de type "si-alors" qui permettent
de montrer la probabilité d'interactions entre des éléments de données au
sein de grands ensembles de données dans différents types de bases de
données.
• L'algorithme fonctionne de la manière suivante : vous disposez de diverses
données, par exemple une liste de pièces que vous avez achetés au cours
des six derniers mois. L'algorithme calcule un pourcentage des pièces
achetés ensemble.
Règles d'association
• A titre d'exemple,