Test PDF
Test PDF
Test PDF
1
TABLE DES MATIÈRES
2 Détection de communauté 26
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2 Communautés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2.1.1 Les bases . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2.1.2 Définitions locales . . . . . . . . . . . . . . . . . . 28
2.2.1.3 Définitions globales . . . . . . . . . . . . . . . . . . 28
2.2.2 Définitions basées sur la similarité des sommets . . . . . . 28
2.2.3 Les méthode pour calculer la similarité . . . . . . . . . . . 29
2.2.4 Complexité informatique . . . . . . . . . . . . . . . . . . . . 29
2.2.5 Objective de détection de communautés dans les graphes 30
2.3 Les approches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3.1 Méthodes Traditionnelles . . . . . . . . . . . . . . . . . . . . 31
2.3.1.1 Partition de graphe . . . . . . . . . . . . . . . . . . 31
2.3.1.2 Partitions . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3.1.3 Classification hiérarchique . . . . . . . . . . . . . . 32
2.3.1.4 Clustering partiel . . . . . . . . . . . . . . . . . . . 34
2.3.1.5 Cluster spectral . . . . . . . . . . . . . . . . . . . . 35
2.3.1.6 Algorithmes proposés ( metaheuristiques ) . . . 35
2.3.1.7 Algorithme de chauve souris amélioré basé sur
l’algorithme évolutionnaire différentiel . . . . . . 36
2.3.1.8 Algorithme de recherche de dispersion basé sur
l’algorithme génétique . . . . . . . . . . . . . . . . 37
2.4 Modularité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.5 évaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Page | 2
TABLE DES MATIÈRES
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Page | 3
3.8.1.2 Sélection par rang . . . . . . . . . . . . . . . . . . 57
3.8.1.3 Sélection par Elitisme . . . . . . . . . . . . . . . . 58
3.8.2 Le croisement . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.8.2.1 Le croisement binaire . . . . . . . . . . . . . . . . 60
3.8.2.2 Croisement uniforme . . . . . . . . . . . . . . . . . 61
3.8.2.3 Croisement réel . . . . . . . . . . . . . . . . . . . . 61
3.8.3 La Mutation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.8.3.1 mutation binaire . . . . . . . . . . . . . . . . . . . . 62
3.8.3.2 mutation réelle . . . . . . . . . . . . . . . . . . . . 62
3.9 Critère d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Bibliographie 64
bibliographie 64
Table des figures 65
TABLE DES MATIÈRES
Introduction Générale
Page | 5
Chapitre 1
Etat de l’art sur l’analyse des réseaux
sociaux
Sommaire
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.1 Réseau social . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.2 Réseaux sociaux en ligne . . . . . . . . . . . . . . . . . . . 9
1.3 Origines des réseaux sociaux . . . . . . . . . . . . . . . . . . . . 10
1.4 Historique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4.1 Le classement des réseaux sociaux en Europe en 2016 12
1.4.2 Les Types des RS . . . . . . . . . . . . . . . . . . . . . . . 13
1.5 Représentation d’un réseau social . . . . . . . . . . . . . . . . 16
1.5.1 Les acteurs sociaux . . . . . . . . . . . . . . . . . . . . . . . 16
1.5.2 Les liens sociaux . . . . . . . . . . . . . . . . . . . . . . . . 16
1.5.3 Représentation graphique . . . . . . . . . . . . . . . . . . . 17
1.5.4 Reprèsentation matricielle . . . . . . . . . . . . . . . . . . 17
1.5.5 Graphe orientè . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.5.6 Fonctionnement d’un Rèseau Social . . . . . . . . . . . . 20
1.5.7 Domaines d’application rèseaux sociaux en ligne . . . . 21
1.6 Analyse des réseaux sociaux en ligne . . . . . . . . . . . . . . 22
1.6.1 Origine de l’analyse des réseaux sociaux . . . . . . . . . 22
6
1.6.2 Notion de calcule en ARS . . . . . . . . . . . . . . . . . . 22
1.6.3 Centralité d’intermédiarité . . . . . . . . . . . . . . . . . . 23
1.6.4 Centralienne de proximité . . . . . . . . . . . . . . . . . . 23
1.6.5 Centralisation de pouvoir . . . . . . . . . . . . . . . . . . . 23
1.6.6 Prestige . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.7 La Représentation des RS dans l’ARS . . . . . . . . . . . 24
1.6.8 La détection des structures communautaires . . . . . . . 24
1.6.9 L’étude de l’évolution dynamique des réseaux sociaux . 24
1.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Page | 7
1.1. INTRODUCTION
1.1. Introduction
e nos jours, les réseaux sociaux ont pris une importante part dans la vie
D quotidienne des millions d’utilisateurs abonnés à ces derniers, en offrant
une large gamme d’intérêts et de pratiques. La principale caractéristique des
réseaux sociaux est la capacité de réunir différents individus autour d’un point
de vue commun ou de les rassembler autour de croyances collectives.
Les réseaux sociaux permettent aux gens de se connecter avec des étrangers
ou de maintenir leurs relations existantes.
Les gens se connectent aux réseaux sociaux pour des intérêts partagés tels
que la profession, les études, le business ou pour des intérêts fondés sur la
langue commune, la nationalité ou des partages raciaux, religieux, et sexuels.
Les réseaux sociaux intègrent plusieurs outils et de nouvelles technologies
de communication comme la connectivité mobile ou le partage des photos et de
vidéos ainsi que les techniques de géo localisation.
Le grand nombre d’abonnés et leur activités sur les RS a engendré une grande
masse d’informations.
En effet l’exploitation de cette masse d’informations a conduit à la naissance
de différentes études sur les RS , c’est pour ça il est important de bien cerner
l’usage de ces réseaux sur le Web Pour cela il est nécessaire de définir les
réseaux sociaux, leur typologie et de savoir comment ils peuvent se former et se
construire.
Afin de mieux cerner le phénomène et d’en comprendre la portée, un cas
particulier MySpace est le réseau social le plus utilisé au monde.
Dans ce chapitre, nous présentons l’état de l’art de réseaux sociaux, en
couvrant la plupart de ses aspects, tout en nous consacrant plus particulièrement
aux avancées les plus récentes du domaine, nous donnerons quelques définitions
et la terminologie. Nous aborderons les réseaux sociaux et leurs représentations.
Page | 8
1.2. DÉFINITION
1.2. Définition
1.2.1. Réseau social
Aujourd’hui, un réseau social est défini comme une structure définie par
des relations entre des individus . Concrétement, c’est l’ensemble des individus
avec qui une personne est en contact. Il s’agit également de liens entre des
personnes : les habitants d’un quartier, une famille...
Un réseau social représente un systéme d’entités en interaction.
On le modélisera comme un graphe G=( D .S) ; A / où S est un ensemble
d’entités (les sommets ou nòuds du graphe) et A est l’ensemble des arcs (ou
connexions) représentant les interactions entre ces sommets .
Page | 9
1.3. ORIGINES DES RÉSEAUX SOCIAUX
Page | 10
1.4. HISTORIQUE
Figure 1.2 – les différents types de RS avec des exemples de SRS réels
l’informatique.
1.4. Historique
La notion de réseau social est née depuis que l’homme est constitué en société,
en formant des groupes sociaux selon une croyance ou un thème fédérateur tel
que la religion, la classe sociale, le niveau d’étude... etc.
Avec l’apparition d’internet cette notion a pris de nouvelles grandeurs, parmi
les premiers réseaux sociaux apparus nous citons : Le premier réseau social a
avoir réuni toutes les catégories de base pour faire quelque chose de complet
Page | 11
1.4. HISTORIQUE
Page | 12
1.4. HISTORIQUE
Figure 1.3
Page | 13
1.4. HISTORIQUE
1.4.2.1. RS de publication
1.4.2.2. Exemple
1.4.2.3. RS de partage
1.4.2.5. Exemple
Page | 14
1.4. HISTORIQUE
Les photos sont téléchargées vers les RS par l’utilisateur et elles sont
partagées avec les autres membres souhaités du réseau.
1.4.2.7. Exemple
1.4.2.9. Exemple
1.4.2.11. Exemple
Page | 15
1.5. REPRÉSENTATION D’UN RÉSEAU SOCIAL
sations qui peuvent être instantanées ou hors ligne sur des thèmes spécifiques.
Ces conversations amènent d’importantes masses d’informations actuelles, d’où
nous pouvons dire que ces RS sont des moyens d’interaction sociale directe pour
les utilisateurs.
1.4.2.13. Exemple
Page | 16
1.5. REPRÉSENTATION D’UN RÉSEAU SOCIAL
Figure 1.4
Page | 17
1.5. REPRÉSENTATION D’UN RÉSEAU SOCIAL
Figure 1.5
Figure 1.6
Page | 18
1.5. REPRÉSENTATION D’UN RÉSEAU SOCIAL
1.5.4.1. Thèoréme
Figure 1.7
Page | 19
1.5. REPRÉSENTATION D’UN RÉSEAU SOCIAL
Figure 1.8
Page | 20
1.5. REPRÉSENTATION D’UN RÉSEAU SOCIAL
mais surtout pour y participer et crèer des liens avec les autres membres. En
gènèral, ce profil est prèsentè par un espace personnel (page web) visible par
tous les internautes. Il s’agit d’un espace rèservè aux membres où ils ont la
possibilitè d’y mettre tout ce qu’ils souhaitent : Textes, histoires, journal intime,
photos de vacances ou encore vidèos. La mise en relation des membres se fait
de maniére trés simple soit par un lien vers l’autre profil que l’internaute insére
manuellement dans blogroll soit en invitant l’autre membre joindre n cercle
d’amis. Les rèseaux sociaux personnels sont donc plus orientès vers la diffusion
d’informations que vers la relation entre membres. Enfin, les rèseaux sociaux pro-
fessionnels sont les plus avancès d’un point de vue des fonctionnalitès proposèes
pour la gestion de sa communautè. La crèation de son profil est primordiale pour
pouvoir profiter de tous les services associès aux rèseaux professionnels. L’objectif
de ce type de sites est clairement de se construire un rèseau le plus grand et
pertinent possible. Que ce soit dans le cadre d’une recherche d’emploi, pour
trouver des capacitès de financement ou encore des opportunitès de partenariat,
les rèseaux sociaux peuvent s’avèrer bien utiles pour ce genre de demande. De
ce fait, la crèation de sa fiche personnelle (son curriculum vitae ici) est vitale.
Si vous voulez être trouvè où trouver du monde, il faut que cette fiche soit la
plus compléte possible tout en dèfinissant bien ses objectifs professionnels. En
fait, l’utilisation d’un rèseau social en ligne doit se faire image d’un vèritable
rèseau. D’un point de vue de la mise en relation entre les membres, les rèseaux
professionnels sont certainement les plus aboutis tout comme la recherche de
profil. Elles aboutissent souvent sur les profils recherchès et en quelques clics,
avec un message de demande de mise en contact, l’invitation est envoyèe par
courrier èlectronique. Par la suite, la personne invitèe a le choix de refuser ou
d’accepter la mise en relation. Si elle l’accepte, elle sera en contact direct avec
la personne et aura accés utes ses informations professionnelles mais ègalement,
et surtout, verra le rèseau du membre ainsi que son degrè de proximitè avec ses
autres contacts. La crèation de son rèseau n’est pas plus compliquèe que cela et
permet d’être rapidement en relation avec le monde entier
Page | 21
1.6. ANALYSE DES RÉSEAUX SOCIAUX EN LIGNE
Page | 22
1.6. ANALYSE DES RÉSEAUX SOCIAUX EN LIGNE
est impliqué dans plusieurs liens. Chaque nòud dans le réseau social est un
acteur et chaque lien indique que les deux acteurs aux extrémités communiquent
ensemble. Intuitivement, on remarque que l’acteur 1 est l’acteur le plus central
par ce qu’il/elle communique avec la majorité des autres acteurs. Il y a différents
types de liens ou d’implications entre acteurs. Par conséquence, plusieurs types
de centralités seront définis sur les graphes dirigés et non dirigés.
1.6.6. Prestige
Le prestige est une mesure plus raffinée que la centralité. on distingue entre
les liens sortants et ceux entrants. Un acteur prestigieux est un acteur ayant
beaucoup de liens entrants. Le prestige d’un acteur est mesuré par le nombre
des liens entrants
Page | 23
1.6. ANALYSE DES RÉSEAUX SOCIAUX EN LIGNE
Page | 24
1.7. CONCLUSION
prennent en compte cet aspect. L’une des techniques qui existent est l’évaluation
temporelle des RS . L’évaluation temporelle visualise l’état de la structure sociale
instant donné en évaluant son comportement t instant.
1.7. Conclusion
Les réseaux sociaux ont toujours été présents dans la vie sociale de l’être
humain. Ils n’attendaient plus qu’un moyen pour prendre de l’ampleur. Ce moyen
est Internet et les nouvelles technologies. Ainsi il est possible de créer des
réseaux de plusieurs millions de personnes. Tout individu peut entrer en relation
par le biais de 5 contacts maximum, avec n’importe quelle personne se trouvant
sur la surface de la terre. La puissance des réseaux sociaux est donc décuplée gr
au média Internet. Il s’agit lun phénomène que nul ne pouvait prévoir, il y a encore
quelques années. La technologie a mis portée de tout acun ou presque un outil
possédant un très fort potentiel social. Enfin, il est intéressant de mettre en étroite
relation entre les réseaux sociaux et le monde de l’entreprise. C’est en effet, un
ensemble sous-estimé du domaine social sur Internet. Bien entendu, il existe des
réseaux sociaux professionnels mais leur utilisation reste exclusivement externe
entreprise. Lorsque l’on parle de communauté, d’environnements collaboratifs, de
dynamique de groupe, tout le monde pense entreprise, lieu de prédilection des
relations et de contacts humains.
Page | 25
Chapitre 2
Détection de communauté
Sommaire
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2 Communautés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2.2 Définitions basées sur la similarité des sommets . . . . . 28
2.2.3 Les méthode pour calculer la similarité . . . . . . . . . . 29
2.2.4 Complexité informatique . . . . . . . . . . . . . . . . . . . 29
2.2.5 Objective de détection de communautés dans les graphes 30
2.3 Les approches . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3.1 Méthodes Traditionnelles . . . . . . . . . . . . . . . . . . . 31
2.4 Modularité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.5 évaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
26
2.1. INTRODUCTION
2.1. Introduction
a science moderne des réseaux a apporté des avancées significatives à
2.2. Communautés
2.2.1. Définitions
2.2.1.1. Les bases
Le premier problème dans le regroupement de graphe est de chercher une
définition quantitative de la communauté. Aucune définition n’est universellement
acceptée. En fait la définition dépend souvent du système spécifique en question
et / ou l’application que l’on a en tête. II nous obtenons l’idée qu’il doit y avoir
plus d’arêtes "à l’intérieur" de la communauté que les sommets de la communauté
avec le reste du graphique. Ceci est la ligne de référence à la base de la plupart
des définitions communautaires, Mais beaucoup de recettes alternatives sont
compatible avec elle. De plus, dans la plupart des cas, les entités sont définies
par un algorithme, ils sont juste les produits finaux de l’algorithme, sans précision
a priori de la définition.
Page | 27
2.2. COMMUNAUTÉS
Figure 2.1
Page | 28
2.2. COMMUNAUTÉS
Figure 2.2
Figure 2.3
Et L infini-norm
Figure 2.4
Page | 29
2.2. COMMUNAUTÉS
Figure 2.5
requis par l’algorithme pour effectuer une te. Cela implique à la fois le nombre
d’étapes de calcul nécessaires et le nombre d’unités de mémoire qui doivent
être simultanément alloué pour exécuter le calcul. De telles demandes sont
généralement exprimées par leurs évolutivités avec la taille de système. Dans le
cas d’un graphe, la taille est indiqué par le nombre de sommets n et / ou nombre
d’arêtes.
Page | 30
2.3. LES APPROCHES
optimisent une fonction de qualité pour évaluer la qualité d’une partition donnée,
comme la modularité, la coupe ratio, la coupe min-max ou la coupe normalisée
(Kernighan et Lin, 1970 ; Chan et al., 1994 ;Shi et Malik, 2000 ; Ding et al., 2001 ;
Newman et Girvan, 2004), les techniques hiérarchiques comme les algorithmes
de division (Flake et al., 2003), les méthodes spectrales (Von Luxburg, 2007) ou
l’algorithme de Markov et ses extensions (Satuluri et Parthasarathy, 2009). Ces
techniques de partitionnement de graphes sont très utiles pour détecter des
composantes fortement connectées dans un graphe. Cette section est consacrée à
la détection de telles communautés qui repose donc uniquement sur les arêtes et
leurs dispositions dans et entre les classes. Deux sommets classés un ensemble
doivent être plus liés entre eux, directement ou par l’intermédiaire d’autres
sommets, que vis-à-vis de sommets placés dans d’autres classes.
2.3.1.2. Partitions
Notions de base : Une partition est une division d’un graphe en clusters,
telle que chaque sommet appartient à un cluster, dans les sommets de systèmes
réels peuvent être partagés entre Différentes communautés. Une division d’un
graphique en chevauchement (ou floue) communautés est appelée couverture. Le
nombre de partitions possibles dans k clusters d’un graphe avec n sommets est le
nombre de Stirling de second. Les partitions peuvent être hiérarchisées, lorsque
Page | 31
2.3. LES APPROCHES
Figure 2.6
Page | 32
2.3. LES APPROCHES
Page | 33
2.3. LES APPROCHES
très fréquente dans les réseaux sociaux, analyse de réseau, biologie, ingénierie,
marketing, etc. Le point de départ de tout regroupement hiérarchique La méthode
est la définition d’une mesure de similarité entre sommets. Après avoir choisi
une mesure, on calcule la similitude pour chaque paire de sommets, peu importe
s’ils sont connecté ou non. A la fin de ce processus, il en reste un avec une
nouvelle matrice n ? n X, la matrice de similarité. Dans la section III.B.4 nous
avons énuméré plusieurs définitions possibles similarité. Les techniques de
classification hiérarchique visent à identifier les groupes de sommets avec une
grande similitude, et peut être classé en deux catégories :
Page | 34
2.3. LES APPROCHES
Page | 35
2.3. LES APPROCHES
Figure 2.9
Page | 36
2.3. LES APPROCHES
formule donnée dans l’équation 7, de l’original DEA à trois vecteurs qui ont
été choisis au hasard parmi la population de chauves-souris généré par le BA
original. La phase de reproduction individuelle de la BADE est montré à la Fig.
5.
Figure 2.10
Page | 37
2.4. MODULARITÉ
2.4. Modularité
L’une des fonctions de fitness les plus populaires et bien connues dans la
littérature est la fonction de modularité. Le concept de modularité a été introduit
en 2004 . Dans ces études, la fonction de modularité basées sur le principe
selon lequel les relations entre les membres dans les communautés doivent être
maximisés et que les relations de ces membres avec les membres des autres
communautés doivent être minimisé. La fonction d’évaluation ainsi obtenue est
basée sur une approche non aléatoire et modèle mathématique. Lorsque l’on
considère également la difficulté de l’analyse des grandes et structures de graphe
complexes, on peut comprendre que le problème de maximisation de la modularité
est un problème de NP-difficile. La fonction de modularité la plus basique Q
qui représente la fonction de modularité du graphe est donnée dans l’équation
suivante :
Figure 2.11
Où, indique les probabilités de bord des sommets binaires, montre le fraction
d’arêtes ayant au moins une extrémité dans le groupe (pourcentage d’arêtes
Page | 38
2.4. MODULARITÉ
avec au moins 1terminer dans le module i). Pour une fonction de modularité
plus générale, lorsqu’un réseau d’échantillons donné est représenté avec toute
structure de graphe, les structures communautaires acquises peuvent être consi-
dérées comme sous-graphes qui ont les qualités et les quantités telles que la
propriété communes maximums , le nombre d’interaction, la similitude de position
en soi. Alors que les sommets (nòuds) qui sont les membres de ces structures
doivent avoir le maximum relations ou propriétés communes maximums avec les
nòuds dans sa propre communauté (à l’intérieur de la communauté), ils doivent
avoir les relations minimales ou communes de propriétés avec les nòuds de
l’autre communauté (en dehors de la communauté). En domaines social , les
personnes ayant de fortes relations se trouvent dans les communautés similaires,
les colonies de créatures vivantes qui se nourrissent les unes les autres se
trouvent dans la même communauté dans les domaines de l’environnement, et
les clusters d’ordinateurs qui ont le maximum de données l’échange et la colla-
boration maximale qu’ils se forment sont situés dans la même communauté dans
les réseaux informatiques peut être donné comme un exemple lié à la Problème
de CD. Supposons qu’une structure de graphe donnée G (V, E) représente un
réseau d’échantillons, et G, V et E représente le graphe donné, l’ensemble des
sommets et l’ensemble des arêtes, respectivement. V = vi | i = 1, 2, 3 ... n et E =
ej | j = 1, 2, 3 ... m où i, j, n et m représentent l’indice du sommet, l’indice du bord,
le nombre des sommets totaux et le nombre des arêtes totales, respectivement.
De plus, supposons qu’une matrice d’adjacence Adj qui démontre les relations
entre les membres des groupes E et V avec des dimensions nxn est défini. Adj
est généré par l’équation 2
Figure 2.12
Page | 39
2.5. ÉVALUATION
Figure 2.13
Figure 2.14
Dans cette étude, la fonction donnée dans l’équation 3 a été utilisée comme
une fonction de remise pour la détection des communautés les plus appropriées
du monde réel de réseaux donné dans le processus de test. Les paramètres
de cette fonction et le complément , descriptions de l’autre problème CD ont
été adaptées aux algorithmes donnés dans la section suivante et les résultats
obtenus des études expérimentales ont été présenté dans les tableaux et les
figures. De plus, les résultats obtenus ont été évalués en analysant en détail
dans la section 4.
2.5. évaluation
Dans la littérature, on rencontre principalement deux modes d’évaluation
des méthodes développées en classification non supervisée de sommets dans
les réseaux d’information. La première d’entre eux est l’évaluation à l’aide de
critères internes. On cherche alors à obtenir une partition la meilleure possible
au sens d’un critère particulier, comme la modularité. Or face à un problème réel,
la question que l’on se pose est plutt "La solution que m’apporte l’algorithme
est-elle de qualité, a-t-elle de bonnes propriétés ?" que "La solution que m’apporte
Page | 40
2.6. CONCLUSION
l’algorithme est-elle la meilleure ?" (Ou l’une des meilleures, la meilleure réponse
face à un compromis temps / résultat). En particulier, la notion de "bonne
solution" varie selon le contexte d’application. Le second mode d’évaluation est
la confrontation des classes fournies par la méthode à des groupes "naturels".
On dira alors que l’on évalue le résultat selon un critère externe. Le score se
calcule alors en termes de précision et de rappel, ou encore de F-mesure. Si
plusieurs mesures hybrides ont été proposées pour opérer la classification dans
des réseaux d’information, elles ne peuvent pas réellement être employées en
tant que critères d’évaluation, en tout cas si elles sont également utilisées pour
construire les classes car l’évaluation sera biaisée. Dans l’état de l’art figure
cependant le critère de Joint Silhouette Coefficient proposé par Moser et al.
et qui permet de quantifier la qualité d’une partition construite sur un réseau
d’information en tenant compte des deux types de données : attributs et relations
(Moser et al., 2007). Cet indice, inspiré de l’indice de Silhouette de Rousseeuw
(Rousseeuw, 1987), est défini par :
Figure 2.15
2.6. Conclusion
Le fait que l’analyse de réseau social se situe entre plusieurs domaines
(so-l’informatique, les mathématiques et la physique) a conduit à de nombreux
approches thodologiques.
C’est pourquoi tant de programmes ont été créés dans l’ordre manipuler
et étudier les réseaux sociaux. Alors qu’un outil autonome est très utile pour
la visualisation graphique (jusqu’à un maximum de quelques milliers de nuds),
format de données conversion ou calcul d’indicateurs, les bibliothèques sont
plus adaptées aux tes impliquant des dizaines de milliers de nuds et pour des
opérations telles que l’union et la différence entre les ensembles de nuds ou
pour le regroupement.
Une juste séparation des algorithmes, des interfaces d’utilisateurs (y compris
Page | 41
2.6. CONCLUSION
Page | 42
Chapitre 3
Autres approches liées à la colonie
d’abeilles
Sommaire
3.1 Hybrid Fuzzy Logic and Artificial Bee Colony Algorithm for
Intrusion Detection and Classification . . . . . . . . . . . . . . . 45
3.1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.1.2 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.1.3 Calcul naturel . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.1.4 Biologiquement Calcul Inspiré . . . . . . . . . . . . . . . . 46
3.1.5 Biologie Motivé informatiquement . . . . . . . . . . . . . . 46
3.1.6 Calcul avec biologie . . . . . . . . . . . . . . . . . . . . . . 47
3.1.7 Informatique intelligente . . . . . . . . . . . . . . . . . . . 47
3.1.8 Processus de création d’un algorithme inspiré da La
Nature . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.1.9 Application de l’algorithme (méta heuristiques) . . . . . 47
3.2 Optimisation Combinatoire En mathématique . . . . . . . . . . 49
3.2.1 Minimum Local . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.2.2 Minimum Global . . . . . . . . . . . . . . . . . . . . . . . . 49
43
3.2.3 Voisinage . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3 Classification des Méta heuristiques . . . . . . . . . . . . . . . 49
3.4 Notre approche Algorithme Génétique . . . . . . . . . . . . . . 51
3.4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.4.2 Terminologie . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.5 Fonctionnement générale . . . . . . . . . . . . . . . . . . . . . . 52
3.5.1 Définition 01 (Gène) . . . . . . . . . . . . . . . . . . . . . . 52
3.5.2 Définition 02 (Chromosome) . . . . . . . . . . . . . . . . . 52
3.5.3 Définition 03 (Individu) . . . . . . . . . . . . . . . . . . . . 52
3.5.4 Définition 04 (population) . . . . . . . . . . . . . . . . . . 52
3.5.5 Définition 05 (Génération) . . . . . . . . . . . . . . . . . . 52
3.5.6 Dentition 06 (fonction de fitness ou fonction d’évaluation) 53
3.5.7 Fonctionnement général . . . . . . . . . . . . . . . . . . . 53
3.6 Algorithme de base AG . . . . . . . . . . . . . . . . . . . . . . . 53
3.7 Principe de fonctionnement . . . . . . . . . . . . . . . . . . . . . 55
3.7.1 Codage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.7.2 Population Initiale . . . . . . . . . . . . . . . . . . . . . . . 56
3.7.3 Adaptation . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.8 Les opérateurs d’un algorithme génétique . . . . . . . . . . . . 57
3.8.1 la sélection . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.8.2 Le croisement . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.8.3 La Mutation . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.9 Critère d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Page | 44
3.1. HYBRID FUZZY LOGIC AND ARTIFICIAL BEE COLONY ALGORITHM FOR
INTRUSION DETECTION AND CLASSIFICATION
3.1.2. Définition
On peut définir l’informatique bio-inspirée comme un système ou une architec-
ture dont l’organisation est issue de la connaissance que l’on a du fonctionnement
des systèmes vivants. Il s’agit donc de comprendre des phénomènes biologiques
(propriétés d’adaptation, d’auto-organisation...), de les modéliser afin d’utiliser
cette modélisation pour mettre au point de nouvelles méthodologies de traitement
de l’information utilisant les propriétés essentielles du vivant. L’objectif est de
reproduire et utiliser les mécanismes observés dans le vivant dans différents
domaines (informatique, recherche, mathématiques, robotique...). Il est intéres-
sant d’observer, par exemple, le fonctionnement d’une société d’insectes afin
de comprendre comment est mise en uvre leur intelligence collective. En effet,
des sociétés composées d’individus "simples" (thermites, fourmis, abeilles par
exemple), peuvent ensemble résoudre des problèmes complexes en suivant des
règles élémentaires. Les défis visés sont par exemple de mieux formaliser de
nouvelles méthodes de calculs cellulaires, d’élaborer de nouveaux algorithmes
d’optimisation, de développer des architectures bio-inspirées pour des machines
autonomes... Un algorithme est un ensemble d’instructions à suivre qui défi-
nissent "ce qu’il faut faire" et "dans quel ordre" pour résoudre un problème donné
(ou un ensemble de problèmes). Les algorithmes vont permettre de résoudre
des problèmes dits "combinatoires", caractérisés par leur complexité. En effet,
leur résolution nécessite l’exploration d’un nombre important de combinaisons.
En pratique, on ne pourra pas résoudre toutes les instances d’un problème
complexe, certaines pouvant être résolues plus rapidement que d’autres. Il s’agit
Page | 45
3.1. HYBRID FUZZY LOGIC AND ARTIFICIAL BEE COLONY ALGORITHM FOR
INTRUSION DETECTION AND CLASSIFICATION
Page | 46
3.1. HYBRID FUZZY LOGIC AND ARTIFICIAL BEE COLONY ALGORITHM FOR
INTRUSION DETECTION AND CLASSIFICATION
Page | 47
3.1. HYBRID FUZZY LOGIC AND ARTIFICIAL BEE COLONY ALGORITHM FOR
INTRUSION DETECTION AND CLASSIFICATION
combinatoires. Le terme méta heuristique vient des mots grecs méta (au de la)
et heuriskein (trouver).
Il n’y a pas clairement de consensus sur la notion exacte des heuristiques et
des métas heuristiques. Nous allons adopter Celles-ci :
Une heuristique est une technique de résolution spécialisée a un problème.
Elle ne garantit pas la qualité de la solution obtenue.
Un méta heuristique est une heuristique générique qu’il faut adapter à chaque
problème. Il ne faut pas confondre méta heuristique et math euristique.
Une math euristique est une méthode d’optimisation combinant des techniques
métas heuristiques a des algorithmes " de programmation mathématique (PM).
On peut ainsi avoir des métas heuristiques dénies ou améliorées par des
techniques de PM, ou des métas heuristiques accélérant des algorithmes de PM.
Exemple : Utiliser un méta heuristique pour générer des colonnes en généra-
tion de colonnes. Une méta heuristique : est une méthode algorithmique capable
de guider et d’orienter le processus de recherche dans un espace de solution,
souvent très grand à des régions riches en solutions optimales. Le fait de rendre
cette méthode abstraite et plus générique conduite à une utilisation vaste pour
des champs d’applications différents. A ces applications, les méta heuristiques
Page | 48
3.2. OPTIMISATION COMBINATOIRE EN MATHÉMATIQUE
permettent, de trouver des solutions, peut être pas toujours optimales, en tout
cas très proches de l’optimum et en un temps raisonnable.
Page | 49
3.3. CLASSIFICATION DES MÉTA HEURISTIQUES
Page | 50
3.4. NOTRE APPROCHE ALGORITHME GÉNÉTIQUE
3.4.2. Terminologie
Page | 51
3.5. FONCTIONNEMENT GÉNÉRALE
Page | 52
3.6. ALGORITHME DE BASE AG
• Répéter
Page | 53
3.6. ALGORITHME DE BASE AG
Page | 54
3.7. PRINCIPE DE FONCTIONNEMENT
Figure 3.6
Page | 55
3.7. PRINCIPE DE FONCTIONNEMENT
Figure 3.7
Page | 56
3.8. LES OPÉRATEURS D’UN ALGORITHME GÉNÉTIQUE
3.7.3. Adaptation
La fonction d’adaptation, ou fitness, associe une valeur pour chaque individu.
Cette valeur a pour but d’évaluer si un individu est mieux adapté qu’un autre
à son environnement. Ce qui signifie qu’elle quantifie la réponse fournit au
problème pour une solution potentielle données. Ainsi les individus peuvent être
comparés entre eux. Cette fonction, propre au problème, est souvent simple à
formuler lorsqu’il ya peu de paramètres. Au contraire, lorsqu’il ya beaucoup de
paramètres ou lorsqu’ils sont corrèles, elle est plus difficile à définir. Dans ce cas,
la fonction devient une somme pondérée de plusieurs fonctions. Un ajustement
des coefficients est nécessaire.
3.8.1. la sélection
La sélection permet d’identifier statistiquement les meilleurs individus de la
population courante qui seront à se reproduire. Cette opération est fondée la
performance des individus, estimée à l’aide de la fonction d’adaptation. Il existe
différents principes de sélection :
Page | 57
3.8. LES OPÉRATEURS D’UN ALGORITHME GÉNÉTIQUE
rang =P ensemble fi/n, alors le plus mauvais individu aura le premier rang, le
suivant le deuxième rang, ainsi de suite. La sélection par rang d’un individu est
la même que par roulette, mais les proportions sont en relation avec le rang
plutt qu’avec la valeur de l’évaluation. Avec cette méthode de sélection, tous
les individus ont une chance d’être sélectionnés. Cependant, elle conduit à une
convergence plus lente vers la bonne solution.
prob(i) = fi=Pfj où désigne la somme des adaptations de la population.
Figure 3.9
Page | 58
3.8. LES OPÉRATEURS D’UN ALGORITHME GÉNÉTIQUE
que celle de la loterie biaisée dans le sens où elle amènera à une convergence
prématurée encore plus rapidement et surtout de manière encore plus sûre que
la méthode de sélection de la loterie biaisée. En effet, la pression de la sélection
est trop forte, la variance nulle et la diversité inexistante. Une sélection par
élitisme après avoir trié la population selon la fonction d’adaptation permet de
nous donner la population suivante :
Figure 3.10
3.8.2. Le croisement
La naissance d’un nouvel individu, nécessite la prise aléatoire d’une partie des
gènes de chacun des deux parents. Ce phénomène, issu de la nature est appelé
croisement (crossover). Le croisement est le processus de prendre deux parents
et de produire à partir d’elles des enfants. Il s’agit d’un processus essentiel
pour explorer l’espace des solutions possibles. La littérature définit plusieurs
opérateurs de croisement. Ils différent selon le type de codage adapté et la
nature du problème traité.
Figure 3.11
Page | 59
3.8. LES OPÉRATEURS D’UN ALGORITHME GÉNÉTIQUE
Figure 3.12
Figure 3.13
Page | 60
3.8. LES OPÉRATEURS D’UN ALGORITHME GÉNÉTIQUE
Figure 3.14
3.8.3. La Mutation
C’est un processus où un changement mineur de code génétique est appliqué
à un individu pour introduire de la diversité et ainsi d’éviter de tomber dans des
optimums locaux. Différentes manières de mutation d’un chromosome sont aussi
définies dans la littérature.
Page | 61
3.9. CRITÈRE D’ARRÊT
Page | 62
Conclusion
A méthode d’optimisation par colonie d’abeille est l’une des récentes mé-
L thodes d’optimisation. Elle est représentée par un algorithme qui peut e
appliqué à de nombreux problèmes d’optimisation dans le management, l’ingé-
nierie, et le contrle.
Elle est basée sur le concept de coopération qui rend les abeilles plus efficaces
et ainsi arrivées à leurs buts rapidement. Cette méthode a la capacité, gr à
l’échange d’informations et le processus de recrutement d’intensifier la recherche
dans les régions prometteuses de l’espace de solutions.
Bibliographie
[1] H. YAHYA, Book "The Miracle of the honeybee", G. M. D. Cd., Ed. Okmeydani-
Istanbul-Turkey, March 2007.
[4] Dervis Karaboga, Bahriye Basturk, A powerful and efficient algorithm for nu-
merical function optimization : artificial bee colony (ABC) algorithm. Springer
Science+Business Media B.V. 2007.
64
Table des figures
2.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.7 Schématique d’un graphe hiérarchique . . . . . . . . . . . . . . . . 33
2.8 Un dendrogramme, ou arbre hiérarchique ,Horizontal les coupes
correspondent aux partitions du graphe dans les communautés. 33
2.9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.14 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.15 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
65
TABLE DES FIGURES
Page | 66
Liste des Algorithmes
67