1 These Esseiva
1 These Esseiva
1 These Esseiva
FACULTE DE DROIT
ECOLE DES SCIENCES CRIMINELLES
INSTITUT DE POLICE SCIENTIFIQUE
THESE DE DOCTORAT
Présentée à
Par
PIERRE ESSEIVA
Licencié en sciences forensique
de l’Université de Lausanne
2004
Remerciements
Ce travail de thèse a été réalisé à l’Institut de Police Scientifique de l’Université de Lausanne sous la
direction de Monsieur le Professeur Pierre MARGOT.
Le jury était composé de Monsieur le Professeur Pierre MARGOT, directeur de l’Institut de Police
Scientifique, directeur de thèse, de Monsieur le Professeur Franco TARONI, Professeur à l’Institut de
Police Scientifique, président, de Monsieur le Docteur Olivier GUENIAT, chef de la police de sûreté
du canton de Neuchâtel, de Monsieur le Docteur Fabrice BESACIER, chef de la section analyse de
stupéfiants du laboratoire de police scientifique de Lyon, de Monsieur le Docteur Henk HUIZER,
XTC project leader Netherlands Forensic Institute et de Monsieur le Docteur Jean-Luc VEZ, directeur
de l’Office fédéral de la police.
Je tiens à exprimer ma vive gratitude aux personnes qui m’ont fait bénéficier de leurs connaissances et
qui m’ont soutenu lors de la réalisation de cette recherche.
Je tiens également à remercier tout particulièrement :
Mon amie Sonia pour ses encouragements et sa compréhension.
Le Professeur Pierre MARGOT dont les conseils judicieux m’ont permis d’orienter les voies de
recherches à suivre.
Monsieur le Docteur Olivier GUENIAT qui m’a transmis sa passion pour l’analyse des produits
stupéfiants.
Monsieur le Professeur Olivier RIBAUX pour ces nombreux conseils relatifs à l’analyse criminelle.
Monsieur Frederic ANGLADA et Monsieur le Docteur Olivier DELEMONT pour les nombreuses
discussions et leurs idées éclairées.
Toutes les personnes du groupe stupéfiants ou ayant transité par ce dernier.
Françoise et Hans AEBERSOLD, pour leur amitié et la relecture méticuleuse de mon manuscrit.
Les brigades stupéfiants des cantons du Jura, Vaud, Neuchâtel, Genève et Tessin pour leur
disponibilité et pour avoir cru en l’utilité des liens chimiques.
Tous mes collègues, amis, anciens étudiants et étudiants de l’Institut de Police Scientifique qui m’ont
suivi et soutenu lors de cette aventure.
TABLES DES MATIÈRES 1
1. INTRODUCTION
INTRODUCTION 5
1.1. Introduction
La production, la consommation et le trafic de substances illicites, héroïne et cocaïne,
constituent un sérieux problème moral, économique et de santé publique auquel se heurtent les
sociétés. L’essentiel des réactions a porté sur l’étude des causes sociales, psychologiques ou
psychiatriques qui amènent un individu à la toxicomanie. L’action répressive s’oriente quant à elle
systématiquement vers les personnes, leurs provenances et la surveillance de leurs activités. Si de
nombreuses saisies sont effectuées, son effet sur l’ampleur du trafic reste modeste en regard des
moyens investis (écoutes téléphoniques, observations, conditions difficiles avec recours systématique
à des traducteurs, etc.). De plus, l’image du marché reste très partielle car les personnes arrêtées
appartiennent souvent à un maillon plus ou moins fermé de la chaîne.
Plus spécifiquement les données relatives aux saisies de stupéfiants ne sont pas exploitées. Le
traitement systématique et coordonné de ces informations vise à comprendre en temps réel les
mécanismes d’approvisionnement et de distribution de l’héroïne et de la cocaïne. Les liens entre des
saisies internes et l’état dans lequel ces stupéfiants entrent dans le pays, coupées, préparées,
conditionnées, devraient apporter une connaissance importante de l’organisation des réseaux mafieux
en amont des dealers / consommateurs locaux.
Une meilleure compréhension de ces phénomènes au travers de l’analyse de ces données passe
par une image ou une définition des voies d’introduction utilisées par les trafiquants en fonction du
lieu et du temps. La gestion globale et coordonnée de ces informations conjointement aux
renseignements traditionnels vise à optimaliser l’engagement des ressources policières et douanières
appropriées à l’échelle du pays.
Dans un premier temps, le problème de l’identité des saisies c’est-à-dire aux fondements de
l’établissement des liens chimiques entre échantillons est étudié. Il s’agit de mieux comprendre les
fonctions utilisées pour comparer les échantillons entre eux ainsi que la mise en place de techniques
statistiques (analyse en composante principale, analyse canonique) trouvant des applications directes
INTRODUCTION 6
dans le travail de routine. Dans un second temps, l’utilisation d’outils permettant une gestion et une
visualisation des liens chimiques mis en évidence est évaluée.
La thèse de Guéniat a permis la validation de techniques analytiques permettant d’extraire une
signature chimique ou un profil de la saisie. La notion de lien chimique et son interprétation
(compréhension de l’organisation du trafic illicite de stupéfiants) ont été abordées. Notre démarche
vise maintenant à cerner quelques rouages de l’organisation du trafic de stupéfiants et de proposer une
architecture cohérente et efficace de la gestion des analyses des produits stupéfiants. Le but poursuivi
par ce travail est de fournir une information opérationnelle utile aux forces de police actives dans la
lutte contre le trafic de stupéfiant.
7
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 8
2.1. La Plante
2.1.1. Le cocaïer
Le cocaïer est un arbuste cultivé, taillé à une hauteur variable selon les régions de production.
Les rameaux, de coloration rougeâtre portent des feuilles ovales, entières, courtement pétiolées. Les
fleurs, pentamères, sont blanc jaunâtre. Le fruit est une petite drupe rouge. La mastication entraîne
plus ou moins rapidement une anesthésie de la langue et des muqueuses. Dans le cas des Erythroxylum
cultivés pour la production de feuilles riches en cocaïne, on peut distinguer quatre variétés rattachées à
deux espèces, E. coca et E. novogranatense.
Figure 2: Zones de production de l'Erythroxylum coca. On voit aisément que la Colombie est le
principal pays producteur de feuilles de coca [Office des Nations Unies pour le contrôle
des drogues et la prévention du crime, 2002].
2.1.2. Le pavot
Abstraction faite des innombrables espèces de "pavots sauvages" et "pavots de jardin" que l'on
cultive dans presque tous les pays, comme fleurs d'ornement ou d'agrément, il existe une quarantaine
au moins de variétés différentes de pavots somnifères connues. Elles se distinguent par la couleur des
fleurs et la forme des capsules.
Les variétés de pavots simples, à petites têtes rondes, légèrement anguleuses, qui s'ouvrent à
maturité et qui se rapprochent des espèces sauvages, résistent davantage au froid et à la chaleur.
Craignant moins les mauvaises herbes, elles exigent moins de soins. Elles sont cultivées aux Indes, en
Afghanistan, en Iran, en ex-Union-Soviétique, dans certaines régions de l'Anatolie occidentale et, très
peu, dans les Balkans. Leurs productions ne sont pas très abondantes.
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 11
Figure 4: Zone de production du pavot [Office des Nations Unies pour le contrôle des drogues et la
prévention du crime, 2002].
La physionomie de la production de pavot a grandement changé entre 2000 et 2001. En effet,
suite à l’interdiction de culture du pavot édictée en 2000 par le mollah Omar chef du régime des
Talibans, la production afghane a diminué drastiquement, mais augmente à nouveau suite à la chute du
régime.
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 12
Dans la phase finale un excès de base (hydroxyde de calcium ou hydroxyde de sodium) est
ajouté à l’« agua rica » qui neutralise l’acide sulfurique et convertit la cocaïne sous forme de sel en
cocaïne base qui précipite dans la solution aqueuse sous la forme d’une gomme jaunâtre. La substance
solide ainsi récupérée est la pâte de coca. Cette dernière est filtrée puis séchée.
La quantité de cocaïne présente dans la pâte de coca varie de 30 à 80%. Cette pâte est
également constituée d’autres alcaloïdes et de substances inorganiques.
Bazuco
Une variante de cette première méthode consiste à extraire le bazuco. Il est obtenu en
mélangeant un diluant insoluble (farine) à la solution d’acide sulfurique diluée avant l’extraction par le
solvant organique. La base ajoutée induit une première précipitation qui est filtrée. Le filtrat ainsi
obtenu est séché, il s’agit du bazuco. La farine est utilisée comme indicateur visuel pour différencier
les deux phases. En se séparant de cette phase riche en cinnamoylcocaïne, on diminuera les quantités
d’agent d’oxydation nécessaires pour purifier la cocaïne et la poudre obtenue sera plus pure et plus
blanche.
calcium ou carbonate est alors ajouté au « jus » d’acide sulfurique. Cette opération transforme la
cocaïne sulfate en cocaïne base qui va précipiter. La pâte est alors extraite avec du kérosène. De
l’acide sulfurique est additionné à ce dernier faisant précipiter la cocaïne. La solution obtenue est
l’ « agua rica » définie plus haut. Les Pozo contenant les feuilles de coca subissent plusieurs fois la
même opération avec les mêmes feuilles. Le même kérosène est utilisé plusieurs fois et s’enrichit en
cocaïne. L’ « agua rica » est alors traitée de manière similaire que lors de la technique d’extraction au
solvant. Elle est donc rendue basique par addition d’une base inorganique pour obtenir la précipitation
de la pâte de coca. Cette technique a l’avantage d’utiliser peu de solvant organique. Diverses variantes
des techniques présentées ci-dessus existent.
Une variante également très utilisée consiste à effectuer une transformation dite « de la feuille-
à la base ». En utilisant cette technique, on n'extrait jamais la pâte de coca. La solution non-oxydée
(solution d’ « agua rica ») que l’on obtient lors de l’extraction au kérosène est ajustée à un pH plus
élevé avec un sel de carbonate ou bicarbonate et est directement traitée au permanganate de potassium
[Casale et Meyers, 1996].
La cocaïne base est dissoute dans du diéthyléther. Elle est ensuite filtrée et débarrassée d’une
grande partie de ses impuretés. On ajoute de l’acétone et de l’acide chlorhydrique concentré. La
cocaïne se retrouve sous sa forme de sel hydrochloré. Les solvants utilisés peuvent varier en respectant
les conditions suivantes : il faut que la cocaïne base soit soluble dans le solvant A (diethylether), le
solvant B (acétone) doit être miscible dans l’acide chlorhydrique concentré et la cocaïne HCl doit être
insoluble dans le mélange A+B. La majeure partie des impuretés présentes dans la pâte de coca initiale
se retrouve dans le produit final.
La cocaïne est également "coupée", diluée ou adultérée avec d'autres substances. Les diluants
(substances pharmacologiquement non actives) rencontrés le plus souvent sont des sucres tels que le
lactose, le glucose ou le mannitol. Les adultérants (substances pharmacologiquement actives) les plus
utilisés sont l’acide acétylsalycilique, l’acide citrique et la caféine.
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 14
La cocaïne est principalement présente sous sa forme hydrochlorée dans le marché illicite. Sa
concentration rencontrée dans les divers prélèvements peut varier dans un intervalle compris entre 15
et 100%.
80
100
Nombre d'échantillons
Nombre d'échantillons
60
40
50
20
0 0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100
[% en HCL] [% en HCL]
120
100
Nombre d'échantillons
80
60
40
20
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100
[% en HCL]
Figure 5: Pureté des échantillons de cocaïne HCl (calculs effectués sur environ 1000 échantillons
analysés entre 2000-2002 à l’IPS).
bicarbonate de sodium que l’on porte à ébullition. La cocaïne base précipite dans la solution
bouillante. Cette préparation ne nécessite pas de solvants inflammables. La base est éventuellement
mélangée à du tabac, à du chanvre ou à d’autres herbes. Les formes fumées produisent très rapidement
des effets intenses (absorption pulmonaire rapide, concentration plasmatique très élevée) mais de
courte durée ; la dépression profonde qui suit pousse à la réutilisation, la dépendance s’installe très
rapidement.
L’ecgonine methyl ester (EME) provient de deux sources : la première résulte de l’hydrolyse
de la cocaïne et la seconde de sa présence dans les feuilles de l’Erythroxylum coca. L’EME est co-
extraite avec la cocaïne à cause de ses propriétés basiques. Néanmoins, elle ne supporte pas le
permanganate de potassium et est facilement saponifiée comme base libre en ecgonine.
L’ecgonine est présente dans les feuilles de l’Erythroxylum coca. C’est un acide carboxilique
hautement soluble dans l’eau. Il est peu probable que l’ecgonine survive à la transformation en sel à
cause de sa forte solubilité dans les solutions aqueuses et vu sa réactivité envers les procédures
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 16
oxydatives. L’ecgonine peut résulter de l’hydrolyse acide de la cocaïne ou, en très faible quantité, de
l’oxydation de la cynnamoylecgonine methyl ester et de l’hydrolyse de la EME.
La tropacocaïne se retrouve dans les feuilles de coca. Elle n’est pas un produit de dégradation
d’un des alcaloïdes de la cocaïne.
La cis et la trans cinnamoylecgonine methyl ester se retrouve dans les feuilles du cocaïer
[Casale et Moore, 1994].
La benzoylecgonine est également présente dans les feuilles. Néanmoins, il s’agit plutôt d’un
produit d’hydrolyse de la cocaïne. Elle n’est pas co-extraite lors de la préparation de la cocaïne du fait
de sa haute solubilité dans les bases faibles et de sa faible solubilité dans le diethyl éther.
La n-formyl cocaïne est une molécule neutre produite par l’oxydation au permanganate de
potassium de la cocaïne [Brewer et Allen, 1991].
La norcocaïne est une molécule basique produite par l’oxydation au permanganate de
potassium [Kumar et Kiser, 1995].
D’autres substances sont également présentes dans les feuilles en quantité minimes, il s’agit
des truxilinnes, de l’hygrine, la cuscohygrine, les hydroxycocaïne et les trimetoxy substitués
(3,4,5-trimetoxycocaïne ; 3,4,5-trimetoxy-cis-cinnamoylcocaïne ; 3,4,5-trimetoxytropacacaïne)
[Moore et Casale, 1994]. Certaines d’entres elles comme les hydroxycocaïne, les trimetoxy substitués
et les truxillines peuvent également être formées lors de processus dégradation.
Par opium préparé ou CHANDOO, on entend le produit de l'opium brut, obtenu par une série
d'opérations en particulier, la dissolution et l'ébullition. L’opium est donc dissout dans une solution
aqueuse bouillante qui solubilise la majeure partie des alcaloïdes de l’opium. Il suffit par la suite de
filtrer la solution pour la rendre propre à la consommation.
La teneur en morphine du CHANDOO est généralement faible. Elle varie entre 5 et 9 %
suivant la qualité et la provenance de l'opium brut, utilisé pour sa fabrication.
Dans le premier cas, il s'agit de ceux qui mangent, mastiquent, absorbent ou avalent l'opium.
L'opium se prend par petites doses 5 à 10 centigrammes par jour, à heures fixes, ou lorsque le besoin
se fait sentir.
Les mangeurs d'opium consomment le CHANDOO, aussi bien que l'opium brut. Mais, d'une
façon générale, l'opium préparé est le moins souvent utilisé du fait de sa confection demandant un
travail long et délicat. Cette pratique est la plus répandue en Inde, en Irak et en Afghanistan.
L'autre façon de consommer l'opium consiste à le fumer. Pour ce faire, les fumeurs utilisent
une pipe. Au moyen, d'une longue aiguille d'acier, de 15 à 20 centimètres, le fumeur puise, dans son
tube, ou dans sa boîte à opium, la valeur de 10 à 20 centigrammes de CHANDOO qu'il arrondit en
boule, et qu'il approche de la flamme d'une petite lampe à mèche, d'un type spécial, dénommée
"Keden". Quand la pâte est bien chauffée, qu'elle se ramollit, et qu'elle commence à s'élever en une
bulle, de couleur ambrée, le fumeur l'applique à l'orifice du fourneau et aspire, par intervalles
réguliers, les bouffées de fumée qui se dégagent de l'opium embrasé. Une petite boule d'opium est
fumée, en moins de 20 à 30 aspirations, c'est-à-dire en moins d'une minute et demie. Dès que la
première boule est consommée, le fumeur en prend une seconde, puis une troisième et, ainsi de suite,
jusqu'à ce qu'il ait épuisé la dose qu'il s'est assignée. On considère qu'un fumeur moyen fume, en
général, une dizaine de petites boules, soit 1 à 2 grammes d'opium, dans la même séance.
2.3.3. La morphine
L’opium purifié est à nouveau dissout dans de l’eau chaude. La solution est alcalinisée en
ajoutant de l’hydroxyde de sodium par exemple. La morphine base insoluble dans l’eau froide est
transformée en son sel, le morphinate de calcium parfaitement soluble. La plupart des autres alcaloïdes
sont insolubles dans cette solution. Une filtration permet d’éliminer ces produits.
Le filtrat est récupéré et légèrement chauffé. On ajoute alors du chlorure d’ammonium pour
atteindre un pH compris entre 8 et 9. On laisse refroidir la solution et la morphine base (ainsi que la
codéine, la noscapine et la papavérine) précipite. On filtre le tout et la morphine base se trouve sous sa
forme d’une poudre beige-brune [Huizer, 1994].
Elle est consommée essentiellement par voie intraveineuse. En effet, au vu des diverses
applications de la morphine dans le domaine médical, elle se présente le plus fréquemment sous forme
liquide. De nos jours, la morphine est la drogue de la famille des opiacés la moins utilisée illicitement
sur notre territoire.
2.3.4. L’héroïne
La transformation de la morphine en diacétylmorphine (héroïne) nécessite l’utilisation d’un
produit d’acétylation. L’anhydride acétique en est un de choix. Une solution de cette substance est
ajoutée à la morphine (sous forme de base, de sel hydrochloré ou sulfaté). La solution est chauffée à
85°C pendant 5 heures. Du charbon actif est ajouté pour adsorber les impuretés solides. Le tout est
filtré afin d’obtenir une solution limpide. La dernière opération consiste à ajouter du carbonate de
sodium afin de faire précipiter l’héroïne base. Une filtration permet d’obtenir une poudre granuleuse
de couleur blanche.
La transformation de l’héroïne base en héroïne HCl nécessite les produits suivants : de l’alcool
éthylique, de l’éther et de l’acide chlorhydrique. L’héroïne base est dans un premier temps dissoute
dans une fraction d’alcool éthylique et d’acide chlorhydrique. On ajoute ensuite de l’acide
chlorhydrique jusqu’à ce que toute l’héroïne base soit transformée en héroïne HCl. A ce stade on
ajoute de l’alcool éthylique et de l’éther puis on laisse reposer la solution. Dès que les premiers
cristaux apparaissent, on rajoute de l’éther. Lorsque la précipitation est complète, il suffit de récupérer
le précipité par filtration et de le sécher. Le filtrat à l’aspect d’une poudre fine blanche [Huizer, 1994].
Cette poudre fine blanche (héroïne hydrochlorée) était fabriquée dans les années 60 à 80 par
les chimistes de la French Connection et de la Pizza Connexion. De nos jours, l’héroïne provient
majoritairement d’Asie du sud-ouest, d’Afghanistan ou du Pakistan. L’extraction de la morphine
s’effectue principalement dans des bergeries d’alpage où les phases de purification sont souvent
omises. Par la suite, la morphine est envoyée dans des laboratoires possédant un équipement très
modeste (Turquie, Liban, Grèce, Macédoine ou dans les pays producteurs) qui la transformeront en
héroïne base [Koutouzis et Perez, 1996]. Le schéma de fabrication est le suivant : l’héroïne base est
précipitée dans la solution aqueuse de carbonate de calcium ou de sodium et redissoute dans une
solution aqueuse acide à laquelle une base est ajoutée ainsi qu’un solvant immiscible dans lequel
l’héroïne base est soluble. Ensuite le solvant est évaporé et l’héroïne base est récupérée.
Plus encore que d'autres stupéfiants, l'héroïne est "coupée", diluée ou adultérée avec d'autres
substances. Les adultérants les plus utilisés dans ce but sont de loin la caféine, le paracétamol et la
procaïne [Zingg et al., 1998]. Les diluants rencontrés le plus souvent sont des sucres tel que le lactose
ou le mannitol.
L’héroïne saisie en Suisse est principalement sous sa forme de base. Les concentrations
d'héroïne rencontrées dans les échantillons peuvent varier de 4 à 70%. Une légère diminution de la
pureté de la diacétylmorphine en 2002 (voir Figure 6) est observée dans nos résultats d’analyses.
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 19
500 500
400 400
Nombre d'échantillons
Nombre d'échantillons
300 300
200 200
100 100
0 0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100
[% en base]
[% en base]
150
Nombre d'échantillons
100
50
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100
[% en base]
Figure 6: Pureté des échantillons d’héroïne analysés à l’IPS entre 2000 et 2002. Une diminution de
la qualité du produit vendu apparaît en observant les divers graphiques.
La pratique la plus répandue est la voie intraveineuse. Elle permet d'obtenir rapidement "le
flash" recherché. Cette manière de faire nécessite peu de matériel. La poudre achetée est versée dans
une cuillère dont on a tordu le manche de façon à ne pas se brûler lorsqu'on la mettra sur une source de
chaleur, dont la plus usuelle est une bougie. Mais l'héroïne sous forme de base est peu soluble dans
l'eau à pH 7. Pour la solubiliser, il faut acidifier le mélange. La plupart des toxicomanes le font avec
du jus de citron ou de l'acide ascorbique. Une fois l'héroïne dissoute dans l'eau acidifiée, et refroidie, le
mélange est prêt à être injecté.
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 20
Pour la méthode fumée, le toxicomane dépose l'héroïne sur du papier d'aluminium et place le
tout au-dessus d'une source de chaleur, par exemple une bougie ou un briquet. Après quelques instants,
il suffit d'inhaler la sublimation ainsi obtenue. Dans le jargon, cette façon de faire est appelée "chasse
au dragon".
L'héroïne peut aussi être fumée en cigarette. Pour cela, elle est mélangée avec du tabac ou de
la marijuana et est consommée comme un joint. Toutefois, ces deux procédés sont principalement
utilisés par des consommateurs débutants, car la montée des effets est moins violente que par injection
intraveineuse.
Le troisième mode de consommation de l'héroïne est le "sniff". Tout comme la cocaïne, elle
est répandue sur une surface lisse, par exemple un miroir, en lui donnant une forme de ligne. Puis à
l'aide d'une paille placée dans une narine, le stupéfiant est "sniffé". L’héroïne HCl se prête
particulièrement à ce genre de pratique.
Le Pavaver somniferum élabore également d’autres types structuraux comme des aporphines
(isoboldine, corytubérine) ou des composé à noyau protopinique comme la protopine et la cryptopine.
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 22
3.1. Introduction
Le marché mondial du trafic illicite de stupéfiant est détenu, selon les régions du monde et les
spécificités des produits, par des organisations de type mafieux et terroriste qui par leur structure
organisée leur permet d’assurer la production, la transformation et la diffusion de ces substances à
l’échelle mondiale ainsi que le recyclage des bénéfices engendrés par une telle activité. Le trafic de
stupéfiants n’est qu’une activité parmi d’autres du crime organisé dont l’activité diversifiée,
multinationale, contribue souvent au fonctionnement de certaines économies nationales et participe à
la vie politique et sociale. Il est certain que ces entités doivent disposer d’infrastructures efficaces et
flexibles capables de tromper les organes de contrôles tout en maximisant leurs revenus. Le marché
des stupéfiants est caractérisé par son dynamisme, sa souplesse et sa capacité à s’adapter à des
contraintes changeantes. Il se dégage de cette structure de marché, un caractère hautement
imprévisible rendant souvent illusoire l’efficacité des actions répressives.
L’homme d’affaires grec Elie Eliopoulos est une autre figure importante dans la genèse du
grand trafic de produits stupéfiants. Ce dernier a également su s’attacher les services de personnes au-
dessus de tout soupçon, lui permettant de mener à bien son trafic d’héroïne. Lorsqu’il décida de partir
à la conquête du marché américain, il n’hésita pas à s’allier à des gangsters déjà en place dans le pays
cible.
Ces organisations au pouvoir très centralisé et concentré sur une personne, employaient déjà
des méthodes d’avant-garde : mobilité, délocalisation, emploi de courtiers et d’hommes de paille,
investissements dans des pays possédant les infrastructures et les législations les plus favorables,
corruption, couverture aux visages multiples (politique, scientifique,...). Les sites de distributions
(compartimentalisation) sont diversifiés, leur structure est parcellisée en entités autonomes dont la
position au sein de l’organisation est évolutive et provisoire. Ces méthodes ne sont pas sans rappeler
celles utilisées de nos jours par les « nouvelles mafias ». Il faut également noter les implications
étatiques dans la distribution des stupéfiants à des fins purement politiques et dont les rouages
bénéficient de protection et d’opacité que l’investigation ne peut que difficilement percer.
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 24
Le cartel de Cali a grandement aidé à éliminer son concurrent de Medellin. C’est la raison
pour laquelle il a été « ignoré » pendant un certain temps par le DEA (Drug Enforcement
Administration). L’arrestation de la plupart des chefs du Cartel de Cali en 1995 (principalement les
frères Orejueta) a eu pour effet de faire éclater les structures du trafic de cocaïne. Cet éclatement a
donné naissance à une multitude d’opérateurs plus indépendants, utilisant les structures mises en place
par les cartels de Cali et de Medellin.
Actuellement, le trafic mondial de cocaïne est dominé largement par les trafiquants
colombiens travaillant pour le groupe armé FARC (forces armées révolutionnaires marxistes de
Colombie), d’aspiration communiste qui veut renverser le gouvernement en place. Grâce aux revenus
générés par le trafic de cocaïne, cette organisation est financièrement indépendante et échange
allègrement cet argent contre des armes ou directement la cocaïne contre ces dernières. Il en va de
même au Pérou (sentier lumineux) et au Nicaragua où la cocaïne et les revenus en découlant
constituent le nerf de la guerre de ces factions révolutionnaires.
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 25
Légende
Route de la cocaïne voie
aérienne, largages
Route de la cocaïne
par vedettes ou cargos
Figure 7: Schéma de l’organisation du trafic de cocaïne par les trafiquants colombiens (tiré de
[Labrousse et Koutousis, 1996].
La figure ci-dessus représente le transit de la cocaïne de la Colombie aux Etats-Unis. On
remarque aisément à l’aide de cette carte, la diversité avec laquelle la cocaïne est amenée en Amérique
du Nord. Les trafics routiers, aériens et maritimes sont largement utilisés. Pour ces grandes
organisations, possédant des crédits financiers importants, tous les moyens, aussi onéreux soient-ils,
sont utilisés pour amener la marchandise à bon port.
On remarque que le Mexique constitue un relais important pour l’expédition de la cocaïne
destinée aux Etats-Unis. Une autre voie clé est la route empruntant la région des Caraïbes ou la
Jamaïque et Haïti et dans une moindre mesure Puerto Rico, les Bahamas et la République Dominicaine
jouent un rôle important [DEA Resources 1998-2003]. Des vedettes rapides sont souvent utilisées pour
amener les cargaisons à destination. Les bateaux cargos et les containers sont également choisis pour
faire transiter de grandes quantités de produits stupéfiants.
La cocaïne destinée à l’Europe transite par deux axes principaux, la péninsule ibérique avec
les côtes de Galice et du Portugal ainsi que les îles Canaries et la Hollande avec les ports
d’Amsterdam, Rotterdam et Anvers. Les ports et les Aéroports d’Afrique de l’Ouest constituent
également des relais d’envois provenant d’Amérique du Sud. De là, la cocaïne transite par le détroit de
Gibraltar à destination de l’Italie. Depuis le nord du Maroc, la cocaïne utilise la voie du haschisch et
entre directement en Espagne par la côte. Dans cette zone la contrebande entre l’Afrique et le
continent européen est une véritable tradition.
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 26
Légende
Flux du trafic de
cocaïne
Laboratoires
de cocaïne
Culture de coca
d’héroïne. Il n’est donc pas étonnant que la production et le trafic de cette substance n’aient cessé
d’augmenter durant cette période.
4565
4000
3512
Production d'opium (en tonnes)
3276
2827
3000
2650
2371
2363
2248
2152
2123
2000 1523
1265
1132
876
1000
534
521
445
350
312
212
185
180
0
1982
1983
1984
1990
1991
1992
1993
1998
1999
2000
2001
1980
1981
1985
1986
1987
1988
1989
1994
1995
1996
1997
Année
Figure 9: Production d’opium en Afghanistan [Office des Nations Unies pour le contrôle des
drogues et la prévention du crime, 2002].
Dès 1996, année où les Taliban prirent le contrôle de presque tout le pays et 1999, la
production doubla. L’Afghanistan des Taliban était l’exemple d’un état fondé sur la production illicite
d’opium. A travers ce gain, il ont été à même de maintenir leur régime en place et de soutenir des
groupes terroristes comme Al Qaeda d’Osama bin Laden. En juillet 2000, le dirigeant suprême des
Taliban interdit totalement, par un décret, la culture du pavot à opium essayant par ce geste de s’attirer
la sympathie de dirigeants internationaux. Cette interdiction fut respectée dans la plupart des zones
sous domination des Taliban et les récoltes enregistrèrent un recul de près de 95% passant de 3276
tonnes en 2000 à 185 tonnes en 2001. Elle était ainsi revenue aux niveaux enregistrés 20 ans
auparavant. Cette chute aurait dû se répercuter sur le marché mondial puisqu’une diminution de 3100
tonnes équivaut à diminuer de deux tiers la production mondiale sans que cette dernière soit
compensée par un accroissement de la production dans une autre région du monde (voir Figure 4).
Cette répercussion s’est concrétisée en 2001 par une baisse de plus de moitié des saisies d’opium dans
les pays ayant des frontières communes avec l’Afghanistan (La République islamique d’Iran, le
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 28
Turkménistan, l’Ouzbékistan). Si les saisies d’opium ont diminué, les saisies d’héroïne sont par contre
demeurées relativement stables. Cela semble donc indiquer que des stocks avaient été constitués. Cette
hypothèse est encore accentuée du fait que de manière générale, les prix de l’héroïne n’ont pas pris
l’ascenseur, phénomène souvent associé à une pénurie d’une marchandise spécifique sur le marché.
Malgré l’ouverture de cette nouvelle voie, la Turquie demeure la principale étape du transit
d’héroïne vers l’Europe occidentale. De là, le transport direct vers l’Ouest, trop voyant devient rare, de
multiples relais (et autant de lieux de stockage) en Europe centrale et dans les Balkans ont été mis en
place. La voie des Balkans, contrôlée par les mafias albanaises qui depuis les guerres des années 90
ont accru leur rôle dans cette région, a été le témoin de violents affrontements entre turcs et albanais
avec comme finalité l’éviction des trafiquants turcs au profit des truands albanais, devenus des relais
obligatoires pour la route du Sud (via la Macédoine et l’Italie) et le trafic destiné à la Suisse. L’Inde et
le Pakistan (via les aéroports internationaux et le port de Karachi) constituent également une voie
privilégiée vers les marchés internationaux. La figure ci-dessous illustre cette dynamique du trafic
d’opiacés à partir de l’Afghanistan.
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 29
Légende
Route de l’héroïne
Laboratoires d’héroïne
Culture de pavot
Figure 10: Principales voies de distribution de l’héroïne depuis l’Afghanistan (informations tirées de
DEA Resources 1998-2003).
Deux autres pays jouent également un rôle grandissant dans le trafic d’héroïne et de cocaïne, il
s’agit de la Colombie et du Mexique qui alimentent le marché américain. La Colombie,
vraisemblablement par souci de diversification s’est lancée dans la culture du pavot depuis les années
90. Elle est capable actuellement de produire une centaine de tonnes d’opium par année. Les voies de
contrebande sont les mêmes que celles utilisées pour la cocaïne. Le Mexique quant à lui produit sa
fameuse « black tar » (héroïne grossièrement raffinée mais très pure et peu onéreuse). Sa production
annuelle est estimée à environ 2% de la production mondiale. L’introduction de cette héroïne sur le
marché américain se ferait prioritairement par voies routières via leur frontière commune.
Légende
Route du Triangle d’Or
Laboratoires d’héroïne
Culture de pavot
Figure 11: Principales voies de distribution de l’héroïne dans le monde (informations tirées de DEA
Resources 1998-2003).
de la vente en Suisse était tenu par les ressortissants albanophones. Le fort ralentissement des flux
migratoires de ces communautés balkaniques a diminué l’accessibilité de l’héroïne. Les héroïnomanes
se sont donc tournés vers la cocaïne dont ils ont fait un usage compulsif. Parallèlement, un nouveau
flux migratoire était apparu en Suisse par l’émergence des Africains de l’Ouest notamment du Nigeria,
de la Sierra Leone, de Guinée, et du Bénin. Ces derniers se sont assez rapidement accaparés du marché
de la vente au détail de cocaïne, du fait que ces pays de l’Afrique de l’Ouest se trouvent sur une des
voies de transit choisie par les cartels colombiens pour acheminer la drogue en Europe. La cocaïne est
acheminée par voie navale, par cargos d’Amérique du Sud vers l’Afrique de l’Ouest, puis utilise le
flux migratoire vers l’Europe. Il était donc logique de retrouver ces personnes dans le commerce de la
vente au détail sur le territoire helvétique et ceci d’autant plus que les bénéfices engendrés par ce
genre de trafic sont très importants.
Le trafic de cocaïne pénètre en Suisse par différentes voies (voir Figure 12) [Guéniat et
Esseiva 2002] :
• Les données douanières concernant les saisies montrent que le fret représente une part
importante de l’importation de cocaïne en Suisse ; la plupart du temps, elle est cachée
dans des biens de consommation très variés (ananas, huile, habits, tissus,…).
Légende
Flux d’importation aérien de
cocaïne en Suisse Constance
Schaffhouse
Flux d’importation terrestre
Winterthur
de cocaïne en Suisse
Bâle
Zürich St-Gall
Flux de distribution de
cocaïne à l’intérieur de la
Suisse
Principaux lieux de
stockage de cocaïne Berne Lucerneee
Neuchâtel
Coire
Fribourg
Lausanne
Genève
Sion
Lugano
Chiasso
Les principaux lieux de stockage de cocaïne sont généralement supposés localisés dans les
villes de tailles importantes de Suisse (principalement Berne, Zürich, Bâle, Genève) regroupant une
forte diaspora originaire de l’Afrique de l’Ouest [Sources policières, communications personnelles].
Le début des années 90 fait apparaître une passation de pouvoir quant à la détention de la
vente sur rue. Le conflit de l’Ex-Yougoslavie confère au Serbes, Bosniaques, Croates, etc, le pouvoir
de la distribution de l’héroïne en Suisse. Les Turcs se retirent et se spécialisent dans la transformation
de la morphine en héroïne et dans la logistique du transit. De nouvelles voies d’acheminement
apparaissent alors au gré des flux migratoires [Labrousse et Koutousis, 1996].
Enfin, la complexité et la durée de la guerre du Kosovo placent les albanophones dans une
situation de domination de la vente d’héroïne en Suisse. Dans ce cas de figure, on retrouve
l’importance du flux migratoire qui détermine le monopole de ce marché illicite dont les bénéfices
servent à financer l’effort de guerre de ces populations. Cette mafia albanophone est basée dans les
principales villes de Suisse (Zurich, Berne et Bâle) où elle cache des stocks parfois importants
d’héroïne (stock pouvant atteindre des centaines de kilos). Le trafic routier est la technique de
contrebande la plus souvent utilisée pour l’acheminement d’héroïne en Suisse. Quelques dizaines de
kilos dans les voitures jusqu’à quelques centaines dans les camions entrent quotidiennement en Suisse
principalement par la douane de Chiasso et par les postes frontières avec l’Allemagne, dont le plus
important à Bâle [Sources policières, communications personnelles].
En ce qui concerne la diffusion de l’héroïne dans les différents cantons, cette organisation
criminelle est très structurée et très disciplinée du fait de son fonctionnement clanique. Elle utilise à
outrance la répartition cantonale des requérants d’asile pour tisser un réseau national couvrant les
besoins de consommation dans pratiquement tous les cantons suisses. Actuellement et depuis la fin du
conflit kosovar, le paysage du trafic d’héroïne a quelque peu changé puisqu’une pénurie de ce produit
s’est fait sentir. Une explication probable de ce phénomène peut être le ralentissement des flux
migratoires des communautés albanophones diminuant l’accessibilité à l’héroïne.
Une schématisation des voies d’entrées de ce stupéfiant en Suisse, de ses lieux de stockage et
de sa dynamique de distribution est illustrée par la figure suivante :
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 34
Légende
Berne
Lucerne
Neuchâtel
Coire
Fribourg
Lausanne
Genève
Sion
Lugano
Chiasso
3.7. Conclusion
Ce chapitre permet de mettre en évidence les relations étroites existant entre le trafic de
produits stupéfiants, et les zones d’instabilités politiques, les pouvoirs corrompus ou les guérillas
visant le pouvoir. Dans tous les exemples explicités ci-dessus, le marché illicite de la cocaïne ou de
l’héroïne est utilisé comme moyen de financement de ces organisations illégitimes. Souvent le
domaine d’action répressif est très limité puisque dans certains cas, les politiques, l’armée et même les
milieux financiers influents sont eux-mêmes parties prenantes de ce juteux marché. La mise en
évidence des diverses voies de distributions et des intervenants principaux sont des informations
directement reliées à un niveau d’analyse stratégique puisqu’elles donnent des renseignements sur
l’évolution des tendances du trafic de produits stupéfiants cibles à long terme, offrant la possibilité aux
décideurs d’orienter leur politique de lutte contre le crime en fonctions des connaissances qu’ils ont
acquises sur les différentes formes de criminalité et sur l’ampleur de ces dernières.
Dans le cadre de cette étude nous nous sommes focalisé à un niveau plus local, voire régional.
L’aspect opérationnel, à savoir fournir de l’information utile à l’enquête pour éclaircir des cas concrets
(isolés ou connexes) de manière immédiate, sera privilégié avec en toile de fond, la volonté de
développer un outil utile à la compréhension du trafic dans son organisation de distribution.
35
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 36
4.1. Introduction
Les différentes étapes du prototype de profilage mis au point dans cette étude se décomposent
en 4 phases distinctes:
PHASE 1 PHASE 2
Mise en évidence des composantes Algorithmes de comparaison
de profilage - Méthodes statistiques non supervisées
- Choix de la méthode (mesures de distances, analyse en
analytique composantes principales)
- Analyse canonique - Méthodes statistiques supervisées
(SIMCA, réseaux de neurones)
Hypothèse 1
- L’analyse des constituants Hypothèses 2
majeurs est suffisante pour - 2.1 La mesure de distance du cosinus
mettre en exergue un profil carré est une méthode de choix pour la
chimique des saisies d’héroïne comparaison 2 à 2 d’échantillons
et de cocaïne utilisable dans un d’héroïne et de cocaïne.
concept opérationnel. - 2.2 La mesure de distance du cosinus
carré minimise les risques de faux positifs
et négatifs.
- 2.3 Les méthodes statistiques non
supervisées permettent d’effectuer un
premier tri au sein de la base de données
regroupant les diverses saisies de produits
stupéfiants.
- 2.4 Les méthodes statistiques supervisées
permettent de confirmer les liens établis
au préalable.
PHASE 3
Figure 14: Schématisation des différentes phases constituant la méthode développée dans cette
recherche ainsi que les hypothèses de la présente recherche.
La première phase est consacrée à l'inventaire des méthodes analytiques permettant de générer
la signature chimique des saisies de cocaïne et d’héroïne. Cette signature chimique est en fait le profil
chimique qui est composé d’éléments en traces (souvent appelés impuretés) qui font parties
intégrantes de la matrice de l’héroïne et de la cocaïne. Ces éléments peuvent être des substances
présentes naturellement dans la plante (par exemple la noscapine pour l’héroïne, l’ecgonine pour la
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 38
cocaïne ou les éléments inorganique) et qui sont coextraites avec le stupéfiant (cocaïne et
diacétylmorphine). Ces substances comme la codéine qui se transforme en acétylcodéine par exemple
peuvent également subir des modifications structurelles lors des différentes étapes d’extraction, de
transformation et de purification du stupéfiant. Il peut également s’agir de solvants résiduels utilisés
lors des différentes étapes de fabrication présentées dans le chapitre 2. Le fondement de toute tentative
de comparaison entre saisies de produit stupéfiant consiste à utiliser ces éléments en traces et de
former un profil chimique. Ensuite il s’agit d’estimer le pouvoir discriminant de ce profil ainsi que
l’interprétation des résultats fournis.
Chaque type de variables nécessite la mise en place d’une procédure d’analyse spécifique. Un
bref descriptif de ces méthodes sera effectué en mettant en exergue celles qui présentent les meilleures
performances (pouvoir discriminant, sensibilité, reproductibilité, sélectivité, prix, temps d’analyse,…).
Dans cette phase, on parlera également de la possibilité d’effectuer un choix au sein de ces
méthodes et de la pertinence de les utiliser dans une séquence d’analyse.
Une grande variété de colonnes ont été testées par Demedts et ses collaborateurs [Demedts et
al., 1983] Chiarotti et ses collaborateurs [Chiarotti et al., 1983] ainsi que Kaa et Bent [Kaa et Bent,
1986]
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 39
De même, certains auteurs ont tenté d’utiliser divers types de produits de dérivatisation. Parmi
ces chercheurs, on peut citer Sobol et Sperling [Sobol et Sperling, 1975], Lim et Chow [Lim et Chow,
1978], Law et al. [Law et al., 1983] Gloger et Neumann [Gloger et Neumann, 1983] et Moore [Moore,
1990].
Différentes techniques chromatographiques ont également été testées comme par exemple un
chromatographe en phase gazeuse (CPG) couplé à un détecteur à capture d’électron (ECD). Ce type de
détecteur plus sensible qu’un détecteur à ionisation de flamme (FID) semble être une technique de
choix pour l’établissement d’une signature chimique d’éléments en trace. Moore et Allen ont
particulièrement favorisé ce type de technique [Moore et al., 1984], [Moore et al., 1986].
Johnston et King [Johnston et King, 1998], O’Neil [O’Neil et al., 1984], [O’Neil et Gough,
1985], [O’Neil et Pitts, 1992], Narayanaswami [Narayanaswami et al.,1979] et Perillo [Perillo et al.,
1994] se sont quant à eux intéressés à la détermination de la provenance des saisies d’héroïne en
étudiant divers paramètres comme les caractéristiques physiques de l’héroïne ou en essayant de créer
des paramètres permettant d’identifier la provenance géographique des saisies. La difficulté de ce
genre d’études réside principalement dans le fait que l’on n’est jamais certain de l’origine des saisies
que l’on utilise comme standard.
D’autres techniques ont également été investiguées, comme dans les travaux utilisant la HPLC
[Cashman et Thornton, 1972], [Baker et Gough, 1981] et les travaux de Besacier [Besacier et al.,
1997] où l’analyse isotopique du 13C a été utilisée comme critère d’origine des saisies et comme
moyen d’effectuer des liens chimiques. Néanmoins, ce type de technique est lourd du point de vue de
la préparation alors que des résultats en temps réels sont essentiels vu le caractère mouvant du trafic. Il
en va de même pour certaines techniques très pointues définies par Moore où le temps nécessaire au
conditionnement de l’échantillon est trop important pour effectuer des analyses en routine. C’est
pourquoi, comme nous le verrons par la suite, la préférence est donnée à des techniques simples du
point de vue de la préparation tout en maintenant un niveau d’information suffisant pour une
utilisation policière opérationnelle. La méthode mise au point par Guéniat [Guéniat, 2003] pour
l’analyse des constituants majeurs est une illustration des techniques que nous privilégierons dans
cette étude.
La méthode mise en place par Stead est simple et permet d’obtenir un profil des constituants
majeurs ainsi que la quantification de la diacétylmorphine. Cette méthode également utilisée par
Barnfield et ses collaborateurs [Barnfield et al., 1988] présente néanmoins certains désavantages. En
effet, il n’est pas possible de chromatographier un large spectre d’adultérants et de diluants (les sucres
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 40
ne peuvent pas être chromatographiés par cette technique) et les molécules sensibles à l’hydrolyse et à
la désacétylation dans l’injecteur se dégradent facilement.
La méthode de Gloger & Neumann inclut dans sa phase de préparation une dérivatisation qui
donne un avantage certain dans la chromatographie FID de composés délicats comme ceux comportant
des groupes hydroxyles, amines ou carboxyles. Finalement et en résumé, cette méthode offre la
possibilité, en une seule analyse, de pouvoir quantifier la diacétylmorphine, de pouvoir séparer les
constituants majeurs de l’héroïne et d’avoir la possibilité de chromatographier un large spectre
d’adultérants et de diluants.
Guéniat s’est inspiré de ces deux méthodes en optimalisant certains critères. Sa méthode
répond à tous les critères chromatographiques définis plus haut. En effet, elle permet de quantifier le
principe actif principal, de séparer de manière satisfaisante les constituants majeurs (méconine,
acétylcodéine, acéthylthébaol, 6-monoacétylmorphine, noscapine, papavérine) ainsi qu’un grand
nombre d’adultérants et de diluants. Elle offre également une bonne sensibilité et une bonne résolution
des pics ainsi qu’une stabilité de certains composés très réactifs (grâce à l’utilisation de la solution de
dérivatisation). Ainsi la méthode retenue par Guéniat est la suivante :
Appareil : GC Perkin Elmer Autosystem
Injecteur : 290°C
Détecteur : 320°C
8. Pour l’analyse quantitative, préparer 5 standards de 1mg, 2mg, 4mg, 6mg, 8mg et
établir la droite de régression.
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 41
Cette méthode permet de séparer plus d’une quarantaine de standards diluants et adultérants
compris. Elle constitue la méthode de routine établie à l’IPS. Le travail avec une méthode unique,
simple sur la durée permet des comparaisons multiples dans le temps et fournissant une quantité
importante d’information.
C’est donc cette technique qui est adoptée dans ce travail pour effectuer l’analyse et la
comparaison des saisies d’héroïne.
Figure 15: Exemple d’un Chromatogramme typique des constituants majeurs de l’héroïne.
1) Méconine, 2) Heineicosane (standard interne), 3) Acétylcodéine, 4) Acétylthébaol, 5) 6-
monoacétylmorphine, 6) Diacétylmorphine, 7) Papavérine, 8) Noscapine.
al., 1984] et par Neumann et Gloger [Neumann et Gloger, 1982]. Une variante de ces méthodes
analytiques a été choisie dans le cadre de ce travail [Esseiva et Guéniat, 1997].
Les composants constituants le profil chimique de cette méthode sont les suivantes :
N° PIC SUR FIGURE 16 NOM DE LA SUBSTANCE
1 Méconine
8 Tetramethylsilylthebaol
9 O4-Acetylthebaol
12 6-O-,N-Diacetylnorcodeine
13 Unknown
14 4-acetoxy-3,6-dimethoxy-5-[2-(N-methylacetamido)]Ethylphenanthrene
15 3-O,6-O,N-Triacetylnormorphine
18 N-Acetylnorlaudanosine
23 4-acetoxy-3,6-dimethoxy-8-[2-(N-methylacetamido)]Ethylphenanthrene
24 N-Acetylnornarcotine
25 (E)-N-Acetylanhydronornarceine
26 (1R,9R)-1-acetoxy-N-acetyl-1,9-dihydroanhydronornarceine
27 (Z)-N-Acetylanhydronornarceine
Tableau 1 : Composants mineurs prises en compte pour la comparaison.
Injecteur : 290°C
Détecteur : 320°C
Split : 50 :1
1. peser 20 mg d’héroïne.
3. Ajouter 2 ml de toluène.
La figure suivante illustre un chromatogramme obtenu par l’analyse des composants mineurs
Figure 16: Exemple d’un chromatogramme des composants mineurs. Le numéro correspond au nom
du composant répertoriés dans le Tableau 1.
Si 600V 251.611 nm
Mn 600V 257.610 nm
Mg 600V 279.553 nm
Cu 600V 324.753 nm
Ca 600V 394.366 nm
Al 600V 396.152 nm
Sr 600V 407.771 nm
Ba 600V 455.403 nm
Na 600V 589.592 nm
K 600V 766.490 nm
Composition élémentaire
200
180
160
Normalisation au Composé principal
140
120
100
80
60
40
20
8284.8 Na
Mg
Si
8284.7 Sr
Echantillons Mn
Zn Eléments
8283.14 Al
Ba
Cu
8283.10 K
Figure 17: Exemple d’un graphique représentant les profils inorganiques de 4 saisies.
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 45
Les éléments inorganiques proviennent d'ions absorbés sur le matériel organique [Guéniat,
2003] ce qui peut apporter des informations intéressantes sur l’origine d’une drogue ou sa méthode de
production (les minéraux seraient assimilés par la plante sur son lieu de pousse) . Néanmoins, il faut
être conscient que l’ajout de certains diluants ou adultérants (principalement ceux contenant eux-
mêmes des composés inorganiques) peut masquer le profil minéral d’une saisie.
Cette méthode est intéressante lorsqu’elle est utilisée de manière complémentaire aux
méthodes organiques pour confirmer ou infirmer une apparente identité [Esseiva et Guéniat, 1997].
Cartier et ses collaborateurs [Cartier et al., 1997], proposent d’utiliser le principe de « l’Head-
space » passif en préconisant une préconcentration des vapeurs sur une trappe de charbon actif
(DFLEX®). Le stupéfiant et le charbon actif sont introduits dans un flacon de 2ml, le charbon actif
étant isolé de la poudre dans un flacon conique. Le tout est chauffé pendant 60 minutes à 80°C. Le
charbon actif va donc prendre au piège les vapeurs résiduelles présentes dans le produit stupéfiant. Le
charbon actif est ensuite élué avec 50 microlitres de CS2 (dissulfure de carbone) dont 1 microlitres est
injecté dans la colonne.
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 46
Injecteur : 280°C
Détecteur : 280°C
Chaque échantillon de cocaïne et d’héroïne est préparé en pesant 300 mg (cocaïne), ou 250 mg
(héroïne) de poudre. Cette méthode permet de séparer une vingtaine de composés organiques volatils à
la base de nombreux solvants.
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 47
Casale, quant à lui, débuta ses recherches en publiant un article sur la différentiation de la
pseudoecgonine et de l’ecgonine par CPG-MS, IR et NMR [Casale, 1990] et par l’étude de
N-acétylnorcocaïne [Casale, 1991]. Casale et Waggoner [Casale et Waggoner, 1991] ont également
développé une méthode permettant d’analyser 13 constituants présents dans la cocaïne. Ces traces sont
étudiées à cause de leurs modes de formation et de leurs propriétés. Ces traces sont celles dites
majeures du fait de leur quantité pouvant être assez importante. Dans cet article, une approche
statistique (notamment une analyse en composantes principales) a également été tentée pour effectuer
la comparaison d’échantillons. Casale et Watterson [Casale et Watterson, 1993] étudieront les réseaux
de neurones également dans l’optique d’effectuer des comparaisons d’échantillons. Casale fut
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 48
également au même titre que Moore, un pionnier dans la découverte de nouveaux alcaloïdes de la
cocaïne [Casale et Moore, 1994], [Casale et Moore, 1996a], [Casale et Moore, 1996b], [Casale et al.,
1998].
La méthode de Casale et Waggoner fait, quant à elle, appel à une dérivatisation au BSA (N,O-
bi(triméthilsilyl)acétamide permettant en une seule analyse de chromatographier adultérants, diluants
et constituants majeurs.
La méthode mise au point par Guéniat reprend une partie des critères de chromatographie mis
en place par Casale et Waggoner. Elle permet en une seule analyse de quantifier la substance active, de
séparer les adultérants et les diluants ainsi que les constituants majeurs.
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 49
Figure 19: Exemple d’un chromatogramme représentant les composants majeurs de la cocaïne (les
numéros des pics correspondent aux numéros des composants répertoriés ci-dessous).
La numérotation des composants listés ci-dessous fait référence au numéro des pics de la
Figure 19. Ces traces sont celles choisies dans cette étude pour définir un profil chimique de la cocaïne
1) Acide benzoïque
4) Anhydroecgonine
6) Ecgonine
7) Tropacocaïne
8) Heineicosane (standard interne)
9) Cocaïne
10) Benzoylecgonine
11) Norcocaïne
12) Cis-cinnamoylecgonine méthyl ester
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 50
Les conditions analytiques de la méthode mise au point par Guéniat [Guéniat, 2003] et
utilisées dans ce travail sont les suivantes :
Appareil : GC Perkin Elmer Autosystem
Injecteur : 230°C
DétecteurC 320°C
7. Pour l’analyse quantitative, préparer 5 standards de 1mg, 2mg, 4mg, 6mg, 8mg et
établir la droite de régression.
51
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 52
Saisie de produit
Processus d’identification
stupéfiant
Méthode de comparaison
Test d’orientation
Microcristaux
TLC Solvants
Solvants ICP
GC-MS
Ces analyses ont été effectuées en choisissant des saisies distinctes et possédant un nombre
conséquent d’échantillons. Dans le cadre de cette étude, 97 échantillons ont ainsi été choisis. Ces
échantillons provenaient de 12 saisies ayant des profils différents donc considérées comme provenant
de lots différents. Chaque prélèvement (3 prélèvements par échantillons) analysé selon les 3 méthodes
décrites auparavant a été comparé à la base ainsi constituée. L’analyse des solvants a été mise de côté
du fait que cette dernière n’était pas utilisée en routine. La réciprocité des liens chimiques entre les
diverses techniques a ainsi pu être testée.
Saisie
Prélèv.
Analyse GC-FID des Analyse,
constituants majeurs comparaison,
classification Prélèv.
Prélèv.
Echantillon
Analyse,
Analyse GC-FID des comparaison, Comparaison des
constituants mineurs classification Prélèv. liens mis en
évidence avec les
différentes
méthodes
Prélèv.
Prélèv.
Analyse,
Echantillon
Analyse ICP-AES des
constituants comparaison,
inorganiques classification Prélèv.
Prélèv.
Prélèv.
Cette figure permet de clarifier la systématique de comparaison adoptée ainsi que de définir
les différents termes relatifs à une saisie. Ainsi, la saisie peut être définie comme le matériel séquestré
par la police (par exemple le matériel séquestré chez un revendeurs, à savoir 1 kilo d’héroïne
conditionné dans 10 minigrip® de 100 grammes). Cette saisie peut être constituée de plusieurs
échantillons (par exemple plusieurs pacsons, ou plusieurs minigrip®). Ensuite analytiquement de
chaque échantillon trois prélèvements sont effectués et analysés selon les méthodes analytiques
choisies. Cette méthode de travail implique l’hypothèse d’homogénéité de l’échantillon analysé sans
quoi il ne serait pas possible d’effectuer un appariement des prélèvements à leur échantillon originel.
Cette étude a montré le potentiel des méthodes analytiques choisies pour classer les
prélèvements dans leur échantillon d’origine et respectivement dans leur saisie (il faut être attentif car
une saisie peut être constituée d’échantillons ayant des profils chimiques différents).
Chaque lien établi à l’aide de la méthode des constituants majeurs a été comparé à
l’information fournie par les deux autres types d’analyses (analyses des constituants mineurs et
inorganiques).
La méthode des constituants majeures a ainsi été choisie comme méthode de référence pour
plusieurs raisons : par rapport à la préparation des échantillons, elle est la plus facile et la plus rapide.
D’un point de vue analytique, les constituants majeurs de l’héroïne permettent de quantifier le produit
actif (diacétylmorphine) dans l’échantillon. La méthode permet également de détecter les différents
adultérants et diluants présents dans l’échantillon. Le tableau ci-après résume ces informations. Le
signe + indique la technique la plus avantageuse.
Les résultats indiquent que dans plus de 95% des cas, un lien obtenu par l’analyse des
constituants majeurs est confirmé par les analyses successives des constituants mineurs et des
constituants inorganiques. Cette étude empirique montre une corrélation indéniable entre les types de
traces et qu’il suffit dans la grande majorité des cas d’effectuer la seule analyse des constituants
majeurs pour avoir une information intéressante, pratiquement un temps réel. En cas de série
identifiée, une vérification détaillée de l’ensemble peut être envisagée sur demande spécifique.
Ces constatations de lien effectuées à l'aide de la fonction cosinus [Keto, 1989] ont été
confirmées à l'aide d'une méthode de classification différente. Les techniques de clustering ou analyse
de groupement [Legendre P. et Legendre L., 1998]; [Klemenc, 2001], ont été choisies pour tester les
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 56
liens établis à l'aide de notre méthodologie de travail. Les résultats (voir figures ci-après) pour les
saisies jugées différentes (plusieurs échantillons ont été analysés) montrent que le classement effectué
est similaire et ceci pour les trois types de variables considérées (traces mineures, majeures et
inorganiques).
BE00023.C
BE00022.D
BE00022.C
BE00023.B
BE00023.A
BE00022.B
BE00022.A
BE00021.D
BE00021.C
BE00021.B
BE00021.A
95JU113.D
95JU113.C
95JU112.C
95JU113.B
95JU113.A
95JU110.C
95JU110.D
95JU112.B
95JU112.A
95JU110.B
95JU110.A
95JU111.D
95JU111.C
95JU111.B
95JU111.A
196FR22.D
196FR22.C
196FR22.B
196FR22.A
196FR12.A
196FR21.D
196FR21.A
196FR21.B
196FR12.D
196FR12.C
196FR21.C
196FR12.B
BE00023.A
BE00022.D
BE00022.C
BE00023.C
BE00022.B
BE00022.A
BE00023.B
95JU111.D
95JU111.C
95JU111.B
95JU111.A
95JU113.D
95JU113.C
95JU112.C
95JU112.B
95JU113.B
95JU113.A
95JU112.A
95JU110.C
95JU110.B
95JU110.A
95JU110.D
196FR22.D
196FR21.D
196FR22.C
196FR22.B
196FR22.A
196FR21.C
196FR21.B
196FR21.A
196FR12.D
196FR12.C
196FR12.B
196FR12.A
BE00021.D
BE00021.B
BE00021.C
BE00021.A
BE00023.C
BE00023.B
BE00023.A
BE00022.B
BE00022.A
BE00022.D
BE00022.C
BE00021.D
BE00021.C
BE00021.B
BE00021.A
95JU113.D
95JU113.C
95JU113.B
95JU113.A
95JU112.C
95JU112.B
95JU112.A
95JU110.D
95JU110.C
95JU110.B
95JU110.A
196FR22.D
196FR22.C
196FR22.B
196FR22.A
196FR12.D
196FR12.C
196FR12.B
196FR12.A
196FR21.D
196FR21.C
196FR21.B
196FR21.A
95JU111.D
95JU111.C
95JU111.B
95JU111.A
Ces trois figures confirment les observations effectuées lors de l’étude préliminaire: Les
constituants mineurs et inorganiques n’amènent pas d’informations supplémentaires ou de manière
limitée, leur analyse n’est donc pas pertinente dans une perspective de renseignement.
Matrice Matrice
réponse exploratoire
Y X
Figure 25: Schématisation de l’analyse canonique. Les deux matrices représentées sont celles
utilisées dans l’équation 1
L’analyse canonique peut être représentée par la matrice de dispersion résultant de la fusion
des données de X et Y . Elle se présente sous la forme suivante :
⎡ S y1 , y1 ... S y1 , y p S y1 , x1 ... S y1 , xm ⎤
⎢ . . . . ⎥⎥
⎢
⎢ . . . . ⎥
⎢ ⎥
⎢ . . . . ⎥
⎢S y , y ... S y p , y p S y p , x1 ... S y p , xm ⎥ ⎡S YY S YX ⎤ ⎡ S YY S YX ⎤
S Y+X =⎢ p 1 ⎥= = (Équation 1)
⎢ S x1 , y1 ... S x1 , y p S x1 , x1 ... S x1 , xm ⎥ ⎢⎣S XY S XX ⎥⎦ ⎢⎣S' YX S XX ⎥⎦
⎢ . . . . ⎥
⎢ ⎥
⎢ . . . . ⎥
⎢ . . . . ⎥
⎢ ⎥
⎢ S xm , y1 ... S xm , y p S xm , x1 ... S xm , xm ⎥⎦
⎣
⎡S S12 ⎤
S = ⎢ '11 (Équation 2)
⎣S 12 S 22 ⎥⎦
alors que S12 et sa transposée S'12 renseignent sur les interactions entre les deux groupes.
qui correspond à une des équations suivantes résultant de la multiplication de chaque membre
de l’équation précédente par S11 ou S 22
et
S12S'11S-112 − S 22 λk I = 0 (Équation 5)
( )
La corrélation canonique rk est la racine carrée des valeurs propres λk λ k = rk2 . Les mêmes
valeurs de λk sont trouvées en résolvant les deux équations. La suite consiste à calculer les vecteurs
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 62
propres des deux équations correspondants à chaque valeur propre. Les deux vecteurs propres donnent
les combinaisons linéaires des deux groupes de variables de départ correspondantes à chaque valeur
propre. Pour la valeur propre λk , les vecteurs propres u k et v k sont calculés en utilisant les équations
matricielles suivantes :
(S
12 )
S-1 22 S'12 − S11λk u k = 0 (Équation 6)
et
(S
12 )
S'11S-112 − S 22 λk v k = 0 (Équation 7)
Pour faciliter les calculs, les vecteurs propres sont normalisés en divisant chaque u k par le
(
scalaire résultant du calcul u 'S11 u k )1/ 2
(
et chaque v k par v 'S 22 v k )
1/ 2
ce qui fixe la variance des
variables canoniques à 1.
Les deux matrices des positions sur un axe d’ordination canonique sont :
[ ]
Tu = Y1 U = yi1u1k + ... + y ip u pk (Équation 8) pour une matrice Y1 avec p variables
et
Ces équations contiennent les coordonnées des différents objets dans les deux systèmes d’axes
principaux. Les vecteurs colonnes dans Tu ne sont pas corrélés entre eux, la même affirmation peut
variance de Y1 ou Y2 .
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 63
Afin de palier à ce problème, il est nécessaire de calculer les coefficients de redondances. Ces
derniers sont utilisés en analyse de corrélation canonique pour mesurer la proportion de variance de
Y1 ou Y2 qui est expliquée par une combinaison linéaire des variables Y1 ou Y2 .
U1 U2 U3 U4 U5 U6 Somme des
redondances
MEC -0.164 -0.255 0.02 -0.033 -0.36 -0.088
ACETYLCOD -0.922 0.297 0.212 -0.108 -0.042 -0.042
MAM 0.69 -0.016 0.121 -0.405 -0.582 0.082
THEB -0.008 0.01 0.019 -0.573 -0.804 0.158
PAP -0.272 0.701 -0.536 0.016 -0.381 -0.05
NOSC -0.189 0.758 -0.38 -0.469 -0.0002 -0.161
VARIANCE EXTRAITE 0.243 0.203 0.082 0.120 0.210 0.011
REDONDANCE 20.546 11.586 2.391 1.982 2.180 0.054 38.741
Rk 0.918 0.755 0.54 0.405 0.322 0.217
Rk2 0.842 0.570 0.2916 0.1640 0.103 0.047
2
Rk *100 84.272 57.002 29.16 16.4025 10.368 4.708
Tableau 3: Résultats de l’analyse canonique entre le groupe de variables des constituants majeures et
le groupe de variables des constituants mineurs générés lors de l’analyse de 66 saisies
d’héroïne.
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 64
U1 U2 U3 U4 U5 U6 Somme des
redondances
MEC -0.42 0.373 -0.065 -0.266 -0.75 0.216
ACETYLCOD -0.377 0.471 0.648 -0.028 -0.007 -0.464
6MAM 0.105 0.796 0.039 -0.365 0.469 0.01
THEB 0.329 0.679 -0.332 -0.281 0.138 -0.472
PAP 0.783 -0.004 -0.036 -0.52 -0.098 0.325
NOSC 0.919 0.061 -0.05 -0.225 -0.151 0.276
VARIANCE EXTRAITE 0.315 0.243 0.08 0.100 0.138 0.111
REDONDANCE 29.4 16.3 5.8 6.1 4.1 2.7 64.8
Rk 0.933 0.672 0.651 0.614 0.3 0.25
Rk2 87.04 45.158 42.380 37.6996 9 6.25
Tableau 4: Résultats de l’analyse canonique entre le groupe de variables des constituants majeurs et
le groupe de variables des constituants inorganiques générés lors de l’analyse de 100
saisies d’héroïne.
De ces tableaux, plusieurs conclusions peuvent être tirées : Les valeurs Rk représentent les
coefficients de corrélations canoniques, c'est-à-dire, le degré de corrélation linéaire entre uk et vk. Le
carré de Rk (Rk2), exprime la proportion de la variance de la kème Uk qui est expliquée par sa
conjuguée Vk et vice versa. Ainsi pour le Tableau 3, on peut donc dire qu’environ 84% de la variation
dans la combinaison linéaire des variables initiales des constituants majeures représentées par U1 est
attribuable à la combinaison linéaire des variables initiales des constituants mineurs représentés par
V1. Le même type de constatation peut être effectué avec U2, U3, U4, U5, U6.
L’analyse des redondances apporte des éléments importants dans l’interprétation de l’analyse
canonique. La mise en évidence de la redondance en analyse canonique permet d’exprimer le pouvoir
exploratoire des variables canoniques d’un domaine (par exemple les constituants majeures) par
rapport aux variables observées dans l’autre domaine (par exemple les constituants mineures).
La somme des redondances exprime la proportion de la variance totale d'une série de variables
caractérisant un ou des échantillons qui peut être prédite par les variables canoniques d'un autre groupe
de variables caractérisant le même échantillon ou série d'échantillons. On peut donc dire, dans le cas
du premier tableau, que 39% (38.741) de la variabilité observée par les constituants majeures est
prédictible par les variations observées par les constituants mineures dans l’échantillonnage analysé.
Le même genre de conclusions peut être fait pour le Tableau 4 à savoir, qu’environ 65% de la
variabilité observée par les constituants majeures est prédictible par les variations observées par les
constituants inorganiques.
inorganiques. L’analyse canonique relativise ces résultats puisqu’au mieux les constituants majeurs
prédisent le 65% de la variabilité observée par les constituants inorganiques.
Afin de trouver une explication à ces divergences, il est nécessaire de comprendre la manière
de mettre en évidence les liens que nous avons adoptée dans l’étude préliminaire.
La première étape consiste, à l’aide de la fonction du cosinus à classifier les candidats ayant
des profils chimiques similaires. Les seuils sont fixés de manière empirique en comparaison des
valeurs prises lorsque l’on compare par la fonction cosinus des échantillons issus de la même saisie.
Ensuite, la seconde étape consiste en une comparaison visuelle deux à deux, afin de confirmer le lien
préalablement mis en évidence. Cette dernière étape est subjective, principalement pour des techniques
analytiques extrayant plusieurs variables. En effet, on arrive à comprendre que, lors d’une
comparaison visuelle, notre œil opère d’une manière sélective en choisissant comme critère les
variables dominantes dans un chromatogramme ou dans un graphique comme critère de décision. Au
contraire, l’analyse canonique, elle, prend en compte la totalité des informations donc des variables à
disposition. Cette différence peut expliquer en partie les divergences observées. De plus, il ne faut pas
perdre de vue que les saisies de stupéfiants ne sont pas toujours très homogènes ; des variations sont
observables même lorsque l’on analyse deux fois le même prélèvement. Cette inhomogénéité
influence également à la baisse les valeurs des sommes de redondances.
En conclusion, on ne peut pas dire que l’analyse des constituants majeurs englobe toute
l’information véhiculée par l’analyse des constituants mineures et inorganiques, mais l’importance des
redondances est confirmée. Dans l’optique policière opérationnelle où la rapidité de l’information
transmise aux enquêteurs est primordiale, le fait de choisir l’analyse des constituants majeurs comme
analyse de référence constitue un compromis intéressant dans le sens que le contenu informatif est
important et qu’il y a peu de chances qu’il soit modifié de manière significative par une analyse plus
poussée qui ne se justifie que dans la perspective éventuelle de dispute judiciaire.
On doit également être conscient qu’il est extrêmement compliqué de gérer une trop grande
quantité de données. Il vaut mieux dans un premier temps, se contenter de faire l’analyse des
constituants majeures et de mettre en place une systématique de comparaison cohérente au lieu de
vouloir tout analyser et d’être submergé de données non exploitées, voire inexploitables ou
majoritairement corrélées. Néanmoins, le choix de cette méthode analytique a été dicté par le type
d’héroïne saisis dans notre pays. Cette dernière est quasi toujours sous forme basique, riche en
constituants. Lors de l’analyse d’héroïne ayant une origine géographique connue, il a été observée
(voir Annexe 2) que tel n’était pas la règle, puisque la majorité des saisies d’héroïne analysées (Asie
du sud Est et Amérique du Sud par exemple) était sous forme de sel hydrochloré, pauvre en
constituants majeurs (seule 3, l’acétylcodéine, la 6-monoacétylmorphine et l’acétylthébaol sont
présentes). Dès lors, vu le nombre restreint de variables, il n’est pas exclu qu’il faille revoir le choix de
la méthode analytique dans un autre contexte opérationnel.
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 66
5.1.5. Conclusion
Les différentes techniques de profilage empiriquement puis à l’aide de l’analyse canonique ont
permis d’estimer la perte d’information due à la limitation au choix d’une des méthodes analytiques
utilisées. La décision d’effectuer une seule technique de profilage découle également du souci de
s’orienter plus spécifiquement vers une gestion efficace et réaliste d'analyse de produits stupéfiants en
routine. Il est ainsi nécessaire d’appliquer une systématique éprouvée et rapide. C’est pourquoi la
séquence d’analyse en routine de nos échantillons a été délibérément simplifiée. Cette simplification
implique nécessairement une perte d’information, dans des limites acceptables et dont l’effet est
minime sur le résultat puisque la quasi totalité des liens existants sont mis en évidence par la méthode
que nous avons choisie mais est essentielle sur un plan opérationnel (gain de temps !). Le fait de
sélectionner la méthode (constituants majeurs) la plus simple (prix, mise en œuvre, instrumentation) et
la plus efficace du point de vue du contenu d’informations, constitue un bon compromis et permet de
confirmer l’hypothèse N°1 affirmant que les constituants majeurs offrent une information suffisante
pour créer un profil chimique utilisable dans une optique opérationnelle.
.
67
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 68
6. ALGORITHMES DE COMPARAISON
(HYPOTHESES 2.1, 2.2)
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 69
6.1. Introduction
La notion de lien utilisée dans l’analyse de produits stupéfiants est complexe. D’une manière
intuitive, lorsque deux échantillons sont considérés comme liés, ces derniers présentent entre eux des
caractéristiques communes.
Cette notion est très vaste et renferme des définitions multiples. Ceci découle de plusieurs
facteurs notamment du fait qu’un lien peut être mis en évidence à plusieurs niveaux et à l’aide de
plusieurs descripteurs.
On peut également citer des liens effectués à l’aide de profil de solvant ou d’un profil
inorganique. Au niveau chimique, la complexité du problème est déjà bien réelle. Ce dernier se
complique encore lorsque l’on prend en considération l’organisation même d’un trafic qui est organisé
de manière tentaculaire. Dès lors, en présence d’un lien, il devient extrêmement aléatoire de vouloir le
replacer dans le cadre esquissé ci-dessus. C’est pourquoi la situation a été simplifiée en se focalisant
sur l’information que nous maîtrisons, s’affranchissant ainsi de toute la partie abstraite et sujette à de
nombreuses discussions.
Ainsi, nous avons adopté la démarche suivante : nous pouvons aisément estimer la variabilité
d’une saisie en effectuant une série d'analyses d'échantillons la constituant. En partant de ces valeurs
mesurées, nous pouvons estimer son homogénéité. Ensuite au sein des bases de données regroupant les
résultats des analyses des échantillons de produits stupéfiants, nous recherchons les candidats dont les
caractéristiques chimiques entrent dans la variabilité de la saisie mesurée au préalable. Dès lors,
lorsque des échantillons satisfont aux critères précités, nous pouvons conclure qu'ils sont liés à cette
nouvelle saisie et qu’ils appartiennent donc au même lot de production. On a donc restreint la
définition du lien à un seul niveau.
En plus de la complexité inhérente à la notion de lien, il faut encore prendre en considération
les diverses problématiques engendrées par les méthodes de mesures de distances utilisées pour
effectuer le "groupage" des échantillons présentant des profils proches. Une description des fonctions
les plus utilisées et une comparaison de leur efficacité à classer les échantillons de produits stupéfiants,
constituent une étape importante pour permettre une utilisation des données analytiques.
Les différentes méthodes étudiées peuvent être groupées en deux classes principales, les
techniques dites non supervisées et celles supervisées. Les techniques non supervisées comme les
techniques de mesure de distance entre échantillons n’ont pas d’informations sur l’éventuelle
distribution des données en groupes, classes prédéfinies. Ces méthodes sont généralement utilisées
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 70
comme mesures préliminaires avant d’utiliser des techniques réputées supervisées qui elles nécessitent
une connaissance de la structure des données. Le software SIMCA (Soft Independant Modelling of
Class Analogy) est l’une de ces méthodes. Celui-ci consiste en une utilisation de l'analyse en
composante principale pour effectuer un groupage à partir d'une série de données. En effet, dans
l’article de Jonson et Strömberg [Jonson and Strömberg, 1994] la méthode du quotient (cf. ci-dessous)
est considérée comme une méthode de classification préliminaire avant de créer un modèle de
classification à l’aide du software SIMCA.
y21 X1
Descripteur y2 D1=(X1,X2)
y22 X2
y12 y11
Descripteur y1
p
D1 = ( x1, x 2 ) = ∑(y
j =1
1j − y2 j ) 2 (Équation 10)
y1j : rapport de l’aire du pic j sur l’aire du standard interne dans le chromatogramme a
y2j : rapport de l’aire du pic j sur l’aire du standard interne dans le chromatogramme b
Cette méthode est particulièrement sensible aux erreurs dues aux contaminants, aux erreurs
chromatographiques ou aux pics manquants.
D’autres techniques de mesures de distances ont été dérivées à partir la distance Euclidienne à
savoir la distance de Chord et la mesure géodésique.
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 71
La distance de Chord
X1 La distance géodésique
1
X2
La distance de Chord a une valeur maximale de 2 pour des échantillons étant à l’opposé
l’un de l’autre et une valeur de 0 lorsque les deux échantillons sont similaires. Cette mesure est en fait
la mesure de la distance Euclidienne après avoir normalisé les vecteurs à une valeur de 1. La distance
de Chord est définie par la formule suivante :
⎛ p ⎞
⎜ ⎟
⎜ ∑ y1 j y 2 j ⎟
D 2 ( x1 , x 2 ) = 2⎜1 −
j =1
⎟ (Équation 11)
⎜ p p
⎟
⎜ ∑y ∑y 2
1j
2
2j ⎟
⎝ j =1 j =1 ⎠
L’intérieur de cette équation correspond au cosinus de l’angle (θ) entre les deux vecteurs. La
distance de Chord peut donc s’écrire comme :
Cette formule peut également être modifiée pour mesurer la longueur de l’arc entre les deux
vecteurs c'est-à-dire la distance géodésique (cf figure ci-dessus). La formule est la suivante :
⎡ D 22 ( x1 , x 2 ) ⎤
D3 ( x1 , x 2 ) = arccos⎢1 − ⎥ (Équation 13)
⎣ 2 ⎦
Manhattan. Cette mesure est également sensible aux problèmes des données manquantes. La mesure
de Manhattan est la suivante :
p
D4 ( x1 , x2 ) = ∑ y1 j − y2 j (Équation 14)
j =1
Cette formule a donné lieu à différentes variantes comme le coefficient métrique de similarité
de Canberra employée par Thornton [Thornton, 1975] pour la comparaison d’indices matériels en
sciences forensiques (verre, cheveux, terre).
p ⎡ y ⎤
1 j − y2 j
D5 (x1, x 2 ) = ∑ ⎢ ⎥ (Équation 15)
j =1 ⎢ ( y1 j + y 2 j )⎥
⎣ ⎦
La méthode du quotient est utilisée pour rechercher des liens entre objets à l’intérieur d’une
base de données. La base de cette méthode consiste à calculer les quotients des aires des pics :
qi = xi/yi i = 1, 2,…, p
Où xi et yi sont les pics correspondants entre deux chromatogrammes et p est le nombre de
pics sélectionnés ou de variables utilisées pour la comparaison. S’il existe un lien entre deux profils,
les quotients auront une valeur proche de l’unité. Par la suite, un indice de similitude est calculé pour
chaque paire de quotient selon la formule suivante :
Variable A B C D E F G N
A q1 0 8.2 12.3 1.2 9.5 4.2 14.9 3
B q2 8.2 0 5.6 15.7 4.8 17.3 3.1 4
C q3 12.3 5.6 0 16.1 7.3 11.5 2.3 4
D q4 1.2 15.7 16.1 0 2.7 16.7 5.5 4
E q5 9.5 4.8 7.3 2.7 0 6.2 3.6 6
F q6 4.2 17.3 11.5 16.7 6.2 0 7.4 4
G q7 14.9 3.1 2.3 5.5 3.6 7.4 0 6
Tableau 5 : Exemple de matrice 7 × 7 avec comme conditions : rmax = 8% et Nmin = 6.
1
⎛ n ⎞ r
Dr (k , l ) = ⎜⎜ ∑ x kj − xlj
r
⎟ (Équation 16)
⎟
⎝ j =1 ⎠
où r est plus grand ou égal à 1.
Pour r = 2, on retrouve la distance Euclidienne.
Lorsque des variables sont corrélées, la distance Euclidienne conduit à des conclusions
erronées. Pour éliminer ce problème, 3 procédures peuvent être envisagées :
• enlever une des variables fortement corrélées à ou aux autre(s) (méthode la plus
simple mais peu robuste),
• introduire une distance qui prenne en compte les corrélations comme la distance de
Mahalanobis. Pour ce faire, on introduit la matrice de corrélation dans l’équation
correspondant à la notation vectorielle de la distance Euclidienne :
n
Dkl2 = ∑ ( x kj − xlj ) 2 = ( x k . − xl . )( x k . − xl . )' où (xk. − xl.)' est la transposée du vecteur
j =1
de covariance.
le coefficient de corrélation. On a :
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 74
∑ (x
j =1
kj − x k . )( xlj − xl . )
rkl = (Équation 17)
n n
∑ (x
j =1
kj − xk . ) 2
∑ (x
j =1
lj − xl . ) 2
vecteurs sont corrélés. Quand k et l sont complètement corrélés, leur direction coïncide complètement.
L’angle et, en particulier son cosinus, est une mesure de corrélation (et une mesure de
similarité) :
∑x
j =1
kj xlj
cos α = 1/ 2
(Équation 18)
⎡ n ⎤ n
⎢∑ x kj ⋅ ∑ xlj ⎥
2 2
⎣ j =1 j =1 ⎦
L’équation 18 présente une structure proche de l’équation 17. Dans l’équation 18 les valeurs
brutes sont utilisées alors que dans l’autre équation, les valeurs sont comparées à leur moyenne
(valeurs centrées). On peut donc dire que r est le cosinus de l’angle entre des vecteurs centrés. Cette
fonction cosinus a été utilisée par Keto [Keto, 1989] traitant de la comparaison de spectres de
pyrogramme. Elle a été légèrement modifiée pour prendre la forme suivante :
⎡
C = 100 × ⎢ 2
(a1b1 + a2b2 + ... + anbn )
2
⎤
2 ⎥
(Équation 19)
( 2 2 2 2
⎣ a1 + a2 + ... + an × b1 + b2 + ... + bn ⎦ ) ( )
Nouveau candidat X
Groupe B
Groupe A
Figure 28: Représentation du « plus proche voisin ». Dans ce cas le nouveau candidat X sera
rattaché au groupe B car sa distance à ce dernier est plus petite qu’à celle du groupe A.
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 76
Nouveau candidat X
Groupe B
Groupe A
Figure 29: Représentation du « voisin le plus éloigné ». Dans ce cas le nouveau candidat X sera
rattaché au groupe B car sa distance à l’échantillon le plus éloigné de ce groupe est plus
petite qu’à celui du groupe A.
Nouveau candidat X
Groupe B
Groupe A
Figure 30: Représentation de la « Mesure centrale ». Dans ce cas le nouveau candidat X sera
rattaché au groupe B car sa distance au centre de ce dernier est plus faible que celle du
centre du groupe A.
Dans le cadre de ce travail, la technique de la mesure « Mesure centrale » a été choisie lors de
l’utilisation de technique de « clustering ». La justification de ce choix peut être motivée du fait que
cette méthode est un bon compromis par rapport aux deux autres et devrait éviter les difficultés
causées par des groupes ayant une grandes dispersion.
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 77
En ce qui concerne les saisies non liées 71 candidats (profil différent) ont été sélectionnés, ce
6.6.1. Résultats
Fonction cosinus carré Coefficient de corrélation de Pearson
200 100
saisies liées
BNL random BNL random
saisies liées
80
150
60
100
40
50
20
0
0
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97
-27 -19 -11 -3 5 13 21 29 37 45 53 61 69 77 85 93
Corrélation Corrélation
300 800
600
200
400
100
200
0 0
6 19 32 45 58 71 84 97 110 123 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 3.2 3.4 3.6 3.8 4 4.2 4.4
Distance Distance
200 200
150 150
100 100
50 50
0 0
0.6 2.2 3.8 5.4 7 8.6 10.2 11.8 13.4 15 16.6 18.2 19.8 21.4 23 24.6 2 7 12 17 22 27 32 37 42 47 52 57 62 67 72 77 82 87 92 97
r
Distance ikmax
Figure 31: Représentation des courbes de distributions des valeurs de comparaison obtenues pour
des échantillons liés (courbe rouge) et des échantillons non liés (courbe bleue).
Les graphiques ci-dessous représentent un agrandissement des zones de recouvrements des
courbes formées par la distribution des valeurs de comparaison obtenues pour des échantillons liés
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 79
(courbe rouge) et des échantillons non liés (courbe bleue). L’intersection des deux courbes et les zones
de recouvrements de ces dernières permettent d’évaluer le taux de faux positifs et de faux négatifs.
40 80
30 60
20 Faux négatifs 40
10 20 98.1
0 0
96.9 97.1 97.3 97.5 97.7 97.9 98.1 98.3 98.5 98.7 98.9 99.1 99.3 99.5 95.9 96.3 96.7 97.1 97.5 97.9 98.3 98.7 99.1 99.5
Corrélation Corrélation
% faux négatifs = 2.70 (zone 97.8 – 99.5) % faux négatifs = 3.10 (zone 98.1 – 99.7)
% faux positifs = 0.71 (zone 96.9 – 97.8) % faux positifs = 1.30 (zone 95.8 – 98.1)
Distance Euclidienne Distance de Canberra
40 100
saisies liées
BNL random
35 BNL random
saisies liées
80
30
8.6
25
60
20
15 40
10
20
0.42
5
0
0
0.4 1.6 2.8 4 5.2 6.4 7.6 8.8 10 11.2
0.2 0.26 0.32 0.38 0.44 0.5 0.56 0.62 0.68 0.74 0.8
Distance
Distance
% faux négatifs = 15.29 (zone 1.6 – 8.6) % faux négatifs = 1.13 (zone 0. – 0.42)
% faux positifs = 3.87 (zone 8.6 –12) % faux positifs = 2.82 (zone 0.42 – 0.90)
Distance de Manhattan Méthode du Quotient
100 200
80
150
60
3.6
100
40
27
50
20
0 0
1.1 1.4 1.7 2 2.3 2.6 2.9 3.2 3.5 3.8 4.1 3 9 15 21 27 33 39 45 51 57 63
Distance r
ikmax
% faux négatifs = 13.08 (zone 1.60 – 3.60) % faux négatifs = 1.13 (zone 1.00 – 27.00)
% faux positifs = 4.54 (zone 3.60 – 4.20) % faux positifs = 6.25 (zone 27.00 – 67.20)
Figure 32: Agrandissement des courbes valeurs de comparaison obtenues pour des échantillons liés
(courbe rouge) et des échantillons non liés (courbe bleue). Les taux de faux positifs et faux
négatifs sont également représentés en estimant l’aire des zones de recouvrements de ces
dernières.
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 80
Les valeurs des moyennes, les écart-types et les écarts entre maximum et minimum sont
donnés sous forme de tableau. Dans le cas des distances Euclidienne et de Manhattan, les résultats ont
été reportés sans et avec standardisation. Le tableau suivant regroupe les constatations effectuées lors
de la comparaison des différentes méthodes. Les pourcentages de faux positifs et négatifs ont
également été répertoriés. Ces valeurs ont été estimées en déterminant l'aire de la courbe formée par
les échantillons liés qui se confond avec celle des échantillons non liés, c'est-à-dire des faux négatifs,
et vice et versa, pour estimer les faux positifs. Le tableau ci-dessous récapitule les différents résultats
obtenus.
Valeur Ecart-type Max – Min Max – Min % faux % faux
moyenne comp. échant. comp. comp. négatifs positifs
comp. échant. liés (%) échant. liés échant. non
liés liés
Tableau 6: Résumé des valeurs obtenues par la comparaison des différentes fonctions
mathématiques pour un même échantillonnage. Les deux dernières lignes du tableau
représentent les valeurs obtenues pour la distance Euclidienne et de Manhattan obtenues
avec des valeurs standardisées. Aucune différence notoire n’a été observée en
comparaison des valeurs obtenues avec ces mêmes distances mais pour les valeurs
normalisées.
En comparant les différents résultats, la meilleure méthode est celle du quotient suivi des mesures de
corrélations.
Les critères les plus importants à prendre en considération lors de la comparaison des divers
algorithmes mathématiques présentés ci-dessus sont le pourcentage de faux positifs et de faux négatifs.
Dans l’optique de l’information que l’on veut fournir aux enquêteurs, la formule nous donnant le plus
faible taux de faux positifs va être privilégiée. Cette stratégie a pour but d’éviter de donner aux
inspecteurs de police des informations erronées. En fonction de ce critère, il ressort que la méthode du
cosinus carré donne les résultats les plus fiables avec des risques d’erreur qui peuvent être minimisés
en fixant un seuil (> 99.4) tout en ne risquant qu’un pourcentage de faux négatifs de moins de 3%.
La distance de Canberra quant à elle ne possède pas de seuil où le recouvrement n’existe plus.
Néanmoins, elle montre le taux de recouvrement le plus faible pour le % de faux négatifs. De plus,
bien qu’elle possède une échelle de dispersion assez réduite (de 0 à 4.5), toutes les valeurs
correspondant aux saisies non liées se distribuent de manière homogène le long de cette échelle. C’est
donc une distance intéressante à retenir pour l’analyse de nos données. Les distances Euclidiennes et
de Manhattan ont un taux de recouvrement très important en plus d’un écart-type élevé, c’est pourquoi
elles ne seront pas prises en considération pour la suite des travaux.
Concernant la méthode du quotient, les indices de similitude maximaux rik max dans le cas
des saisies non liées présentent une bonne dispersion sur l’échelle des valeurs (de 0 à 100). Si l’on
agrandit la partie de superposition, seuls de faibles pourcentages de faux négatifs et de faux positifs
(1.13 et 6.25) sont observés. Lorsque la valeur de rik max est fixée inférieure à 15%, il n’y a plus
recouvrement et le risque d’obtenir des faux négatifs est minimisé. C’est donc une méthode
intéressante pour comparer des chromatogrammes dont certains pics sont manquants comme c’est
souvent le cas pour les échantillons de cocaïne par exemple.
6.6.3. Conclusion
Ce chapitre a permis de confronter diverses fonctions de comparaisons d'échantillons utilisées
dans le domaine du profilage de produits stupéfiants. La fonction cosinus carré a montré son utilité en
mettant en évidence ses avantages (principalement son faible taux de faux positifs) par rapport aux
autres méthodes. Néanmoins, d’autres fonctions comme la distance de Canberra, la corrélation de
Pearson et la méthode du quotient ont présenté des résultats comparables à ceux obtenus avec la
méthode du cosinus carré. Le choix d’une méthode est fonction des données que l’on a à comparer, si
ces dernières présentent par exemple une forte proportion d’informations manquantes, le choix de la
méthode de comparaison s’en trouvera affecté. Dans tous les cas, la méthode de sélection exposée
dans ce travail permet d’effectuer un choix objectif en se basant sur des critères pertinents (taux de
faux positifs, de faux négatifs,…). Dès lors, pour la suite de cette recherche, la méthode du cosinus
carré a été choisie pour effectuer la comparaison 2 à 2 d’échantillons de stupéfiants provenant de
saisies.
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 82
Une seconde technique largement utilisée pour tester la normalité d’un jeu de données est
basée sur la vérification graphique de l’adéquation d’un modèle de distribution qui s’appelle « normal
probability plotting » [Legendre P. et Legendre L., 1998]. L’objectif est de représenter les données
d’une telle manière que si elles appartiennent à une population distribuée selon une loi normale, elles
vont suivre une ligne droite
(ck , c~k ), (k = 1...100) est alors un ensemble de points approximativement alignés le long de la droite
de pente 1 qui passe par l’origine. On remarque que les observations ordonnées
sont des estimations des percentiles p k / n , k = 1,..., n en pratique, on représente alors les
( )
points p k / n , x[k ] . Cette représentation est une courbe de probabilité. Sous SPSS® elle se nomme
« QQ-plot ». La Figure 34 illustre une de ces représentations correspondant à des valeurs répondant
aux critères d’une loi normale.
Fréquence mesurée
Fréquence attendue
20 5%
10
0
ACOD
-5
-10
-15
-3 -2 -1 0 1 2 3
Normal Distribution
Les tests de normalité appliqués aux constituants de la cocaïne et de l’héroïne ont montré que
ces dernières, de manière générale, ne suivaient pas des lois normales. L’acétylcodéine est la variable
dont les données se rapprochent le plus d’une distribution normale. Comme la condition nécessaire à
l’utilisation de techniques paramétriques est que les données à traiter aient une distribution normale,
nous ne pouvons pas dans notre cas utiliser de telles techniques. C’est pourquoi notre choix s’est porté
prioritairement sur des méthodes non paramétriques.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 88
L’étude des corrélations entre variables a été effectuée à l’aide du calcul de la corrélation de
Pearson et du rho de Spearman afin d’évaluer les différences engendrées par ces deux techniques
applicables à des groupes de données dont les distributions sont différentes. Nos données nécessitent
l’utilisation du rho de Spearman pour le calcul de la corrélation à cause de leur comportement.
Néanmoins comme explicité précédemment Pearson a été appliqué simultanément dans une
perspective comparative.
Tableau 7: Tableau des résultats des valeurs de corrélation calculées à l’aide de la formule de
Pearson pour les constituants majeurs de l’héroïne.
Tableau 8: Tableau des résultats des valeurs de corrélation calculées à l’aide rho de Spearman pour
les constituants majeurs de l’héroïne.
Les résultats répertoriés dans le Tableau 7 et le Tableau 8 montrent qu’il n’y a pas de grandes
différences entre les valeurs de corrélation obtenues par Spearman ou Pearson. Le rho de Spearman
sera privilégié du fait de la distribution des variables utilisées pour le profilage de l’héroïne. La plus
forte corrélation enregistrée entre les différentes variables revient au couple formé par la noscapine et
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 89
la papavérine (0.79). Etant donné ce résultat, il semble légitime de dire qu’un des deux constituants
peut être négligée. Afin de vérifier cette hypothèse, une saisie a été comparée à quatre autres (une de
ces quatre est liée à la saisie de comparaison). Le résultat obtenu est illustré dans la Figure 35.
Le fait d’éliminer un constituant sur les six de départ fait perdre une partie de l’information,
principalement au niveau des échantillons qui ne sont pas liés (cf. courbe bleue en regard de la rouge).
Ainsi, pour l’héroïne il n’a pas été jugé judicieux d’éliminer cette variable, d’autant plus que leur
nombre est déjà peu important.
En effet, la systématique de la mise en évidence des liens telle qu’elle est appliquée en routine
à l’IPS n’est pas influencée par le traitement d’une variable supplémentaire.
100
95
Valeurs de corrélation
90
85
Toutes impuretés
80 Sans noscapine
75
0 50 100 150 200
Numéro échantillon
Une démarche similaire a été appliquée pour les variables de la cocaïne. La première opération
a été de déterminer quelles étaient les constituants que l’on retrouvait le plus souvent dans les saisies
de cocaïne, tant il est vrai que certaines d’entres-elles ne se trouvent quasiment jamais dans les saisies
de cocaïne analysées à l’IPS. La Figure 36 représente le pourcentage d’échantillons contenant les
diverses constituants majeurs de la cocaïne.
100
90
Nombre de cas contenant l'impureté (%)
80
70
60
50
40
30
20
10
0
ne
e
e
ne
er
e
e
e
E
E)
in
ïn
qu
in
ïn
M
st
M
ni
ai
on
n
ca
ca
lE
lE
oï
le
(E
go
oc
go
oy
oy
cg
co
co
nz
hy
ac
ec
Ec
er
m
am
oe
or
yl
be
et
op
st
yl
rm
na
dr
m
zo
le
nn
e
Tr
Fo
in
hy
id
e
n
hy
ci
-c
Ac
in
Be
An
-
s-
N
ét
is
on
an
C
cg
Tr
ne
oe
ni
dr
go
hy
Ec
An
Figure 36: Graphique présentant le pourcentage d’échantillon contenant les diverses constituants.
En consultant la Figure 36 ont été choisis pour l’analyse des données les traces les plus
souvent présentes dans les saisies de cocaïne. Notre choix s’est porté sur la Cis-cinnamoylecgonine
méthyl ester, la Trans-cinnamoylecgonine méthyl ester, la benzoylecgonine et l’ecgonine méthyl ester,
la norcocaïne, l’ecgonine et la tropacocaïne. Les autres traces ont été ignorées dans cette étude du fait
de leur faible représentation.
L’étude des corrélations entre les différents constituants majeurs de la cocaïne formant le
profil chimique de cette dernière a montré des résultats comparables à ceux obtenus pour l’héroïne.
Une forte corrélation a également été mise en évidence entre la Cis-cinnamoylecgonine méthyl ester et
la Trans-cinnamoylecgonine méthyl ester. Il n’a pas été jugé pertinent d’éliminer une de ces deux
variables, pour les raisons évoquées ci-dessus. Le nombre de variables limité (7) et la diminution de la
discrimination constituent des arguments de poids.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 91
Tableau 9: Tableau des résultats des valeurs de corrélation calculées à l’aide de la formule de
Pearson pour les constituants majeurs de la cocaïne.
Rho de Spearman EME EC Tropa BenzoylEc Nor CIS TRANS
EME Coefficient de corrélation 1.000 .392** .272** .352** .213** .333** .312**
Sig. (2-tailed) . .000 .000 .000 .001 .000 .000
N 224 224 224 224 224 224 224
EC Coefficient de corrélation .392** 1.000 .173** .409** .155* .120 .057
Sig. (2-tailed) .000 . .010 .000 .021 .074 .395
N 224 224 224 224 224 224 224
Tropacocaine Coefficient de corrélation .272** .173** 1.000 .231** .132* .249** .255*
Sig. (2-tailed) .000 .010 . .000 .049 .000 .000
N 224 224 224 224 224 224 224
BenzoylEc Coefficient de corrélation .352** .409** .231** 1.000 .204** .443** .331*
Sig. (2-tailed) .000 .000 .000 . .002 .000 .000
N 224 224 224 224 224 224 224
Norcocaïne Coefficient de corrélation .213** .155** .132** .204** 1.000 .004 -.026
Sig. (2-tailed) .001 .021 .049 .002 . .948 .695
N 224 224 224 224 224 224 224
CIS Coefficient de corrélation .333** .120 .249** .443** .004 1.000 .934**
Sig. (2-tailed) .000 .074 .000 .000 .948 . .000
N 224 224 224 224 224 224 224
TRANS Coefficient de corrélation .312** .057 .255** .331** -.026 .934** 1.000
Sig. (2-tailed) .000 .395 .000 .000 .695 .000 .
N 224 224 224 224 224 224 224
** La corrélation significative à un niveau de 0.01 (test bilatéral).
* La corrélation significative à un niveau de 0.05 (test bilatéral).
Tableau 10: Tableau des résultats des valeurs de corrélation calculées à l’aide de la formule de
Spearman pour les constituants majeurs de la cocaïne.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 92
240
220 Caffeine
200
180 6-monoacetylmorphine
160
140
120
100
80
60
Acetylcodeine Noscapine
40
Papaverine
20
Acetylthebaol
0
Meconine
-20
-40
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
r r r r
a ⋅ b = a × b × cosθ (Équation 20)
Sachant que l’expression du produit scalaire en fonction des composantes des vecteurs
relativement à une base orthonormée dans l’espace est,
⎛ a1 ⎞ ⎛ b1 ⎞
⎜ ⎟ ⎜ ⎟
r ⎜ a2 ⎟ r ⎜ b2 ⎟ r r
si a = ⎜ ⎟ et b = ⎜ ⎟ alors a ⋅ b = a1b1 + a2b2 + ... + anbn (Équation 21)
... ...
⎜ ⎟ ⎜ ⎟
⎜a ⎟ ⎜b ⎟
⎝ n⎠ ⎝ n⎠
et que la norme d’un vecteur en fonction de ses composantes dans l’espace est :
r
a = a12 + a22 + ... + an2 (Équation 22)
alors, le carré du cosinus de l’angle entre 2 vecteurs est :
cos θ = r 2
2 (ar ⋅ br )r
2
⇒ cos θ =
2 (a1b1 + a2b2 + ... + anbn )2
a ×b
2
(a
2
1 + a22 + ... + an2 )× (b12 + b22 + ... + bn2 )
(Équation 23)
Le cosinus de l’angle entre deux variables centrées et réduites n’est autre que leur coefficient
de corrélation linéaire.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 94
⎡
C = 100 × ⎢ 2
(a1b1 + a2b2 + ... + anbn )2 ⎤
2 ⎥
(Équation 19)
⎣ a(
1 + a2
2
+ ... + an
2
) (
× b1
2
+ b2
2
+ ... + b)
n ⎦
chromatogramme B.
La valeur de corrélation est un nombre sans dimension, auto-normalisé et indépendant de la
longueur du vecteur (c’est à dire de la taille de l’échantillon).
7.2.3. Evaluation des valeurs prise par la fonction cosinus carré lors de la
comparaison d’échantillons non liés.
Pour cette étude nous avons sélectionné aléatoirement dans la base de données répertoriant les
saisies d’héroïne, 178 saisies réputées non liées chimiquement (profils différents). Nous avons ensuite
calculé les valeurs de corrélation obtenues en comparant chaque saisie avec les 177 autres (15931
comparaisons). La même opération a été effectuée avec 143 saisies de cocaïne possédant des profils
chimiques différentes (10296 comparaisons). Les figures suivantes illustrent la distribution de ces
résultats.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 95
120
100
80
Fréquence
60
40
20
0
0
3.5
7
10.5
14
17.5
21
24.5
28
31.5
35
38.5
42
45.5
49
52.5
56
59.5
63
66.5
70
73.5
77
80.5
84
87.5
91
94.5
98
Valeur de corrélation
250
200
150
Fréquence
100
50
0
0
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
Valeur de corrélation C
• les valeurs de corrélation oscillent dans une proportion importante vers les valeurs
comprises entre 85 et 100. Ces constatations indiquent qu’une proportion importante
des saisies d’héroïne et de cocaïne analysées à l’IPS possède un profil chimique
proche. Cette observation semble indiquer une proximité de production et
méthodologique proche voire unique. Cela n’est pas surprenant si l’on admet que
l’héroïne saisie en Suisse provient majoritairement des laboratoires du Croissant d’or
(Afghanistan), ainsi que les renseignements de police et de l’UNDCP (United Nations
International Drug Control Programme) semblent l’indiquer, dont les matières
premières et les méthodes de production ne sont pas radicalement différentes de l’un à
l’autre. On se trouve donc en présence d’une production de stupéfiants endogène dont
les signatures chimiques sont peu diversifiées. Des constations similaires peuvent
également être faites pour la cocaïne dont la production est majoritairement assurée
par la Colombie. Cependant, une variation plus importante est observées.
• Néanmoins une différentiation est possible lorsque l’on compare cette distribution à
celle des échantillons considérés comme liés (voir chapitre précédent lors du choix de
la fonction de comparaison).
• La dispersion des valeurs de C est importante. Les valeurs de corrélation résultant des
comparaisons effectuées entre les différents échantillons à priori non liés s’étalent
donc sur une plage importante. Cette observation permet de valider la méthode de
classification quant à son aptitude à mettre en évidence des liens entre saisies ou, au
contraire, mettre en évidence la variété qui existe entre saisies non liées
chimiquement. On peut, en quelque sorte, comparer cette dispersion avec le pouvoir
discriminant de la méthode. En effet, si toutes les valeurs de corrélation étaient
comprises entre 90 et 100 par exemple, on risquerait d’obtenir des résultats présentant
un fort taux de faux positifs.
0
20
40
60
80
100
120
0
10
20
30
40
50
60
0
20
40
60
80
100
Figure 41 :
0 0 0
0.2
0.2 0.2
0.4
0.4 0.4
0.6
0.6 0.8
0.6
0.8 1
0.8
1 1.2
1 1.4
1.2
1.2 1.6
1.4
1.8
1.4 1.6 2
1.6 1.8 2.2
1.8 2 2.4
2.2 2.6
Classes
Classes
2
Classes
2.8
Meconine
Papavérine
2.2 2.4
3
2.6
2.4 3.2
2.8 3.4
2.6
3 3.6
6-Monoacétylmorphine (MAM)
2.8
3.2 3.8
3 4
3.4
3.2 4.2
3.6
4.4
3.4 3.8 4.6
3.6 4 4.8
0
20
40
60
80
100
120
140
0
10
20
30
40
50
60
70
80
0
5
10
15
20
25
30
35
0 0 0
0.2
0.2
0.2 0.4
0.4 0.6
0.4 0.8
0.6
1
0.6
0.8 1.2
0.8 1.4
1 1.6
1.2 1 1.8
2
1.4 1.2 2.2
1.6 2.4
1.4
2.6
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2)
Classes
1.8
Classes
2.8
Classes
1.6
Noscapine
3
2
Acétylthebaol
Acétylcodéine
1.8 3.2
2.2 3.4
2 3.6
2.4
3.8
2.2
2.6 4
350
200
300
250
150
Fréquence
Fréquence
200
100
150
100
50
50
0 0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
0
2
Classes Classes
250
400 400
200
300 300
Fréquence
Fréquence
Fréquence
150
200 200
100
100 100
50
0 0 0
0 0.10.20.30.40.50.60.70.80.9 1 1.11.21.31.41.51.61.71.81.9 2 2.12.2 0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
0.4
0.8
1.2
1.6
2.4
2.8
3.2
3.6
4.4
4.8
5.2
5.6
6.4
6.8
7.2
7.6
1
0
120 140
120
100
100
80
80
Fréquence
Fréquence
60
60
40
40
20
20
0 0
0.2
0.4
0.6
0.8
1.2
1.4
1.6
1.8
2.2
2.4
2.6
2.8
3.2
3.4
3.6
3.8
4.2
4.4
4.6
4.8
5.2
5.4
5.6
5.8
0
0.2
0.4
0.6
0.8
1.2
1.4
1.6
1.8
2.2
2.4
2.6
2.8
3.2
3.4
3.6
3.8
4.2
4.4
4.6
4.8
5.2
5.4
5.6
5.8
0
Classes Classes
Figure 42 : Représentation des répartitions des aires des constituants majeurs de la cocaïne.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 99
• La courbe de tendance esquissée en rouge sur les Figure 39 et Figure 40 montre une
périodicité dans sa construction indiquant peut être que la courbe délimitait des
groupes de saisies proches les unes des autres. Si cette hypothèse est vérifiée, il serait
théoriquement possible de fixer un échantillon comme standard de mesure
(échantillon de référence). Chaque échantillon serait comparé à ce dernier et sa valeur
de corrélation ainsi obtenue (valeur de corrélation standardisée) serait utilisée pour
sélectionner les échantillons de la base de données ayant des caractéristiques proches
(cette sélection s’effectuerait en choisissant les échantillons dont la valeur de
corrélation standardisée se situe dans un intervalle proche de celui du nouveau
candidat). L’étude de ce phénomène sera présentée ci-dessous
Afin d’estimer la validité d’un tel critère, il est nécessaire de considérer les éléments suivants :
Dans un premier temps, il faut étudier le comportement de la fonction cosinus carré qui peut
être représenté graphiquement comme suit :
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 100
100
0.97
90
80
70
Valeurs de corrélation
60
50
40
30
20
10
10 170 190 350
0
1
21
41
61
81
101
121
141
161
181
201
221
241
261
281
301
321
341
361
Angle (°)
Figure 43 : Représentation de la fonction cosinus avec en rouge 4 angles ayant les mêmes valeurs.
Le tableau suivant représente les valeurs prises par C suivant l’angle séparant deux vecteurs:
Tableau 11: Valeurs prises par la fonction cosinus suivant l’angle pris entre 2 chromatogrammes.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 101
On remarque que pour la valeur de C égale à 96.98, il existe des valeurs d’angle de 10° et 170°
modulo 2π satisfaisant à ces conditions. Ceci est dû à la périodicité de la fonction cosinus.
V1
V3 β
−α2 α1
γ α2 V0
-α1
V2
V4
Le choix du vecteur standard influence donc les valeurs de corrélation attribuables aux divers
chromatogrammes de la base. Ce moyen n’est pas valable pour effectuer une sélection cohérente.
Afin de comprendre cette problématique, des saisies d’héroïne et de cocaïne ont été tamisées.
Cette opération s’est effectuée sur un vibreur de marque RETSCH VS 1000. Les tamis utilisés sont
calibrés de la manière suivante :
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 102
0.75 mm, 0.40 mm, 0.30 mm, 0.25 mm, 0.20 mm, 0.10 mm, < 0.10mm. Les différentes
fractions ainsi récupérées ont été analysées par la suite par les techniques analytiques présentées
précédemment.
Les valeurs étant rangées par ordre croissant, la médiane est le nombre qui partage la série en
deux parties de même effectif. Il y a autant de valeurs inférieures à la médiane que de valeurs
supérieures. La médiane diffère de la moyenne principalement du fait des propriétés suivantes :
• La moyenne dépend de la valeur de tous les nombres composant la série alors que la
médiane dépend essentiellement de leur ordre.
Le quantile de p est la valeur de rang p(n+1). Quand p = 0,5, alors il s’agit de la médiane,
valeur de rang (n+1). Dans ce cas, la fréquence a été partagée en deux parties égales. Les quartiles sont
les 3 quantiles de 0.25, 0.50, 0.75: Q0.25, Q0.5, Q0.75 notés aussi Q1, Q2, Q3. On peut aussi définir
les déciles (p variant de 0.1 à 0.9, soit 9 en tout), et les centiles (p variant de 0.01 à 0.99, soit 100 en
tout). Ainsi, par exemple, le 25ème centile (ou le 1er quartile, noté Q1) est la valeur telle que 25% des
données lui sont inférieures et donc 75% lui sont supérieurs. Ceci signifie que 33% de l’aire sous la
courbe de distribution se trouve à gauche de la valeur Q1.
c) Le diagramme en boîte (box-plot)
Les principaux paramètres que nous venons de voir peuvent aussi faire l’objet d’une
représentation graphique. Le diagramme en boîte donne en effet les informations suivantes :
• Le rectangle est prolongé par deux lignes parallèles à l’échelle, indiquant les valeurs
maximales et minimales.
Cette représentation est aussi appelée "boîte à moustaches" dans certains logiciels utilisés en
statistique.
Il existe des "variantes" dans la façon dont les logiciels génèrent ces diagrammes, notamment
au niveau de la représentation des valeurs éloignées ou extrêmes. Pour les identifier visuellement, ces
dernières sont alors représentées en dehors de la ligne horizontale. Cette dernière n’a donc plus comme
longueur l’étendue de la série. Dans le logiciel SPSS® par exemple, une valeur est définie comme
éloignée ("outlier") si sa distance au 75ième percentile (ou au 25ième) est supérieure à 1,5 x (Q3-Q1).
Une valeur est définie comme extrême si sa distance au 75ième percentile (ou au 25ième) est
supérieure à 3 x (Q3-Q1).
Les propriétés fondamentales d’une représentation sous forme d’un box-plot sont les
suivantes : elle est utilisable pour tout type de distribution (validité), elle n’est pas influencée par des
valeurs extrêmes (robuste) et elle permet de mettre en évidence ces données
Cette représentation est particulièrement utile pour comparer les caractéristiques de plusieurs
distributions
Valeur maximale
75% percentile
Médiane
25% percentile
Valeur minimale
Les résultats sont présentés en utilisant la méthode des diagrammes en boîte afin de pouvoir
comparer les distributions des différentes fractions. Cette manière de faire a été utilisée pour les 6
constituants majeurs de l’héroïne et les 7 constituants majeurs de la cocaïne pris en compte lors de la
comparaison d’échantillons en routine, ainsi que pour les valeurs de quantification du principe actif, à
savoir la diacétylmorphine et la cocaïne.
On remarque en analysant les différents résultats mis en évidence que pour chaque constituant
analysé (voir Annexe 5) il existe des différences significatives entre les différentes fractions Ainsi, par
exemple, pour l’analyse 1 de l’héroïne (cf. Annexes 5), la fraction Hero_poudre (fraction < 0.10 mm)
possède systématiquement une valeur plus élevée. De manière générale, on peut également remarquer
que les fractions les plus grandes et, plus particulièrement celle de 0.75 mm, présentent la plus grande
dispersion (inhomogénéité) de leurs données.
Ces résultats peuvent expliquer les différences rencontrées lors de la comparaison de profils
chimiques résultant de l’analyse d’échantillons provenant d’une même saisie. Ce genre de problème
peut être évité par la dissolution de la poudre dans un solvant approprié (dichlorométhane par
exemple) et laisser évaporer ce dernier. Le résidu ainsi obtenu devrait être le plus homogène possible.
Les différentes fractions ont ensuite été comparées les unes par rapport aux autres à l’aide de
la fonction cosinus. Intuitivement, les valeurs de ces comparaisons devraient être très élevées et
devraient permettre de les lier entre-elles puisqu’au départ ces dernières proviennent de la même
matrice. Or les résultats obtenus sont tout autre puisque comme représenté dans les Figure 46 et Figure
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 105
47 les données résultant des fractions élevées (> 40 mm) fournissent lors de l’analyse des « faux
négatifs ». Cette phase à granulométrie élevée possède donc des proportions des constituants majeurs
différents de celles de faible granulométrie. Une hypothèse pouvant expliquer ce phénomène pourrait
être recherchée dans le mélange des différents lots de cocaïne et d’héroïne pour créer un stock de ces
substances. En effet, si deux poudres de formes physiques différentes (une sous forme pulvérulente
fine et l’autre sous forme de petits cailloux par exemple) sont mélangées, il y a fort à parier qu’il ne
sera pas possible d’obtenir un produit homogène. Dès lors, un tamisage comme montré précédemment
permet de séparer deux stupéfiants ayant des caractéristiques physiques différentes.
100.00
99.00
98.00 Auto26599B.10.1
Valeurs de corrélation
97.00 Auto26599B.20.1
96.00 Auto26599B.25.1
Auto26599B.30.1
95.00
Auto26599B.40.1
94.00 Auto26599B.75.1
93.00 Auto26599B.Mix1
92.00 Auto26599B.Poudre1
91.00
90.00
Auto26599B.Mix1
Auto26599B.10.1
Auto26599B.20.1
Auto26599B.25.1
Auto26599B.30.1
Auto26599B.40.1
Auto26599B.75.1
Auto26599B.Poudre1
Fraction
Figure 46 : Représentation des comparaison entre les différentes fractions d’héroïne à l’aide de la
fonction cosinus. A noter le décrochement des valeurs de corrélation obtenus pour la
fraction plus grande que 0.75 mm.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 106
100
99.8
99.6 Coc_10_1.1
Valeurs de corrélation
Coc_20_1.1
99.4 Coc_25_1.1
Coc_30_1.1
99.2
Coc_40_1.1
99 Coc_75_1.1
Coc_Mix_2.1
98.8 Coc_poudre_1.1
98.6
98.4
Coc_Mix_2.1
Coc_10_1.1
Coc_20_1.1
Coc_25_1.1
Coc_30_1.1
Coc_40_1.1
Coc_75_1.1
Coc_poudre_1.1
Fraction
Figure 47: Représentation des comparaison entre les différentes fractions de cocaïne à l’aide de la
fonction cosinus. A noter le décrochement des valeurs de corrélation obtenus pour la
fraction plus grande que 0.75 mm.
Une solution permettant d’assurer une homogénéité optimale consisterait à passer au tamis les
différentes poudres afin de sélectionner la fraction inférieure à 10mm. Néanmoins, cette manière
d’opérer prête à discussion puisque l’on sélectionne une partie de l’échantillon qui n’est pas
représentative de la totalité de la matrice à analyser.
S’est alors posée la question de savoir si la méthodologie de travail adoptée dans ce travail
était adéquate. En effet, lors de la pesée d’un échantillon, seul 7 mg de poudre sont prélevés. Il se peut
donc que sur trois prélèvements par exemple, un de ceux-ci soit représenté majoritairement par une
des fractions qui diffère de la moyenne. Afin d’estimer l’influence de la faible quantité de poudre
pesée, 10 fois plus de poudre ont été pesées (70 mg), diluées et les distributions de ces pesées ont été
comparées. Les graphiques suivants résument les résultats obtenus.
L’échantillon nommé dil 6599B représente l’échantillon dont on a pesé 10 fois plus de
substance que les autres et que l’on a dilué 10 fois afin de garantir une proportionnalité
dans la quantité mesurée.
Les échantillons 6599B essai 1, 6599B essai 2, 6599B essai 3 sont des échantillons de la
même saisie que l’échantillon dil 6599B mais que l’on a analysé de la manière habituelle.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 107
10.4
10.2
10.0
9.8
9.6
9.4
9.2
9.0
8.8
N= 3 3 3 3
2.4
2.2
2.0
1.8
1.6
1.4
N= 3 3 3 3
40
30
20
N= 3 3 3 3
13
12
11
10
8
N= 3 3 3 3
13
12
11
10
8
N= 3 3 3 3
50
40
30
20
N= 3 3 3 3
Les résultats illustrés ci-dessus montrent que la pesée d’un échantillon plus important semble
stabiliser la dispersion des données. Néanmoins en comparant les résultats, il ne semble pas que la
dilution améliore de manière très sensible la reproductibilité des analyses.
Afin de vérifier ce qui précède, une comparaison a été effectuée entre les échantillons dilués et
les échantillons préparés selon la méthode standard. La figure ci-dessous montre que les valeurs prises
par ces comparaisons sont comparables (pas de présence de faux positifs)
6
Echantillon dilué
Echantillon méthode standard
5
4
Fréquence
00
0
0
.0
.2
.4
.6
.8
.0
.2
.4
.6
.8
.0
.2
.4
.6
.8
0.
97
97
97
97
97
98
98
98
98
98
99
99
99
99
99
10
Valeurs de corrélation
Figure 54: Comparaison effectuée à l’aide de la fonction cosinus entre les échantillons dilués et ceux
préparés selon la méthode standard. Aucune différence notable n’a pu être notée.
De plus, la mise en routine d’une systématique de dilution n’est pas aisément applicable
puisque le temps dévolu à cette préparation est conséquent.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 111
A.1
A.1 100.00
A.2 99.98
A.3 99.97
MelC.2 94.58
MelC.1 94.25
MelC.3 94.00
MelB.2 83.78
MelB.1 83.34
MelB.3 81.40
MelA.3 73.80
MelA.2 73.07
MelA.1 71.79
B.1 66.09
B.2 65.53
B.3 64.39
Tableau 12: Résultat de la comparaison à l’aide de la fonction cosinus entre la saisie A et les différents
mélanges préparés en combinant cette saisie avec la saisie B.
Lorsque l’on mélange deux saisies ayant des profils différents, il est évident qu’une nouvelle
saisie ayant des caractéristiques chimiques différentes de celles des saisies initiales est obtenue.
De plus, les tableaux de corrélation entre les différentes variables (cf. Tableau 7 et Tableau 8)
montrent que les corrélations observées entre ces dernières sont toujours positives ce qui implique que
lorsque la valeur d’une variable augmente, les autres augmentent également. Ces considérations
montrent que les valeurs prises par les différentes variables sont assez bien délimitées et permettent
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 112
d’expliquer que les valeurs de corrélations se concentrent dans la partie du cercle trigonométrique
comprise entre 0° et 90°.
Afin d’étayer ce raisonnement, la fonction de cosinus a été modifiée afin de mesurer le cosinus
à la place du cosinus carré. La Figure 55 représente les deux fonctions précitées :
0.8
0.6
0.4
0.2
cos x
0
cos2 x
0
16
32
48
64
80
96
112
128
144
160
176
192
208
224
240
256
272
288
304
320
336
352
-0.2
-0.4
-0.6
-0.8
-1
Angle (°)
Dans le cas du cosinus, les angles supérieurs à 90° donnent des valeurs négatives alors que
pour le cosinus carré elles sont positives. A partir de ceci, il est donc possible de calculer les angles
obtenus entre des chromatogrammes. Le cosinus entre les vecteurs résultants des 2 échantillons non
liés est calculé de la manière suivante :
r r r r
a ⋅ b = a × b × cos θ
r
cos θ = r
(ar ⋅ b r)
⇒ cos θ =
(a1b1 + a 2 b2 + ... + a n bn )
(Équation 24)
a ×b (a2
1 + a 22 + ... + a n2 × ) (b 1
2
+ b22 + ... + bn2 )
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 113
Les angles obtenus à partir de la base des échantillons non liés sont représentés sur la figure
suivante
800
700
600
500
Occurence
400
300
200
100
0
90
88
85
83
81
78
76
74
71
69
66
64
61
59
56
53
50
47
44
41
37
33
28
23
16
0
Angle(°)
Figure 56: Représentation des saisies d’héroïne réputées non liées à l’aide de la fonction cosinus
modifiée.
Il apparaît que sur la totalité de la base de données, aucune valeur supérieure à 90 ° n’a été
retrouvée. Cette constatation confirme l’hypothèse selon laquelle, les valeurs de C occupent le premier
quart du cercle trigonométrique. Les risques de faux positifs semblent donc être limités voire
inexistants.
Afin d’estimer l’importance de ces dégradations, des simulations ont été effectuées en
supposant que le 100% de la dégradation de la DAM se transforme en MAM.
Ces simulations ont pour objectif de déterminer si la dégradation des échantillons due à leur
stockage ou à leur vieillissement influence la valeur de corrélation C de manière significative. Ces
tests sont intéressants puisqu’ils permettront de déterminer s’il faut s’attendre à des variations
significatives en analysant un échantillon à un temps t et si ce même échantillon est analysé une
nouvelle fois ultérieurement. Il en va de même concernant des saisies provenant d’un même lot, mais
saisies à un intervalle de temps de plusieurs mois par exemple.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 114
100
98
96
Valeur de corrélation
94
92
90
88
86
84
82
0 10 20 30 40 50 60 70 80 90
Variation de la MAM (%)
Le graphique et le tableau ci-dessus illustrent les variations de la valeur de C lorsque l’on fait
varier les valeurs des aires de la DAM et de la MAM. Les valeurs de corrélation sont peu influencées
par des grandes variations de l’aire d’une trace lorsque cette variation est reportée sur une autre
substance (la diacétylmorphine par exemple). Il faut donc se référer au pourcentage de variation que
l’on effectue par rapport à l’aire totale du chromatogramme.
D’après ces simulations, il semble que les variations mineures pouvant provenir de la
dégradation d’un composé sont peu visibles. Par exemple avec une dégradation de 35.21% de la MAM
qui représente qu’une variation de 0.46% sur l’aire totale, la valeur de corrélation est quasiment
inchangée.
Tableau 14: Illustration de la variation de C en fonction de la variation de l’aire totale due à une
dégradation d’un constituant.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 116
Valeurs papavérine
5 1.86
Valeurs noscapine
1.86
Figure 58: Explication graphique du phénomène d’inversion d’aire entre deux constituants.
7.2.10. Conclusions
Les tests effectués ci-dessus ont permis d’apporter des éclairages importants sur la validité de
la fonction cosinus que nous utilisons pour comparer les échantillons de produits stupéfiants.
Ainsi, l’origine mathématique de la fonction ainsi que sa représentation graphique, son
comportement et ses avantages par rapport aux autres fonctions utilisées fréquemment pour la
comparaison de produits stupéfiants ont pu être validés.
Ainsi l’hypothèse 2.2 relative à l’efficacité de la fonction cosinus carré à minimiser le taux de
faux positifs et faux négatifs est confirmée par les résultats obtenus dans ce chapitre.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 118
8. LES TECHNIQUES DE
RECONNAISSANCE DE GROUPE OU
« PATTERN RECOGNITION »
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 119
8.1. Introduction
Afin d’apprécier la structure des informations répertoriées dans les bases de données de
l’héroïne et de la cocaïne et dans l’optique de mettre en évidence d’éventuelles classes chimiques,
diverses techniques de reconnaissances de groupe ont été testées. Premièrement, il est nécessaire de
définir la notion de classe chimique. Une classe chimique est définie comme une collection d’objet
(dans notre cas des échantillons de produits stupéfiants) ayant des caractéristiques similaires.
La connaissance a priori de l’appartenance de différents objets à une classe chimique n’est pas
toujours disponible, dans ce cas des techniques non supervisées sont appliquées. Ces dernières sont
souvent utilisées pour analyser et représenter la distribution de ces données en divers groupes sans
imposer une appartenance de classe à ces échantillons. L’analyse en composante principale est l’une
de ces techniques statistiques qui est évaluée dans ce chapitre. Il s’agira d’apprécier l’hypothèse 2.3
qui dit que les techniques non supervisées ont un potentiel de tri initial intéressant.
Les méthodes supervisées quant à elles utilisent les informations d’appartenance à une classe
chimique. Le but de ces méthodes est de construire un modèle permettant de prédire l’appartenance
d’échantillons futurs à une éventuelle classe chimique. Ces méthodes impliquent nécessairement une
phase d’apprentissage permettant de développer le modèle le plus adapté à la classification des
échantillons à disposition. Cette phase permet de répondre à l’hypothèse 2.4 concernant l’utilisation de
ces méthodes mathématiques afin de confirmer les liens obtenus à l’aide de la systématique de
comparaison proposée dans cette recherche.
Afin de guider le praticien quant au choix de ces techniques analytiques un arbre de décision a
été schématisé dans la figure suivante [Beebe et al., 1998] :
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 120
Voulez-vous
développer un modèle Non
pour prédire Techniques non supervisées
l’appartenance d’un
échantillon à une classe
spécifique ?
Analyse de groupe
hiérarchique (Hierarchical
Cluster Analysis)
Puis
Oui
Analyse en composante
principale (ACP)
Analyse de groupe
Non
hiérarchique et ACP pour
un examen initial des
Calibrations multivariées données
Non
Figure 59: Arbre décisionnel utilisable pour sélectionner les techniques de reconnaissance de
groupes. Les formes remplies en gris montrent le chemin adopté dans le cadre de ce
travail.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 121
La figure ci-dessus permet selon les données à disposition de définir les techniques statistiques
exploratoire et prédictive à privilégier. La première étape a principalement été effectuée pour étudier la
structure des données à disposition et valider les classes définies à l’aide de la fonction cosinus.
L’analyse en composante principale a été utilisée comme élément de sélection préliminaire à l’analyse
des échantillons 2 à 2 à l’aide de la fonction cosinus. SIMCA (Soft Independent Modelling of Class
Analogy) a ensuite été utilisée comme validation d’un lien préalablement mis en évidence.
Afin d’améliorer la base de données regroupant les résultats des saisies de produits stupéfiants,
des techniques empruntées à la statistique exploratoire ont été testées dans l’optique de simplifier la
comparaison en synthétisant, résumant et structurant l’information des données à disposition.
Les deux principaux groupes de techniques statistiques exploratoires sont les suivants:
• les méthodes de classifications non supervisées, tel que les mesures de distances ou
l’analyse en composante principale permettant soit de sélectionner et regrouper des
échantillons ayant des caractéristiques chimiques proches [Derde and Massart, 1982].
• les méthodes de classifications supervisées, tel que SIMCA permettant de valider les
classifications effectuées au préalable par les techniques non supervisées.
L’analyse en composante principale est utilisée pour réduire la dimension (le nombre de
variables) d’un problème. Cette diminution du nombre de variables doit s’effectuer en perdant le
minimum d’information. L’analyse des premières composantes principales (celles qui renferment le
plus d’information) permet dans la majorité des cas de représenter de manière suffisante l’information
véhiculée par les variables initiales. Les composantes principales secondaires ne représentent que peu
d’information puisque leur variance est moindre.
On peut également relever que les composantes principales ne sont pas corrélées entre-elles. Il
en résulte que si l’on choisit les deux premières composantes principales pour représenter des
échantillons caractérisés par 6 variables, on assure que l’information véhiculée par la première
composante principale est totalement indépendante de celle véhiculée par la seconde.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 122
Le premier axe principal d’une distribution ellipsoïdale est la ligne qui passe à travers la plus
grande dimension de l’ellipse. L’axe principal suivant passe par la deuxième dimension la plus grande
et ainsi de suite. En deux dimensions le premier axe principal correspond à l’axe principal de la
concentration de l’ellipse (donc la première composante principale qui explique la majorité de
l’information des données initiales) et le second axe principal correspond à l’axe mineur qui est en fait
celui de la seconde composante principale. Ces deux axes sont perpendiculaires l’un par rapport à
l’autre. De manière similaire, on peut penser en p-dimension où il y a p axes consécutifs qui sont
perpendiculaires les uns par rapport aux autres.
[( y
1 − µ1 ) + ( y 2 − µ 2 ) + ... + ( y p − µ p )
2 2 2
] = ([y − µ ][y − µ ] )
1
2 '
1
2
(Équation 25)
Le premier axe principal est la droite qui passe par le centre µ de l’ellipse et qui la traverse
dans sa plus grande dimension. Le second axe principal passe aussi par µ , c’est une droite
perpendiculaire au premier axe principal. Donc le demi-premier axe principal de l’ellipse est celui qui
maximise la distance d’un point de l’ellipse au centre µ de cette ellipse. Soit :
Les multiplicateurs de Lagrange ( λ ) sont utilisés pour calculer les valeurs minimales et
maximales d’une fonction à plusieurs variables lorsque les relations entre ces différentes variables sont
connues. Dans le cas présent, l’équation à maximiser est la suivante :
f ( y) = [ y − µ ][ y − µ ] − λ
' ∂
∂y
{ }
[ y − µ ]Σ −1 [ y − µ ]' − α (Équation 26)
Les valeurs qui maximisent cette fonction sont trouvées en calculant la dérivée partielle et en
la fixant à 0
∂
f ( y)
∂y
∂
∂y
{
[ y − µ ][ y − µ ]' − λ ∂ [ y − µ ]Σ −1 [ y − µ ]' − α
∂y
}
( )
Il est important de se rappeler ici que y est un vecteur à p-dimension, y1 , y 2 ,..., y p ce qui
(Σ − λI )[ y − µ ] = 0 (Équation 27)
Σ.
Pour trouver les vecteurs déterminants des axes principaux p successifs, il est nécessaire de
classer les valeurs propres de la matrice Σ en ordre décroissant λ1 〉 λ2 〉...〉 λ p ≥ 0
L’étape suivante consiste à calculer les nouvelles variables. Ces nouvelles variables (v) sont
reliées aux variables primitives par la transformation suivante :
v = [ y − µ ]U (Équation 28)
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 124
y2
(µ1 , µ 2 )
y1
[ y2 − µ 2 ]
y2
(µ1 , µ 2 )
[ y1 − µ1 ]
y1
y1
v1 = [ y − µ ]u 1
y2
v 2 = [ y − µ ]u 2
(µ1 , µ 2 )
y1
u k (S − λk I ) = 0 (Équation 29)
S − λk I = 0 (Équation 30)
qui est utilisée pour calculer les valeurs propres λk . Les vecteurs propres u k associés aux λk
sont calculés en introduisant les différents u k dans l’équation 30. Les vecteurs propres sont les axes
principaux de la matrice de dispersion S . Ces vecteurs propres sont normalisés avant de calculer les
composants principaux, qui donnent les coordonnés des objets sur les axes principaux successifs.
L’analyse en composante principale possède les propriétés suivantes:
• Les matrice de dispersion étant symétrique, les axes principaux sont orthogonaux les
uns par rapport aux autres
• Suite aux deux premières propriétés, l’analyse en composante principale peut souvent
résumer dans une dimension plus petite la plus grande partie de la variabilité de la
matrice de dispersion d’un grand nombre de descripteurs. Elle permet donc de mesurer
la quantité de la variance expliquée par ces quelques axes indépendants.
L’exemple ci-dessous est volontairement choisi simple pour des raisons évidentes de calcul. Il
s’agit de calculer les vecteurs propres de deux analyses d’héroïne (composées des six composants
majeurs). Y est la matrice construite à l’aide des valeurs obtenues pour chaque composant (chaque
ligne regroupe les valeurs prises par un composant spécifique).
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 127
⎡2 1⎤
⎢3 4⎥⎥
⎢
Y = ⎢5 0⎥
⎢ ⎥
⎢7 6⎥
⎢⎣9 2⎥⎦
⎡ − 3.2 − 1.6 ⎤
⎢− 2.2 1.4 ⎥
⎢ ⎥
[y - y] = ⎢− 0.2 − 2.6⎥
⎢ ⎥
⎢ 1.8 3.4 ⎥
⎢⎣ 3.8 − 0.6⎥⎦
La matrice de dispersion peut être directement calculée en multipliant la matrice des données
[ y − y ]' [ y − y ] = ⎡⎢
1 8.2 1.6 ⎤
S= ⎥
n −1 ⎣1.6 5.8⎦
u k (S − λk I ) = 0
on obtient les vecteurs propres associés à ces valeurs. Une fois que ces vecteurs ont été
normalisés ils deviennent les colonnes de la matrice U :
⎡ 0.8944 -0.4472⎤
U=⎢ ⎥
⎣-0.4472 0.8944 ⎦
Les valeurs ( yij − y ) sont les coordonnées de l’objet i par rapport aux différentes variables
centrées j alors que les valeurs u j1 correspondent aux « loadings » des variables sur les premiers
vecteurs propres. Le positionnement de tous les objets par rapport au nouveau système d’axes est
donné par la matrice F des variables transformées. Elle est appelée la matrice des composés scorés :
F = [ y − y ]U (Équation 32)
Ou U est la matrice des vecteurs propres et [ y− y ] est la matrice des observations centrées.
Les deux colonnes de la matrice des composés scorés constituent les coordonnées des 5 objets par
rapports au nouveaux axes principaux, il peuvent être utilisés pour les représenter graphiquement
respectivement par rapport aux axes principaux I et II.
y2 y2
(a) ( y2 − y2 ) (b)
( y1 − y1 )
y1
y1
y2 ( y2 − y2 ) (d)
II (c)
II
I ( y1 − y1 )
I
y1
Figure 63: Exemple des transformation appliquée lors d’une analyse en composantes principales.
(a) 5 objets sont représentés graphiquement par rapport aux variables y1 et y 2 . (b)
Après avoir centré les données, les objets sont alors représentés en respectant les axes
( y1 − y1 ) et ( y 2 − y 2 ) sous forme d’axes discontinus. (c) les objets sont décrits par
rapport aux axes principaux I et II. (d). Les deux systèmes d’axes peuvent être superposés
en effectuant une rotation des axes principaux.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 130
On peut vérifier dans cet exemple à deux variables que les objets sont positionnés dans un
système utilisant les composantes principales d’une même manière que le système original d’axe.
L’analyse en composante principale a seulement effectué une rotation des axes d’une manière telle que
les nouveaux axes correspondent aux deux composantes principales de la variabilité.
Lorsqu’il y a plus de deux variables, comme c’est souvent le cas dans le type de données
étudiées, l’analyse en composante principale effectue également une rotation du système des axes des
variables en plusieurs dimensions. Dans ce cas, les composantes principales I et II définissent le plan
permettant la représentation de la quantité la plus importante de la variance initiale. Les objets sont
projetés sur ce plan pour préserver, autant que possible, la distance euclidienne qu’ils avaient les uns
par rapport aux autres dans l’espace multidimensionnel formé par les descripteurs initiaux.
Les traitements statistiques ont été effectués sur S-PLUS® 2000 Professional Edition for
Windows et Pirouette 3.10 d’Infometrix. L’utilisation systématique des composantes principales est
effectuée dans l’environnement FileMaker Pro 5 pour Windows.
b) Calcul de la composante principale
I) L’héroïne
La première opération consiste à épurer la base des différents répliquats et entrées aberrantes.
Afin d’illustrer cette étape, on peut dire qu’une saisie est souvent composée de plusieurs échantillons.
La procédure d’analyse se déroule de la manière suivante : 3 prélèvements d’environ 8mg sont
préparés pour chaque échantillon d’une saisie. Chaque prélèvement est analysé 2 fois soit un total de 6
analyses par échantillon. Un prélèvement par saisie a été sélectionné afin d’éviter qu’un poids trop
important soit attribué aux saisies constituées de nombreux échantillons.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 131
La variance extraite par chaque composante principale est calculée: Le premier exemple
illustre les résultats obtenus avec les constituants majeurs effectués à l’aide du programme S-PLUS®
2000. Dans ce programme statistique les données sont centrées et réduites (xi = (xi - moyenne de x /
écart-type de x). L’unité de mesure n’a ainsi plus d’importance puisque les variables sont sans
dimension. Surtout cette métrique donne à chaque caractère la même importance, quelles que soient
les valeurs prises par ces dernières, en leur attribuant une variance de 1. Ainsi, prenons l’exemple de
l’acétylthébaol dont la valeur moyenne se situe bien au-dessous de celle de l’acétylcodéine, l’opération
décrite précédemment aura comme effet de rendre comparable des deux variables puisque les deux
distributions seront centrées en 0 avec une variance de 1.
Les différentes lignes illustrent les différentes étapes nécessaires pour calculer les
composantes principales.
> y<-scale(herototalepurZSCORE,center=T)
> bdata<-scale(y,center=T)
> p.objet2<-prcomp(bdata)
> v<-p.objet2$sdev^2
> round(v,2)
[1] 2.90 1.20 0.87 0.71 0.29 0.04
> round(100*v/sum(v),1)
[1] 48.3 20.1 14.5 11.8 4.8 0.6
> round(100*cumsum(v)/sum(v),1)
[1] 48.3 68.4 82.9 94.6 99.4 100.0
100
90
80
70
Pourcentage cumulé
60
50
40
30
20
10
0
0 1 2 3 4 5 6
Composante principale N°
Figure 64 : Pourcentage cumulé de la variance totale expliquée par les composantes principales des
constituants majeurs de l’héroïne.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 132
Les résultats présentés dans la Figure 64 ci-dessus montrent que la première composante
principale résume 48.3% de la variabilité contenues dans les données initiales. En utilisant la même
démarche on peut montrer qu’en utilisant une représentation en deux dimensions basée sur les deux
premières composantes principales, on obtient un système prenant en compte le 68.4% de la variabilité
des observations initiales. On peut donc conclure que les deux premières composantes principales
réduisent les observations initialement représentées dans un espace à six dimensions en un espace à
deux dimensions avec une perte d’information de 32.6% (100-68.4).
La même systématique de calcul a été effectuée pour les variables caractérisant les
constituants mineurs et les constituants inorganiques :
100
90
80
Pourcentage cumulé
70
60
50
40
30
20
10
0
0 2 4 6 8 10 12
Composantes principales N°
Figure 65 : Pourcentage cumulé de la variance totale expliquée par les différentes composantes
principales des constituants mineurs de l’héroïne.
Dans le cas des constituants mineurs, la première composante principale ″explique″ le 59.3%
de la variabilité des données de départ. La seconde composante principale ″explique″ quant à elle le
18.4%. Ensemble, elles représentent le 77.7% de la variabilité des variables initiales. Il est donc
possible de conclure que les deux premières composantes principales réduisent les observations
représentées en un espace à deux dimensions (initialement à 12) avec une perte d’information de
22.3% (100-77.7).
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 133
100
90
80
Pourcentage cumulé
70
60
50
40
30
20
10
0
0 1 2 3 4 5 6 7 8 9 10
Composantes principales N°
Figure 66 : Pourcentage cumulé de la variance totale expliquée par les composantes principales des
constituants inorganiques de l’héroïne.
100
90
80
Pourcentage cumulé
70
60
50
40
30
20
10
0
0 1 2 3 4 5 6 7
Composante principale N°
Figure 67: Pourcentage cumulé de la variance totale expliquée par les composantes principales des
constituants majeurs de la cocaïne.
Dans le cas présent, la combinaison des deux premières composantes principales permettent
d’obtenir une représentation des données initiales dans un espace à deux dimensions (initialement sept
avec une perte d’information de 32.6% (les variances cumulées des deux premières composantes
principales est de 67.4).
Différentes règles ont été édictées afin de décider du nombre de composantes à prendre en
considération, mais aucune d’entre elles ne fonctionne en toutes les circonstances. Un critère souvent
avancé consiste à sélectionner autant de composantes principales nécessaires pour expliquer le 80% de
la variance des données initiales. Néanmoins, ce critère nécessite souvent la sélection d’un nombre
important de composantes principales rendant ainsi caduque l’utilité première de l’analyse en
composante principale qui est de diminuer la dimension d’un problème spécifique.
Une autre manière de concevoir cette sélection consiste à écarter les composantes principales
expliquant une variance trop faible. Ainsi certains auteurs [Legendre P. et Legendre L., 1998]
proposent d’éliminer les composantes principales expliquant une variance de moins de 70/P ou P est le
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 135
nombre de variables utilisées pour caractériser un échantillon. Il est également possible d’utiliser le
seuil 100/P. Il existe également des variations des critères susmentionnés qui stipulent qu’il ne faut pas
prendre en compte les variations expliquant de petites proportions de la variance totale, les dernières
représentant simplement des variations aléatoires dans les données à disposition. En suivant ce concept
les composantes principales expliquant moins de 5% de la variance totale sont éliminées.
Les valeurs données dans le tableau ci-dessus montrent qu’il n’y a pas réellement de règles strictes
quant au choix du nombre de composantes principales à prendre en considération. Ce nombre dépend
de l’utilisation de ces dernières. Il ne faut pas oublier que l’analyse en composante principale est une
technique exploratoire et à ce titre le nombre de composantes principales sélectionné doit permettre
une analyse facilitée des données à disposition en mettant en évidence le comportement de ces
dernières (groupe de données, données aberrantes,…). Nous le verrons par la suite, nous choisirons de
retenir deux composantes pour effectuer notre premier tri.
> round(p.objet2$rotation,2)
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 0.34 0.13 -0.49 0.79 0.07 -0.01
[2,] 0.41 0.47 -0.10 -0.38 0.67 0.03
[3,] 0.27 0.15 0.86 0.39 0.07 0.01
[4,] 0.43 0.48 -0.05 -0.23 -0.73 -0.06
[5,] 0.49 -0.49 -0.02 -0.12 -0.06 0.71
[6,] 0.47 -0.52 0.01 -0.13 0.04 -0.70
Dans cet exemple, la première colonne contient les coefficients de la première composante
principale, la seconde colonne les coefficients de la seconde composante principale et ainsi de suite.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 136
et ainsi de suite.
Méconine : 2.4
Acétylcodéine : 4.5
Acétylthebaol : 1.2
6-Mono-acétylmorphine : 5.3
Noscapine : 3.4
Papavérine : 3.9
Est égale à :
Dans le cas présent, les deux premières composantes principales (expliquant 68.4% de la
variance des données initiales) ont été prises en compte pour effectuer un premier tri au sein de la base
de données. Le fait de s’être restreint à deux composantes peut être justifié de diverses manières. En
choisissant 2 composantes, on respecte le seuil généralement fixé par les statisticiens (critère de 100/P
du tableau du nombre de composantes à prendre en compte). Comme il ne faut pas perdre de vue que
la première approche visée en utilisant l’analyse en composante principale consiste à trier la structure
des données à disposition (le premier tri est ainsi basé sur 68.4% de la variabilité). Cette systématique
permet d’éliminer les échantillons n’ayant aucune similarité avec un nouveau candidat. La
visualisation de cette structure est possible et aisée, car la représentation est en deux dimensions. Il
faut également remarquer que les différentes composantes principales ne sont pas corrélées (cf. théorie
sur l’orthogonalité entre les différentes composantes principales). Dans notre cas la première
composante principale n’est donc pas corrélée avec la deuxième, il n’existe donc pas de redondance
quant à l’information apportée par ces deux mesures. Afin d’illustrer cette étape, six saisies réputées
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 137
différentes (ayant des profils chimiques différents) ont été sélectionnées. L’analyse de clustering
hiérarchique menée sur ces 6 saisies montre leurs différences.
Figure 68: Exemple de la répartition de 6 saisies d’héroïne réputées comme non liées à l’aide de la
méthode de clustering à l’aide du programme Infometrix®.
On a ensuite représenté ces saisies dans un espace à deux dimensions construit à l’aide de la
première et de la deuxième composante principale.
Groupe II 4 échantillons
Groupe IV 16 échantillons
Groupe V 3 échantillons
Groupe VI 4 échantillons
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 138
30
I
25
20
PC2
15
II
10
IV
VI
5 III
V
0
0 5 10 15 20 25 30 35 40
PC1
Figure 69 : Exemple de la répartition de 6 saisies d’héroïne réputées comme non liées à l’aide des
deux premières composantes principales.
On remarque aisément à l’aide du graphique ci-dessus, que l’utilisation des deux premières
composantes principales calculées à l’aide des constituants majeurs de l’héroïne permet de séparer ces
différentes saisies. L’idée de tri associée à cette méthode consiste à replacer un nouvel échantillon
dans l’espace ainsi créé et, selon sa position, de sélectionner les échantillons se situant dans son
environnement proche. Cela donne une hypothèse d’association qui peut ensuite être analysée plus
finement si nécessaire.
Les 3 techniques de classification utilisées ont permis de grouper les différentes saisies d’une
manière similaire. L’analyse en composante principale, telle que nous l’avons définie, convient donc
parfaitement pour classifier les saisies d’héroïne en classes.
Fort de ces constatations, cette technique de classification non-supervisée a été implantée au
sein de la base de donnée renfermant les résultats des analyses d’héroïne. Une automatisation a été
programmée sur FileMaker Pro 5® permettant d’effectuer un premier tri, sélectionnant ainsi les
candidats possédant un profil proche de celui du nouveau candidat. La mise en place de cette
systématique a pour but de diminuer le nombre d’échantillons que l’on va comparer par la suite deux à
deux avec la fonction cosinus. Il est vrai, qu’avec le nombre croissant d’échantillons se trouvant
stockés dans la base de données, il est important de pouvoir effectuer cette première sélection afin
d’accélérer le processus de comparaison et d’interprétation. La base de données présente une
architecture incluant un calcul automatique des deux premières composantes principales ainsi que la
sélection découlant de ces deux valeurs. Une page de cette base se présente comme suit :
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 140
Classe
chimique
Figure 71 : Exemple de l’architecture de la base de données héroïne avec les PC1 et PC2.
Le premier tri s’effectue par la sélection initiale des différents prélèvements de la saisie. Les
moyennes des PC1 et PC2 ainsi que leur écart type sont calculés. Enfin une recherche comprise entre
PC1moy ± 3*écart type et PC2moy ± 3*écart type (règle des 3 sigmas) permet d’effectuer le tri.
Il faut également tenir compte du fait qu’une saisie peut être composée d’échantillons qui ne
sont pas tous du même lot. Dans cette situation, il est nécessaire de séparer les différents lots et
d’effectuer une recherche pour chaque lot permettant ainsi parfois de lier des cas apparemment non
liés.
II) La Cocaïne
Les coefficients des différentes composantes principales sont calculés de la même manière que
pour l’héroïne. Le programme S-PLUS® offre la possibilité de calculer ces derniers :
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 141
> round(p.object$rotation,2)
[,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,] -0.50 -0.09 -0.16 0.18 -0.53 0.07 0.64
[2,] -0.51 -0.08 -0.12 0.09 -0.36 -0.01 -0.76
[3,] -0.46 -0.08 -0.14 0.49 0.72 -0.04 0.06
[4,] -0.27 0.15 0.95 0.04 -0.01 -0.06 0.03
[5,] -0.41 -0.25 -0.04 -0.83 0.26 -0.01 0.09
[6,] -0.14 0.67 -0.10 -0.12 0.08 0.71 -0.02
[7,] -0.13 0.67 -0.18 -0.11 -0.01 -0.70 0.05
Dans cet exemple, la première colonne contient les coefficients de la première composante
principale, la seconde colonne les coefficients de la seconde composante principale et ainsi de suite.
Dans le cas présent pour les analyses effectuées avec les constituants majeurs de la cocaïne, on
a choisi de prendre en compte les deux premières composantes principales (expliquant 76.3% de la
variance des données initiales) pour effectuer un premier tri au sein de la base de données. Pour
illustrer le potentiel de classification de ce système 6 saisies de cocaïne présentant des profils
chimiques ont été sélectionnées.
Groupe II 5 échantillons
Groupe III 8 échantillons
Groupe IV 10 échantillons
Groupe V 5 échantillons
Groupe VI 5 échantillons
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 142
Une analyse de clustering hiérarchique menée sur ces 6 saisies montre le caractère différent
(profil chimique) des 6 saisies prises en considération.
g00197.1b
g00197.3b
g00197.3c
g00196.4b
g99252.6b
g99252.6c
562575-1-1
638138.2-1A
638138.1-1A
638138.1-1B
g99222.10b
g99222.13b
g99222.14b
g99222.11b
g99222.10c
g99222.13a
g99222.12c
g99222.13c
g99222.14a
g99222.14c
671171.1-2
671171.1-1
671171.1-3
G
562575-1-1 C
N
562575-1-1
562575-1-1
Figure 72: Exemple de la répartition de 6 saisies de cocaïne réputées comme non liées à l’aide de la
méthode de clustering à l’aide du programme Infometrix®.
Ensuite, ces dernières ont été représentées selon leurs deux premières composantes
principales. Les résultats ont été observés :
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 143
1
Groupe III Groupe V
0.5
Groupe II
Groupe I Groupe IV 0
-0.5
PC1
-1
-1.5
-2 Groupe VI
-2.5
-3
-0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8
PC2
Figure 73: Exemple de la répartition de 6 saisies de cocaïne réputées comme non liées à l’aide des
deux premières composantes principales.
La Figure 73 met en évidence que les différentes saisies réputées non liées forment des
groupes séparés en représentant leurs deux premières composantes principales.
On a également effectué une analyse à l’aide de la fonction cosinus. Les résultats obtenus
confirment les classifications obtenues ci-dessus.
Les 3 techniques de classification utilisées ont permis de grouper les différentes saisies d’une
manière similaire. L’analyse en composante principale, telle que nous l’avons définie, convient donc
parfaitement pour classifier des échantillons de cocaïne.
Ce constat conforte notre analyse et les résultats comparables aux performances observées sur
l’héroïne, permettent une application aux saisies de cocaïne répertoriées dans la base FileMaker Pro®.
Il s’agit dans ce cas de transformer les coefficients des composantes principales en corrélation.
Les variables initiales ont été standardisées avant d’effectuer le calcul de la composante principale. Il
en résulte une situation où la variance totale est simplement le nombre de variables (P) et la proportion
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 144
de la variance expliquée par chaque composante principale est sa variance divisée par P. La corrélation
entre la ième composante principale Ci et la jème variable xj est :
1
rij = aij (VarCi ) 2
(Équation 33)
Tableau 17 : Analyse des composantes principales des constituants majeurs pour l’héroïne.
Dans le Tableau 17 la corrélation existant entre les variables initiales et les composantes
principales est recherchée. En utilisant l’équation 33 et en fixant l’indice de corrélation à 0.8 il est
possible de fixer un seuil (voir dernière ligne du tableau) permettant d’estimer la corrélation existante
entre les variables initiales et les composantes principales. Dans le cas qui nous occupe les valeurs qui
montrent une corrélation supérieure à 0.7 sont mises en exergue. On remarque que 4 variables initiales
sur 6 sont fortement corrélées avec la première composante principale. Ces corrélations sont positives.
La première composante principale peut être vue comme une représentation pondérée ou un résumé
des variables initiales.
II) La cocaïne
La mesure de la corrélation existante entre les coefficients utilisés pour construire les
composantes principales et les variables initiales est identique à celle obtenue pour l’héroïne. Le
tableau ci-dessous résume ces calculs.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 145
Variance de la composante principale (Ci) 4.058 1.893 0.398 0.291 0.253 0.070 0.042
0.8/(Ci) puissance ½ (cf. équation 34) 0.397 0.581 1.269 1.484 1.590 3.034 3.903
Tableau 18: Analyse des composantes principales des constituants majeurs de la cocaïne.
Dans le tableau ci-dessus la corrélation existant entre les variables initiales et les composantes
principales est recherchée. En utilisant l’équation 33 et en fixant l’indice de corrélation à 0.8 il est
possible de fixer un seuil (voir dernière ligne du tableau) permettant d’estimer la corrélation existant
entre les variables initiales et les composantes principales. Dans le cas qui nous occupe les valeurs qui
montrent une corrélation supérieure ou égale à 0.8 sont mises en évidence. 5 variables initiales sur 7
sont fortement corrélées avec la première composante principale. La première composante principale
peut être vue comme une représentation pondérée ou un résumé des cinq premiers constituants. La
seconde composante principale quant à elle représente un résumé de la proportion de Cis-
cinnamoylecgonine méthyl ester et de la Trans-cinnamoylecgonine méthyl ester.
0.5
0.45
Coefficient d'ACP pour chaque variable
0.4
0.35
1er variable
2ème variable
3ème variable
0.3 4ème variable
5ème variable
6ème variable
0.25
0.2
0.15
50 100 150 200 Base entière
Nombre d'analyses
0.6
0.4
Coefficient d'ACP pour chaque variable
0.2
0
2ème variable
3ème variable
4ème variable
5ème variable
-0.2 6ème variable
1er variable
-0.4
-0.6
50 100 150 200 Base entière
Nombre d'analyses
Figure 74: Evolution des coefficients de la première et de la deuxième composante principale dans le
temps (héroïne).
On remarque que les coefficients se stabilisent lorsqu’ils sont calculés avec un nombre de
saisies suffisantes (environ 100). Il semble donc qu’il ne soit pas nécessaire de modifier ces
coefficients dès qu’ils sont calculés avec un nombre statistiquement important d’échantillons.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 148
II) La cocaïne
L’estimation de la variabilité des coefficients pour la cocaïne a été estimée en les calculant
tous les 25 nouvelles saisies. Les résultats suivants ont pu être mis en évidences :
0.2
1er variable
2ème variable
0.1 3ème variable
4ème variable
Coefficient d'ACP pour chaque variable
5ème variable
0 6ème variable
7ème variable
-0.1
-0.2
-0.3
-0.4
-0.5
-0.6
25 50 75 100 Base entière
Nombre d'analyses
0.8
0.6
1er variable
Coefficient d'ACP pour chaque variable
2ème variable
3ème variable
0.4 4ème variable
5ème variable
6ème variable
7ème variable
0.2
-0.2
-0.4
25 50 75 100 Base entière
Nombre d'analyses
Figure 75: Evolution des coefficients de la première et deuxième composante principale dans le
temps (cocaïne).
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 149
On remarque comme pour l’héroïne que les coefficients se stabilisent lorsqu’ils sont calculés
avec un nombre de saisies suffisantes (environ 75). Il semble donc qu’il ne soit pas nécessaire de
modifier ces coefficients dès qu’ils sont calculés avec un nombre statistiquement important
d’échantillons.
40
cl17
cl6 cl16
30 cl4
cl3
cl15
PC1
20 cl20 cl2
cl9 cl18
cl19 cl10
cl14
cl12
10 cl11
0
-10 0 10 20 30
PC2
Figure 76: Représentation des différentes classes mise en évidence pour les saisies d’héroïne.
Dans la plupart des cas les classes sont bien définies sauf pour deux couples (classes 12 et 14
ainsi que 18 et 20) où les valeurs de leurs deux premières composantes principales se recoupent. Dans
ces cas le calcul de la troisième composante principale permet de les séparer. Ainsi dans notre
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 150
cl.11 cl.12 cl.14 cl.15 cl.16 cl.17 cl.18 cl.19 c.l2 cl.20 cl.3 cl.4 cl.6 cl.9
cl.11 100.00
cl.12 92.79 100.00
cl.14 62.31 59.10 100.00
cl.15 53.84 64.06 38.09 100.00
cl.16 53.47 78.14 41.05 70.05 100.00
cl.17 39.21 52.25 29.08 97.55 68.95 100.00
cl.18 64.32 78.37 44.21 96.53 83.98 92.32 100.00
cl.19 51.37 53.59 34.93 95.23 49.82 90.76 86.15 100.00
cl.2 75.36 92.64 50.52 79.65 93.80 72.93 92.26 64.36 100.00
cl.20 71.39 81.10 49.67 96.24 78.06 89.38 98.83 89.23 90.66 100.00
cl.3 66.14 85.97 43.52 83.66 95.74 79.66 94.62 67.28 98.72 91.33 100.00
cl.4 57.28 75.75 40.38 92.99 90.48 91.41 98.48 78.67 93.29 94.88 96.97 100.00
cl.6 52.83 75.65 36.67 82.57 97.05 82.15 92.47 63.80 94.10 86.74 97.74 97.20 100.00
cl.9 65.81 72.56 46.23 97.93 68.87 91.81 96.25 95.35 82.78 98.31 84.37 90.89 79.52 100.00
Tableau 19: Tableau des valeurs de corrélation obtenues pour les différentes classes d’échantillon
d’héroïne mises en évidence.
Ce tableau montre que les différentes classes dont les valeurs de corrélation ont été calculées à
partir des valeurs moyennes de chaque constituant majeur pris en considération se différencient les
unes des autres au niveau du seuil que l’on s’était fixé (99.5) même si les classes 18, 20 sont assez
proches.
Cette manière de procéder permet d’esquisser une approche de type supervisée puisque chaque
classe chimique est en quelque sorte modélisée par un échantillon représentatif de cette dernière. La
démarche est la suivante, lorsqu’un nouveau candidat doit être analysé, il est d’abord comparé à
l’ensemble des classes mises en évidence. Cela permet un gain de temps puisqu’on ne compare plus
les échantillons de la saisie à tous les échantillons de la base (+ de 5000 échantillons à ce jour). Une
proximité d’appartenance à une classe (cf. exemple suivant) est exprimée en pourcentage. Enfin les
échantillons de la nouvelle saisie sont comparés avec les échantillons des saisies appartenant au sous-
groupe le plus proche, déterminant une proximité qui permet d’évaluer un lien entre cette nouvelle
saisie et celles provenant de cas précédents.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 151
Exemple :
Une nouvelle saisie v01265 est constituée de 8 échantillons, 3 répliquats par échantillons
portent à 24 le nombre total d’analyses. Les 24 objets sont comparés avec les différents
sous-ensembles en utilisant la méthode du cosinus carré. Les valeurs moyennes du
cosinus carré sont calculées pour chaque comparaison avec un sous-ensemble. Les
résultats sont les suivants :
v01265
cl.9 99.90
cl.20 98.63
cl.15 98.11
cl.18 96.56
cl.19 95.24
cl.17 91.78
cl.4 91.12
cl.3 84.55
cl.2 83.12
cl.6 79.99
cl.12 73.03
cl.16 69.18
cl.11 66.27
cl.14 46.78
v01265
v01264 99.96
t00206 99.75
n01205 99.71
t00207 99.67
g01063 99.57
g00210.1a 99.31
g00339 99.30
G99207.20a 99.25
n01290.1a 99.23
Tableau 21: Valeurs de cosinus carré entre la nouvelle saisie v01265et les saisies appartenant à la
classe 9,
La saisie v01265 appartient donc bien à la classe 9. La démarche de comparaison est
grandement simplifiée puisque la sélection des échantillons proches du nouveau candidat
est très sélective.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 152
Néanmoins, la modélisation des différentes classes n’est pas optimale dans le prototype
présenté ci-dessus puisque cette dernière est représentée par une seule valeur. L’utilisation de
techniques dites supervisées est censée palier à ce problème.
La figure ci-dessous empruntée d’un exemple présenté dans Beebe [Beebe et al., 1998]
explique d’une manière assez claire le fonctionnement du SIMCA. Dans cet exemple la classe A est
représentée par une boîte tridimensionnelle, la classe B est représentée sur un plan alors que la classe
C sur une ligne. Ce concept peut être élargi à des dimensions plus grandes ou des « hyper cubes » sont
dessinés autour des données.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 153
A
Y
A
A
A
A
A A
A
C
A
C
B
B
X
B
C B
B B
Les limites des classes dans SIMCA sont fixées par les nouveaux systèmes d’axes calculés par
l’analyse en composantes principales. L’ACP définit l’orientation des boîtes en mesurant l’espace et
ses « limites » (voir ci-dessous) fixant les bords de la boîte. Pour calculer l’appartenance d’un inconnu
à une classe, SIMCA utilise une combinaison de la distance de cet inconnu au modèle ACP ainsi que
de sa distance aux « limites ». Ceci est illustré par la figure suivante pour la détermination de Y à la
classe C.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 154
a
c
C C
C C C
C C b
YACP
Modèle SIMCA
Limites de la classe « C »
• Contrôler à l’aide de techniques non supervisées (HCA ou ACP) pour tous les
échantillons que les différentes classes ne sont pas confondues.
• Utiliser les groupes d’entraînement pour générer les modèles SIMCA pour chaque
classe en notant les différents critères choisis (limites des boîtes multidimensionnelles,
nombre de composantes principales prises en compte,…).
• A l’aide des modèles définis plus haut prédire la classe des groupes tests.
• Si les résultats sont concluants, on valide le modèle, sinon on évalue les différents
critères ainsi que les groupes d’entraînement et de tests.
En reprenant les 6 saisies utilisées comme exemple dans les parties relatives à l’analyse en
composante principale et la fonction cosinus il est possible de montrer, en appliquant un modèle
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 155
SIMCA, que la différenciation entre saisies s’effectue de manière optimale. A noter dans la figure
suivante que les points noirs situés à proximité des différentes saisies, définissent l’espace (enveloppe)
occupé par les différentes classes. Ainsi un nouveau candidat est attribué à une classe existante si sa
localisation spatiale dans le modèle sélectionné est englobée dans l’enveloppe d’une des classes.
BE00021.D
BE00021.C
BE00021.B
PC3
BE00022.B
BE00022.A
BE00023.B
BE00024.C
BE00023.A
BE00022.C
BE00024.A
BE00022.D
BE00024.B
BE00025.A
BE00023.D
BE00025.C
BE00023.C
BE00025.D
BE00024.D
BE00025.B 96AGR31.B
96AGR31.D
96AGR31.C
96AGR31.A
PC1
96NED11.D
96NED11.C
96NED11.B
96NED11.A
196FR21.C
196FR22.D
196FR22.C
196FR21.B
196FR21.D
196FR22.B
196FR21.A
196FR22.A
t00161.1Ea
t00161.2Dc
t00161.1Bb
t00161.1Fb
t00161.1Fc
t00161.1Ca
t00161.1Fa
t00161.1Ac
t00161.1Dc
t00161.1Cc
t00161.2Cb
t00161.1Eb
t00161.2Ac PC2
t00161.1Cb
t00161.2Ea
t00161.1Bc
t00161.2Ab
t00161.2Ba
t00161.2Ec
t00161.1Ec
t00161.1Db
t00161.1Gct00161.1Da
t00161.2Eb
t00161.1Ga
t00161.2Db
t00161.1Ba
t00161.2Gb
t00161.1Gb
t00161.2Fa
t00161.2Fb
t00161.2Bc
t00161.2Fc
t00161.2Da
t00161.2Cc
t00161.2Bb
t00161.2Aa
t00161.2Gc
t00161.2Ga
t00161.2Ca
t00161.1Aa
t00161.1Ab
Figure 79 : Représentation dans un espace en trois dimensions de 6 saisies ayant des profils
différents. On remarque qu’il n’y a pas de recouvrement entre saisies.
d’entraînement et 1/3 échantillons tests. Par souci de facilitation de lecture des modèles, nous avons
séparé les classes en deux groupes et effectué un modèle pour chacun.
Le premier modèle regroupant les classes 11, 12, 14, 15, 16, 17, 18, 19 et le second les classes
2, 3, 4, 6, 9, 20. Les deux tableaux suivants résument le processus d’apprentissage nécessaire à
l’établissement des modèles :
Pred10 Pred11 Pred12 Pred14 Pred15 Pred16 Pred17 Pred18 Pred19
@2 @3 @3 @3 @2 @2 @2 @3 @2
Classe 10 15 0 0 0 0 0 0 0 0
Classe 11 0 18 0 0 0 0 0 0 0
Classe 12 0 1 32 0 0 0 0 0 0
Classe 14 0 0 0 12 0 0 0 0 0
Classe 15 0 0 0 0 20 0 0 0 0
Classe 16 0 0 0 0 0 65 0 0 0
Classe 17 0 0 0 0 0 0 66 6 0
Classe 18 0 0 0 0 0 0 0 6 0
Classe 19 0 0 0 0 0 0 0 0 61
Tableau 22: Tableau représentant le résultat de la classification des différents échantillons à leur
classe chimique respective selon le modèle SIMCA numéro 1. A noter que la classification
s’est effectuée correctement pour environ 98% des échantillons.
Le taux de classification correcte des différents échantillons selon leur appartenance respective
aux différentes classes chimiques avoisine les 97%. Ce résultat montre le potentiel de SIMCA à
modéliser ces dernières. Il est également intéressant de noter que le chiffre suivant le symbole @ à la
première colonne des deux tableaux indique le nombre de composantes principales prises en compte
pour modéliser les différentes classes. Ainsi la classe 10 est modélisée avec 2 composantes principales
et la classe 6 avec 3.
Les distances entre les différentes classes ont également été calculées afin d’estimer celles
présentant des risques de fausses classifications (faux positifs) vu la proximité respective de leurs
enveloppes. Les classes 18 et 17 ainsi que 9 et 4 semblent être proches les unes des autres vu que lors
du processus d’entraînement des fausses classifications sont apparues. Ces résultats indiquent que les
enveloppes de ces classes se recoupent. Les distances entre les différentes classes sont résumées dans
les deux tableaux ci-dessous :
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 157
Tableau 24 : Récapitulatif des distances entre les classes sélectionnées pour le modèle n°1.
Tableau 25: Récapitulatif des distances entre les classes sélectionnées pour le modèle n°2.
Le modèle 1 renferme des classes chimique proches comme la classe 11 et la 12, ainsi que la
15, la 18 et la 19. Quant aux problèmes de classification rencontrés entre les classes 18 et 17 ainsi que
9 et 4, elles peuvent trouver une explication dans le fait que leur distance respective est faible (3.7 et
2.2). Néanmoins, il est intéressant que cette problématique ne soit pas rencontrée pour toutes les
classes chimiques dont les distances respectives sont faibles. Afin de trouver une explication à ce
phénomène, il s’agit de prendre en considération une variable importante, à savoir la dispersion de ces
classes dans l’espace (volume occupé par l’enveloppe). En effet, en comparant deux classes chimiques
positionnées à la même distance d’une troisième, il semble raisonnable d’admettre que celle occupant
le plus grand volume dans l’espace ait plus de chance de chevaucher cette dernière.
8.5.4. Pouvoir discriminant des différentes variables utilisées pour créer le modèle
Le pouvoir de modélisation des différentes variables a été mesuré afin de déterminer celles
ayant peu ou pas d’influence quant à la modélisation de l’information contenue dans les différentes
classes chimiques du groupe d’entraînement. Les résultats synthétisés dans la figure suivante montrent
que pour les deux modèles la noscapine, la papavérine, la monoacétylmorphine ainsi que
l’acétylcodéine sont les variables ayant le plus grand pouvoir discriminant dans les modèles de
classification de l’héroïne mis en évidence.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 158
0.95
Pouvoir de modélisation
0.9
0.85
0.8
0.75
Meconin COD Thebaol MAM Pap Nosc
Variable
0.95
Pouvoir de modélisation
0.9
0.85
0.8
0.75
Meconin COD Thebaol MAM Pap Nosc
Variable
Figure 80: Pouvoir de modélisation pour les 6 variables et pour les deux modèles utilisés. A noter
que les variables apportant le plus d’informations sont la l’aétylcodéine (COD) la
papavérine (Pap) la noscapine (Nosc) et la 6-monoacétylmorphine (MAM).
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 159
Entraînement Entraînement Test correct (vrai Test incorrect Faux positif (%)
correct (%) incorrect (%) positif %) (faux négatif %) (test sur 300
601 échantillons 601 échantillons 163 échantillons 163 échantillons échantillons)
Modèle 1 97.7 2.3
Modèle 2 96.3 3.7
Ensemble
97.0 3.0 92.0 8.0 2.0
des modèles
Tableau 26 : Récapitulation des résultats obtenus avec le modèle SIMCA.
Le Tableau 26 montre que le modèle SIMCA mis en place donne de très bons résultats. Tant la
phase d’entraînement que la phase de test ont permis de valider cette méthode. De plus, avec un taux
de faux positif de 2%, on limite le nombre d’informations erronées que l’on va transmettre aux
organes d’enquête.
Neurones Neurones
cachées de sorties
x1 y1
1 1
Sorties
Entrées
x2 y2
2 2
x3 y3
…
…
Figure 81 : Architecture d’un MLP.
Brièvement les réseaux testés dans le cadre de ce travail fonctionnent de la manière suivante :
dans un premier temps toutes les variables d’entrées sont été normalisées et centrées. Cette opération
est importante puisqu’elle permet d’éviter que des entrées ayant des grandeurs très différentes soient
dominantes par rapport à celles ayant des valeurs plus petites. Ensuite, il s’agit d’effectuer la phase
d’apprentissage. Cette phase consiste à estimer les paramètres des neurones du réseau, afin que celui-
ci remplisse au mieux la tâche qui lui est affectée. Dans notre cas, les échantillons composant nos
différentes classes chimiques ont servi « d’exemples » afin d’entraîner le système à classifier
automatiquement de nouveaux échantillons. Les algorithmes utilisées dans la présentes recherche
(back propagation et conjugate gradient descent) sont présentés en détail dans les articles [Esseiva et
al., 2003b], [Casale et Watterson, 1993] et [Kingston, 1992].
8.6.2. Résultats
La phase d’apprentissage a été effectuée avec approximativement 1000 échantillons regroupés
en 20 classes chimiques. Les échantillons ont été divisés en un groupe d’entraînement (330 unités) et
un groupe de vérification (168 unités). Le groupe de vérification permet de contrôler que le réseau lors
de sa phase d’apprentissage ne souffre pas de surapprentissage (overlearning) [Bishop, 1995]. 60
échantillons supplémentaires appartenant aux 20 classes chimiques ont été utilisés comme échantillons
tests afin de valider la prédiction d’appartenance de ces derniers à l’une des 20 classes chimiques
respectives. De plus, 370 échantillons n’appartenant à aucune des 20 classes chimiques précitées ont
également introduits dans le réseau de « neurones optimal » afin de déterminer si ces derniers
produisent des faux positifs.
Réseaux Entraînement Entraînement Entraînement Test correct Test incorrect Test inconnu Faux positifs
correct (%) incorrect (%) inconnu (%) (%) (%) (%) (%)
MLP 6:35:20 98.68 0.00 1.32 88.14 3.39 8.47 1.88
MLP 6:23:20 98.95 0.26 0.79 91.53 1.69 6.78 51.08
MLP 6:22:20 97.63 0.53 1.84 88.14 3.39 8.47 35.48
MLP 6:20:20 97.63 0.79 1.58 72.88 3.39 23.73 19.35
RBF 6:120:20 97.38 0.40 2.20 83.05 16.95 0.00 5.01
RBF 6:116:20 96.78 0.40 2.81 84.74 15.26 0.00 5.30
RBF 6:126:20 96.58 0.40 3.01 83.05 1.69 15.25 5.60
RBF 6:121:20 97.38 0.60 2.00 96.61 1.69 1.69 4.12
Tableau 27 : Représentation des performances des 8 meilleurs réseaux de neurones mis en évidence par
le programme Trajan Neural Network Simulator 6®.
Comme présenté ci-dessus le réseau donnant les meilleures performances est un réseaux de
type RBF constitué de 6 entrées (les 6 constituants majeurs de l’héroïne), d’une couche cachées (121
noeuds) et de 20 sorties (les 20 classes chimiques). Ce réseau de neurones classifie correctement
97,4% des échantillons ainsi que 96,6% des échantillons tests. De plus, son taux de faux positifs est de
l’ordre de 4%, ce qui est acceptable dans l’optique opérationnelle présenté dans cette recherche.
L’architecture de ce réseau est représentée de la manière suivante :
Entrées (6 constituants
majeurs) Sorties
(20 classes
chimiques)
1 couche cachée
(121 noeuds)
8.6.3. Conclusions
L’utilisation des réseaux de neurones, en tant que méthodes statistiques supervisées pour la
classification des échantillons de produits stupéfiants, a été démontrée dans le cadre de ce travail.
Cette technique se rapproche de par sa philosophie à SIMCA. Cependant, l’avantage majeur de cette
technique consiste en la possibilité de traduction de l’algorithme neuronale de classification en code
C++. Cette fonctionnalité permet de créer un programme exécutable pouvant être implémenté sur
n’importe quel système. Cette démarche est intéressante d’un point de vue de l’harmonisation de
méthodes analytique entre laboratoires. En effet, si les laboratoires utilisent une méthode analytique
standardisée, il est envisageable de développer un site Internet sur lequel on pourrait tester
l’appartenance d’une saisie à une classe chimique existante. Un prototype a déjà été créé et évalué à
satisfaction.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 163
Nouvel
échantillon,
nouveau candidat
Stockage de
l’information dans
base de données
Utilisation de l’analyse en
composante principale (tri)
Sélection des
échantillons avec
profils « similaires »
Analyse de la sélection 2 à 2 à
l’aide de la fonction cosinus. Seuil
élevé, éviter les faux positifs
Si lien entre deux saisies mais pas de classe existante Si appartient à une classe existante
Figure 83 : Proposition d’une séquence d’analyse pour les échantillons de produits stupéfiants de
type héroïne et cocaïne.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 164
En résumé, la mise en place de la séquence d’analyse a été pensée dans l’optique de mettre à
disposition un outil permettant d’effectuer un travail de routine. Le choix de la technique d’analyse,
permettant premièrement d’obtenir des informations d’un bon niveau général (pureté de la substance
active, produit de coupage et profil chimique) en un temps minimum. Il en est de même pour le
traitement statistique où les diverses étapes ont été automatisées le plus possible et en essayant de
limiter au maximum le taux de faux positifs fournissant des informations erronées aux organes
d’enquête.
8.8. Conclusions
Le tri au sein de nos bases de données par composantes principales est efficace ainsi que nous
l’avons montré. Cette étape est importante puisque le nombre d’enregistrements est toujours plus
important. En effet, une comparaison deux à deux de toute la base de données à l’aide de la fonction
cosinus prendrait énormément de temps. En choisissant d’inclure cette possibilité de tri, une sélection
préliminaire regroupe les échantillons proches du nouveau candidat. En appliquant ce principe on
réduit grandement le nombre d’échantillons à comparer deux à deux (fonction cosinus) de même que
le temps et la complexité du processus. L’hypothèse 2.3 est alors confirmée.
Une autre utilité de cette étape réside dans la réduction numérique obtenue par la mesure des
composantes principales. En effet, un échantillon est caractérisé par le résultat de sa première et de sa
deuxième composante. Ainsi un nouveau candidat peut être rapidement classé en comparant ses
composantes principales avec un descripteur des séries présentes dans la base de données (ce
descripteur découlant également des premières et deuxièmes composantes principales de chaque
échantillon constituant la série). Cette manière de procéder implique l’attribution, à chaque série
présente dans les bases de données d’un identificateur sous la forme susmentionnée. Ceci permet de
donner une définition claire d’une série de manière rapide et simple. De plus, lorsqu’un échantillon est
attribué à une classe on peut systématiquement valider ce choix par la méthode SIMCA. Cette manière
de procéder correspond à celle proposée par Beebe [Beebe et al., 1998] (cf. Figure 59) qui, dans en
premier temps, utilise une technique de reconnaissance de groupes non supervisée donc sans préjuger
de l’appartenance de l’échantillon à une éventuelle classe chimique. Cette étape confirme l’hypothèse
2.4 quant au potentiel des méthodes supervisées à valider les liens établis lors de la phase d’analyses
non supervisées.
La méthodologie de mise en évidence des liens chimiques proposée dans le cadre de cette
recherche offre une systématique d’analyse rapide (choix d’une seule méthode analytique nécessitant
une préparation simple), fiable (faible taux de faux positifs et négatifs), peu coûteuse (méthode
analytique standard) et offrant une quantité et qualité d’informations (en une seule analyse, on obtient
des informations précises et utiles sur les constituants majeurs, sur la pureté de la substance active et
sur les produits de coupage) permettant une utilisation opérationnelle du prototype. Les liens mis en
évidence entre les différents échantillons de produits stupéfiants sont effectués à l’aide des constituants
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 165
majeurs de l’héroïne et de la cocaïne. Ces données permettent de relier ces échantillons quant et de
formuler des hypothèses raisonnable et pertinentes quant à l’organisation du trafic.
Les problèmes relatifs à l’interprétation de ces liens et à leur utilisation opérationnelle
constituent un problème difficile abordé dans la phase suivante de notre recherche.
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 166
La diffusion de l’information concernant les liens chimiques mis en évidence par le procédé
décrit auparavant est une étape cruciale nécessitant une gestion rationnelle et cohérente de ceux-ci.
Elle est avantageusement mise en œuvre par l'utilisation de logiciels informatiques spécialement
conçus pour gérer (Ibase®) et représenter (Analyst Notebook® et Case Notebook®) ce genre de
données qui permettent ensuite de communiquer par l'intermédiaire d'un système de transmission
sécurisé (de l'IPS ne partent que des données non sensibles, complétées par la police, selon les besoins,
avec des informations sur les personnes) et rapide (courrier électronique crypté).
Chaque échantillon est entré dans la base de données en spécifiant le type de produit
rencontré, sa pureté, ses produits de coupage ainsi que la classe chimique (entité regroupant des
échantillons ayant un même profil chimique) à laquelle il appartient :
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 168
Figure 84 : Exemple d’une page de la base de donnée IBase® adoptée pour les échantillons.
L’échantillon est l’unité centrale de la gestion des liens, il constitue le niveau fondamental. De
ce niveau fondamental se dégage un niveau général défini par l’appartenance de l’échantillon à une
saisie (données circonstancielles) et son appartenance à une classe chimique (donnée analytique,
chimique). Les classes chimiques sont liées directement avec les échantillons d’une saisie et non avec
cette dernière. En effet, une saisie peut être constituée d’échantillons ayant des profils chimiques
différents (plusieurs groupes) pouvant être liés à des classes différentes (cf. saisie C dans figure 2). Le
schéma ci-après illustre ce qui précède.
Figure 85 : Schématisation de la construction des liens. La saisie C est constituée de 2 groupes. Les
échantillons C1, C2, C3 et C4, C5 ont des profils chimiques différents puisque le premier
groupe appartient à la classe chimique N°1 et le second à la classe chimique N°2.
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 169
Une autre entité répertoriée est la saisie. Le masque servant à entrer les informations est le
suivant :
Figure 86: Exemple d’une page de la base de donnée IBase® adoptée pour les saisies.
Les informations enregistrées au sujet des saisies, sont, entres autre, le nom de cette dernière,
sa référence police, sa date et son lieu de saisie.
Enfin la dernière entité représentée concerne les différentes classes chimiques mises en
évidence au sein de la base de données.
Figure 87 : Exemple d’une page de la base de donnée IBase® adoptée pour les classes chimiques.
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 170
Les informations relatives aux classes chimiques concernent principalement les noms donnés à
ces dernières.
A ce stade, il est important de préciser la notion de classe chimique qui est essentielle dans le
cadre de ce travail. En effet, la classe chimique est une dénomination subjective se basant sur des
critères statistiques. Elle informe que deux saisies de produits stupéfiants possèdent un degré de
similitudes répondant aux seuils fixés par le scientifique (voir chapitres précédents). En aucun cas
cette notion donne des renseignements sur l’origine du stupéfiant, sur l’appartenance de saisies à un
même lot de production ou de distribution. Seul la mise en commun de cette notion mathématique
avec les informations policières connexes devrait permettre d’effectuer une interprétation plus
approfondie des liens mis en évidences.
Figure 88 : Exemple de l’information mise en évidence par l’Analyst Notebook® et transmise au cas
par cas aux enquêteurs.
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 171
La figure ci-dessus présente un exemple où tous les liens relatifs à une classe chimique ont été
développés et organisés en fonctions de leur niveau d’information. On retrouve en vert les liens
chimiques de classes, en rouge les liens indiqua qu’un échantillon appartient à une saisie (information
circonstancielle) et enfin en bleu (un rectangle bleu délimitant au sein d’une classe les échantillons
adultérés de manière identique) les liens relatifs au coupage qui sont des informations permettant
d’émettre des hypothèses quant au niveau du trafic (réseau de distribution).
Il est également possible de représenter les saisies de manière chronologique à l'aide de Case
Notebook®. Cette vision nous permet d'apprécier le taux d'activité d'une filière de manière temporelle.
Prenons un exemple réel regroupant 6 classes chimiques interconnectées (par exemple par une
saisie possédant des échantillons appartenant à deux classes chimiques distinctes) les unes aux autres
que nous avons présentées de cette façon.
La figure 87 montre le début de la série. La première classe chimique à apparaître est la classe
9 dont la première saisie est datée du 24 août 1999. Suivent ensuite la classe chimique 10 et la classe
chimique 2 débutant respectivement le 1er septembre 1999 et le 26 octobre 1999. Il est important de
préciser que lorsqu’une boîte représentant une saisie est relié à deux classes chimique cette dernière
est composée d’échantillons possédant deux profils chimiques différents (cf. saisie 99235 de la Figure
89 qui possède des échantillons rattachés aux classes chimiques 2 et 3 ).
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 172
La notion de lot est définie dans le cas présent comme une quantité de stupéfiant regroupée à
un temps t en une seule matrice dont le profil chimique des traces est similaire. L’appartenance à un
même lot peut donc fournir une information relative à un laboratoire, si ce dernier produit un lot de X
kilos qui est par la suite distribué dans la rue, ou à un grossiste s’il crée son propre produit en
mélangeant des lots d’héroïne acquis auprès de divers laboratoires (voir en détail par la suite).
Afin d’expliciter cette hypothèse de l’unicité chimique d’un lot, on part du principe que la
fabrication d’un lot d’héroïne ou de cocaïne produit des quantités comprises entre 5 et 10 kilogrammes
ainsi que montré par Guéniat [Guéniat 2001]. Aucune donnée précise n’est actuellement disponible
mais il semble raisonnable d’admettre que cette estimation est proche de la réalité puisque cette
transformation s’effectue dans des laboratoires clandestins qui, principalement par mesure de
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 174
discrétion, ne disposent pas d’une infrastructure permettant de traiter en une seule fois des dizaines,
voire des centaines de kilogrammes de morphine ou de coca. Ainsi, chaque lot produit dans un
laboratoire, traité avec la même méthodologie de fabrication d’héroïne, possède un profil chimique
propre dépendant de facteurs influençant de manière drastique le produit final. Ces facteurs sont, d’une
part, la matière première (pavot ou feuilles de coca) dont la composition peut varier fortement, les
produits chimiques entrant dans le processus de purification/extraction tels que les solvants et les
réactifs oxydants et réducteurs qui sont souvent de qualité inégale et réutilisés le plus souvent possible
pour réduire les frais. D’autre part, les recettes utilisées afin d’extraire les différents alcaloïdes sont
souvent empiriques et rarement standardisées. Les temps de réactions ainsi que les quantités de
réactifs/solvants utilisés peuvent varier fortement d’une extraction à l’autre. Les proportions des
différents constituants utilisés pour le profilage du stupéfiant étant dépendantes de telles conditions, il
est raisonnable de considérer que chaque lot préparé est différent. Ceci est confirmé par la recherche
menée par Aalberg et ses collaborateurs [Aalberg et al., 2001]) où il a été montré que l’obtention de
lots de production d’amphétamines ayant des profils chimiques similaires nécessitait une
standardisation stricte des diverses phases de synthèses.
Cependant, il a été démontré que certaines classes chimiques (donc un profil chimique
spécifique) se retrouvent sur le marché pendant presque 3 ans. Ceci implique que des dizaines de
kilogrammes de cette héroïne aient été vendus dans toute la Suisse (lien entre différents cantons).
Cette valeur sous-estime encore la production réelle puisque nous n’avons qu’une vision reflétant
l’action policière (ce que la police saisit) et non une vision globale du marché. Deux hypothèses
pouvant expliquer ces observations peuvent être émises. La première consiste à imaginer que les
trafiquants rassemblent et mélangent les différents lots d’héroïne qu’ils reçoivent de leurs fournisseurs.
Ce faisant, ils créent une nouvelle entité d’héroïne de grande taille ayant des caractéristiques
chimiques similaires (voir chapitre 3 § 3 où il a été montré qu’en mélangeant deux héroïnes ayant un
profil X et Y, on obtient une héroïne Z ayant un profil différent). Par la suite, ce stock est conditionné
pour la vente et expédié vers les différents marchés. Cette manière de faire a été observée en Australie
où des volumes importants (des centaines de kilogrammes) d’héroïne possédant des caractéristiques
chimiques similaires ont été saisis par la police fédérale [Anglada et al., 2002]. Cette notion de stock a
déjà été évoquée suite au décret du Molah Omar chef des Talibans interdisant la culture du pavot en
Afghanistan. Ce décret a fait chuter de près de 95% la production de pavot mais cette diminution n’a
pas été ressentie sur l’offre d’héroïne ainsi que sur son prix. Il est donc raisonnable de penser que la
demande en produit stupéfiant ait pu être remplie par les stocks existants.
réseaux d’alimentation. Dès lors toutes les conditions sont réunies pour obtenir des profils chimiques
peu variables. Cette seconde hypothèse semble être la plus probable car, vu la consommation
importante d’héroïne en Suisse (en estimant le nombre de toxicomanes en Suisse (env. 10000) ainsi
que leur consommation quotidienne (env. 1gr.), il est possible d’évaluer à une dizaine de kilos la
consommation d’héroïne par jour), il est peu imaginable que des stocks avoisinant la tonne soit
constitués par mélanges de centaines de lots de production.
Finalement, peu importe quelle hypothèse est la privilégiée, l’existence sur le marché de de
profils chimiques présents sur une longue période donne au profilage sa raison d’être. Sans cette
persistance dans le temps, les liens seraient moins fréquents du fait de la disparition rapide des classes
chimiques du marché.
que la drogue entrant par le Tessin approvisionne Berne et Zurich qui sont avec Bâle, les principaux
centres de stockage de produits stupéfiants. Dès lors, il paraît essentiel d’étendre la vision actuelle
pour obtenir une évaluation plus pertinente de la taille et de la dynamique du marché suisse. La mise
en place d’une entité en charge de récolter cette information et possédant une vision plus générale,
plus globale des connexions pouvant intervenir entre les différentes affaires est selon nous une
condition nécessaire au succès d’une telle entreprise. Cette entité, à la manière du CICOP (Concept
Intercantonal de Coordination Opérationnel et Préventif) au niveau des cambriolages, aurait la tâche
de gérer ces informations en redistribuant aux différents organes judiciaires concernés la synthèse
effectuée.
La principale pierre d’achoppement à la mise en place d’un tel processus consiste à trouver les
interlocuteurs adéquats pour gérer et interpréter cette nouvelle information. Bien que destinée aux
enquêteurs des brigades stupéfiants, il semble utopique de demander à ces derniers de gérer ces
données. Ceci pour deux raisons principales : la première relève d’un point de vue purement pratique
qui découle de la charge de travail importante qui incombe déjà aux investigateurs et la seconde du fait
de la complexité de cette information. Cette complexité nécessite une formation spécifique ainsi que
du temps afin d’extraire tout le potentiel de ce nouvel outil.
Idéalement la création d’une entité fonctionnant à la manière d’une cellule d’analyse
criminelle qui centralise, analyse et redistribue l’information serait souhaitable. Elle devrait permettre
d’émettre des hypothèses relatives à la structure des associations criminelles et d’en expliquer les
relations. En adoptant une logique abductive (dépassent les simples faits), en émettant certaines
hypothèses de travail fondées sur les informations récoltées et traitées dans un cas particulier ainsi que
sur les enseignements récoltés lors d’anciennes enquêtes, elle devrait permettre l’utilisation rationnelle
de ces données.
Actuellement, la notion de lien chimique et son utilité au sein des corps de police n’ont pas
encore été évaluées. Il serait intéressant de confronter les liens mis en évidence ainsi que leurs
structures avec les relations faites par les enquêteurs et d’estimer l’apport de ces liens s’ils avaient été
transmis à l’enquêteur pendant l’affaire en cours. Pour ce faire, il est nécessaire d’effectuer une
analyse rétrospective afin de déterminer qu’elles hypothèses auraient pu être émises et quels critères
permettent de les émettre.
Ainsi le schéma de gestion et d’interprétation des liens peut être représenté de la manière
suivante :
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 178
Formulation d’hypothèses
ACTION
Figure 95 : Schéma de gestion et d’interprétation des liens chimiques.
En résumé, les différents liens gérés dans IBase® fournissent une vision actualisée de
l’évolution du marché de distribution des produits stupéfiants cibles de la police. Ainsi, lors de la mise
en évidence de l’activité d’un réseau de distribution, représentée par une classe d’échantillons, il est
possible d’effectuer des liens entre différentes saisies et, par extension et prudence, aux personnes
impliquées dans les saisies de produits stupéfiants et par conséquent d’obtenir une représentation aussi
proche et complète que possible de la situation réelle. La démarche visant à gérer des liens entre des
saisies de stupéfiants permet aux forces de police de fixer des priorités sur les actions à mener dans le
temps et dans l'espace, de même que de fournir une information consolidée de l’étendue du réseau lors
d’une arrestation. Tout cela est vrai à la condition que l’information de lien chimique soit obtenue en
temps réel ! Cela n’est de loin pas facilement acquis vu le nombre d’échantillons à analyser.
Il s’agit d’un trafic de cocaïne entre la Suisse et la Bolivie traité par la brigade des stupéfiants
de Lausanne. Cette affaire a montré que les saisies XXX et YYY, faites sur des passeurs de cocaïne en
provenance de la Bolivie, possédaient un profil chimique similaire. Ces deux saisies ont également pu
être reliées à la saisie ZZZ, cette dernière étant chimiquement indifférentiable des deux autres. Cette
information a été fournie aux enquêteurs qui ont déterminé que les personnes transportant les saisies
XXX et YYY étaient payées par ZZZ en tant que « mules » pour alimenter ce dernier en cocaïne. Dans
ce cas précis, le lien chimique confirmé par les données d’enquête, a apporté une information
importante à la police en l’aiguillant sur le commanditaire de ces deux livraisons. De plus, un autre
lien intéressant a été mis en évidence avec la saisie AAA effectuée sur une personne de nationalité
bolivienne ayant résidé en Suisse. Cette information a été exploitée par les enquêteurs qui ont pu
déterminer que AAA avait fourni de la cocaïne à ZZZ en 1999 lorsque ce dernier était en rupture de
stock (à nouveau des liens ont été mis en évidence à plus d’une année et demie d’intervalle confortant
l’idée d’existence de stock). Cet exemple démontre clairement l’utilité opérationnelle des liens
chimiques qui ont permis de mettre en évidence des relations qui ne l’auraient pas nécessairement été
par l’enquête. De plus, un nombre important d’informations non traitées est encore disponible. Ainsi,
des relations avec des cas genevois ont été mises en évidence et mériteraient d’être approfondies, de
même que toutes les informations traditionnelles de police.
Producteur /
laboratoire Trafiquant Grossiste Vendeur Utilisateur
Grossiste 1 Grossiste 2
Organisation 1 Organisation 2
Figure 98 : Exemple d’une structure simple ou un laboratoire fournit des stupéfiants à un grossiste
qui alimente deux organisations différentes.
La figure suivante représente la division d’un lot d’héroïne qui est distribué à plusieurs
revendeurs. Dans ce cas de figure, le laboratoire 1 a divisé un lot en deux parties qu’il a distribuées à
deux revendeurs différents. Le lien chimique ne se situe donc plus au niveau du grossiste mais du
laboratoire. Le fait que deux organisations vendent un stupéfiant ayant les mêmes caractéristiques
chimiques n’implique pas que ces dernières appartiennent à un même réseau de distribution, mais
plutôt, dans cet exemple-ci, qu’elles ont un même réseau d’approvisionnement.
INTERPRÉTATION ET GESTION DES LIENS 183
Grossite1 Grossiste 2
Organisation 1 Organisation 2
Figure 99 : Exemple d’une structure simple ou un laboratoire fournit des stupéfiants à deux
grossistes différents qui alimentent deux organisations différentes.
Grossiste 2
Grossiste 1
Organisation 1 Organisation 2
Figure 100 : Exemple d’un grossiste qui mélange des lots d’héroïne provenant de deux laboratoires ou
de deux lots différents.
La situation se complique encore (voir Figure 100) dans le cas où un mélange de lots
différents est réalisé pour créer un nouveau lot d’héroïne ayant un profil chimique spécifique. Cette
opération peut se faire à divers niveaux, à savoir au lieu même de production en rassemblant la totalité
de la production journalière, ou au niveau du grossiste qui regroupe l’héroïne qu’il a reçue de plusieurs
fournisseurs. Dans ce contexte, la classe peut relier des saisies à un lieu de fabrication ainsi qu'un
réseau de distribution.
INTERPRÉTATION ET GESTION DES LIENS 184
Pour illustrer cette problématique, un schéma de distribution simple a été choisi, mais la réalité
est vraisemblablement plus complexe, avec une multiplication des intermédiaires, brouillant ainsi les
pistes et augmentant les possibilités et la complexité de l’interprétation. Le point crucial de la
transmission d’information aux policiers consiste à rendre ces derniers attentifs au fait que si deux
personnes sont arrêtées avec un produit stupéfiant ayant les mêmes caractéristiques chimiques cela ne
signifie pas nécessairement qu’il y ait un lien entre elles; il faut plutôt les informer qu'il existe un lien
au niveau de la filière. Le degré de participation de ces personnes ainsi que leur « rôle » au sein de
l'organisation doivent être définis à l'aide des informations policières (rétroactifs, renseignements,
brigade d'observation).
9.2. Conclusions
Ce chapitre a permis de valider l’hypothèse 3 relative à l’utilisation des programmes de type
IBase®, Analyst Notebook® et Case Notebook® pour la visualisation des liens chimiques. Comme
démontré ci-dessus sans l’aide de ces outils, il est illusoire de vouloir transmettre et intégrer cette
information de manière opérationnelle dans le processus d’investigation. De même l’hypothèse 4
concernant le potentiel de la mise en commun des liens chimiques avec les informations traditionnelles
de police a également été partiellement confirmée en montrant leur utilité dans des cas réels.
Néanmoins, il reste un travail important à effectuer concernant une intégration plus systématique basée
sur une interprétation des schémas de liens mis en évidence permettant d’émettre des hypothèses quant
à l’organisation d’un réseau de distribution.
185
DISCUSSION GÉNÉRALE DES RÉSULTATS 186
10.1. Introduction
Cette recherche s’insère dans la continuité de celle menée par Guéniat [Guéniat 2001]. Ce
dernier avait traité les problématiques liées au profilage de l’héroïne et de la cocaïne. Il avait
notamment abordé de manière détaillée les différentes méthodes analytiques permettant d’établir un
profil chimique ainsi que la conceptualisation et l’interprétation des liens chimiques. Ce travail
reprend certaines de ces notions en poursuivant les pistes de recherche mises en évidence.
Le but principal du présent travail consistait à mettre sur pied un outil rapide et efficace
permettant d’effectuer le profilage des saisies de produits stupéfiants de type héroïne et cocaïne. Il
s’agissait de valider les choix effectués et de s’assurer que les directions prises permettaient de
minimiser les faux positifs et faux négatifs au niveau des liens chimiques. La gestion de ces derniers
ainsi que leur intégration dans une optique d’analyse criminelle opérationnelle ont également été
abordés. Ces différentes étapes vont être discutées dans les paragraphes suivants.
montré que 60% de l’information véhiculée par les variables inorganiques était contenue dans les
variables des constituants majeurs. Ce pourcentage baissait à environ 40% pour les constituants
mineurs. On remarque qu’en choisissant de n’utiliser qu’une seule méthode analytique, on perd
sciemment de l’information. Cependant, cette perte est acceptable en regard des avantages évidents
énoncés précédemment et dans une optique opérationnelle.
Actuellement, la tendance des recherches documentées dans les journaux spécialisés est
principalement axée sur le développement de nouvelles techniques analytiques de plus en plus
poussées alors que peu de réflexion n’est entamée sur leur potentiel d’utilisation et d’insertion dans un
processus de profilage. Cette démarche s’explique par une optique de procédure accusatoire
(principalement en vigueur dans les pays anglo-saxon) où les résultats des expertises de produits
stupéfiants sont souvent sujets à contre-expertise ou à être défendus devant un tribunal. La pseudo
parade mise en place par les différents laboratoires mandatés pour ce genre de travail a souvent été de
multiplier le nombre de méthodes analytiques utilisées pour le profilage afin de « jeter de la poudre au
yeux » des avocats et des juges. Cependant, comme l’a montré notre étude, il est à notre sens plus
judicieux d’évaluer l’apport d’une nouvelle méthode analytique au processus de profilage en place en
terme d’information apportée, de corrélation avec les méthodes déjà en place ainsi que du coût en
argent et en temps engendré par cette dernière. Au stade actuel de nos recherches, cette surenchère
analytique n’a pas montré de réels avantages par rapport à la systématique proposée dans ce travail.
L’intérêt du profilage de produits stupéfiants se trouve principalement dans son intégration
opérationnelle ou du moins dans l’évaluation de son potentiel informatif. Cette phase, plus complexe,
a jusqu’à présent fort peu été discutée. L’intégration de cette connaissance à un niveau opérationnel
passe obligatoirement par le développement d’une collaboration avec les personnes auxquelles les
résultats sont destinés. Il s’agit de créer un besoin en montrant l’utilité d’une telle démarche. Ce travail
est souvent fastidieux et les résultats concrets prennent du temps à se manifester et à être reconnus.
Néanmoins, cette direction est sans doute celle à adopter, sinon le profilage de produits stupéfiants n’a
pas réellement de raison d’être à un niveau forensique ; il ne servirait qu’à fournir des résultats
d’analyse au cas par cas (demande spécifique d’un juge) et l’aspect d’analyse criminelle serait négligé.
Cela revient à une pure routine ne nécessitant pas d’apport intellectuel ajouté.
Cependant, il faut être conscient que le choix de cette méthode s’est basé sur la forme
chimique des produits stupéfiants saisis en Suisse et pourrait être adaptée si la qualité du produit
entrant dans notre pays venait à changer. Par exemple la quasi totalité de l’héroïne saisie en Suisse se
trouve sous sa forme basique riche en éléments en trace. Par contre, en analysant de l’héroïne saisie en
Australie, il s’est avéré que cette dernière était sous forme de sel hydrochloré pauvre en traces; seuls
l’acétylcodéine, l’acétylthébaol et la 6-mono-acétylmorphine étaient présents. Cette différence est due
à la méthode de fabrication où les divers processus de purification et de transformation en sel
hydrochloré éliminent la papavérine, la noscapine et la méconine. Une recherche a été effectuée en
appliquant la méthode des constituants majeurs à des échantillons d’héroïne hydrochlorée. Bien que
seulement trois constituants étaient présents, il a été possible de mettre en évidence des liens
DISCUSSION GÉNÉRALE DES RÉSULTATS 189
chimiques. Il serait donc intéressant de confronter cette méthode avec celle utilisée en routine pour ce
genre d’échantillons, à savoir la méthode des constituants mineurs. S’il est possible de prouver que les
liens mis en évidence pour des échantillons d’héroïne hydrochlorée par la méthode des constituants
mineurs le sont aussi par la méthodes des constituants majeurs, alors il serait tout à fait envisageable
de n’utiliser que la méthode la plus simple et la plus informative (cette dernière est déjà utilisée en
routine à des fins d’analyse stratégique pour la détermination de la provenance géographique d’un
échantillon d’héroïne).
Le cadre étant fixé, des simulations ont été effectuées et la fonction cosinus s’est montrée
comme la plus adaptée puisque cette dernière présente un taux de faux positifs inférieur à 1%.
Chacune de ces méthodes nécessite l’utilisation de seuils permettant à l’utilisateur de déterminer si
deux échantillons sont liés ou non. Dans cette recherche, ces limites ont été fixées empiriquement.
Ainsi des séries de saisies de grande taille (par exemple une saisie de 500 gr.) ou composées de
plusieurs échantillons (plusieurs minigrip®) ont été analysées. Plusieurs prélèvements ont été
effectués et analysés au sein de ces dernières. Les diverses valeurs obtenues ont permis de fixer un
seuil au-dessus duquel on considère les échantillons comme liés et au-dessous duquel ils ne le sont
plus. On a en quelque sorte calculé une variabilité intra-saisie et lors du processus de comparaison de
deux échantillons, on détermine si la valeur obtenue pour ces échantillons se situe au-dessus ou au-
dessous du critère décisionnel fixé.
Néanmoins ce seuil pose un problème connu sous le nom de « fall of the cliff effect ». En
effet, lorsqu’une valeur de comparaison se situe à la limite il devient alors difficile de se prononcer. La
DISCUSSION GÉNÉRALE DES RÉSULTATS 190
littérature propose une manière élégante de répondre à cette problématique consistant à utiliser une
approche continue dite probabiliste. L’utilisation de cette approche a été validée dans une recherche
menée à l’IPS [Dujourdy et al., 2003]. Afin de déterminer si deux saisies sont liées entre elles, on
calcule un rapport de vraisemblance connu sous la locution anglaise Likelihood Ratio (LR). Ce LR
représente en fait le rapport entre deux hypothèses concurrentes. Il calcule le poids entre la probabilité
que les deux saisies soient liées si elles le sont vraiment et la probabilité inverse à savoir la valeur de
probabilité si elles ne le sont pas. Le dénominateur est calculé en estimant la probabilité d’observer la
fréquence de corrélation (le C de la fonction cosinus) obtenue par la comparaison entre deux saisies si
elles sont réellement liées (l’estimation s’effectue en calculant la probabilité d’observer cette valeur de
corrélation dans la population des valeurs de corrélation obtenues en comparant les échantillons
constituants une des deux saisies). Le numérateur s’obtient quant à lui en estimant la probabilité
d’observer la fréquence de corrélation obtenue par la comparaison entre les deux saisies si elles ne
sont pas liées (l’estimation s’effectue en calculant la probabilité d’observer cette valeur dans une
population de valeurs de corrélation obtenues entre saisies non liées). Il faut remarquer que cette
approche bien qu’étant considérée comme continue souffre également du syndrome « fall of the cliff
effect ». En effet, divers auteurs ont proposé l’utilisation d’une échelle verbale pour qualifier la nature
du lien. En ce faisant on retombe également dans le même travers rencontré avec les fonctions
standards de mesures de distances ou de corrélations entre deux chromatogrammes. Si l’on définit par
exemple qu’une valeur de LR comprise entre 10 et 100 soutient l’hypothèse que deux saisies sont liées
ou qu’au dessous de 1 les échantillons ne sont plus liés, il est difficile de conclure lorsque l’on est
confronté à une valeur de LR de 9.8 ou de 0.9. On se retrouve donc confronté à la même situation ou
l’approche choisie aide l’expert à réfléchir sur la valeur des indices à disposition. Cependant, dans le
cadre de cette recherche, la priorité n’a pas été donnée à la comparaison d’échantillons au cas par cas
dans une perspective probatoire, mais plutôt de fournir un outil de travail et d’analyse supplémentaire
et complémentaire aux forces d’enquête.
subséquent avec la fonction cosinus (comparaison deux à deux) s’en trouvent alors grandement
diminués.
Un autre élément fort intéressant a été mis en évidence lors de cette recherche concernant la
matrice même du produit stupéfiant. En effet, lors d’une étude menée sur les diverses fractions
présentes dans une saisie d’héroïne (cf. Annexe 5) il a été montré que les proportions en constituants
majeurs peuvent varier considérablement selon la fraction étudiée (pour rappel, chaque fraction était
séparée par un crible dont les mailles ont des dimensions connues). Ces résultats montrent que le
stupéfiant saisi par la police n’est pas une substance homogène. Ceci est explicable, d’une part, par la
fabrication de ces stupéfiants et, d’autre part, par le conditionnement du produit final (pain, bloc,
d’héroïne ou de cocaïne) prêt à la distribution. La fabrication est artisanale et/ou sans application de
critères stricts comme il peut être observé en milieu industriel licite. Comme nous l’avons vu
précédemment, les trafiquants et/ou les grossistes concentrent vraisemblablement en un moment donné
des quantités de produits stupéfiants importantes qu’ils devront conditionner par la suite. Cette
substance, la plupart du temps sous forme pulvérulente, ne possède pas toujours les mêmes propriétés
physiques (poudre plus ou moins fine ou grossière). Il est donc probable que lors de la préparation des
lots de 0.5 à 1 kilo, la matrice utilisée ne soit pas totalement homogène et soit constituée de différents
gradients, comme nous l’avons observé. Ces constations sont importantes du point de vue du profilage
de produits stupéfiant, puisqu’elles influent directement sur l’intra-variabilité des produits analysés. Il
est donc important de prendre en considération cette notion d’inhomogénéité sans quoi les liens mis en
évidence ne refléteront pas la réalité. De même, au niveau de l’échantillonnage cette problématique
devrait être prise en compte, car elle pourrait jouer un rôle important dans les modèles d’aide à
l’échantillonnage actuellement en développement [Coulson et al., 2001] ; [Aitken et Lucy, 2002].
La mise en oeuvre de techniques de classification dites supervisées était une suite logique à la
phase initiale d’analyse de données qui s’était basée sur des techniques telles que l’analyse en
composantes principales et les mesures de distance qui sont des techniques de classifications non
supervisées puisqu’elles fonctionnent sans connaissance à priori de la distribution des différentes
saisies étudiées.
Premièrement, lors du processus d’apprentissage, chaque classe est traitée séparément, permettant
ainsi d’obtenir un modèle propre à cette dernière. Par exemple, certaines classes chimiques sont plus
dispersées (intervariabilité plus importante) que d’autres. SIMCA prend en considération ces
informations et modélise chaque classe en conséquence. De plus, lorsque le prototype a été
« entraîné » (processus d’apprentissage où des saisies de différentes classes chimiques sont implantées
dans le programme afin qu’il puisse en définir correctement les caractéristiques), il est possible
d’émettre un pronostic d’appartenance pour un nouveau candidat. Cette phase de prédiction est utile
puisque, très rapidement, il est possible de déterminer si un nouvel échantillon possède les
caractéristiques nécessaires pour entrer dans une classe chimique préalablement répertoriée. La
création de nouvelles classes chimiques, ainsi que l’augmentation de la population de celles qui
existent, nécessite la mise à jour du modèle. Cette phase est rapide et intuitive. Les différents tests
effectués ont montré que la classification était correctement effectuée dans plus de 95% des cas. Cette
technique est donc tout à fait utilisable dans le contexte de profilage de produits stupéfiants. Dans le
même ordre d’idée, des techniques de réseaux de neurones artificiels (Trajan Neural Network®) ont
également été testées sur le même type de données. Les résultats sont comparables à ceux obtenus
avec la méthode SIMCA [Esseiva et al., 2003b].
Ces techniques de classification offrent des possibilités d’automatisation qui s’avèrent être très
intéressantes. SIMCA ainsi que Trajan Neural Network® possèdent une fonctionnalité permettant
l’accès au code C++ généré dans la phase d’apprentissage. Il est dès lors possible de compiler ce code
afin de créer un programme exécutable. Dès lors, il n’est plus nécessaire de posséder le programme en
question pour effectuer une classification d’une saisie de produit stupéfiant. L’interface permettant
d’effectuer cette tâche est très simple, il suffit à l’utilisateur de télécharger ses données, que le
programme traitera instantanément. Ce dernier fournira un résultat sous la forme d’appartenance ou
non à une classe chimique répertoriée dans le prototype (il est également possible d’inclure cette
comparaison sur une interface Internet). A ce stade, il n’est plus nécessaire d’être un spécialiste des
composantes principales ou des réseaux de neurones pour effectuer ce travail de classification.
Toutefois, il est primordial de garder à l’esprit les fonctionnements de ces procédures de classification
si l’on veut être capable de fournir une interprétation correcte des données obtenues en « output ». Ce
processus est enclin à fournir des faux positifs et des faux négatifs même si leur taux est faible. Ces
méthodes de classifications sont utiles pour confronter les résultats obtenus avec les méthodes non
supervisées. En effet, lors du processus de profilage proposé dans cette étude, une première sélection
est effectuée à l’aide d’une analyse en composante principale. Les échantillons de cette sélection sont
alors comparés à l’aide de la fonction cosinus, mettant en évidence les saisies similaires au nouveau
candidat. Si ces saisies appartiennent déjà à des classes chimiques existantes, les méthodes SIMCA et
neuronale sont alors utilisées pour confirmer ce résultat. Cette combinaison de méthodes de
classifications indépendantes permet de minimiser les taux de faux positifs et négatifs.
DISCUSSION GÉNÉRALE DES RÉSULTATS 193
Dès lors, se pose la question récurrente de l’harmonisation des méthodes analytiques. En effet,
si l’on désire actuellement comparer chimiquement une saisie de produits stupéfiant effectuée à Zurich
ou à Bâle avec une saisie analysée à l’IPS, il est nécessaire de faire un nouvel examen complet de ces
échantillons en utilisant la méthodologie actuellement en place dans notre laboratoire. Cette
problématique est importante car la différence au niveau de l’instrumentation et des méthodes
analytique utilisées dans les divers laboratoires rendent incomparable les données à disposition ne
permettant pas leur utilisation d’une manière opérationnelle. Il est certes envisageable de sélectionner
un nombre de laboratoires et leur proposer une systématique analytique, cependant en multipliant les
sites, il devient très difficile de sensibiliser les divers intervenants quant aux buts poursuivis. Toute
une série de critères mis en évidence dans ce travail, comme la préparation de l’échantillon
(homogénéisation), le choix de la méthode et de l’appareil [Aalberg et al., 2001], sont des conditions
critiques qu’il faut absolument contrôler et maîtriser. En multipliants le nombre d’intervenant, on
augmente les problèmes relatifs à une harmonisation des conditions méthodologiques. De ce fait, il
semble important de mettre en place une gestion supra cantonale voire nationale. La mise sur pied
DISCUSSION GÉNÉRALE DES RÉSULTATS 194
d’un laboratoire central devrait minimiser les problèmes mis en exergues en réunissant l’infrastructure
analytique ainsi que le personnel employé. Intuitivement, il semble plus aisé d’assurer la qualité
nécessaire au profilage (contrôle des conditions analytiques, extractions des variables pertinentes,…)
ainsi que la sensibilisation à la problématique dans une entité unique plutôt que dans un système
multiple.
10.6. Perspective
Les buts de ce travail relatif au profilage de produits stupéfiants sont de préparer le terrain à
une implantation plus systématique des résultats obtenus dans un contexte d’actions opérationnelles.
Les réponses apportées aux différentes questions concernant la mise en place d’une stratégie de
profilage ont trouvé des réponses satisfaisantes et préparent la voie à la phase d’intégration
méthodologique. Des recherches doivent encore être effectuées quant à la manière d’intégrer ces
résultats dans un environnement d’informations policières. Il s’agira entre autre de déterminer quelles
hypothèses ces liens chimiques nous permettent d’émettre. Lors de ces travaux, il y a fort à parier que
de nouvelles questions vont être soulevées, comme par exemple celles relatives à l’information
véhiculée par d’autres types de liens tels que ceux fourni par l’adultération (qui fait l’objet d’une autre
étude à l’IPS).
criminalités les plus importantes et des plus organisées (liées à des conflits, de la criminalité
économique et à des organisations criminelles puissantes). On pourrait donc envisager la mise en place
d’une infrastructure comparable en charge soit des cantons, ou chapeauté par la police fédérale. Ceci
d’autant plus que depuis l’entrée en vigueur le 1er janvier 2002 de l’article 340bis du code pénal Suisse
la juridiction fédérale est compétente pour traiter les infractions décrites à l’article 260ter relatif aux
organisations criminelles, dont le trafic de stupéfiants fait partie intégrante.
Idéalement, l’insertion de la notion de classe chimique au sein de la base de données JANUS
qui est actuellement gérée par la confédération et à disposition des cantons serait optimale. En effet,
chaque saisie de produits stupéfiants correspond à une personne qui est répertoriée dans le système en
question. Dès lors, si cette dernière était en possession de produits stupéfiants appartenant à une classe
chimique X, cette information pourrait être insérée dans la base. L’enquêteur pourrait ainsi vérifier si
cette classe chimique est déjà répertoriée dans la mémoire du système et, si tel est le cas, relier son
affaire à d’autres par l’intermédiaire d’un lien au niveau du produit stupéfiant.
.
CONCLUSION 196
11. CONCLUSION
CONCLUSION 197
11.1. Conclusion
L’usage de psychotropes est universel ; dans chaque culture et à chaque période de l’histoire,
ils ont été utilisés pour influencer les humeurs, stimuler les rêves, donner du courage, rechercher de la
détente ou une excitation. Pendant longtemps, ils ont été le monopole d’un savoir mystique ou médical
en main d’une élite initiée à leur utilisation. A partir du XIXe siècle, les stupéfiants naturels ont connu
une mutation suivant le processus de la révolution industrielle occidentale. Depuis, ils ont été
transformés chimiquement pour être consommés de manière massive et parfois même ont été
remplacés par des produits de synthèse (amphétamines et analogues). Les psychotropes se sont
multipliés s’éloignant toujours plus du contexte et des rituels qui avaient donné naissance à leur usage.
A l’heure actuelle, la problématique du trafic de stupéfiants connaît auprès des services de
renseignements et des décideurs un regain d’intérêt important et ceci principalement depuis le 11
septembre 2002, suite aux attentats du World Trade Center. En effet, il semble établi qu’il existe des
liens entre le trafic illicite de stupéfiants et le terrorisme international. Ce trafic serait l’une des
principales sources de financement de ces organisations criminelles. Des efforts importants ont été
consentis principalement par les USA (par l’intermédiaire du DEA) et les Nations Unies (par
l’intermédiaire de UNODC, l’United Nation Office on Drug and Crime) pour fournir une image
internationale des tendances du trafic de produits stupéfiants (les voies de distribution) ainsi que des
principaux pays producteurs. Une approche stratégique a ainsi été mise en place déterminant
principalement au niveau analytique la source des produits stupéfiants. Cette information, combinée
aux données des services de renseignements douaniers et policiers internationaux, permet la
détermination des routes de distribution de ces substances ainsi que les évolutions de ces dernières
pour s’adapter aux diverses mutations de notre monde, qu’elles soient géographiques ou culturelles.
Cette vision permet, à ces organes puissants politiquement d’exercer des pressions politiques envers
ces états impliqués activement dans ce trafic illicite afin d’influencer leur politique de lutte en matière
de stupéfiants.
L’impact politique de la Suisse n’est évidement pas comparable à celui d’une grande
puissance. C’est dans ce contexte particulier que cette recherche a été effectuée. Plus spécifiquement,
il a été décidé de mettre en place un processus axé sur une action opérationnelle, utilisable directement
par les brigades stupéfiants des organes locaux de poursuites pénales (brigades stupéfiants,
magistrats,..). Premièrement, l’aspect profilage, incluant les méthodes analytiques, statistiques et
informatiques a été testés et développés afin de comprendre la mise en évidence rapide de liens entre
échantillons de stupéfiants. Le défi consistait à gérer ces liens chimiques d’une manière cohérente tout
en offrant la possibilité d’une visualisation optimale de la configuration de ces derniers, indispensable
à l’interprétation et la distribution de cette information.
Le prototype mis en place s’est révélé efficace et a permis de gérer des volumes importants
d’échantillons (environ 5000 échantillons d’héroïne et 2800 de cocaïne). Les résultats prometteurs ont
été confirmés et utilisés par les organes judiciaires. L’étape suivante devrait se focaliser sur
CONCLUSION 198
l’implémentation de ce modèle de manière plus systématique. Néanmoins, il faut être conscient que
cette phase n’est pas aisée. Ne serait-ce que du point de vue de la standardisation des méthodes
analytiques, qui posent déjà de nombreux problèmes. Si la même substance est analysée dans le même
laboratoire et sur deux machines de même marque, il n’est pas facile d’obtenir des résultats
comparables. Il est souvent nécessaire d’effectuer une standardisation rigoureuse sans quoi les
résultats diffèreront sensiblement rendant tout profilage illusoire. La problématique s’intensifie encore
si l’on considère que des analyses peuvent se faire dans des laboratoires différents possédants des
appareils différents. Certain dirons que la solution réside dans une centralisation des analyses, mais sur
ce point d’autres problématiques, de nature principalement politique, apparaissent même si aucun
organe d’analyse n’a, à ce jour, envisagé une utilisation systématique des informations matérielles
telle que nous la préconisons. Elle sera pourtant abordée dans le cadre d’un projet transfrontalier avec
la France voisine.
199
BIBLIOGRAPHIE 200
12. BIBLIOGRAPHIE
BIBLIOGRAPHIE 201
12.1. Bibliographie
[Aalberg et al., 2001] Aalberg L., Anderson K., Ballany J., Bertler C., Caddy B., Cole M. D., Dahlén
J., Dujourdy L., Finnon Y., Huizer H., Janhunen K., Kaa E., Kopp I., Lock E., Lopes A.,
Margot P., Poortman A., Sippola E., "Development of a Harmonised Pan-European Method
for the Profiling of Amphetamines", Science and Justice, 41/3, pp. 193-196, 2001
[Afifi et Clark, 1996], Afifi A.A., Clark V., ″Computer-Aided Multivariate Analysis″, Chapman
&Hall, London, 1996
[Aitken et Lucy, 2002] Aitken C., Lucy D.″Estimation of the Quantity of a Drug in a Consignment
from Measurements on a Sample″, Journal of Forensic Sciences, 47/5, pp.968-975, 2002
[Allen et al.,1984] Allen A.C., Cooper D.A., Moore J.M., Gloger M., Neumann H, ″Illicit Heroin
Manufacturing By-products : Capillary Gas Chromatographic Determination and Structural
Elucidation of Narcotine-and Norlaudanosine-Related Compounds″, Analytical Chemistry,
vol. 56, pp. 2940-2947, 1984
[Anglada et al., 2002] Anglada F., Dujourdy L., Esseiva P., Du Pasquier E., Lennard C., Evans I. ″
Chemical Profiling of Heroin Blocks to Assist with the Development of a Statistically
Correct and Practical Sampling Procedure for Large Drug Seizures″ Rapport de stage,
communication interne, Institut de Police Scientifique et de Criminologie, Lausanne, 2002
[Baker et Gough, 1981] Baker P., Gough T. ″The Separation and Quantification of the Narcotics
Components of Illicit Heroin Using HPLC″, Journal of Chromatographic Science, 19, pp.
483-489, 1981
[Barnfield et al., 1988] Barnfield C., Burns S., Byrom D.L., Kemmenoe A.V., ″The Routine Profile of
Forensic Heroin Samples″, Forensic Science International, 39 , pp.107-117, 1988
[Baugh et Liu, 1991] Baugh L.D., Liu R.H, ″Sample Differentiation: Cocaine Example″, Forensic
Science Review, vol. 3, n°101, pp. 101-115, 1991
[Beebe et al., 1998] Beebe K., Pell R., Seasholtz M., ″Chemometrics : a Practical Guide″, Wiley,
New-York, 1998
[Besacier et al., 1997] Besacier F., Guilluy R., Brazier J.L., Chaudron-Thozet H., Girard J., Larnoue
A., ″Isotopic Analysis of 13C as a Tool for Comparison and Origin Assignment of Seized
Heroin Samples″, Journal of Forensic Sciences, 42/3, pp.429-433, 1997
[Brewer et Allen, 1991] Brewer L.M, Allen A., ″N-Formyl Cocaine: A Study of Cocaine Comparison
Parameters″, Journal of Forensic Sciences, 36/3, pp. 697-707, 1991
[Cartier et al., 1997] Cartier J., Guéniat O., Cole M.D., ″Headspace Analysis of Solvents in Cocaine
and Heroin Samples″, Science and Justice, 37/3, pp. 175-181, 1997
BIBLIOGRAPHIE 202
[Casale, 1990] Casale J.F, ″Detection of Pseudoecgonine and Differentiation from Ecgonine in Illicit
Cocaine″, Forensic Science International, 47/3, pp. 277-287, 1990
[Casale, 1991] Casale J.F, ″N-Acetylnorcocaine: A New Cocaine Impurity from Clandestine
Processing″ , Journal of the Clandestine Laboratory Investigating Chemists Association, 1/4,
pp. 23-26, 1991
[Casale et Waggoner, 1991] Casale J.F, Waggoner R.W., ″A Chromatographic Impurity Signature
Profile Analysis for Cocaine Using Capillary Gas Chromatography″, Journal of Forensic
Sciences, 36/5, pp. 1312-1330, 1991
[Casale et Watterson, 1993] Casale J.F, Watterson J.W., ″A Computerized Neural Network Method
for Pattern Recognition of Cocaine Signatures″, Journal of Forensic Sciences, 38/2, pp. 292-
301, 1993
[Casale et Klein, 1993] Casale J.F, Klein R.F.X., ″Illicit Production of Cocaïne″, Forensic Science
Review, 5/2, pp. 95-107, 1993
[Casale et Meyers, 1996] R.P., Casale J.F., Meyers R.P., ″The Stability of Cocaine in Agua/Rica″,
Microgram, vol. XXIX, n°7, pp. 175-178, 1996
[Casale et Moore, 1996a] Casale J.F, Moore J.M, ″Lesser Alkaloids of Cocaine Bearing Plants Part II.
3-Oxo-Substituted Tropane Esters : Detection and Mass Spectral Characterization of Minor
Alkaloids Found in South American Erythroxylum coca var. coca″, Journal of
Chromatography A, 749, pp. 173-180, 1996
[Casale et Moore, 1996b] Casale J.F, Moore J.M, ″Lesser Alkaloids of Cocaine-Bearing Plants Part
III. 2-carbomethoxy-3-oxo Substituted Tropane Esters : Detection and Gas
Chromatrographic-Mass Spectrometric Characterization of New Minor Alkaloids Found in
South American Erythroxylum coca var. coca″, Journal of Chromatography A, 756, pp. 185-
192, 1996
[Casale et al., 1998] Casale J.F, Moore J.M, Odeneal N.G, ″Comparative Determination of 2-
Carbomethoxy-3-Alkyloxy- and Heteroaroyloxy-Substituted Tropanes in Illicit South
American Cocaine Using Capillary Gas Chromatography Single Ion Monitoring″, Journal of
Forensic Sciences, 43/1, pp. 125-132, 1998
[Cashman et Thornton, 1972] Cashman P.J., Thornton J.I., ″High Speed Liquid Adsorption
Chromatography in Criminalistics. II. The Separation of Heroin, O6-Monoacetylmorphine
and Morphine″, Journal of the Forensic Science Society, 12, pp. 417-420, 1972
[Chiarotti et al., 1983] Chiarotti M., Carnevale A., De Giovanni N., ″Capillary Gas Chromatography
Analysis of Illicit Diamorphine Preparations″, Forensic Science International, 21, pp. 245-
252, 1983
[Chiarotti et al., 1991] Chiarotti M., Fucci N., Furnari C., ″Comparative Analysis of Illicit Heroin
Samples″, Forensic Science International, 50/1, pp. 47-55, 1991
[Clark, 1978] Clark C.C., ″Cocaine Comparison Parameters″, Micrograms, 11, pp. 184-187, 1978
BIBLIOGRAPHIE 203
[Coulson et al., 2001] Coulson S., Coxon A., Buckleton J., ″How Many Samples from a Drug Seizure
Need to Be Analyzed ″, Journal of Forensic Sciences, 46/6, pp. 1456-1461, 2001
[Cooper et Allen, 1984] Cooper D.A, Allen A.C., ″Synthetic Cocaine Impurities″, Journal of Forensic
Sciences, 29/4, pp. 1045-1055, 1984
[DEA Resources 1998-2003] Drug Enforcement Administration, For Law Enforcement Officers,
Intelligence Reports, WWW.DEA.GOV, 1998-2003
[Demedts et al., 1983] Demedts P., VanDerVerren J., Heyndrickx A., ″Recent Developments in GC
Column Technology. An Illustration of Its Interest in Forensic Toxicology″, Forensic
Science International, 23, pp.137-142, 1983
[Derde and Massart, 1982], Derde M., Massart D., ″Extraction of Information from Large Data Sets by
Pattern Recognition″, Fresenius Z Analytical Chemistry, 313, pp. 484-495, 1982
[Dreyfus et al, 2002], Dreyfus J-M., Martinez M., Samuelides M., Gordon F., Badran F., Thiria S.,
Hérault L., ″Réseaux de neuronnes″, Editions Eyrolles, 2002, Paris
[Dujourdy et al., 2003] Dujourdy L., Barbati G., Taroni F, Guéniat O., Esseiva P., Anglada F., Margot
P., “Evaluation of Links in Heroin Seizures”, Forensic Science International, 131, pp. 171-
183, 2003
[Esseiva et Guéniat, 1997] Esseiva P.and Guéniat O., ″The Concept of Drug Intelligence in Heroin
Investigation: The problem of the Evaluation of a Sequence of Analysis and a Scheme of
Interpretation for Court Purposes″, 1st European Meeting of Forensic Science, Lausanne,
Switzerland, 17-19 september, 1997
[Esseiva et al, 2003a] Esseiva P., Anglada F., Dujourdy L., Taroni F., Margot P, ″ A Methodology for
Illicit Heroin Seizures Comparison in a Drug Intelligence Perspective Using Large
Databases″, Forensic Science International, 132, pp.139-152, 2003.
[Esseiva et al., 2003b] Esseiva P., Anglada F., Dujourdy L., Taroni F., Margot P, Du Pasquier E.,
Dawson M., Roux C., Doble P, ″ Chemical Profiling and Classification of Illicit Heroin by
Principal Component Analysis, Squared Cosine Function and Artificial Neural Network″
Forensic Science International, 2003, accepted
[Gittins, 1985], Gittins R., ″Canonical Analysis. A Review with Applications in Ecology″, Springer-
Verlag, Berlin Heidelberg, 1985
[Gloger et Neumann, 1983] Gloger M. et Neumann H., ″Analysis of Heroin Samples by Capillary Gas
Chromatography. Comparison of Glass Capillary Column and Packed Column″, Forensic
Science International, 22, pp. 63-74, 1983
[Guéniat et Esseiva 2002] Guéniat O., Esseiva P., ″Histoire, production et trafic de la cocaïne″,
Dépendances, No 18, pp. 4-12, 2002
[Guéniat, 2003] Guéniat, O., ″L’établissement et la notion de liens dans l’analyse d’échantillons de
cocaïne et d’héroïne″, Thèse de doctorat, Institut de Police Scientifique et de Criminologie,
Lausanne, PPUR, 2003 à paraître
[Huizer, 1988] Huizer, H., ″Analytical Studies on Illicit Heroin″, Thèse de doctorat, Forensic science
Laboratory of the Ministry of Justice, Rijswijk, Netherlands, 1988
BIBLIOGRAPHIE 204
[Huizer, 1994] Huizer H., ″A Contribution to Comparison″, Forensic Science International, 69, pp. 17-
22, 1994
[Janzen, 1987] Janzen K.E, ″Cross-Matching of Cocaine Samples. A Case Study″, Canadian Society
of Forensic Science Journal, 20/2, pp. 77-82, 1987
[Janzen et al., 1992] Janzen K.E., Walter L., Fernando A.R., ″Comparison Analysis of Illicit Cocaine
Samples″, Journal of Forensic Sciences, 37/2, pp. 436-445, 1992
[Janzen et al., 1994] Janzen K.E, Fernando A.R., Walter L., ″A Database for Comparison Analysis of
Illicit Cocaine Samples″, Forensic Science International, 69, pp. 23-29, 1994
[Johnston et King, 1998] Johnston A., King L.A., ″Heroin profiling : Predicting the Country of Origin
of Seized Heroin″, Forensic Science International, 95, pp. 47-55, 1998
[Jonson et Strömberg, 1993] Jonson C.S.L., Strömberg L., ″Computer Aided Retrieval of Common-
Batch Members in Leuckart Amphetamine Profiling″, Journal of Forensic Sciences, 38/6, pp.
1472-1477, 1993
[Kaa et Bent, 1986] Kaa E., Bent K., ″Impurities, Adulterants and Diluents of Illicit Heroin in
Denmark″, Forensic Science International, 31, pp. 195-210, 1986,
[Keto, 1989] Keto R.O., ″Comparison of Smokeless Powders by Pyrolysis Capillary Gas
Chromatography and Pattern Recognition″, Journal of Forensic Sciences, 34/1, pp. 74-82,
1989
[Killeen et al., 1980] Killeen T. J., Eastwood D., Hendrick M. S., ″ Oil-matching by Using a Simple
Vector Model for Fluorescence Spectra ″, Talanta, 26, pp. 1-6,1980
[Kingston, 1992] Kingston C., ″Neural Networks in Forensic Sciences″, Journal of Forensic Sciences,
37, pp. 252-264, 1992
[Klemenc, 2000] Klemenc S., ″Noscapine as an Adulterant in Illicit Heroin Samples ″, Forensic
Science International, 2000,108, pp. 45-49.
[Klemenc, 2001] Klemenc S., ″In Common Batch Searching of Illicit Heroin Samples – Evaluation of
Data by Chemometrics Methods ″, Forensic Science International, 2001,115, pp. 43-52.
[Koutouzis et Perez, 1996] Koutouzis M., Perez P. ″Atlas mondial des drogues″, Presse Universitaires
de France, Paris, 1996
[Kumar et Kiser, 1995] Kumar A., Kiser W.O., ″Identification and Quantitation of Norcocaine in
Illicit Cocaine Samples″, Journal of Forensic Sciences, 40/3, pp. 464-466, 1995
[Labrousse et Koutousis, 1996] Labrousse A., Koutouzis M., ″Géopolitique et Géostratégies des
Drogues″, Ed. Economica, Paris, 1996
BIBLIOGRAPHIE 205
[Law et al., 1983] Law B., Joyce J.R, Bal T.S, Goddard C.P., Japp M., Humphreys I.J., ″The
Characterisation and Comparison of Illicit Heroin by Gas Chromatography and High-
performance Liquid Chromatography″, Analytical Proceedings, 20, pp. 611-613, 1983
[LeBelle et al., 1988] LeBelle M., Lauriault G., Callahan S., Latham D., Chiarelli C., Beckstead H.,
″The Examination of Illicit Cocaine″, Journal of Forensic Sciences, 33/3, pp. 662-675, 1988
[Legendre P. et Legendre L., 1998] Legendre P., Legendre L. ″Numerical Ecology″, Elsevier, Second
English Edition, Amsterdam, 1998
[Lim et Chow, 1978] Lim H.-Y., Chow S.-T, ″Heroin Abuse and a Gas Chromatographic Method for
Determining Illicit Heroin Samples in Singapore″, Journal of Forensic Sciences, 23/2, pp.
319-328, 1978
[Moore, 1973] Moore J.M, ″Identification of cis- and trans-Cinnamoylcocaine in Illicit Cocaine
Seizures″, Journal of the Association of Official Analytical Chemists, 56, pp. 1199-1205,
1973
[Moore, 1974] Moore J.M, ″Gas Chromatographic Detection of Ecgonine and Benzoylecgonine in
Cocaine″, Journal of Chromatography, 101, pp. 215-218, 1974
[Moore et al., 1984] Moore J.M, Allen A.C., Cooper D.A., ″Determination of Manufacturing
Impurities in Heroin by Capillary Gas Chromatography with Electron Capture Detection
After Derivatization with Heptafluorobutyric Anhydride″, Analytical Chemistry, 56/4, pp.
642-646, 1984
[Moore et al., 1986] Moore J.M., Allen A.C., Cooper D.A., ″Determination of Neutral Manufacturing
Impurities in Heroin by Capillary Gas Chromatography with Electron Capture Detection
after Reduction with Lithium Aluminium Hydride and Derivatization with
Heptafluorobutyric Anhydride″, Analytical Chemistry, 58, pp. 1003-1007, 1986
[Moore et al., 1987] Moore J.M, Cooper D.A, Lurie I.S., Kram R.C., Carr S., Harper C., Yeh J.,
″Capillary Gas Chromatography-Electron Capture Detection of Coca-Leaf Related
Impurities in Illicit Cocaine: 2,4-Diphenylcyclobutane-1,3-Dicarboxylic Acids, 1,4-
Diphenylcyclobutane-2,3-Dicarboxylic Acids, and Their Alkaloidal Precursors, the
Truxillines″, Journal of Chromatography, 410, pp. 297-318, 1987
[Moore, 1990] Moore J.M, ″The Application of Chemical Derivatization in Forensic Drug Chemistry
for Gas and High-Performance Liquid Chromatography Methods of Analysis″, Forensic
Science Review, 2/2, pp. 79-124, 1990
[Moore et al., 1993a] Moore J.M, Cooper D.A., ″The Application of Capillary Gas Chromatography-
Electron Capture Detection in the Comparative Analyses of Illicit Samples″, Journal of
Forensic Sciences, 38/6, pp. 1286-1304, 1993
[Moore et al., 1993b] Moore J.M, Meyers R.P., Jimenez M.D., ″The Anatomy of a Cocaine
Comparison Case: A Prosecutorial and Chemistry Perspective″, Journal of Forensic
Sciences, 38/6, pp.1305-1325, 1993
[Moore et Casale, 1994] Moore J.M, Casale J.F, ″In-depht Chromatographic Analyses of Illicit
Cocaine and its Precursor, Coca Leaves″, Journal of Chromatography, 674, pp. 165-205,
1994
[Moore et al., 1995] Moore J.M, Casale J.F, Fodor G., A.B. Jones A.B., ″Detection and
Characterization of Cocaine and Related Tropane Alkaloids in Coca Leaf, Cocaine, and
Biological Specimens″, Forensic Science Review, 7/2, pp.78-101, 1995
BIBLIOGRAPHIE 206
[Moore et al., 1996] Moore J.M, Casale J.F, Cooper D.A., ″Comparative Determination of Total
Isomeric Truxillines in Illicit, Refined, South American Cocaine Hydrochloride using
Capillary Gas Chromatography Electron Capture Detection″, Journal of Chromatography ,
756, pp. 193-201, 1996
[Moore et Casale, 1997] Moore J.M, Casale J.F, ″Lesser Alkaloids of Cocaine Bearing Plants Part I :
Nicotinoyl-,2’-Pyrroloyl, and 2’- and 3’-Furanolyecgonine Methyl Ester – Isolation and
Mass Spectral Characterisation of Four New Alkaloids of South American Erythroxylum
coca Var. coca″, Journal of Forensic Sciences, 42/2, pp. 246-255, 1997
[Moore et Casale, 1998] Moore J.M, Casale J.F, ″Cocaine Profiling Methodology – Recent
Advances″, Forensic Science Review, 10/1, pp. 13-45, 1998
[Morello et Meyers, 1995] Morello D.R., Meyers R.P., ″Qualitative and Quantitative Determination of
Residual Solvents in Illicit Cocaine and Heroin HCl″, Journal of Forensic Sciences, 40/6, pp.
957-963, 1995
[Myors et al., 2001] Myors R.B., Crisp P.T., Skopec S. V., Wells R.J., ″ Investigation of Heroin
Profiling Using Trace Organic Impurities″, Analyst, 126, pp. 679-689, 2001
[Narayanaswami et al., 1979] Narayanaswami K., Golani H.C., Dua R.D., ″Assay of Major and Minor
Constituents of Opium Samples and Studies of Their Origin″, Forensic Science International,
14, pp. 181-190, 1979
[Neumann et Gloger, 1982] H. Neumann, M. Gloger, ″Profiling of Illicit Heroin Samples by High-
Resolution Capillary Gas Chromatography for Forensic Application″, Chromatographia, 16,
pp. 261-264, 1982
[Office des Nations Unies pour le contrôle des drogues et la prévention du crime, 2002], Office des
Nations Unies pour le contrôle des drogues et la prévention du crime″ Tendances mondiales
des drogues illicites″, Publications des Nations Unies, New York, 2002
[O’Neil et al., 1984] O'Neil P.J, Baker P.B., Gough T.A., ″Illicit Imported Heroin Products: Some
Physical and Chemical Features Indicative of Their Origin″, Journal of Forensic Sciences,
29/3, pp. 889-902, 1984
[O’Neil et Gough, 1985] O'Neil P.J, Gough T.A., ″Illicitly Imported Heroin Products: Some Physical
and Chemical Features Indicative of Their Origin. Part II″, Journal of Forensic Sciences,
30/3, pp. 681-691, 1985
[O’Neil et Pitts, 1992] O'Neil P.J, Pitts J.E., ″Illicitly Imported Heroin Products (1984 to 1989): Some
Physical and Chemical Features Indicative of Their Origin″, Journal of Pharmacy and
Pharmacology, 44/1, pp. 1-6, 1992
[Perillo et al., 1994] Perillo B.A, Klein R.F.X, Franzosa E.S., ″Recent advances by the US Drug
Enforcement Administration in Drug Signature and Comparative Analysis″, Forensic
Science International, 69, pp. 1-6, 1994
[Ribaux, 1997] Ribaux, O., ″La recherche et la gestion des liens dans l’investigation criminelle : le cas
particulier du cambriolage″, Thèse de doctorat, Institut de Police Scientifique et de
Criminologie, Lausanne, 1997
[Saporta, 1990] Saporta G., ″Probabilités, analyse des données et statistiques″, Editions Technip,
Paris, 1990
[Selvin, 1998] Selvin S, ″ Modern Applied Biostatistical Methods Using S-Plus″, New York Oxford,
Oxford university Press, 1998
[Sobol et Sperling, 1975] Sobol S.P., Sperling A.R., ″A Comparison of Heroin Samples″, Forensic
Science, G. Davies Ed., American Chemical Society Symposium Series 13, Washington DC,
pp. 170-182, 1975
[Stead et al., 1991] A.H. Stead, P.G. Ashton, C.A. Owen, J.D. Partridge, M.D. Osselton, ″The
Profiling and Characterisation of Illicit Heroin Samples by Capillary Gas Chromatography″,
Central Research and Support Establishment, Home Office Forensic Science Service,
Aldermaston, Reading, Berkshire, RG7 4PN, pp. 1-42, 1991
[Strömberg, 1972] Strömberg L., ″Minor Components of Cannabis Resin. III. Comparative Gas
Chromatographic Analysis of Hashish″, Journal of Chromatography, 68, pp. 253-258, 1972
[Strömberg et Maehly, 1975] Strömberg L., Maehly A.C., ″Comparative Gas Chromatographic
Analysis of Narcotics III. Phenmetrazine Hydrochloride″, Journal of Chromatography, 109,
pp. 67-72, 1983
[Strömberg et al, 1983] Strömberg L., Bergkuist H., Edringsghe E. ″Comparative Gas
Chromatographic Analysis of Narcotics IV Methamphetamine Hydrochloride″, Journal of
Chromatography, 109, pp. 65-72, 1983
[Strömberg et al, 2000], Strömberg L., Lundberg L., Neumann H., Bobon B., Huizer H., Van
der Stelt N. ″Heroin Impurity Profiling. A Harmonization Study for Retrospective
Comparisons ″, Forensic Science International, 69, pp. 1-6, 1994
[Tanaka et al., 1994] Tanaka K., Takeshi O., Takako I., Sueshige S., ″Impurity Profiling Analysis of
Illicit Methamphetamine by Capillary Gas Chromatography″, Journal of Forensic Sciences,
39,2, pp. 500-511, 1994
[Taroni, 1996] Taroni, F., ″La recherche et la gestion des liens dans l’investigation criminelle : une
étape vers l’exploitation systématique des données de police″, Thèse de doctorat, Institut de
Police Scientifique et de Criminologie, Lausanne, 1996
[Thornton, 1975] Thornton J.I., ″The use of an Agglomerative Numerical Technique in Physical
Evidence Comparisons″, Journal of Forensic Sciences, 19, 4, pp. 873-883, 1975
[Vandeginste et al., 1998] Vandeginste B.M.G, Massart D.L., Buyden L.M.C., De Jong S., Lewi P.J.,
Smeyers-Verbeke J., ″Handbook of Chemometrics and Qualimetrics : Part B ″, Elsevier,
Amsterdam, 1998
[Wells et al., 1995] Wells R.J., Skopec S.V., Iavetz R., Robertson J., ″Trace Element Analysis of
Heroin by ICP-MS″, communication personnelle
BIBLIOGRAPHIE 208
[Zingg et al., 1998] Zingg Ch, Esseiva P., Margot P. “Les composantes de l’héroïne saisie par les
services de police – rapport intermédiare”, Recherches de l’OFSP en matière de
dépendances. 1996-98, volume 1 : recherche fondamentale.
UNIVERSITE DE LAUSANNE
FACULTE DE DROIT
ECOLE DES SCIENCES CRIMINELLES
INSTITUT DE POLICE SCIENTIFIQUE
Par
PIERRE ESSEIVA
Licencié en sciences forensique
de l’Université de Lausanne
2004
ANNEXE 1 1
Annexe 1
Constituants principaux de la
cocaïne et de l’héroïne
ANNEXE 1 2
H3C COOCH3
H 3C COOCH3 H 3C N
N COOH
N
OH
H H
H
Anhydroecgonine méthyl ester (AME) Anhydroecgonine (AE) Ecgonine méthyl ester
O
H3C OH O H3C
N N
OH O O
H H O
Ecgonine Acide benzoïque Tropacocaïne
O O
H 3C O H3C O
N H H N H
O O
H
H O H O
Cis-cinnamoylecgonine méthyl ester Trans-cinnamoylecgonine méthyl ester
O
O O
H3C OH O
N H N
O O
H O H O
Benzoylecgonine (ecgonine benzoylester) N-formyl cocaïne
O
O
HN
H O
Norcocaïne
ANNEXE 1 3
2
HO
1 CH3O
3
15 10
16
O 9 O
14 N CH3
H N CH3
6 H
8
HO
7 HO
CH3O
O
O N CH3
O
N CH3 H O O
H CH3O
H
CH3O
Noscapine (=narcotine) OMe
Thébaïne
OMe
CH3O
N
CH3O
OMe
Papavérine
OMe
ANNEXE 2 4
Annexe 2
Chromatogrammes de saisies
d’héroïne (différents pays)
d’origine géographique
connue
ANNEXE 2 5
Les chromatogrammes obtenus l’ont été par GC-FID en utilisant la méthode d’analyse des
constituants majeurs décrite dans cette recherche. Les saisies ont été mises à disposition par AGAL
(Australian Gouvernement Analytical Laboratory). L’origine géographique de ces saisies est garantie
puisqu’elles ont été effectuées sur le terrain par le DEA (Drug Enforcement Administration).
Annexe 3
Notions de base d’algèbre
matricielle
ANNEXE 3 12
Algèbre matricielle
Introduction
Le résumé ci-après a pour but de se familiariser avec quelques notions concernant les opérations
mathématiques que l’on peut effectuer sur des matrices. Ces dernières sont très importantes dans le
cadre du travail qui nous occupe puisque les différentes données à disposition sont souvent
représentées sous cette forme. Les informations synthétisées ci-dessous sont tirées pour la plus grande
partie de [Saporta, 1990], [Bronson., 1994] et [Legendre P. et Legendre L., 1998], [Esbensen, 2001].
Les matrices
Le tableau ci-dessous schématise une matrice que l’on rencontre souvent dans l’analyse des produits
stupéfiants. Les colonnes de la matrice sont construites par les descripteurs qui correspondent aux
variables (méconine, acétylcodéine, ecgonine,…) qui résultent de l’analyse. Les lignes sont construites
par les différents échantillons analysés.
DESCRIPTEUR
L’utilisation du calcul matriciel est très importante dans le domaine de l’analyse de produits
stupéfiants puisque la grande majorité des informations que nous récoltons est stockée sous forme de
matrices.
De plus, les techniques d’analyse multidimensionnelles, utilisées de plus en plus souvent pour
répondre aux besoins des chercheurs, font obligatoirement appel aux notions de matrices qui
permettent de conceptualiser et d’expliquer les notions mises en œuvre.
Une matrice est un tableau rectangulaire d’éléments disposés en lignes horizontales et colonnes
verticales, habituellement mis entre crochets. Une matrice peut être définie comme un ensemble
ordonné de n respectivement p nombres généralement représentés sous forme d’un tableau à n lignes
et p colonnes constitué de ces éléments.
La matrice Y est rectangulaire construite par des lignes et des colonnes remplies par des nombres yij
⎡ y11 y12 . . . y1 p ⎤
⎢y y 22 . . . y 2 p ⎥⎥
⎢ 21
⎢ . . ⎥
Y=⎢ ⎥
⎢ . . ⎥
⎢ . . ⎥
⎢ ⎥
⎣⎢ y n1 yn2 . . . y np ⎦⎥
Lorsque l’on demande l’ordre d’une matrice, on dit quelle est d’ordre (n × p ) .
Matrices spéciales
Une matrice diagonale est une matrice dont tous les éléments n’étant pas dans la diagonale sont égaux
à0
⎡3 0 0⎤
⎢0 7 0 ⎥
⎢ ⎥
⎢⎣0 0 1⎥⎦
La matrice diagonale qui contient les valeurs venant du vecteur [x i ] est notée D( x ) . La matrice
diagonale des déviations standard est notée D(∂ ) et la matrice diagonale des valeurs propres D(λ ) est
notée Λ (la notion de valeurs propres sera définie par la suite). Une matrice diagonale où tous les
éléments sont constitués de 1 est une matrice unité ou une matrice identité.
⎡1 0 0 ⎤
⎢0 1 0 ⎥ = I
⎢ ⎥
⎢⎣0 0 1⎥⎦
Une matrice dont tous les éléments sont égaux à 0 est une matrice nulle ou une matrice 0
ANNEXE 3 14
Le transposé d’une matrice B de format (n × p ) est noté B ' qui est une nouvelle matrice de format
( p × n ) dans laquelle bij' = b ji . En d’autres termes, les lignes d’une matrice sont égales aux colonnes
de l’autre.
⎡1 2 3⎤
⎢4 5 6⎥
B=⎢ ⎥
⎢7 8 9⎥
⎢ ⎥
⎣10 11 12⎦
⎡1 4 7 10⎤
B = ⎢⎢2 5 8 11⎥⎥
'
⎢⎣3 6 9 12⎥⎦
La transposition est une opération très importante en algèbre linéaire puisqu’elle permet de calculer les
relations entre objets et suite à la transposition, les relations entre variables.
Une matrice carrée (2 × 2) , (3 × 3) qui est identique lorsqu’on la transpose, est une matrice
symétrique.
⎡ b1 ⎤
⎢b ⎥
La matrice colonne est une matrice de type (1 × p ) : b = ⎢ ⎥
2
⎢ ... ⎥
⎢ ⎥
⎣bn ⎦
Les n nombres du vecteur constituent les coordonnées d’un point à n-dimension dans un espace
Euclidien qui peut être vu comme le point final d’une ligne partant de l’origine comme illustré par la
figure ci-dessous :
ANNEXE 3 15
(4,3)
En utilisant le théorème de Pythagore, il est aisé de calculer la norme du vecteur (4,3) qui est
⎡ b / b 2 + b 2 + ... + b 2 ⎤ ⎡ b1 ⎤
⎢ 1 1
2
2
2
n
2
⎥ ⎢b ⎥
⎢b2 / b1 + b2 + ... + bn ⎥ 1 ⎢ 2⎥
⎢ ⎥ =
... 2 2 2 ⎢ ... ⎥
⎢ ⎥ b1 / b1 + b2 + ... + bn ⎢ ⎥
⎢⎣bn / b12 + b22 + ... + bn2 ⎥⎦ ⎣bn ⎦
ANNEXE 3 16
L’addition de deux matrices ne peut s’effectuer qu’avec des matrices de même ordre qui peuvent être
additionnées. L’addition des matrices est associative et commutative, l’élément neutre est la matrice 0
A + (B + C) = (A + B ) + C et A + B = B + C
Exemple :
⎡ 1 5 25⎤ ⎡ 2 4 5⎤ ⎡ 3 9 30⎤
⎢14 3 3 ⎥ + ⎢ 4 5 0⎥ = ⎢18 8 3 ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢⎣23 12 5 ⎥⎦ ⎢⎣53 4 3⎥⎦ ⎢⎣76 16 8 ⎥⎦
La soustraction de deux matrices se définit de la même manière que l’addition. Les deux matrices
doivent être de même ordre et il suffit de soustraire les éléments correspondants.
Le produit scalaire de deux vecteurs ayant le même nombre d’éléments s’écrit de la manière suivante :
⎡ c1 ⎤
⎢c ⎥
[ ]
bc = b • c = b1b2 ...b p ⎢ ⎥ = b1c1 + b2 c 2 + ... + b p c p = un scalaire
1
⎢ ... ⎥
⎢ ⎥
⎢⎣c p ⎥⎦
A (B + C) = (AB ) C A (B + C) = AB + AC (B - C)A = BA − CA
mais en général, AB ≠ BA . De plus, (AB ) = B ' A '
'
En géométrie analytique, on peut montrer que le produit scalaire de deux vecteurs obéit à la relation
suivante :
Il ressort de cette formule que deux vecteurs dont le produit scalaire est égal à 0 sont orthogonaux.
ANNEXE 3 17
Déterminant
Le déterminant d’une matrice carrée B noté B , est un scalaire. Si l’on écrit cette matrice sous forme
d’un tableau d’éléments, alors on représente son déterminant en remplaçant les crochets par des lignes
verticales.
Le déterminant d’une matrice d’ordre 2 est calculé de la manière suivante :
b11 b12
B = = b11b22 − b12 b21
b21 b22
On calcule les déterminants des matrices n × n , avec n > 2, par le processus suivant de réduction et de
développement utilisant les mineures et les cofacteurs.
⎡0 1 2 ⎤
B = ⎢⎢3 4 5⎥⎥
⎢⎣6 7 8 ⎥⎦
4 5
M 11 = = 4(8) − 5(7 ) = −3
7 8
0 1
M 23 = = 0(7 ) − 1(6) = −3
6 7
1 2
M 31 = = 1(5) − 2(4) = −3
4 5
On définit le cofacteur Bij d’une matrice B d’ordre n en fonction de la mineure associée par
Bij = (− 1)
i+ j
M ij
n n
B = ∑ aik Aik = ∑ a kj Akj
k =1 k =1
⎡ 2 3 4⎤
A = ⎢⎢− 5 5 6⎥⎥
⎢⎣ 7 8 9 ⎥⎦
2(− 1) {5(9) − 6(8)} + 3(− 1) {(− 5)(9) − 6(7 )} + 4(− 1)4 {(− 5)(8) − 5(7 )} = −45
2 3
Le rang de la matrice
Le rang d’une matrice est défini comme le nombre de lignes ou de colonnes linéairement
indépendantes que l’on retrouve dans la matrice
⎡− 1 1 1 ⎤
⎢ 3 0 − 2⎥
⎢ ⎥
⎢⎣ 4 1 − 3⎥⎦
Inversion de matrice
En algèbre matricielle, la division de C par B n’existe pas. L’opération équivalente consiste à
multiplier C par l’inverse ou la matrice réciproque de B. L’inverse la matrice B est noté B-1.
La matrice B-1 doit être unique et la relation B B-1 = B-1 B = I
Dans la nouvelle matrice Λ tous les éléments en dehors de la diagonale sont nuls :
⎡λ11 0 0 ⎤
⎢0 λ22 .... 0 ⎥⎥
Λ=⎢
⎢ ... ... ... ... ⎥
⎢ ⎥
⎣0 0 λnn ⎦
La nouvelle matrice est appelée matrice des valeurs propres (eigenvalues). Les nouvelles variables
dont les associations sont décrites dans la matrice Λ sont linéairement indépendantes les unes des
autres. L’utilisation de la lettre grecque λ pour représenter les valeurs propres est expliquée par le fait
que ces valeurs propres sont des multiplicateurs de Lagrange. La matrice Λ est appelée la forme
canonique de la matrice A .
u i (A − λI ) = 0
De par la nature des éléments, il est nécessaire d’introduire une matrice unité I à l’intérieur de la
parenthèse permettant d’effectuer la différence de deux matrices carrées. Il en ressort donc qu’en
multipliant la matrice carrée (A − λI ) par le vecteur colonne u i , on obtient le vecteur colonne nul
(0).
Si u i est lui-même un vecteur nul l’équation précédente peut être écrite comme :
A - λi I = 0
ANNEXE 3 20
⎡ 2 2⎤
A=⎢ ⎥
⎣2 5⎦
⎡ 2 2⎤ ⎡1 0 ⎤
⎢ 2 5 ⎥ − λ ⎢0 1 ⎥ = 0
⎣ ⎦ ⎣ ⎦
d’où
⎡ 2 2 ⎤ ⎡λ 0 ⎤
⎢2 5⎥ − ⎢ 0 λ ⎥ = 0
⎣ ⎦ ⎣ ⎦
et enfin
2−λ 2
2 5−λ
(2 − λ )(5 − λ ) − 4 = 0
ce qui donne
λ 2 − 7λ + 6 = 0
La résolution de cette équation nous donne les deux valeurs propres de A qui sont :
λ1 = 6 et λ2 = 1
L’ordre des vecteurs propres est arbitraire. Il est alors possible de calculer les vecteurs propres u 1 et
⎛ ⎡2 2⎤ ⎡1 0⎤ ⎞ ⎡u11 ⎤ ⎛ ⎡2 2⎤ ⎡1 0⎤ ⎞ ⎡u12 ⎤
⎜⎢ − ⎟ = ⎜⎢ ⎟
6 ⎢
⎜ 2 5 ⎥ ⎢0 1 ⎥ ⎟ u ⎥ 0 et
⎜ 2 5⎥ − 1⎢0 1⎥ ⎟ ⎢u ⎥ = 0
⎝⎣ ⎦ ⎣ ⎦ ⎠ ⎣ 21 ⎦ ⎝⎣ ⎦ ⎣ ⎦ ⎠ ⎣ 22 ⎦
ANNEXE 3 21
⎡− 4 2⎤ ⎡u11 ⎤ ⎡1 2⎤ ⎡u12 ⎤
⎢ 2 1 ⎥ ⎢u ⎥ = 0 et ⎢ ⎥⎢ ⎥ = 0
⎣ ⎦ ⎣ 21 ⎦ ⎣2 4⎦ ⎣u 22 ⎦
− 4u11 + 2u 21 = 0 1u12 + 2u 22 = 0
− 2u11 + 1u 21 = 0 2u12 + 4u 22 = 0
Ces équations linéaires sont toujours indéterminées. Pour palier à cette indétermination, une valeur
arbitraire par exemple u = 1 peut être assignée à chaque terme u de chaque groupe d’équations.
deviennent − 4 + 2u 21 = 0 1 + 2u 22 = 0
⎡1 ⎤ ⎡ 1 ⎤
⎢ 2⎥ et ⎢ − 1 / 2⎥
⎣ ⎦ ⎣ ⎦
du concept de variance. La variance est une mesure de la dispersion d’une variable aléatoire y j autour
de sa moyenne, elle est notée σ 2j . La covariance mesure la dispersion liée de deux variables aléatoires
Les éléments σ jk de la matrice ∑ sont formés des covariances entre toutes les paires des p variables
aléatoires.
ANNEXE 3 22
n 2
∑ (y )
1
s 2j = ij − yj (Equation 1)
n −1 i =1
( )
Dans le même ordre d’idée, le calcul de la covariance s 2j de y j et y k est effectué en utilisant les
( )
variables centrées y ij − y j et ( y ik − y k ) en utilisant une formule de la « variance bivariée ». La
∑ (y )
1
s jk = ij − y j ( y ik − y k ) (Equation 2)
n −1 i =1
Lorsque k = j l’équation 2 est égale à l’équation 1. La racine carrée de la variance est appelée l’écart-
type ( σ j ). L’écart-type (donc la covariance) a l’avantage d’être mesuré sur la même échelle que les
positive implique que la majorité des points est située dans les quadrants I et III. Ceci correspond à
une relation positive entre les deux descripteurs. L’inverse est vrai pour une covariance négative pour
laquelle la majorité des points est dans les quadrants II et IV. Dans le cas d’une covariance faible ou
nulle, les points sont distribués de manière équitable parmi les quatre quadrants du graphique. La
covariance mesure en quelque sorte leur association linéaire.
Enfin, dérivant directement des fonctions décrites précédemment et afin de déterminer leur
dépendance linéaire, il est utile d’introduire la notion de corrélation qui est la mesure la plus
communément utilisée en pratique.
La corrélation entre deux variables est calculée en divisant la covariance par le produit de leurs
déviations standard. La corrélation est une valeur sans unité. En général, c’est la mesure la plus utile
de l’indépendance entre deux variables. Le coefficient de corrélation de Pearson r , défini ci-dessous,
r 2 est souvent utilisé pour mesurer la fraction de la variance totale qui peut être modélisée par cette
mesure d’association linéaire. Ainsi le r est défini comme suit :
s jk ∑ (y
i =1
ij − y j )( y ik − y k )
r jk = =
s j sk n n
∑ (yij − y j )2 ∑ ( y ik − y k )2
i =1 i =1
ANNEXE 3 23
Comme pour la matrice de dispersion, il est possible de construire la matrice corrélation P (rho) dont
les éléments sont constitués des coefficients de corrélation linéaire ρ jk :
⎡ 1 ρ12 ... ρ1 p ⎤
⎢ρ 1 ... ρ 2 p ⎥⎥
⎢ 21
⎢ . . ... . ⎥
P=⎢ .⎥
⎢ . . ... . ⎥
⎢ . . ... . ⎥
⎢ ⎥
⎣⎢ ρ p1 ρ p2 ... 1 ⎦⎥
La matrice de corrélation est en fait la matrice de dispersion des variables standardisées. On peut
remarquer que les éléments de la diagonale de la matrice P sont égaux à 1. Ceci découle du fait que la
comparaison de n’importe quel élément avec lui-même est un cas de dépendance complète qui donne
une valeur de corrélation égale à 1.
Le coefficient de corrélation de Spearman est utilisé pour analyser des variables ne suivant pas une loi
normale, il s’agit donc d’un test non-paramétrique. Le r statistique de Spearman appelé ρ (rho) est
basé sur l’idée que des descripteurs apportent la même information (sont en parfaite corrélation) si les
rangs de chaque objet sont les mêmes pour les deux descripteurs.
L’exemple suivant illustre le calcul d’un coefficient de corrélation avec la méthode de Spearman:
∑ (y
i =1
ij − y j )( y ik − y k )
r jk =
n n
∑ (y − yj) ∑ (y − yk )
2 2
ij ik
i =1 i =1
En introduisant les données numériques dans la formule ci-dessus avec les données de l’exemple ci-
dessus, on obtient le calcul suivant :
−2 −2
r12 = = = −0.4
5X 5 5
ANNEXE 3 24
Une corrélation parfaite serait de 1 lorsque tous les points sont alignés.
ANNEXE 4 25
Annexe 4
Description des bases de données
servant à l’extraction des valeurs
des constituants principaux ainsi
que des macros visual basic®
écrites pour la comparaison
d’échantillons
ANNEXE 4 26
Introduction
Cette annexe présente la structure des différents outils (tableur excel ®, File Maker Pro ®) entrant en ligne de
compte dans l’analyse des produits stupéfiants et dans la gestion des informations mises en évidence.
Bouton de démarrage
macro
La première opération consiste à vérifier les temps de rétention des substances utilisées pour la comparaison.
Ensuite la macro peut être activée en pressant sur le bouton démarrage macro.
Une fois que l’on a pressé sur le bouton macro la boîte de dialogue suivante apparaît :
Lorsque la macro d’introduction a été lancée (soit pour les constituants majeurs ou pour les adultérants), les
données relatives aux aires de chaque composé cible ont été introduites dans un classeur Microsoft Excel ®. Il
faut encore contrôler qu’aucune aberration ne se soit produite. Les données se présentent sous cette forme :
ANNEXE 4 28
Les données ainsi entrées ayant été contrôlées, il faut les exporter pour les introduire dans la base de données
centrale. Pour ce faire, il suffit de presser sur le bouton « Macro mise à jour ». Les fichiers .dif nécessaires sont
alors automatiquement créés.
La phase suivante consiste à compléter la base principale avec ces nouvelles données. La base de données se
présente sous la forme suivante :
Bouton
importer
Bouton
exporter
Figure 4: Base de données File Maker Pro 4 regroupant l’ensemble des échantillons.
ANNEXE 4 29
Pour importer les données, il suffit de cliquer sur le bouton importer. Le masque présenté ci-dessus permet
d’effectuer un certains nombres d’opérations. Dans un premier temps, il nous permet de trier les échantillons
quant à leur pureté en cocaïne ou diacétylmorphine, à leurs adultérations, à leur lieu de saisie,…. Ces tris sont
très utiles car dans certains cas ils nous permettent d’effectuer une première sélection avant l’exportation des
échantillons à comparer.
Une autre option de la base consiste à avoir inclus une rubrique lot de production et profil. Ces rubriques sont
rattachées à une base liée où tous les échantillons possédant un lien chimique (appartenance à une classe
chimique) sont répertoriés. Lorsqu’une valeur apparaît dans une des deux rubriques, il suffit de cliquer sur un
des carrés adjacents pour activer le fichier lié respectif. Cette option permet de se rendre compte très rapidement
si le prélèvement en question possède des liens chimiques et s’il appartient à une classe chimique.
La figure de la page suivante présente un exemple de ce qui est décrit ci-dessus
Figure 5: Base de données regroupant les liens entre les différents échantillons.
ANNEXE 4 30
Par la suite il s’agit d’exporter les échantillons que l’on veut comparer. Pour ce faire, on active le bouton
exporter. Il se crée alors un fichier exportTot.dif qui sera utilisé dans le classeur excel KetoHeroFinal001 pour
effectuer la comparaison.
Le fichier KetoHeroFinal001 se présente de la manière suivante :
Il suffit d’entrer le nombre d’échantillons et de cliquer sur introduction, la macro se charge d’introduire les
échantillons et de les préparer à la comparaison (les valeurs sont normalisées à l’aire de la diacétylmorphine ou
de la cocaïne).
Le deuxième bouton effectue exactement le même travail. La différence réside dans le fait que les valeurs des
aires ne sont plus normalisées, mais elles sont remplacées par leur valeur de z-score. Lorsque l’on veut travailler
avec des valeurs ayant des unités différentes, il est nécessaire de transformer les valeurs en valeurs sans unités.
Pour ce faire on calcule la moyenne de la variable et son écart-type. On peut alors calculer la déviation absolue
de la moyenne, on obtient alors le z-score [Kaufmann et Rousseeuw, 1990].
ANNEXE 4 31
Lorsque les valeurs ont été introduites on peut alors passez à la comparaison. Il suffit alors de peser sur le
bouton comparaison et la boîte de dialogue suivante apparaît :
Une fois la comparaison effectuée il ne reste plus qu’à effectuer la dernière opération qui consiste à l’épuration
des résultats.
Détail de la macro d'extraction des données stockées sur le CPG Perkin Elmer écrite en Visual
Basic®
Private Sub CommandButton1_Click() Déclaration des variables
'macro impuretés
Dim echantillon As Integer
Dim fich As Variant
Dim repertoire As String
Dim No As Integer
Dim echantrech As String
Dim echantrech2 As String
Dim val1 As Variant
Dim val2 As Variant
Dim i As Integer
Dim c As Variant
val2 = "0"
Windows("INTRO_hero.xls").Activate
Sheets("traitement").Select
Range("c30").Select
Selection.PasteSpecial Paste:=xlValues,
Operation:=xlNone, SkipBlanks:= _
False, Transpose:=False
ANNEXE 4 34
Windows("INTRO_hero.xls").Activate
Sheets("traitement").Select
Range("J9:q9").Select
Selection.Copy
Range("C1").Select
Selection.PasteSpecial Paste:=xlValues,
Operation:=xlNone, SkipBlanks:= _
False, Transpose:=False
Range("A1:l1").Select
Application.CutCopyMode = False
Selection.Copy
Sheets("HERO-PRINC").Select
Range("A3").Select
Selection.PasteSpecial Paste:=xlValues,
Operation:=xlNone, SkipBlanks:= _
False, Transpose:=False
Windows("INTRO_hero.xls").Activate
Sheets("Traitement").Select Effacement des valeurs copiées provenant du tx0
actif
Range("A30:C100").Select
Application.CutCopyMode = False
Selection.ClearContents
End Sub
ANNEXE 4 35
Range("A3", sel).Select
Selection.Copy Cette partie copie les données qui
Windows(classnom).Activate formeront le classeur adNom.dif qui
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone, regroupe les différents prélèvements
SkipBlanks:= _ analysés et leur adultération
False, Transpose:=False
Application.CutCopyMode = False
Rows("1:1").Select
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False
'enregistrement au format xls et dif
ChDir "D:\Gestion données PFS\Héroïne"
ActiveSheet.SaveAs FileName:= _
"D:\Gestion données PFS\héroïne\adNom",
FileFormat:=xlNormal, _
Password:="", WriteResPassword:="",
ReadOnlyRecommended:=False, _
CreateBackup:=False
ActiveSheet.SaveAs FileName:= _
"D:\Gestion données PFS\héroïne\adnom",
FileFormat:=xlDIF, _
CreateBackup:=False
ActiveWorkbook.Close
'partie adnom2
Workbooks.Add Dans cette partie on procède de la
classnom = ActiveWorkbook.Name même manière que décrite ci-dessus où
l'on va créer un classeur Adult_noms
contenant des informations à introduire
dans la base principale
Windows("INTRO_hero.xls").Activate
Sheets("adult_noms").Select
Range("A3", sel1).Select
Selection.Copy
Windows(classnom).Activate
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False
Windows("INTRO_hero.xls").Activate
Sheets("adult_noms").Select
Rows("1:1").Select
Selection.Copy
Windows(classnom).Activate
Rows("1:1").Select
Selection.Insert Shift:=xlDown
Rows("1:1").Select
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False
FileFormat:=xlNormal, _
Password:="", WriteResPassword:="",
ReadOnlyRecommended:=False, _
CreateBackup:=False
ActiveSheet.SaveAs FileName:= _
"D:\Gestion données PFS\héroïne\adNom2",
FileFormat:=xlDIF, _
CreateBackup:=False
ActiveWorkbook.Close
Sheets("concat").Select
Set plageSource = Worksheets("concat").Range("A2:b2")
Set plageÀremplir = Worksheets("concat").Range("A2", sel2)
plageSource.AutoFill Destination:=plageÀremplir
Range("A3", sel2).Select
Selection.Copy
Windows(classnom).Activate
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False
Windows("INTRO_hero.xls").Activate
Sheets("concat").Select
Rows("1:1").Select
Selection.Copy
Windows(classnom).Activate
Rows("1:1").Select
Selection.Insert Shift:=xlDown
Rows("1:1").Select
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False
ActiveWorkbook.Close
Windows("INTRO_hero.xls").Activate
Sheets("hero-princ2").Select
Range("A3", sel1).Select
Selection.Copy
Windows(classnom).Activate
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False
Windows("INTRO_hero.xls").Activate
Sheets("hero-princ2").Select
Rows("1:1").Select
Selection.Copy
Windows(classnom).Activate
Rows("1:1").Select
Selection.Insert Shift:=xlDown
Rows("1:1").Select
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False
ActiveWorkbook.Close
Sheets("hero-princ2").Select
Range("A3", sel4).Select
Selection.ClearContents
Sheets("hero-adult").Select
Range("A3", sel1).Select
Selection.ClearContents
Sheets("noms conc").Select
Range("A3", sel1).Select
Selection.ClearContents
Sheets("concat").Select
Range("A3", sel2).Select
Selection.ClearContents
Application.DisplayAlerts = True
End Sub
ANNEXE 4 40
Windows("KetoherFinal001.xls").Activate
Sheets("Zscores").Select
Range("A2").Select
ActiveSheet.Paste
Sheets("Zscores2").Select
Range("A2:AX2").Select
Set plagesource = Worksheets("Zscores2").Range("A2:ax2")
Set plageÀremplir = Worksheets("Zscores2").Range("A2", sel1)
plagesource.AutoFill Destination:=plageÀremplir On incrémente une plage de cellules, qui
elles-mêmes contiennent des formules
Range("A2", sel1).Select
selection.Copy
Sheets("hero-princ2").Select
Range("A3").Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Sheets("keto").Select
Set plagesource = Worksheets("keto").Range("A2:g2")
Set plageÀremplir = Worksheets("keto").Range("A2", sel2)
plagesource.AutoFill Destination:=plageÀremplir
Sheets("Zscores2").Select
Range("A3", sel1).Select
selection.ClearContents
' cpt = 0
Windows("ketoherfinal001").Activate
Sheets("hero-princ2").Select
Rows(i).Select On sélectionne la ligne du prélèvement
que l'on veut analyser
selection.Copy On la copie
Sheets("hero-princ2").Select
Rows(2).Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone, On la colle en position 2 (2ème ligne)
SkipBlanks:= _ dans le classeur hero-princ2
False, Transpose:=False
Sheets("Keto").Select
Set plagesource = Worksheets("Keto").Range("A2:g2")
Set plageÀremplir = Worksheets("Keto").Range("A2", selec1) Dans le classeur Keto, on incrémente
les cellules de la première ligne
plagesource.AutoFill Destination:=plageÀremplir
'Worksheets("hero-princ").Rows(1).Select
Sheets("Keto").Select
Range("A2", selec1).Select
Application.CutCopyMode = False
selection.Copy
Sheets("Keto2").Select On fait la même chose que ci-dessus
mais pour le classeur Keto2
Range("A2").Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
ANNEXE 4 43
False, Transpose:=False
selection.Sort Key1:=Range("B2"), Order1:=xlDescending,
Header:=xlGuess, _
OrderCustom:=1, MatchCase:=False, Orientation:=xlTopToBottom
cpt = cpt + 1
End If
Next j
Sheets("keto3").Select
Range("a2", "g" & cpt + 1).Select
selection.ClearContents Les classeurs sont prêts pour une
nouvelle comparaison
Next i
MsgBox ("la macro de comparaison est terminée") Affichage d'un message lorsque la
macro est terminée
End Sub
ANNEXE 4 45
Windows("classeur2.xls").Activate
Sheets("final1").Select
Range("b2").Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
ANNEXE 4 46
Sheets("feuil1").Select
Range("b2", sele).Select
selection.Copy
Sheets("epur2").Select
Range("b2").Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Windows("classeur2.xls").Activate
Sheets("epur2").Select
Set plagesource = Worksheets("epur2").Range("A2")
Set plageÀremplir = Worksheets("epur2").Range("A2", sele2)
plagesource.AutoFill Destination:=plageÀremplir
Next j
Next cpt
ANNEXE 4 47
Next i
Sheets("epur2").Select
Range("a1", sele).Select
selection.Copy
Sheets("final1").Select On copie les résultats contenus dans
epur2 dans final1
Range("A1").Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
MsgBox ("La macro épuration 1 est terminée") Message lorsque la macro est
terminée
Application.ScreenUpdating = True On réactive la vision des changements
de fenêtres
End Sub
ANNEXE 4 48
Windows("classeur2.xls").Activate
echantillon = Worksheets("epur1").Range("a1").Value + 1 Affectation de la variable
échantillon
sele = "CC" & echantillon Affectation de la variable
sele
sel = "a" & echantillon Affectation de la variable
sel
On accélère la macro en
cachant les
Application.ScreenUpdating = False changements de fenêtres
Sheets("epur2").Select
Range("b2", sele).Select
selection.Copy
Sheets("final2").Select
Range("b2").Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone, SkipBlanks:= _
False, Transpose:=False
End If
Next j
Next k
Application.ScreenUpdating = True On réactive la vision des
End Sub changements de fenêtres
sub epurer1()
Sheets("final2").Select
Rows(cpt + cpt4).Select
Application.CutCopyMode = False
selection.Delete Shift:=xlUp
If cpt4 < 1 Then
cpt4 = cpt4
Else
cpt4 = cpt4 - 1
End If
If cpt4 = 1 Then
cpt4 = 0
End If
cpt2 = 2
Windows("classeur2.xls").Activate
Sheets("final2").Select
Range("A1").Select
Set plagesource = Worksheets("final2").Range("a1")
Set plageÀremplir = Worksheets("final2").Range("a1", sel)
plagesource.AutoFill Destination:=plageÀremplir
Sub sauver()
ActiveWorkbook.SaveAs FileName:="D:\Test visual basic\comparaison2.xls", _ On sauve le classeur sous
le nom comparaison2.xls
FileFormat:=xlNormal, Password:="", WriteResPassword:="", _
ReadOnlyRecommended:=False, CreateBackup:=False
ANNEXE 4 51
Annexe 5
Représentation graphique des
tests des fractions
ANNEXE 5 53
2.2
2.0
1.8
1.6
1.4
1.2
1.0
.8
N= 3 3 3 3 3 3 3 3
11.5
11.0
10.5
10.0
9.5
9.0
8.5
N= 3 3 3 3 3 3 3 3
3.5
3.0
2.5
2.0
1.5
1.0
N= 3 3 3 3 3 3 3 3
60
50
40
30
20
10
N= 3 3 3 3 3 3 3 3
18
16
14
12
10
6
N= 3 3 3 3 3 3 3 3
70
60
50
40
30
20
N= 3 3 3 3 3 3 3 3
.5
.4
.3
.2
N= 4 4 4 4 4 4 4 4
7.8
7.6
7.4
7.2
7.0
6.8
6.6
N= 4 4 4 4 4 4 4 4
2.0
1.8
1.6
1.4
1.2
1.0
N= 4 4 4 4 4 4 4 4
40
30
20
10
0
N= 4 4 4 4 4 4 4 4
3.8
3.6
3.4
3.2
3.0
2.8
2.6
2.4
N= 4 4 4 4 4 4 4 4
12
11
10
7
N= 4 4 4 4 4 4 4 4
.35
.34
.33
.32
.31
.30
5
.29
.28
.27
N= 6 6 6 6 6 6 6 6
.30
.28
.26
.24
.22
.20
.18
N= 6 6 6 6 6 6 6 6
.5
.4 6
.3
.2
N= 6 6 6 6 6 6 6 6
.8
.7
.6
.5
N= 6 6 6 6 6 6 6 6
1.4
5
1.3
1.2
1
1.1
1
5
1.0
.9
.8
.7
N= 6 6 6 6 6 6 6 6
1.4
1.3
1.2
6
1.1
1.0
.9
.8
.7
N= 6 6 6 6 6 6 6 6
70
60
50
40
30
20
10
N= 4 4 4 4 4 4 4 4
62
60
58
56
54
52
50
N= 6 6 6 6 6 6 6 6