0% ont trouvé ce document utile (0 vote)
147 vues274 pages

1 These Esseiva

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1/ 274

UNIVERSITE DE LAUSANNE

FACULTE DE DROIT
ECOLE DES SCIENCES CRIMINELLES
INSTITUT DE POLICE SCIENTIFIQUE

LE PROFILAGE DE L’HEROÏNE ET DE LA COCAÏNE

MISE EN PLACE D’UNE SYSTEMATIQUE


PERMETTANT UNE UTILISATION
OPERATIONNELLE DES LIENS CHIMIQUES

THESE DE DOCTORAT
Présentée à

l’Institut de Police Scientifique


de l’Université de Lausanne

Par

PIERRE ESSEIVA
Licencié en sciences forensique
de l’Université de Lausanne

2004
Remerciements
Ce travail de thèse a été réalisé à l’Institut de Police Scientifique de l’Université de Lausanne sous la
direction de Monsieur le Professeur Pierre MARGOT.

Le jury était composé de Monsieur le Professeur Pierre MARGOT, directeur de l’Institut de Police
Scientifique, directeur de thèse, de Monsieur le Professeur Franco TARONI, Professeur à l’Institut de
Police Scientifique, président, de Monsieur le Docteur Olivier GUENIAT, chef de la police de sûreté
du canton de Neuchâtel, de Monsieur le Docteur Fabrice BESACIER, chef de la section analyse de
stupéfiants du laboratoire de police scientifique de Lyon, de Monsieur le Docteur Henk HUIZER,
XTC project leader Netherlands Forensic Institute et de Monsieur le Docteur Jean-Luc VEZ, directeur
de l’Office fédéral de la police.

Je tiens à exprimer ma vive gratitude aux personnes qui m’ont fait bénéficier de leurs connaissances et
qui m’ont soutenu lors de la réalisation de cette recherche.
Je tiens également à remercier tout particulièrement :
Mon amie Sonia pour ses encouragements et sa compréhension.

Ma famille pour sa confiance et son soutien inconditionnel.

Le Professeur Pierre MARGOT dont les conseils judicieux m’ont permis d’orienter les voies de
recherches à suivre.
Monsieur le Docteur Olivier GUENIAT qui m’a transmis sa passion pour l’analyse des produits
stupéfiants.

Monsieur le Professeur Olivier RIBAUX pour ces nombreux conseils relatifs à l’analyse criminelle.

Monsieur Frederic ANGLADA et Monsieur le Docteur Olivier DELEMONT pour les nombreuses
discussions et leurs idées éclairées.
Toutes les personnes du groupe stupéfiants ou ayant transité par ce dernier.

Monsieur Romain VOISARD pour ses conseils informatiques.


Les inspectrices et inspecteurs du Service d’Identification Judiciaire de Neuchâtel et tout spécialement
Messieurs Emre ERTAN et Raphaël JALLARD.

Françoise et Hans AEBERSOLD, pour leur amitié et la relecture méticuleuse de mon manuscrit.

Les brigades stupéfiants des cantons du Jura, Vaud, Neuchâtel, Genève et Tessin pour leur
disponibilité et pour avoir cru en l’utilité des liens chimiques.

Tous mes collègues, amis, anciens étudiants et étudiants de l’Institut de Police Scientifique qui m’ont
suivi et soutenu lors de cette aventure.
TABLES DES MATIÈRES 1

TABLES DES MATIÈRES


1. Introduction ....................................................................................4
1.1. Introduction.................................................................................................................................. 5
2. Héroïne, cocaïne, de la plante aux stupéfiants .............................8
2.1. La Plante ...................................................................................................................................... 9
2.1.1. Le cocaïer ............................................................................................................................................ 9
2.1.2. Le pavot ............................................................................................................................................. 10
2.2. Fabrication et composition chimique de la cocaïne ................................................................... 12
2.2.1. Les différentes phases de production de la cocaïne ........................................................................... 12
2.2.2. La pâte de coca .................................................................................................................................. 12
2.2.3. Cocaïne base...................................................................................................................................... 13
2.2.4. Cocaïne HCl ...................................................................................................................................... 13
2.2.5. Le « freebasing » et le crack .............................................................................................................. 14
2.2.6. Composition chimique des feuilles de coca....................................................................................... 15
2.3. Fabrication et composition de l’héroïne..................................................................................... 16
2.3.1. Opium purifié .................................................................................................................................... 16
2.3.2. Les usages de l'opium ........................................................................................................................ 16
2.3.3. La morphine....................................................................................................................................... 17
2.3.4. L’héroïne ........................................................................................................................................... 18
2.3.5. La composition chimique de l’opium (les formules chimiques des composés principaux figurent
dans l’Annexe 1) ................................................................................................................................ 20
3. Aperçu du marché illicite de l’héroïne et de la cocaïne.............22
3.1. Introduction................................................................................................................................ 23
3.2. La genèse du grand trafic ........................................................................................................... 23
3.3. Le trafic de cocaïne, les cartels colombiens............................................................................... 24
3.4. Le trafic d’héroïne,..................................................................................................................... 26
3.4.1. L’emblématique Afghanistan ............................................................................................................ 26
3.4.2. Les autres pôles du trafic d’opiacés................................................................................................... 29
3.5. Le trafic de cocaïne en Suisse .................................................................................................... 30
3.6. Le trafic d’héroïne en Suisse...................................................................................................... 32
3.7. Conclusion ................................................................................................................................. 34
4. Mise en évidence des composantes de profilage.........................36
4.1. Introduction................................................................................................................................ 37
4.2. Bref historique des méthodes de profilage de l’héroïne............................................................. 38
4.2.1. Introduction ....................................................................................................................................... 38
4.2.2. Les constituants majeurs.................................................................................................................... 39
4.2.3. Les constituants mineurs.................................................................................................................... 41
4.2.4. Analyse des profils inorganiques....................................................................................................... 43
4.2.5. Les profils de solvants ....................................................................................................................... 45
4.3. Bref historique des méthodes de comparaison de la cocaïne ..................................................... 47
4.3.1. Introduction ....................................................................................................................................... 47
4.3.2. Les constituants majeurs de la cocaïne .............................................................................................. 48
5. Analyses des résultats : choix de la methode (hypothèse 1) ......52
5.1. Processus de comparaison, méthodes à disposition ................................................................... 53
5.1.1. Comparaisons entre méthodes ........................................................................................................... 53
Méthode analytique ..................................................................................................................................... 55
5.1.2. Théorie de l’analyse canonique ......................................................................................................... 59
5.1.3. L'analyse de corrélation canonique.................................................................................................... 61
5.1.4. Utilisation de l’analyse canonique dans l’analyse d’échantillons d’héroïne...................................... 63
5.1.4.1. Les résultats et interprétation de l’analyse canonique .................................................................... 63
5.1.5. Conclusion......................................................................................................................................... 66
TABLES DES MATIÈRES 2

6. Algorithmes de comparaison (hypothèses 2.1, 2.2)....................68


6.1. Introduction................................................................................................................................ 69
6.2. Méthodes de mesure de distance................................................................................................ 69
6.2.1. Distance Euclidienne ......................................................................................................................... 70
6.2.2. Mesure de Manhattan et le coefficient métrique de similarité de Canberra....................................... 71
6.2.3. La méthode du quotient (quotient method)........................................................................................ 72
6.2.4. Les distances de Minkowski.............................................................................................................. 73
6.3. Les corrélations .......................................................................................................................... 73
6.4. Les méthodes de clustering ........................................................................................................ 75
6.5. SIMCA et techniques neuronales............................................................................................... 77
6.6. Choix d’une métrique pour la comparaison d’échantillons d’héroïne ....................................... 77
6.6.1. Résultats ............................................................................................................................................ 78
6.6.2. Discussion des résultats ..................................................................................................................... 80
6.6.3. Conclusion......................................................................................................................................... 81
7. Etude de la fonction cosinus (hypothèse 2.2)..............................84
7.1. Distribution des différentes variables......................................................................................... 85
7.1.1. Tests de normalité.............................................................................................................................. 85
7.1.2. Mesures de la corrélation entre différentes variables......................................................................... 87
7.1.3. Résultats et discussion ....................................................................................................................... 87
7.2. La fonction cosinus pour la comparaison des chromatogrammes.............................................. 92
7.2.1. Introduction ....................................................................................................................................... 92
7.2.2. Développement de la fonction cosinus .............................................................................................. 93
7.2.3. Evaluation des valeurs prise par la fonction cosinus carré lors de la comparaison d’échantillons non
liés...................................................................................................................................................... 94
7.2.4. Utilisation d’un échantillon référence................................................................................................ 99
7.2.5. Analyse des fractions de l’héroïne et de la cocaïne ......................................................................... 101
7.2.5.1. Introduction .................................................................................................................................. 101
7.2.5.2. Les diagrammes en boîtes ou box-plot ......................................................................................... 102
7.2.5.3. Homogénéité des saisies d’héroïne et de cocaïne, l’utilisation des fractions................................ 104
7.2.5.4. Discussion des résultats ................................................................................................................ 104
7.2.6. Mélange de deux saisies de produits stupéfiants ............................................................................. 111
7.2.7. Evaluation des faux positifs............................................................................................................. 111
7.2.8. Etude de l’effet de compensation : .................................................................................................. 113
7.2.9. Inversion entre deux constituants, que se passe-t-il ? ...................................................................... 116
7.2.10. Conclusions ................................................................................................................................... 117
8. Les techniques de reconnaissance de groupe ou « Pattern
Recognition » ..............................................................................118
8.1. Introduction.............................................................................................................................. 119
8.2. L’analyse en composante principale (ACP)............................................................................. 121
8.3. Aperçu théorique de l’analyse en composante principale........................................................ 122
8.3.1. Introduction ..................................................................................................................................... 122
8.3.2. Les axes principaux ......................................................................................................................... 122
8.3.3. Rotation des axes translatés en axes principaux .............................................................................. 122
8.3.4. L’analyse en composante principale................................................................................................ 126
8.3.5. Exemple numérique :....................................................................................................................... 126
8.3.6. Calcul et représentation des composantes principales ..................................................................... 128
8.3.7. Proposition d’utilisation de la composante principale dans la comparaison d’échantillons d’héroïne
et de cocaïne..................................................................................................................................... 130
8.3.7.1. Introduction .................................................................................................................................. 130
8.3.7.2. Résultats et discussions ................................................................................................................ 130
8.3.7.3. Nombre de composantes à prendre en considération.................................................................... 134
8.3.7.4. Mesures des composantes principales pour chaque prélèvement ................................................. 135
8.3.8. Validation des résultats par la fonction cosinus............................................................................... 138
8.3.9. Interprétation des composantes principales des constituants majeurs de l’héroïne et de la cocaïne 143
8.3.10. Evolution des coefficients des composantes principales dans le temps......................................... 145
8.4. Mise en place des classes ......................................................................................................... 149
8.5. SIMCA (Soft Independant Modeling of Class Analogies) ...................................................... 152
8.5.1. Introduction ..................................................................................................................................... 152
8.5.2. Mise oeuvre de la technique ............................................................................................................ 154
TABLES DES MATIÈRES 3

8.5.3. Généralisation à toute la base de données ....................................................................................... 155


8.5.4. Pouvoir discriminant des différentes variables utilisées pour créer le modèle ................................ 157
8.5.5. Evaluation des modèles quant à leurs potentiels de classification................................................... 159
8.6. Technique neuronales .............................................................................................................. 159
8.6.1. Introduction ..................................................................................................................................... 159
8.6.2. Résultats .......................................................................................................................................... 160
8.6.3. Conclusions ..................................................................................................................................... 162
8.7. Proposition d’une séquence d’analyse ..................................................................................... 163
8.8. Conclusions.............................................................................................................................. 164
9. Interprétation et gestion des liens chimiques (hypothèses 3 et 4)
.....................................................................................................166
9.1. IBase® et l’Analyst Notebook® dans la gestion des liens ...................................................... 167
9.1.1. Introduction ..................................................................................................................................... 167
9.1.2. Architecture de la base de données (Ibase®)................................................................................... 167
9.1.3. Visualisation : mise en valeur de l’information............................................................................... 170
9.1.4. Interaction liens chimiques/informations policières ........................................................................ 175
9.1.5. Exemple réel :.................................................................................................................................. 178
9.1.6. Interprétation des liens, qu’est-on en mesure de conclure ? ............................................................ 180
9.2. Conclusions.............................................................................................................................. 184
10. Discussion générale des résultats.............................................186
10.1. Introduction............................................................................................................................ 187
10.2. Choix de la méthode analytique............................................................................................. 187
10.3. Méthode de comparaison des chromatogrammes .................................................................. 189
10.4. Les classes chimiques ............................................................................................................ 191
10.5. Gestion des liens .................................................................................................................... 193
10.6. Perspective ............................................................................................................................. 194
11. Conclusion.................................................................................196
11.1. Conclusion ............................................................................................................................. 197
12. Bibliographie.............................................................................200
12.1. Bibliographie.......................................................................................................................... 201
INTRODUCTION 4

1. INTRODUCTION
INTRODUCTION 5

1.1. Introduction
La production, la consommation et le trafic de substances illicites, héroïne et cocaïne,
constituent un sérieux problème moral, économique et de santé publique auquel se heurtent les
sociétés. L’essentiel des réactions a porté sur l’étude des causes sociales, psychologiques ou
psychiatriques qui amènent un individu à la toxicomanie. L’action répressive s’oriente quant à elle
systématiquement vers les personnes, leurs provenances et la surveillance de leurs activités. Si de
nombreuses saisies sont effectuées, son effet sur l’ampleur du trafic reste modeste en regard des
moyens investis (écoutes téléphoniques, observations, conditions difficiles avec recours systématique
à des traducteurs, etc.). De plus, l’image du marché reste très partielle car les personnes arrêtées
appartiennent souvent à un maillon plus ou moins fermé de la chaîne.

Quantité d’informations relatives à la composition des stupéfiants à l’endroit et au moment de


leurs saisies reste souvent inexploitée, alors que celle-ci peut donner une connaissance complémentaire
et objective de l’ampleur, de la dynamique et de la nature du trafic. Les structures des organisations
criminelles étant très dynamiques, cette connaissance limitée dans le temps est un indicateur
permettant de suivre l’évolution du marché et de la structure du trafic. Cette approche est connue sous
la locution anglaise de « drug intelligence ».
Depuis 1993, une recherche [Guéniat, 2003] a visé à déterminer des données stratégiques et
opérationnelles sur le trafic de stupéfiants dans des zones géographiques limitées et distribuées en
Suisse. Les résultats nous donnent des informations partielles, mais pertinentes, utiles aux organes
judiciaires répressifs. Cependant, une composante demeure difficile à maîtriser : la connaissance des
voies d’introduction et de la qualité des produits stupéfiants introduits dans le pays. L’acquisition de
connaissance est particulièrement freinée par le fractionnement des organes judiciaires compétents.

Plus spécifiquement les données relatives aux saisies de stupéfiants ne sont pas exploitées. Le
traitement systématique et coordonné de ces informations vise à comprendre en temps réel les
mécanismes d’approvisionnement et de distribution de l’héroïne et de la cocaïne. Les liens entre des
saisies internes et l’état dans lequel ces stupéfiants entrent dans le pays, coupées, préparées,
conditionnées, devraient apporter une connaissance importante de l’organisation des réseaux mafieux
en amont des dealers / consommateurs locaux.

Une meilleure compréhension de ces phénomènes au travers de l’analyse de ces données passe
par une image ou une définition des voies d’introduction utilisées par les trafiquants en fonction du
lieu et du temps. La gestion globale et coordonnée de ces informations conjointement aux
renseignements traditionnels vise à optimaliser l’engagement des ressources policières et douanières
appropriées à l’échelle du pays.

Dans un premier temps, le problème de l’identité des saisies c’est-à-dire aux fondements de
l’établissement des liens chimiques entre échantillons est étudié. Il s’agit de mieux comprendre les
fonctions utilisées pour comparer les échantillons entre eux ainsi que la mise en place de techniques
statistiques (analyse en composante principale, analyse canonique) trouvant des applications directes
INTRODUCTION 6

dans le travail de routine. Dans un second temps, l’utilisation d’outils permettant une gestion et une
visualisation des liens chimiques mis en évidence est évaluée.
La thèse de Guéniat a permis la validation de techniques analytiques permettant d’extraire une
signature chimique ou un profil de la saisie. La notion de lien chimique et son interprétation
(compréhension de l’organisation du trafic illicite de stupéfiants) ont été abordées. Notre démarche
vise maintenant à cerner quelques rouages de l’organisation du trafic de stupéfiants et de proposer une
architecture cohérente et efficace de la gestion des analyses des produits stupéfiants. Le but poursuivi
par ce travail est de fournir une information opérationnelle utile aux forces de police actives dans la
lutte contre le trafic de stupéfiant.
7
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 8

2. HEROÏNE, COCAÏNE, DE LA PLANTE


AUX STUPEFIANTS
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 9

2.1. La Plante
2.1.1. Le cocaïer
Le cocaïer est un arbuste cultivé, taillé à une hauteur variable selon les régions de production.
Les rameaux, de coloration rougeâtre portent des feuilles ovales, entières, courtement pétiolées. Les
fleurs, pentamères, sont blanc jaunâtre. Le fruit est une petite drupe rouge. La mastication entraîne
plus ou moins rapidement une anesthésie de la langue et des muqueuses. Dans le cas des Erythroxylum
cultivés pour la production de feuilles riches en cocaïne, on peut distinguer quatre variétés rattachées à
deux espèces, E. coca et E. novogranatense.

Figure 1 : Illustration d'une plante d'Erythroxylum coca.


E. coca var. coca, originaire des Andes péruviennes et boliviennes est actuellement cultivé
dans la région orientale humide de la Cordillère, dans les zones de Cusco et de Huanuco au Pérou et,
en Bolivie, dans les Yungas et dans la zone de Cochabamba. Une autre variété, la var. ipadu Plowman,
est cultivée dans les basses-terres du bassin amazonien par des ethnies semi-nomades. La variété E.
novogranatense var. truxillense [Bruneton, 1993] est caractéristique des zones sèches du nord du
Pérou et de l’Equateur. La Figure 2 représente les principales zones de production. On voit aisément
qu’entre 2000 et 2001 la répartition de la production a peu changé plaçant la Colombie en tête de file
des pays producteurs en s’accaparant environ les trois quarts de la production mondiale de feuilles de
coca.
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 10

Figure 2: Zones de production de l'Erythroxylum coca. On voit aisément que la Colombie est le
principal pays producteur de feuilles de coca [Office des Nations Unies pour le contrôle
des drogues et la prévention du crime, 2002].

2.1.2. Le pavot
Abstraction faite des innombrables espèces de "pavots sauvages" et "pavots de jardin" que l'on
cultive dans presque tous les pays, comme fleurs d'ornement ou d'agrément, il existe une quarantaine
au moins de variétés différentes de pavots somnifères connues. Elles se distinguent par la couleur des
fleurs et la forme des capsules.

La taxinomie du genre est complexe et il existe de nombreuses divergences au sein des


spécialistes. La position adoptée par la Flora Europaea est qu’il existe trois sous-espèces de Papaver
somniferum : deux cultivées (ssp. somniferum et ssp. songaricum Basil) et une sauvage : ssp. setigum
(DC.) Corb., à capsules plus petites.

Les variétés de pavots simples, à petites têtes rondes, légèrement anguleuses, qui s'ouvrent à
maturité et qui se rapprochent des espèces sauvages, résistent davantage au froid et à la chaleur.
Craignant moins les mauvaises herbes, elles exigent moins de soins. Elles sont cultivées aux Indes, en
Afghanistan, en Iran, en ex-Union-Soviétique, dans certaines régions de l'Anatolie occidentale et, très
peu, dans les Balkans. Leurs productions ne sont pas très abondantes.
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 11

Figure 3: Illustration du Papaver setigum (à gauche) et du Papaver somniferum (à droite).


Les pavots fermés, dits aveugles, caractérisés par leurs capsules plus grosses, élargies à la
base, dépourvues d'ouvertures (d'opercules) sous les stigmates, sont cultivés dans presque toutes les
régions d'Asie et dans les Balkans. Les capsules sont moyennes ou très grosses. Leur production de
graines et de suc laiteux est très abondante et la teneur en morphine de leur opium est presque toujours
riche. Les deux principales zones de production du pavot sont le triangle d’or et le croissant d’or (cf.
Figure 4).

Figure 4: Zone de production du pavot [Office des Nations Unies pour le contrôle des drogues et la
prévention du crime, 2002].
La physionomie de la production de pavot a grandement changé entre 2000 et 2001. En effet,
suite à l’interdiction de culture du pavot édictée en 2000 par le mollah Omar chef du régime des
Talibans, la production afghane a diminué drastiquement, mais augmente à nouveau suite à la chute du
régime.
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 12

2.2. Fabrication et composition chimique de la cocaïne


2.2.1. Les différentes phases de production de la cocaïne
La production de cocaïne se fait en trois phases :

• Extraction de la pâte de coca des feuilles du cocaïer.

• Purification de la pâte de coca en cocaïne base

• Conversion de la cocaïne base en son sel hydrochloré

2.2.2. La pâte de coca


Il existe trois méthodes d’extraction [Casale et Klein, 1993] :

La méthode d’extraction au solvant (utilisée au Pérou, Colombie et en Equateur)


Les feuilles de coca sont macérées dans un peu d’eau ; on ajoute une base inorganique afin de
s’assurer que la cocaïne est sous sa forme de base libre (chaux ou un sel carbonate). Ensuite, un
solvant non miscible à l’eau est ajouté (souvent du kérosène, du diesel, du fuel, ou de l’essence). Le
tout est alors mélangé pour que la cocaïne sous forme de base soit extraite par le solvant. Il est
possible de faire plusieurs extractions avec les mêmes feuilles de coca afin d’extraire le maximum
d’alcaloïdes. Le solvant est ensuite récupéré et on lui ajoute de l’acide sulfurique dilué transformant la
cocaïne en son sel sulfaté soluble en solution aqueuse. La solution ainsi obtenue est appelée « agua
rica ». Par souci d’économie, le solvant est souvent réutilisé.

Dans la phase finale un excès de base (hydroxyde de calcium ou hydroxyde de sodium) est
ajouté à l’« agua rica » qui neutralise l’acide sulfurique et convertit la cocaïne sous forme de sel en
cocaïne base qui précipite dans la solution aqueuse sous la forme d’une gomme jaunâtre. La substance
solide ainsi récupérée est la pâte de coca. Cette dernière est filtrée puis séchée.

La quantité de cocaïne présente dans la pâte de coca varie de 30 à 80%. Cette pâte est
également constituée d’autres alcaloïdes et de substances inorganiques.

Bazuco
Une variante de cette première méthode consiste à extraire le bazuco. Il est obtenu en
mélangeant un diluant insoluble (farine) à la solution d’acide sulfurique diluée avant l’extraction par le
solvant organique. La base ajoutée induit une première précipitation qui est filtrée. Le filtrat ainsi
obtenu est séché, il s’agit du bazuco. La farine est utilisée comme indicateur visuel pour différencier
les deux phases. En se séparant de cette phase riche en cinnamoylcocaïne, on diminuera les quantités
d’agent d’oxydation nécessaires pour purifier la cocaïne et la poudre obtenue sera plus pure et plus
blanche.

La technique de l’extraction acide (utilisée en Bolivie)


Les feuilles sont placées dans une tranchée (Pozo) dans laquelle on ajoute une solution d’acide
sulfurique diluée. L’acide sulfurique transforme la cocaïne base en cocaïne sulfate qui se dissout dans
la solution aqueuse. Cette phase est récupérée par siphonage et filtration. Un excès d’hydroxyde de
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 13

calcium ou carbonate est alors ajouté au « jus » d’acide sulfurique. Cette opération transforme la
cocaïne sulfate en cocaïne base qui va précipiter. La pâte est alors extraite avec du kérosène. De
l’acide sulfurique est additionné à ce dernier faisant précipiter la cocaïne. La solution obtenue est
l’ « agua rica » définie plus haut. Les Pozo contenant les feuilles de coca subissent plusieurs fois la
même opération avec les mêmes feuilles. Le même kérosène est utilisé plusieurs fois et s’enrichit en
cocaïne. L’ « agua rica » est alors traitée de manière similaire que lors de la technique d’extraction au
solvant. Elle est donc rendue basique par addition d’une base inorganique pour obtenir la précipitation
de la pâte de coca. Cette technique a l’avantage d’utiliser peu de solvant organique. Diverses variantes
des techniques présentées ci-dessus existent.

2.2.3. Cocaïne base


La conversion de la pâte de coca en cocaïne base est une procédure de purification. La pâte de
coca est dissoute dans une petite quantité d’acide sulfurique dilué. La solution est alors titrée avec une
solution concentrée de permanganate de potassium, un puissant oxydant. Il réagit avec les alcaloïdes
oxydables. Il est ajouté par petite dose et le précipité qui se forme est récupéré. La solution acide est
alors filtrée et traitée avec de l’ammoniaque diluée. La cocaïne se transforme en base et elle précipite.

Une variante également très utilisée consiste à effectuer une transformation dite « de la feuille-
à la base ». En utilisant cette technique, on n'extrait jamais la pâte de coca. La solution non-oxydée
(solution d’ « agua rica ») que l’on obtient lors de l’extraction au kérosène est ajustée à un pH plus
élevé avec un sel de carbonate ou bicarbonate et est directement traitée au permanganate de potassium
[Casale et Meyers, 1996].

2.2.4. Cocaïne HCl


La transformation est effectuée normalement par lot de 1kg maximum dans des laboratoires
assez sophistiqués. La méthode peut varier considérablement d’un laboratoire à un autre surtout dans
le choix des solvants.

La cocaïne base est dissoute dans du diéthyléther. Elle est ensuite filtrée et débarrassée d’une
grande partie de ses impuretés. On ajoute de l’acétone et de l’acide chlorhydrique concentré. La
cocaïne se retrouve sous sa forme de sel hydrochloré. Les solvants utilisés peuvent varier en respectant
les conditions suivantes : il faut que la cocaïne base soit soluble dans le solvant A (diethylether), le
solvant B (acétone) doit être miscible dans l’acide chlorhydrique concentré et la cocaïne HCl doit être
insoluble dans le mélange A+B. La majeure partie des impuretés présentes dans la pâte de coca initiale
se retrouve dans le produit final.

La cocaïne est également "coupée", diluée ou adultérée avec d'autres substances. Les diluants
(substances pharmacologiquement non actives) rencontrés le plus souvent sont des sucres tels que le
lactose, le glucose ou le mannitol. Les adultérants (substances pharmacologiquement actives) les plus
utilisés sont l’acide acétylsalycilique, l’acide citrique et la caféine.
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 14

La cocaïne est principalement présente sous sa forme hydrochlorée dans le marché illicite. Sa
concentration rencontrée dans les divers prélèvements peut varier dans un intervalle compris entre 15
et 100%.

Pureté année 2000 Pureté année 2001


100 150

80

100
Nombre d'échantillons

Nombre d'échantillons
60

40
50

20

0 0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100

[% en HCL] [% en HCL]

pureté année 2002


140

120

100
Nombre d'échantillons

80

60

40

20

0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100

[% en HCL]

Figure 5: Pureté des échantillons de cocaïne HCl (calculs effectués sur environ 1000 échantillons
analysés entre 2000-2002 à l’IPS).

2.2.5. Le « freebasing » et le crack


La cocaïne est également fumée (« freebasing »). La forme basique est la plus adéquate pour
effectuer cette opération (T°C fusion plus bas). Pour former cette base libre, il suffit d’ajouter de
l’ammoniaque concentrée à une solution d’eau et de cocaïne hydrochlorée. Par la suite, il faut extraire
la base libre avec un solvant immiscible par exemple l’éther. La phase éthérée est récupérée et
évaporée à sec.
Le crack est très à la mode surtout aux USA (depuis quelques années également en Suisse). Sa
fabrication est très facile : il suffit de dissoudre la cocaïne hydrochlorée dans de l’eau et du
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 15

bicarbonate de sodium que l’on porte à ébullition. La cocaïne base précipite dans la solution
bouillante. Cette préparation ne nécessite pas de solvants inflammables. La base est éventuellement
mélangée à du tabac, à du chanvre ou à d’autres herbes. Les formes fumées produisent très rapidement
des effets intenses (absorption pulmonaire rapide, concentration plasmatique très élevée) mais de
courte durée ; la dépression profonde qui suit pousse à la réutilisation, la dépendance s’installe très
rapidement.

2.2.6. Composition chimique des feuilles de coca.


La plante renferme une quantité variable d’huiles essentielles à salicylate de méthyle, de
flavonoïdes et de tanins. La teneur en alcaloïdes varie entre 0,5 et 1,5% selon l’espèce, la variété,
l’origine géographique, etc. Le constituant principal (30 à 50 %) est un alcaloïde ester, volatil à l’état
de base, la cocaïne (méthyl-benzoyl-ecgonine) que l’on retrouve dans certaines variétés de plantes
issues de la famille Erythroxylum. Elle est accompagnée d’autres dérivés de l’ecgonine : les
cinnamylcocaïnes et les truxillines principalement [Casale et Klein, 1993],[Moore et Casale, 1994].
D’autres traces (souvent désignée sous le vocable d’impuretés) sont également présentes. Elles
trouvent leur origine soit dans la plante elle-même ou résultent de transformations chimiques se
produisant lors de l’isolation de la cocaïne (les formules chimiques des traces principales figurent dans
l’Annexe 1). Une description de ces dernières est fournie ci-dessous [Casale et Waggoner, 1991].
L’anhydroecgonine methyl ester est une molécule basique présente en trace. Elle est le
produit d’hydrolyse de la cocaïne après l’élimination d’une molécule d’eau suite au départ de l’acide
benzoïque par l’hydrolyse acide. Elle peut également être produite par hydrolyse des truxillines et de
l’ecgonine methyl ester. L’anhydroecgonine methyl ester, composé basique est co-extraite avec la
cocaïne lors des processus de purification. L’utilisation de KMnO4 (permanganate de potassium)
détruit l’anhydroecgonine methyl ester. Cette molécule est également un artefact obtenu par
chromatographie en phase gazeuse.
L’anhydroecgonine, une molécule amphotère, est produite par une hydrolyse acide et une
élimination d’une molécule d’eau. La décomposition de plusieurs alcaloïdes (cocaïne,
benzoylecgonine, ecgonine, anhydroecgonine methyl ester et ecgonine methyl ester) forme
l’anhydroecgonine. Elle n’est pas co-extraite avec la cocaïne à cause de son acidité et de sa solubilité
en milieu basique. Elle est détruite par l’oxydation au permanganate de potassium.

L’ecgonine methyl ester (EME) provient de deux sources : la première résulte de l’hydrolyse
de la cocaïne et la seconde de sa présence dans les feuilles de l’Erythroxylum coca. L’EME est co-
extraite avec la cocaïne à cause de ses propriétés basiques. Néanmoins, elle ne supporte pas le
permanganate de potassium et est facilement saponifiée comme base libre en ecgonine.

L’ecgonine est présente dans les feuilles de l’Erythroxylum coca. C’est un acide carboxilique
hautement soluble dans l’eau. Il est peu probable que l’ecgonine survive à la transformation en sel à
cause de sa forte solubilité dans les solutions aqueuses et vu sa réactivité envers les procédures
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 16

oxydatives. L’ecgonine peut résulter de l’hydrolyse acide de la cocaïne ou, en très faible quantité, de
l’oxydation de la cynnamoylecgonine methyl ester et de l’hydrolyse de la EME.
La tropacocaïne se retrouve dans les feuilles de coca. Elle n’est pas un produit de dégradation
d’un des alcaloïdes de la cocaïne.

La cis et la trans cinnamoylecgonine methyl ester se retrouve dans les feuilles du cocaïer
[Casale et Moore, 1994].

La benzoylecgonine est également présente dans les feuilles. Néanmoins, il s’agit plutôt d’un
produit d’hydrolyse de la cocaïne. Elle n’est pas co-extraite lors de la préparation de la cocaïne du fait
de sa haute solubilité dans les bases faibles et de sa faible solubilité dans le diethyl éther.

La n-formyl cocaïne est une molécule neutre produite par l’oxydation au permanganate de
potassium de la cocaïne [Brewer et Allen, 1991].
La norcocaïne est une molécule basique produite par l’oxydation au permanganate de
potassium [Kumar et Kiser, 1995].

L’hydrolyse de la N-formyl cocaïne, de la norcocaïne et de la tropacocaïne crée peu d’acide


benzoïque, car ces molécules sont présentes en faible concentration.

D’autres substances sont également présentes dans les feuilles en quantité minimes, il s’agit
des truxilinnes, de l’hygrine, la cuscohygrine, les hydroxycocaïne et les trimetoxy substitués
(3,4,5-trimetoxycocaïne ; 3,4,5-trimetoxy-cis-cinnamoylcocaïne ; 3,4,5-trimetoxytropacacaïne)
[Moore et Casale, 1994]. Certaines d’entres elles comme les hydroxycocaïne, les trimetoxy substitués
et les truxillines peuvent également être formées lors de processus dégradation.

2.3. Fabrication et composition de l’héroïne


2.3.1. Opium purifié
L'opium brut contient des matières étrangères, aqueuses ou inertes, qui l'empêchent de brûler
et lui donnent un goût désagréable. Pour le rendre propre à être fumé, il doit subir une série de
préparations, délicates et complexes.

Par opium préparé ou CHANDOO, on entend le produit de l'opium brut, obtenu par une série
d'opérations en particulier, la dissolution et l'ébullition. L’opium est donc dissout dans une solution
aqueuse bouillante qui solubilise la majeure partie des alcaloïdes de l’opium. Il suffit par la suite de
filtrer la solution pour la rendre propre à la consommation.
La teneur en morphine du CHANDOO est généralement faible. Elle varie entre 5 et 9 %
suivant la qualité et la provenance de l'opium brut, utilisé pour sa fabrication.

2.3.2. Les usages de l'opium


Il y a deux façons de consommer de l'opium, l'une consiste à le manger (appelée l'opiophagie)
et l'autre à le fumer.
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 17

Dans le premier cas, il s'agit de ceux qui mangent, mastiquent, absorbent ou avalent l'opium.
L'opium se prend par petites doses 5 à 10 centigrammes par jour, à heures fixes, ou lorsque le besoin
se fait sentir.

Les mangeurs d'opium consomment le CHANDOO, aussi bien que l'opium brut. Mais, d'une
façon générale, l'opium préparé est le moins souvent utilisé du fait de sa confection demandant un
travail long et délicat. Cette pratique est la plus répandue en Inde, en Irak et en Afghanistan.
L'autre façon de consommer l'opium consiste à le fumer. Pour ce faire, les fumeurs utilisent
une pipe. Au moyen, d'une longue aiguille d'acier, de 15 à 20 centimètres, le fumeur puise, dans son
tube, ou dans sa boîte à opium, la valeur de 10 à 20 centigrammes de CHANDOO qu'il arrondit en
boule, et qu'il approche de la flamme d'une petite lampe à mèche, d'un type spécial, dénommée
"Keden". Quand la pâte est bien chauffée, qu'elle se ramollit, et qu'elle commence à s'élever en une
bulle, de couleur ambrée, le fumeur l'applique à l'orifice du fourneau et aspire, par intervalles
réguliers, les bouffées de fumée qui se dégagent de l'opium embrasé. Une petite boule d'opium est
fumée, en moins de 20 à 30 aspirations, c'est-à-dire en moins d'une minute et demie. Dès que la
première boule est consommée, le fumeur en prend une seconde, puis une troisième et, ainsi de suite,
jusqu'à ce qu'il ait épuisé la dose qu'il s'est assignée. On considère qu'un fumeur moyen fume, en
général, une dizaine de petites boules, soit 1 à 2 grammes d'opium, dans la même séance.

2.3.3. La morphine
L’opium purifié est à nouveau dissout dans de l’eau chaude. La solution est alcalinisée en
ajoutant de l’hydroxyde de sodium par exemple. La morphine base insoluble dans l’eau froide est
transformée en son sel, le morphinate de calcium parfaitement soluble. La plupart des autres alcaloïdes
sont insolubles dans cette solution. Une filtration permet d’éliminer ces produits.
Le filtrat est récupéré et légèrement chauffé. On ajoute alors du chlorure d’ammonium pour
atteindre un pH compris entre 8 et 9. On laisse refroidir la solution et la morphine base (ainsi que la
codéine, la noscapine et la papavérine) précipite. On filtre le tout et la morphine base se trouve sous sa
forme d’une poudre beige-brune [Huizer, 1994].

A ce stade il est possible de transformer la morphine base en héroïne. Néanmoins, certains


producteurs lavent leur morphine à l’éther pour éliminer la codéine soluble dans ce solvant. Une autre
méthode de purification de la morphine consiste à la dissoudre dans une solution d’acide
chlorhydrique ou sulfurique transformant la morphine en son sel hydrochloré ou sulfaté. Du charbon
actif est ajouté à la solution qui est chauffée et mélangée. Le charbon actif a pour effet d’éliminer la
plupart des molécules colorées de la morphine base. Cette solution est filtrée puis le filtrat est séché ;
on obtient ensuite la morphine hydrochlorée.

Il est également possible d’ajouter de l’hydroxyde d’ammonium à la solution acide, ou après


avoir redissout le sel hydrochloré de morphine dans une solution acide, pour précipiter la morphine
base qui est filtrée et séchée.
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 18

Elle est consommée essentiellement par voie intraveineuse. En effet, au vu des diverses
applications de la morphine dans le domaine médical, elle se présente le plus fréquemment sous forme
liquide. De nos jours, la morphine est la drogue de la famille des opiacés la moins utilisée illicitement
sur notre territoire.

2.3.4. L’héroïne
La transformation de la morphine en diacétylmorphine (héroïne) nécessite l’utilisation d’un
produit d’acétylation. L’anhydride acétique en est un de choix. Une solution de cette substance est
ajoutée à la morphine (sous forme de base, de sel hydrochloré ou sulfaté). La solution est chauffée à
85°C pendant 5 heures. Du charbon actif est ajouté pour adsorber les impuretés solides. Le tout est
filtré afin d’obtenir une solution limpide. La dernière opération consiste à ajouter du carbonate de
sodium afin de faire précipiter l’héroïne base. Une filtration permet d’obtenir une poudre granuleuse
de couleur blanche.

La transformation de l’héroïne base en héroïne HCl nécessite les produits suivants : de l’alcool
éthylique, de l’éther et de l’acide chlorhydrique. L’héroïne base est dans un premier temps dissoute
dans une fraction d’alcool éthylique et d’acide chlorhydrique. On ajoute ensuite de l’acide
chlorhydrique jusqu’à ce que toute l’héroïne base soit transformée en héroïne HCl. A ce stade on
ajoute de l’alcool éthylique et de l’éther puis on laisse reposer la solution. Dès que les premiers
cristaux apparaissent, on rajoute de l’éther. Lorsque la précipitation est complète, il suffit de récupérer
le précipité par filtration et de le sécher. Le filtrat à l’aspect d’une poudre fine blanche [Huizer, 1994].

Cette poudre fine blanche (héroïne hydrochlorée) était fabriquée dans les années 60 à 80 par
les chimistes de la French Connection et de la Pizza Connexion. De nos jours, l’héroïne provient
majoritairement d’Asie du sud-ouest, d’Afghanistan ou du Pakistan. L’extraction de la morphine
s’effectue principalement dans des bergeries d’alpage où les phases de purification sont souvent
omises. Par la suite, la morphine est envoyée dans des laboratoires possédant un équipement très
modeste (Turquie, Liban, Grèce, Macédoine ou dans les pays producteurs) qui la transformeront en
héroïne base [Koutouzis et Perez, 1996]. Le schéma de fabrication est le suivant : l’héroïne base est
précipitée dans la solution aqueuse de carbonate de calcium ou de sodium et redissoute dans une
solution aqueuse acide à laquelle une base est ajoutée ainsi qu’un solvant immiscible dans lequel
l’héroïne base est soluble. Ensuite le solvant est évaporé et l’héroïne base est récupérée.

Plus encore que d'autres stupéfiants, l'héroïne est "coupée", diluée ou adultérée avec d'autres
substances. Les adultérants les plus utilisés dans ce but sont de loin la caféine, le paracétamol et la
procaïne [Zingg et al., 1998]. Les diluants rencontrés le plus souvent sont des sucres tel que le lactose
ou le mannitol.

L’héroïne saisie en Suisse est principalement sous sa forme de base. Les concentrations
d'héroïne rencontrées dans les échantillons peuvent varier de 4 à 70%. Une légère diminution de la
pureté de la diacétylmorphine en 2002 (voir Figure 6) est observée dans nos résultats d’analyses.
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 19

Pureté année 2000


Pureté année 2001

500 500

400 400
Nombre d'échantillons

Nombre d'échantillons
300 300

200 200

100 100

0 0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100

[% en base]
[% en base]

Pureté année 2002


200

150
Nombre d'échantillons

100

50

0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100

[% en base]

Figure 6: Pureté des échantillons d’héroïne analysés à l’IPS entre 2000 et 2002. Une diminution de
la qualité du produit vendu apparaît en observant les divers graphiques.

Le mode d'administration de l'héroïne se compose de trois procédés, à savoir par la voie


intraveineuse, par fumigation et par "sniff".

La pratique la plus répandue est la voie intraveineuse. Elle permet d'obtenir rapidement "le
flash" recherché. Cette manière de faire nécessite peu de matériel. La poudre achetée est versée dans
une cuillère dont on a tordu le manche de façon à ne pas se brûler lorsqu'on la mettra sur une source de
chaleur, dont la plus usuelle est une bougie. Mais l'héroïne sous forme de base est peu soluble dans
l'eau à pH 7. Pour la solubiliser, il faut acidifier le mélange. La plupart des toxicomanes le font avec
du jus de citron ou de l'acide ascorbique. Une fois l'héroïne dissoute dans l'eau acidifiée, et refroidie, le
mélange est prêt à être injecté.
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 20

Certains toxicomanes combinent l'héroïne avec de la cocaïne. Ce mélange appelé dans le


jargon "Speed Ball", a une action très euphorisante. Cette pratique est bien évidemment dangereuse.
Toutefois, cette manière de procéder est très en vogue.

Pour la méthode fumée, le toxicomane dépose l'héroïne sur du papier d'aluminium et place le
tout au-dessus d'une source de chaleur, par exemple une bougie ou un briquet. Après quelques instants,
il suffit d'inhaler la sublimation ainsi obtenue. Dans le jargon, cette façon de faire est appelée "chasse
au dragon".

L'héroïne peut aussi être fumée en cigarette. Pour cela, elle est mélangée avec du tabac ou de
la marijuana et est consommée comme un joint. Toutefois, ces deux procédés sont principalement
utilisés par des consommateurs débutants, car la montée des effets est moins violente que par injection
intraveineuse.
Le troisième mode de consommation de l'héroïne est le "sniff". Tout comme la cocaïne, elle
est répandue sur une surface lisse, par exemple un miroir, en lui donnant une forme de ligne. Puis à
l'aide d'une paille placée dans une narine, le stupéfiant est "sniffé". L’héroïne HCl se prête
particulièrement à ce genre de pratique.

2.3.5. La composition chimique de l’opium (les formules chimiques des composés


principaux figurent dans l’Annexe 1)
La morphine, alcaloïde majoritaire du groupe des morphinanes est aussi l’alcaloïde le plus
abondant de l’opium (10-12%). C’est une molécule pentacyclique qui possède 5 centres asymétriques :
seul l’énantiomère naturel (lévogyre) est actif (5R, 6S, 9R, 13S, 14R). La présence d’un hydroxyle
phénolique (en 3) confère à cet alcaloïde un caractère amphotère.
Les autres morphinanes sont présents dans l’opium en quantité variable : codéine (2,5-5%) et
la thébaïne moins de 1%.
Un autre alcaloïde pondéralement important dans l’opium est la (-)-noscapine (=narcotine) :
sa teneur varie de 2 à 10%. Ce composé est une base très faible, ses sels sont peu solubles et sa
structure lactonique le rend sensible aux pH alcalins. La noscapine a également été suspectée d’être un
adultérant du fait de sa teneur élevé [Klemenc, 2000] dans certains échantillons, surtout relativement à
la diamorphine. Dans le cadre de cette étude, il a été considéré que la noscapine n’était pas un
adultérant puisque dans aucun échantillon analysé, le cas de figure présenté par Klemenc n’a été
observé.

D’autres dérivés du même groupe, des phtalyltétrahydroisoquinoléines sont présents en


quantité faible ; ils sont accompagnés de sécophtalyisoquinoléines : narcéine, nor-narcéine,
narcéinimide.

Des benzyltétrahydroisoquinoléines (laudanine, laudanosine, laudanidine, codamine,


réticulines…) ainsi qu’un dérivé isoquinoléique la papavérine (teneur moyenne 0,5-1,5%) sont
contenues dans l’opium [Bruneton, 1993].
HÉROÏNE, COCAÏNE, DE LA PLANTE AUX STUPÉFIANTS 21

Le Pavaver somniferum élabore également d’autres types structuraux comme des aporphines
(isoboldine, corytubérine) ou des composé à noyau protopinique comme la protopine et la cryptopine.
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 22

3. APERÇU DU MARCHE ILLICITE DE


L’HEROÏNE ET DE LA COCAÏNE
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 23

3.1. Introduction
Le marché mondial du trafic illicite de stupéfiant est détenu, selon les régions du monde et les
spécificités des produits, par des organisations de type mafieux et terroriste qui par leur structure
organisée leur permet d’assurer la production, la transformation et la diffusion de ces substances à
l’échelle mondiale ainsi que le recyclage des bénéfices engendrés par une telle activité. Le trafic de
stupéfiants n’est qu’une activité parmi d’autres du crime organisé dont l’activité diversifiée,
multinationale, contribue souvent au fonctionnement de certaines économies nationales et participe à
la vie politique et sociale. Il est certain que ces entités doivent disposer d’infrastructures efficaces et
flexibles capables de tromper les organes de contrôles tout en maximisant leurs revenus. Le marché
des stupéfiants est caractérisé par son dynamisme, sa souplesse et sa capacité à s’adapter à des
contraintes changeantes. Il se dégage de cette structure de marché, un caractère hautement
imprévisible rendant souvent illusoire l’efficacité des actions répressives.

3.2. La genèse du grand trafic


Les années 30 virent l’éclosion d’un trafic d’héroïne organisé et très important. Zacharian, un
commerçant arménien, marchand de tapis, se lance avec un associé grec, dans le trafic en gros
d’héroïne. Très vite, d’autres personnes se sont greffées aux deux personnages précités. On trouve
entre autres un Hollandais, des Juifs polonais, et même un Suisse en la personne du Dr Hefti.
L’organisation se fournissait en héroïne dans la ville du Caire. Cette drogue provenait de l’usine
chimique suisse du Dr Hefti, localisée à Altstetten, près de Zürich. Cette entreprise fabriquait sous
licence officielle des opiacés et de la cocaïne. Du Caire, les différentes ramifications de la Zacharian
connexion se chargeaient d’écouler l’héroïne dans toute l’Europe [Labrousse et Koutousis, 1996].

L’homme d’affaires grec Elie Eliopoulos est une autre figure importante dans la genèse du
grand trafic de produits stupéfiants. Ce dernier a également su s’attacher les services de personnes au-
dessus de tout soupçon, lui permettant de mener à bien son trafic d’héroïne. Lorsqu’il décida de partir
à la conquête du marché américain, il n’hésita pas à s’allier à des gangsters déjà en place dans le pays
cible.

Ces organisations au pouvoir très centralisé et concentré sur une personne, employaient déjà
des méthodes d’avant-garde : mobilité, délocalisation, emploi de courtiers et d’hommes de paille,
investissements dans des pays possédant les infrastructures et les législations les plus favorables,
corruption, couverture aux visages multiples (politique, scientifique,...). Les sites de distributions
(compartimentalisation) sont diversifiés, leur structure est parcellisée en entités autonomes dont la
position au sein de l’organisation est évolutive et provisoire. Ces méthodes ne sont pas sans rappeler
celles utilisées de nos jours par les « nouvelles mafias ». Il faut également noter les implications
étatiques dans la distribution des stupéfiants à des fins purement politiques et dont les rouages
bénéficient de protection et d’opacité que l’investigation ne peut que difficilement percer.
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 24

3.3. Le trafic de cocaïne, les cartels colombiens


Les cartels colombiens sont les premiers exportateurs mondiaux de cocaïne. Sous cette
dénomination, sont regroupés des noyaux criminels dont l’origine et la trajectoire diffèrent
notablement. Les cartels de Cali et de Medellin ont commencé leur trafic de cocaïne vers les années
1970 lorsque la demande de l’Amérique du Nord devenait très importante. Les productions
colombiennes de cocaïne explosèrent. La continentalisation de la production et du trafic de cocaïne
commença dans un premier temps comme un phénomène d’irradiation à partir des noyaux colombiens
et, au cours des années 80, suite à la déclaration de guerre des autorités au Cartel de Medellin. Ce
dernier dû se redéployer dans l’ensemble de l’Amérique latine. Le Cartel de Medellin, dirigé par le
tristement célèbre Pablo Escobar, jouissait d’une organisation efficace. Le modus operandi était rôdé
et il existait même une assurance des expéditions dans le sens que si la drogue devait être saisie,
Escobar assurait son remplacement [Labrousse et Koutousis, 1996].

Le cartel de Cali a grandement aidé à éliminer son concurrent de Medellin. C’est la raison
pour laquelle il a été « ignoré » pendant un certain temps par le DEA (Drug Enforcement
Administration). L’arrestation de la plupart des chefs du Cartel de Cali en 1995 (principalement les
frères Orejueta) a eu pour effet de faire éclater les structures du trafic de cocaïne. Cet éclatement a
donné naissance à une multitude d’opérateurs plus indépendants, utilisant les structures mises en place
par les cartels de Cali et de Medellin.
Actuellement, le trafic mondial de cocaïne est dominé largement par les trafiquants
colombiens travaillant pour le groupe armé FARC (forces armées révolutionnaires marxistes de
Colombie), d’aspiration communiste qui veut renverser le gouvernement en place. Grâce aux revenus
générés par le trafic de cocaïne, cette organisation est financièrement indépendante et échange
allègrement cet argent contre des armes ou directement la cocaïne contre ces dernières. Il en va de
même au Pérou (sentier lumineux) et au Nicaragua où la cocaïne et les revenus en découlant
constituent le nerf de la guerre de ces factions révolutionnaires.
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 25

Légende
Route de la cocaïne voie
aérienne, largages

Route de la cocaïne par


camion

Route de la cocaïne
par vedettes ou cargos

Figure 7: Schéma de l’organisation du trafic de cocaïne par les trafiquants colombiens (tiré de
[Labrousse et Koutousis, 1996].
La figure ci-dessus représente le transit de la cocaïne de la Colombie aux Etats-Unis. On
remarque aisément à l’aide de cette carte, la diversité avec laquelle la cocaïne est amenée en Amérique
du Nord. Les trafics routiers, aériens et maritimes sont largement utilisés. Pour ces grandes
organisations, possédant des crédits financiers importants, tous les moyens, aussi onéreux soient-ils,
sont utilisés pour amener la marchandise à bon port.
On remarque que le Mexique constitue un relais important pour l’expédition de la cocaïne
destinée aux Etats-Unis. Une autre voie clé est la route empruntant la région des Caraïbes ou la
Jamaïque et Haïti et dans une moindre mesure Puerto Rico, les Bahamas et la République Dominicaine
jouent un rôle important [DEA Resources 1998-2003]. Des vedettes rapides sont souvent utilisées pour
amener les cargaisons à destination. Les bateaux cargos et les containers sont également choisis pour
faire transiter de grandes quantités de produits stupéfiants.

La cocaïne destinée à l’Europe transite par deux axes principaux, la péninsule ibérique avec
les côtes de Galice et du Portugal ainsi que les îles Canaries et la Hollande avec les ports
d’Amsterdam, Rotterdam et Anvers. Les ports et les Aéroports d’Afrique de l’Ouest constituent
également des relais d’envois provenant d’Amérique du Sud. De là, la cocaïne transite par le détroit de
Gibraltar à destination de l’Italie. Depuis le nord du Maroc, la cocaïne utilise la voie du haschisch et
entre directement en Espagne par la côte. Dans cette zone la contrebande entre l’Afrique et le
continent européen est une véritable tradition.
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 26

L’effondrement du bloc soviétique a également ouvert un nouveau marché pour la cocaïne.


Les trafiquants colombiens possèdent des relations privilégiées avec les responsables du crime
organisé russe. Cette alliance leur offre également de nouvelles voies de pénétrations vers l’Europe
occidentale par la route de l’héroïne à travers les balkans. Les routes clandestines de la cocaïne
deviennent de plus en plus diversifiées pour échapper à la répression policière. La figure suivante
résume les principales voies de distribution de cet alcaloïde.

Légende
Flux du trafic de
cocaïne
Laboratoires
de cocaïne
Culture de coca

Figure 8 : Schématisation des principales voie de la contrebande de la cocaïne (informations tirées


de Office des Nations Unies pour le contrôle des drogues et la prévention du crime, 2002).

3.4. Le trafic d’héroïne,


3.4.1. L’emblématique Afghanistan
Le marché mondial du trafic illicite d’héroïne possède deux pôles principaux, celui constitué
par le croissant d’or (regroupant principalement l’Afghanistan et le Pakistan) et le triangle d’or
(Myanmar, Laos). L’état islamique d’Afghanistan est la plus grande source mondiale de culture et de
transformation d’opium produisant en 2000 le 70% de la production mondiale d’opium illicite [Office
des Nations Unies pour le contrôle des drogues et la prévention du crime, 2002]. Les stupéfiants
constituent la plus grande source de revenus de ce pays du fait de la destruction des infrastructures
économiques résultant des interminables années de guerre. Suite à la retraite des soviétiques en 1989
après plus de 10 ans d’occupation, une guerre civile sanglante a déchiré le pays qui n’avait pas de
gouvernement national fort et reconnu unanimement. Dès lors, les seigneurs de la guerre des
différentes ethnies de ce pays se sont livrés une guerre sans merci pour le pouvoir. La source
principale de financement de ces factions militaires résidait dans les profits engendrés par le trafic
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 27

d’héroïne. Il n’est donc pas étonnant que la production et le trafic de cette substance n’aient cessé
d’augmenter durant cette période.

Production d'opium en Afghanistan


5000

4565
4000

3512
Production d'opium (en tonnes)

3276
2827
3000

2650
2371
2363

2248
2152
2123
2000 1523
1265
1132
876

1000
534
521

445
350
312
212

185
180

0
1982
1983
1984

1990
1991
1992
1993

1998
1999
2000
2001
1980
1981

1985
1986
1987
1988
1989

1994
1995
1996
1997

Année

Figure 9: Production d’opium en Afghanistan [Office des Nations Unies pour le contrôle des
drogues et la prévention du crime, 2002].
Dès 1996, année où les Taliban prirent le contrôle de presque tout le pays et 1999, la
production doubla. L’Afghanistan des Taliban était l’exemple d’un état fondé sur la production illicite
d’opium. A travers ce gain, il ont été à même de maintenir leur régime en place et de soutenir des
groupes terroristes comme Al Qaeda d’Osama bin Laden. En juillet 2000, le dirigeant suprême des
Taliban interdit totalement, par un décret, la culture du pavot à opium essayant par ce geste de s’attirer
la sympathie de dirigeants internationaux. Cette interdiction fut respectée dans la plupart des zones
sous domination des Taliban et les récoltes enregistrèrent un recul de près de 95% passant de 3276
tonnes en 2000 à 185 tonnes en 2001. Elle était ainsi revenue aux niveaux enregistrés 20 ans
auparavant. Cette chute aurait dû se répercuter sur le marché mondial puisqu’une diminution de 3100
tonnes équivaut à diminuer de deux tiers la production mondiale sans que cette dernière soit
compensée par un accroissement de la production dans une autre région du monde (voir Figure 4).
Cette répercussion s’est concrétisée en 2001 par une baisse de plus de moitié des saisies d’opium dans
les pays ayant des frontières communes avec l’Afghanistan (La République islamique d’Iran, le
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 28

Turkménistan, l’Ouzbékistan). Si les saisies d’opium ont diminué, les saisies d’héroïne sont par contre
demeurées relativement stables. Cela semble donc indiquer que des stocks avaient été constitués. Cette
hypothèse est encore accentuée du fait que de manière générale, les prix de l’héroïne n’ont pas pris
l’ascenseur, phénomène souvent associé à une pénurie d’une marchandise spécifique sur le marché.

Concernant les saisies d’héroïne et de morphine en provenance de pays limitrophes de


l’Afghanistan, il a été remarqué en 2001 une intensification de ces dernières principalement au
Tadjikistan et plus au nord dans la Fédération de Russie [Office des Nations Unies pour le contrôle des
drogues et la prévention du crime, 2002]. Ceci semble indiquer que le trafic de la « route du nord » se
soit intensifié au détriment de l’itinéraire traditionnel d’acheminement des opiacés en Europe
occidentale traversant la République islamique d’Iran, le Pakistan et la Turquie. Ce changement
s’explique principalement par le fait que la fin du communisme à ouvert un nouveau marché dans les
pays de l’ex-URSS (qui compte une forte population d’héroïnomanes) et cette « route du nord »
permet également d’accéder à l’Ouest en évitant l’Iran dont la politique de répression est très forte.

Malgré l’ouverture de cette nouvelle voie, la Turquie demeure la principale étape du transit
d’héroïne vers l’Europe occidentale. De là, le transport direct vers l’Ouest, trop voyant devient rare, de
multiples relais (et autant de lieux de stockage) en Europe centrale et dans les Balkans ont été mis en
place. La voie des Balkans, contrôlée par les mafias albanaises qui depuis les guerres des années 90
ont accru leur rôle dans cette région, a été le témoin de violents affrontements entre turcs et albanais
avec comme finalité l’éviction des trafiquants turcs au profit des truands albanais, devenus des relais
obligatoires pour la route du Sud (via la Macédoine et l’Italie) et le trafic destiné à la Suisse. L’Inde et
le Pakistan (via les aéroports internationaux et le port de Karachi) constituent également une voie
privilégiée vers les marchés internationaux. La figure ci-dessous illustre cette dynamique du trafic
d’opiacés à partir de l’Afghanistan.
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 29

Légende
Route de l’héroïne
Laboratoires d’héroïne

Culture de pavot

Figure 10: Principales voies de distribution de l’héroïne depuis l’Afghanistan (informations tirées de
DEA Resources 1998-2003).

3.4.2. Les autres pôles du trafic d’opiacés


L’autre grand producteur de pavot est le Myanmar avec une production avoisinant les 1000
tonnes (cf. Figure 4). La culture et le raffinage du pavot sont effectués en retrait dans les zones
frontières montagneuses. Les groupes ethniques armés tels que les chinois du kokang, l’armée de
l’alliance Nationale Démocratique du Myanmar et l’armée unifiée d’état Wa contrôlent ces zones de
cultures. Ces groupes en conflit avec le pouvoir central tirent de l’opium les revenus nécessaires au
financement de leurs actions militaires. Wei Hsueh Kang le chef des Wa aurait même, selon les
sources américaines, exporté 680 kilos d’héroïne aux Etats-Unis [DEA Resources 1998-2003].
Réfugié dans son enclave du Myanmar, ce baron de la drogue a également su orchestrer la
spectaculaire diversification de ses chimistes étant à l’origine de la fameuse ya ba ou amphétamines
thaï qui a envahi le marché mondial depuis quelques années. Ces organisations alimentent
principalement le marché américain et océanique d’une héroïne sous forme de sel hydrochloré de
grande pureté. La principale route de transit de cette héroïne est la Chine qui accueillerait plus de 50%
de cette contrebande. L’autre voie importante transite par Rangoon, l’Inde et le Bangladesh puis
effectue un relais en Afrique (les ressortissants de l’Afrique de l’ouest, principalement les nigériens
sont très actifs aux USA dans le trafic d’héroïne) avant d’atteindre les USA.
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 30

Deux autres pays jouent également un rôle grandissant dans le trafic d’héroïne et de cocaïne, il
s’agit de la Colombie et du Mexique qui alimentent le marché américain. La Colombie,
vraisemblablement par souci de diversification s’est lancée dans la culture du pavot depuis les années
90. Elle est capable actuellement de produire une centaine de tonnes d’opium par année. Les voies de
contrebande sont les mêmes que celles utilisées pour la cocaïne. Le Mexique quant à lui produit sa
fameuse « black tar » (héroïne grossièrement raffinée mais très pure et peu onéreuse). Sa production
annuelle est estimée à environ 2% de la production mondiale. L’introduction de cette héroïne sur le
marché américain se ferait prioritairement par voies routières via leur frontière commune.

La Figure 11 schématise le trafic mondial d’opiacés.

Légende
Route du Triangle d’Or

Route du Croissant d’Or

Route de Amérique latine

Laboratoires d’héroïne

Culture de pavot

Figure 11: Principales voies de distribution de l’héroïne dans le monde (informations tirées de DEA
Resources 1998-2003).

3.5. Le trafic de cocaïne en Suisse


La cocaïne saisie en Suisse est quasi systématiquement présente sous sa forme de sel
hydrochloré. Il y a très peu de « crack », la forme basique de cet alcaloïde. Dans les années 1970 à
1980, le marché était principalement tenu par les hispanophones qui détenaient unilatéralement les
clefs de l’importation et de la diffusion de la cocaïne sur le marché de la consommation Suisse. Puis,
se sont greffés à la vente et au trafic international, les ressortissants libanais, au plus fort du conflit
qu’a connu le Liban dans le milieu des années 80 (lutte contre Israël et la Syrie ainsi qu’entre clans
musulmans et chrétiens). Le plus grand changement qu’ait connu la Suisse en matière de
cocaïnomanie est survenu en deux étapes : d’une part, le marché de la cocaïne a été dynamisé par
l’essor des mouvements techno dont les participants recherchent des produits stimulants. D’autre part,
la fin du conflit au Kosovo (fin 1999 début 2000) a provoqué une pénurie de l’héroïne dont le marché
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 31

de la vente en Suisse était tenu par les ressortissants albanophones. Le fort ralentissement des flux
migratoires de ces communautés balkaniques a diminué l’accessibilité de l’héroïne. Les héroïnomanes
se sont donc tournés vers la cocaïne dont ils ont fait un usage compulsif. Parallèlement, un nouveau
flux migratoire était apparu en Suisse par l’émergence des Africains de l’Ouest notamment du Nigeria,
de la Sierra Leone, de Guinée, et du Bénin. Ces derniers se sont assez rapidement accaparés du marché
de la vente au détail de cocaïne, du fait que ces pays de l’Afrique de l’Ouest se trouvent sur une des
voies de transit choisie par les cartels colombiens pour acheminer la drogue en Europe. La cocaïne est
acheminée par voie navale, par cargos d’Amérique du Sud vers l’Afrique de l’Ouest, puis utilise le
flux migratoire vers l’Europe. Il était donc logique de retrouver ces personnes dans le commerce de la
vente au détail sur le territoire helvétique et ceci d’autant plus que les bénéfices engendrés par ce
genre de trafic sont très importants.
Le trafic de cocaïne pénètre en Suisse par différentes voies (voir Figure 12) [Guéniat et
Esseiva 2002] :

• Par le traditionnel trafic de la « fourmi », par avions (vols internationaux) et portant


sur de petites quantités, soit par ingestion (« body packing » de 1 à 2 kilos), soit dans
les bagages (1 à 20 kilos). L’aéroport de Kloten est le plus utilisé en Suisse, puis
Genève, Bâle-Mulhouse, Belp et Agno.

• Les données douanières concernant les saisies montrent que le fret représente une part
importante de l’importation de cocaïne en Suisse ; la plupart du temps, elle est cachée
dans des biens de consommation très variés (ananas, huile, habits, tissus,…).

• Par le train, principalement en provenance d’Allemagne en passant par Bâle en


provenance d’Italie par Chiasso, en provenance de France par le TGV et par Genève.

• Par voiture et par camion, notamment en provenance d’Allemagne et d’Italie parfois


de France, en principe dans des caches spécialement aménagées (entre 10 et plusieurs
centaines de kilos).
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 32

Légende
Flux d’importation aérien de
cocaïne en Suisse Constance
Schaffhouse
Flux d’importation terrestre
Winterthur
de cocaïne en Suisse
Bâle
Zürich St-Gall
Flux de distribution de
cocaïne à l’intérieur de la
Suisse
Principaux lieux de
stockage de cocaïne Berne Lucerneee
Neuchâtel

Coire
Fribourg

Lausanne

Genève

Sion
Lugano

Chiasso

Figure 12: Schématique du trafic de cocaïne en Suisse [Guéniat et Esseiva 2002].

Les principaux lieux de stockage de cocaïne sont généralement supposés localisés dans les
villes de tailles importantes de Suisse (principalement Berne, Zürich, Bâle, Genève) regroupant une
forte diaspora originaire de l’Afrique de l’Ouest [Sources policières, communications personnelles].

3.6. Le trafic d’héroïne en Suisse


L’héroïne présente sur le marché Suisse est quasiment toujours sous sa forme de base de
couleur brune provenant principalement d’Afghanistan. Il n’en a pas toujours été ainsi puisque dans
les années 1980, l’héroïne distribuée à l’intérieur de nos frontières provenait des laboratoires de la
célèbre French Connexion qui raffinait un produit de grande pureté, pratiquement de qualité
pharmaceutique : il s’agissait du sel hydrochloré d’héroïne, une poudre blanche et fine. Elle était
produite par de véritables chimistes bénéficiant d’une excellente infrastructure.

La première guerre d’Afghanistan, opposant ce pays à l’URSS, coïncide avec un changement


de produit sur le marché suisse et européen, à savoir l’apparition de l’héroïne-base. Elle est produite
directement et à moindre frais dans les bergeries afghanes, au moyen de produits chimiques
accessibles et primaires (engrais). L’héroïne d’Asie du Sud-Ouest passe alors naturellement sur son
chemin vers l’Europe occidentale par la Turquie, pays incontournable dans le schéma de distribution
et de transit de l’héroïne en Suisse et en Europe. De plus, le conflit turco-kurde, sa frontière avec
l’Iran, sa communauté très bien implantée en Suisse et en Allemagne, la place dans le rôle de leader du
trafic d’héroïne en Europe.
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 33

Le début des années 90 fait apparaître une passation de pouvoir quant à la détention de la
vente sur rue. Le conflit de l’Ex-Yougoslavie confère au Serbes, Bosniaques, Croates, etc, le pouvoir
de la distribution de l’héroïne en Suisse. Les Turcs se retirent et se spécialisent dans la transformation
de la morphine en héroïne et dans la logistique du transit. De nouvelles voies d’acheminement
apparaissent alors au gré des flux migratoires [Labrousse et Koutousis, 1996].

Enfin, la complexité et la durée de la guerre du Kosovo placent les albanophones dans une
situation de domination de la vente d’héroïne en Suisse. Dans ce cas de figure, on retrouve
l’importance du flux migratoire qui détermine le monopole de ce marché illicite dont les bénéfices
servent à financer l’effort de guerre de ces populations. Cette mafia albanophone est basée dans les
principales villes de Suisse (Zurich, Berne et Bâle) où elle cache des stocks parfois importants
d’héroïne (stock pouvant atteindre des centaines de kilos). Le trafic routier est la technique de
contrebande la plus souvent utilisée pour l’acheminement d’héroïne en Suisse. Quelques dizaines de
kilos dans les voitures jusqu’à quelques centaines dans les camions entrent quotidiennement en Suisse
principalement par la douane de Chiasso et par les postes frontières avec l’Allemagne, dont le plus
important à Bâle [Sources policières, communications personnelles].
En ce qui concerne la diffusion de l’héroïne dans les différents cantons, cette organisation
criminelle est très structurée et très disciplinée du fait de son fonctionnement clanique. Elle utilise à
outrance la répartition cantonale des requérants d’asile pour tisser un réseau national couvrant les
besoins de consommation dans pratiquement tous les cantons suisses. Actuellement et depuis la fin du
conflit kosovar, le paysage du trafic d’héroïne a quelque peu changé puisqu’une pénurie de ce produit
s’est fait sentir. Une explication probable de ce phénomène peut être le ralentissement des flux
migratoires des communautés albanophones diminuant l’accessibilité à l’héroïne.

Une schématisation des voies d’entrées de ce stupéfiant en Suisse, de ses lieux de stockage et
de sa dynamique de distribution est illustrée par la figure suivante :
APERÇU DU MARCHÉ ILLICITE DE L’HÉROÏNE ET DE LA COCAÏNE 34

Légende

Flux d’importation d’héroïne en Suisse Constance


Schaffhouse
Flux de distribution d’héroïne à
l’intérieur de la Suisse Winterthur
Bâle
Principaux lieux de stockage Zürich
d’héroïne St-Gall

Berne
Lucerne
Neuchâtel

Coire
Fribourg

Lausanne

Genève

Sion
Lugano

Chiasso

Figure 13: Schématique du trafic de d’héroïne en Suisse [Sources policières, communications


personnelles].

3.7. Conclusion
Ce chapitre permet de mettre en évidence les relations étroites existant entre le trafic de
produits stupéfiants, et les zones d’instabilités politiques, les pouvoirs corrompus ou les guérillas
visant le pouvoir. Dans tous les exemples explicités ci-dessus, le marché illicite de la cocaïne ou de
l’héroïne est utilisé comme moyen de financement de ces organisations illégitimes. Souvent le
domaine d’action répressif est très limité puisque dans certains cas, les politiques, l’armée et même les
milieux financiers influents sont eux-mêmes parties prenantes de ce juteux marché. La mise en
évidence des diverses voies de distributions et des intervenants principaux sont des informations
directement reliées à un niveau d’analyse stratégique puisqu’elles donnent des renseignements sur
l’évolution des tendances du trafic de produits stupéfiants cibles à long terme, offrant la possibilité aux
décideurs d’orienter leur politique de lutte contre le crime en fonctions des connaissances qu’ils ont
acquises sur les différentes formes de criminalité et sur l’ampleur de ces dernières.
Dans le cadre de cette étude nous nous sommes focalisé à un niveau plus local, voire régional.
L’aspect opérationnel, à savoir fournir de l’information utile à l’enquête pour éclaircir des cas concrets
(isolés ou connexes) de manière immédiate, sera privilégié avec en toile de fond, la volonté de
développer un outil utile à la compréhension du trafic dans son organisation de distribution.
35
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 36

4. MISE EN EVIDENCE DES


COMPOSANTES DE PROFILAGE
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 37

4.1. Introduction
Les différentes étapes du prototype de profilage mis au point dans cette étude se décomposent
en 4 phases distinctes:

PHASE 1 PHASE 2
Mise en évidence des composantes Algorithmes de comparaison
de profilage - Méthodes statistiques non supervisées
- Choix de la méthode (mesures de distances, analyse en
analytique composantes principales)
- Analyse canonique - Méthodes statistiques supervisées
(SIMCA, réseaux de neurones)
Hypothèse 1
- L’analyse des constituants Hypothèses 2
majeurs est suffisante pour - 2.1 La mesure de distance du cosinus
mettre en exergue un profil carré est une méthode de choix pour la
chimique des saisies d’héroïne comparaison 2 à 2 d’échantillons
et de cocaïne utilisable dans un d’héroïne et de cocaïne.
concept opérationnel. - 2.2 La mesure de distance du cosinus
carré minimise les risques de faux positifs
et négatifs.
- 2.3 Les méthodes statistiques non
supervisées permettent d’effectuer un
premier tri au sein de la base de données
regroupant les diverses saisies de produits
stupéfiants.
- 2.4 Les méthodes statistiques supervisées
permettent de confirmer les liens établis
au préalable.
PHASE 3

Interprétation, gestion représentation des


liens chimiques
- IBase® PHASE 4
- Analyst Notebook®
- Case Notebook® Abstraction, intégration au sein de
l’enquête, étude de cas
Hypothèse 3
- Ces programmes en offrant la Hypothèse 4
possibilité de représenter les groupes - L’analyse de ces relations et la
et les relations permettent d’émettre mise en commun avec les
des hypothèses sur la structure des informations de police
réseaux de distribution de produits traditionnelles fournissent des
stupéfiants aux niveaux locaux, indices sur l’organisation des
régionaux et inter-régionaux. réseaux de distribution et sur les
sources de production et
d’approvisionnement.

Figure 14: Schématisation des différentes phases constituant la méthode développée dans cette
recherche ainsi que les hypothèses de la présente recherche.
La première phase est consacrée à l'inventaire des méthodes analytiques permettant de générer
la signature chimique des saisies de cocaïne et d’héroïne. Cette signature chimique est en fait le profil
chimique qui est composé d’éléments en traces (souvent appelés impuretés) qui font parties
intégrantes de la matrice de l’héroïne et de la cocaïne. Ces éléments peuvent être des substances
présentes naturellement dans la plante (par exemple la noscapine pour l’héroïne, l’ecgonine pour la
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 38

cocaïne ou les éléments inorganique) et qui sont coextraites avec le stupéfiant (cocaïne et
diacétylmorphine). Ces substances comme la codéine qui se transforme en acétylcodéine par exemple
peuvent également subir des modifications structurelles lors des différentes étapes d’extraction, de
transformation et de purification du stupéfiant. Il peut également s’agir de solvants résiduels utilisés
lors des différentes étapes de fabrication présentées dans le chapitre 2. Le fondement de toute tentative
de comparaison entre saisies de produit stupéfiant consiste à utiliser ces éléments en traces et de
former un profil chimique. Ensuite il s’agit d’estimer le pouvoir discriminant de ce profil ainsi que
l’interprétation des résultats fournis.

Chaque type de variables nécessite la mise en place d’une procédure d’analyse spécifique. Un
bref descriptif de ces méthodes sera effectué en mettant en exergue celles qui présentent les meilleures
performances (pouvoir discriminant, sensibilité, reproductibilité, sélectivité, prix, temps d’analyse,…).

Dans cette phase, on parlera également de la possibilité d’effectuer un choix au sein de ces
méthodes et de la pertinence de les utiliser dans une séquence d’analyse.

4.2. Bref historique des méthodes de profilage de l’héroïne


4.2.1. Introduction
La thèse de O.Guéniat [Guéniat, 2003] propose un historique complet des différentes
méthodes analytiques dans la comparaison d’échantillon d’héroïne et de cocaïne. Quelques points clé
de l’évolution des techniques chromatographique feront ici l’objet d’un développement sans pour
autant entrer dans les détails.
Une des figures marquantes de la comparaison d’échantillons de stupéfiants est très
vraisemblablement Strömberg. Il fut le premier à parler de liens chimiques et de leurs significations
[Strömberg, 1972], [Strömberg et Maehly, 1975], [Strömberg et al, 1983]. D’autres, peu nombreux
[Neumann, 1994], [Huizer, 1988], [Huizer, 1994] [Strömberg et al, 2000], apportèrent une
contribution dans le domaine de l’interprétation des liens chimiques et dans l’harmonisation d’une
méthode de profilage de l’héroïne entre plusieurs laboratoires. Les efforts ont plutôt porté dans la
recherche de nouvelles techniques mais peu sur l’interprétation des résultats.

Le premier article faisant référence à la séparation de différents composants de l’héroïne


(diacétylmorphine, noscapine, papavérine, 6-monoacétylmorphine 3-monoacétylmorphine) est l’œuvre
de Brochmann–Hanssen et Svendsen [Brochmann-Hanssen et Svendsen, 1962].
La chromatographie en phase gazeuse se profile déjà comme une technique de choix dans la
comparaison de liens chimiques. Deux événements importants conditionnèrent la qualité des résultats,
l’apparition des colonnes chromatographiques capillaires et l’utilisation de différents produits de
dérivatisation.

Une grande variété de colonnes ont été testées par Demedts et ses collaborateurs [Demedts et
al., 1983] Chiarotti et ses collaborateurs [Chiarotti et al., 1983] ainsi que Kaa et Bent [Kaa et Bent,
1986]
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 39

De même, certains auteurs ont tenté d’utiliser divers types de produits de dérivatisation. Parmi
ces chercheurs, on peut citer Sobol et Sperling [Sobol et Sperling, 1975], Lim et Chow [Lim et Chow,
1978], Law et al. [Law et al., 1983] Gloger et Neumann [Gloger et Neumann, 1983] et Moore [Moore,
1990].

Différentes techniques chromatographiques ont également été testées comme par exemple un
chromatographe en phase gazeuse (CPG) couplé à un détecteur à capture d’électron (ECD). Ce type de
détecteur plus sensible qu’un détecteur à ionisation de flamme (FID) semble être une technique de
choix pour l’établissement d’une signature chimique d’éléments en trace. Moore et Allen ont
particulièrement favorisé ce type de technique [Moore et al., 1984], [Moore et al., 1986].

Johnston et King [Johnston et King, 1998], O’Neil [O’Neil et al., 1984], [O’Neil et Gough,
1985], [O’Neil et Pitts, 1992], Narayanaswami [Narayanaswami et al.,1979] et Perillo [Perillo et al.,
1994] se sont quant à eux intéressés à la détermination de la provenance des saisies d’héroïne en
étudiant divers paramètres comme les caractéristiques physiques de l’héroïne ou en essayant de créer
des paramètres permettant d’identifier la provenance géographique des saisies. La difficulté de ce
genre d’études réside principalement dans le fait que l’on n’est jamais certain de l’origine des saisies
que l’on utilise comme standard.
D’autres techniques ont également été investiguées, comme dans les travaux utilisant la HPLC
[Cashman et Thornton, 1972], [Baker et Gough, 1981] et les travaux de Besacier [Besacier et al.,
1997] où l’analyse isotopique du 13C a été utilisée comme critère d’origine des saisies et comme
moyen d’effectuer des liens chimiques. Néanmoins, ce type de technique est lourd du point de vue de
la préparation alors que des résultats en temps réels sont essentiels vu le caractère mouvant du trafic. Il
en va de même pour certaines techniques très pointues définies par Moore où le temps nécessaire au
conditionnement de l’échantillon est trop important pour effectuer des analyses en routine. C’est
pourquoi, comme nous le verrons par la suite, la préférence est donnée à des techniques simples du
point de vue de la préparation tout en maintenant un niveau d’information suffisant pour une
utilisation policière opérationnelle. La méthode mise au point par Guéniat [Guéniat, 2003] pour
l’analyse des constituants majeurs est une illustration des techniques que nous privilégierons dans
cette étude.

4.2.2. Les constituants majeurs


Trois méthodes d’analyse peuvent être retenues pour la mise en évidence des constituants
majeurs. Il s’agit de celle mise au point par Stead et ses collaborateurs [Stead et al., 1991], celle de
Gloger et Neumann [Gloger et Neumann, 1983] et celle de Guéniat [Guéniat, 2003].

La méthode mise en place par Stead est simple et permet d’obtenir un profil des constituants
majeurs ainsi que la quantification de la diacétylmorphine. Cette méthode également utilisée par
Barnfield et ses collaborateurs [Barnfield et al., 1988] présente néanmoins certains désavantages. En
effet, il n’est pas possible de chromatographier un large spectre d’adultérants et de diluants (les sucres
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 40

ne peuvent pas être chromatographiés par cette technique) et les molécules sensibles à l’hydrolyse et à
la désacétylation dans l’injecteur se dégradent facilement.
La méthode de Gloger & Neumann inclut dans sa phase de préparation une dérivatisation qui
donne un avantage certain dans la chromatographie FID de composés délicats comme ceux comportant
des groupes hydroxyles, amines ou carboxyles. Finalement et en résumé, cette méthode offre la
possibilité, en une seule analyse, de pouvoir quantifier la diacétylmorphine, de pouvoir séparer les
constituants majeurs de l’héroïne et d’avoir la possibilité de chromatographier un large spectre
d’adultérants et de diluants.

Guéniat s’est inspiré de ces deux méthodes en optimalisant certains critères. Sa méthode
répond à tous les critères chromatographiques définis plus haut. En effet, elle permet de quantifier le
principe actif principal, de séparer de manière satisfaisante les constituants majeurs (méconine,
acétylcodéine, acéthylthébaol, 6-monoacétylmorphine, noscapine, papavérine) ainsi qu’un grand
nombre d’adultérants et de diluants. Elle offre également une bonne sensibilité et une bonne résolution
des pics ainsi qu’une stabilité de certains composés très réactifs (grâce à l’utilisation de la solution de
dérivatisation). Ainsi la méthode retenue par Guéniat est la suivante :
Appareil : GC Perkin Elmer Autosystem

Logiciel : Turbochrom Navigator v4

Colonne : DB1, 30 m, 0.25mm, 0.25 µm

Injecteur : 290°C
Détecteur : 320°C

Four : 150°C, 1min., 150-250°C, 8°C/min., 250-320°C,6°C/min.


Split : 50 :1
He : 1ml/min. (15 psig), H2 45ml/mn, Air 450 ml/mn

1. Chaque échantillon est préparé pour l’analyse de la manière suivante :

2. Peser environ 8mg d’échantillon.

3. Ajouter 500 microlitres d’une solution contenant 1mg/ml d’heneicosane (standard


interne) dans du chloroforme : Pyridine (5 :1).

4. Ajouter 100 microlitres de MSTFA (N-méthyl-N-triméthylsilyl)trifluoroacétamine)


5. Chauffer à 80°C pendant 30 minutes.

6. Laisser reposer 1 heure.

7. Injecter 3 microlitres dans le GC.

8. Pour l’analyse quantitative, préparer 5 standards de 1mg, 2mg, 4mg, 6mg, 8mg et
établir la droite de régression.
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 41

Cette méthode permet de séparer plus d’une quarantaine de standards diluants et adultérants
compris. Elle constitue la méthode de routine établie à l’IPS. Le travail avec une méthode unique,
simple sur la durée permet des comparaisons multiples dans le temps et fournissant une quantité
importante d’information.

C’est donc cette technique qui est adoptée dans ce travail pour effectuer l’analyse et la
comparaison des saisies d’héroïne.

Figure 15: Exemple d’un Chromatogramme typique des constituants majeurs de l’héroïne.
1) Méconine, 2) Heineicosane (standard interne), 3) Acétylcodéine, 4) Acétylthébaol, 5) 6-
monoacétylmorphine, 6) Diacétylmorphine, 7) Papavérine, 8) Noscapine.

4.2.3. Les constituants mineurs


Une autre méthode d’analyse permettant d’effectuer un profilage des saisies d’héroïne basé sur
l’étude des composés acides et neutres de l’héroïne a également été proposée par Allen et al. [Allen et
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 42

al., 1984] et par Neumann et Gloger [Neumann et Gloger, 1982]. Une variante de ces méthodes
analytiques a été choisie dans le cadre de ce travail [Esseiva et Guéniat, 1997].
Les composants constituants le profil chimique de cette méthode sont les suivantes :
N° PIC SUR FIGURE 16 NOM DE LA SUBSTANCE
1 Méconine
8 Tetramethylsilylthebaol
9 O4-Acetylthebaol
12 6-O-,N-Diacetylnorcodeine
13 Unknown
14 4-acetoxy-3,6-dimethoxy-5-[2-(N-methylacetamido)]Ethylphenanthrene
15 3-O,6-O,N-Triacetylnormorphine
18 N-Acetylnorlaudanosine
23 4-acetoxy-3,6-dimethoxy-8-[2-(N-methylacetamido)]Ethylphenanthrene
24 N-Acetylnornarcotine
25 (E)-N-Acetylanhydronornarceine
26 (1R,9R)-1-acetoxy-N-acetyl-1,9-dihydroanhydronornarceine
27 (Z)-N-Acetylanhydronornarceine
Tableau 1 : Composants mineurs prises en compte pour la comparaison.

La méthode mise au point est composée des paramètres analytiques suivants :

Appareil : GC Perkin Elmer Autosystem


Logiciel : Turbochrom Navigator v4

Colonne : DB1, 30 m, 0.25mm, 0.25 µm

Injecteur : 290°C
Détecteur : 320°C

Four : 200°C, 1min., 200-320°C, 4°C/min.,9min.

Split : 50 :1

He : 1ml/min. (15 psig), H2 45ml/mn, Air 450 ml/mn


Chaque échantillon est préparé de la manière suivante :

1. peser 20 mg d’héroïne.

2. ajouter 2 ml de H2SO4 [1M] pour dissoudre l’échantillon.

3. Ajouter 2 ml de toluène.

4. Secouer pendant 5-10 secondes.


5. Reprendre 1 ml de toluène et évaporer à sec sous un flux d’azote.

6. Ajouter au résidu 75 microlitres de chloroforme contenant 0.1mg/ml d’heineicosane.

7. Ajouter 25 microlitres de MSTFA.

8. Chauffer à 75°C pendant 30 minutes.


9. Injecter 2 microlitres dans le GC.
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 43

La figure suivante illustre un chromatogramme obtenu par l’analyse des composants mineurs

Figure 16: Exemple d’un chromatogramme des composants mineurs. Le numéro correspond au nom
du composant répertoriés dans le Tableau 1.

4.2.4. Analyse des profils inorganiques


Cette méthode analytique utilise la spectrométrie d’émission atomique de plasma à couplage
inductif (ICP-AES). Elle permet d’analyser et de quantifier 36 éléments selon une procédure mise en
place par Guéniat [Guéniat, 2003].
L’utilisation de techniques apparentées à l’ICP-MS [Wells et al., 1995] ou à l’absorption
atomique [Chiarotti et al. , 1991] avaient déjà permis d’effectuer du profilage de saisies d’héroïne.
L’instrumentation et les conditions mises en œuvre sont les suivantes :

Appareil : Emission Spectrometer Plasma 1000 Perkin Elmer

Conditions : Argon à 10000°C dans un champ oscillant de 4-50 MHz, 2-5kW

Détecteur : Photomultiplicateur UV-visible


MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 44

Eléments : Zn : 600V 213.856 nm


Fe 600V 238.204 nm

Si 600V 251.611 nm

Mn 600V 257.610 nm

Mg 600V 279.553 nm
Cu 600V 324.753 nm

Ca 600V 394.366 nm

Al 600V 396.152 nm

Sr 600V 407.771 nm
Ba 600V 455.403 nm

Na 600V 589.592 nm

K 600V 766.490 nm

Composition élémentaire

200

180

160
Normalisation au Composé principal

140

120

100

80

60

40

20

8284.8 Na
Mg
Si
8284.7 Sr
Echantillons Mn
Zn Eléments
8283.14 Al
Ba
Cu
8283.10 K

Figure 17: Exemple d’un graphique représentant les profils inorganiques de 4 saisies.
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 45

Chaque échantillon est préparé de la manière suivante :

• Peser 100mg de cocaïne respectivement 50 mg d’héroïne

• Dissoudre dans 5 ml d’acide nitrique suprapur à 5% dans l’eau Elga

• Mettre l’échantillon 5 minutes dans un bain d’ultrasons

• Filtrer la solution au moyen de filtres Milipors à 0.45 µm

Les éléments inorganiques proviennent d'ions absorbés sur le matériel organique [Guéniat,
2003] ce qui peut apporter des informations intéressantes sur l’origine d’une drogue ou sa méthode de
production (les minéraux seraient assimilés par la plante sur son lieu de pousse) . Néanmoins, il faut
être conscient que l’ajout de certains diluants ou adultérants (principalement ceux contenant eux-
mêmes des composés inorganiques) peut masquer le profil minéral d’une saisie.

Cette méthode est intéressante lorsqu’elle est utilisée de manière complémentaire aux
méthodes organiques pour confirmer ou infirmer une apparente identité [Esseiva et Guéniat, 1997].

4.2.5. Les profils de solvants


Une autre méthode élégante de comparaison consiste à rechercher les résidus de solvants se
trouvant dans la matrice de produits stupéfiants.

Le principe de récupération des composés volatils à analyser est le principe « Head-space »,


utilisé notamment dans l’analyse des résidus d’incendie. Il s’agit, en fait, de la récupération des
vapeurs produites par différents moyens (chauffage, vide) au dessus de l’échantillon matrice.

Morello et Meyers [Morello et Meyers 1995] proposaient un système d’extraction « Head-


space » statique intéressant consistant à dissoudre l’héroïne ou la cocaïne dans une solution aqueuse de
sulfate de sodium avant de l’injecter dans un GC-MS (avec une préconcentration des vapeurs avant
l’injection).

Cartier et ses collaborateurs [Cartier et al., 1997], proposent d’utiliser le principe de « l’Head-
space » passif en préconisant une préconcentration des vapeurs sur une trappe de charbon actif
(DFLEX®). Le stupéfiant et le charbon actif sont introduits dans un flacon de 2ml, le charbon actif
étant isolé de la poudre dans un flacon conique. Le tout est chauffé pendant 60 minutes à 80°C. Le
charbon actif va donc prendre au piège les vapeurs résiduelles présentes dans le produit stupéfiant. Le
charbon actif est ensuite élué avec 50 microlitres de CS2 (dissulfure de carbone) dont 1 microlitres est
injecté dans la colonne.
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 46

Figure 18: Exemple d’un chromatogramme de solvants résiduels.


L’instrumentation et les conditions utilisées sont celles décrites par Cartier et al. [Cartier et al.,
1997] :

Appareil : GC-FID Perkin Elmer ® 8500

Colonne : DB-1, 60 m, 0.33 mm, 3.0. µm

Injecteur : 280°C

Détecteur : 280°C

Four : 35°C, 14 min., 35-100°C, 5°C/min, 100-245°C, 7°C/min.


He : 0.7 ml/min. (17 psig), H2 45ml/min, air 450ml/min

Chaque échantillon de cocaïne et d’héroïne est préparé en pesant 300 mg (cocaïne), ou 250 mg
(héroïne) de poudre. Cette méthode permet de séparer une vingtaine de composés organiques volatils à
la base de nombreux solvants.
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 47

4.3. Bref historique des méthodes de comparaison de la cocaïne


4.3.1. Introduction
De même que pour l’héroïne, il existe une panoplie de techniques permettant d’effectuer la
comparaison de la cocaïne. Ce paragraphe traitera plus particulièrement du profil des constituants
majeurs contenus dans la cocaïne. Les techniques permettant de mettre en évidence une signature
inorganique et un profil de solvants résiduels ne seront plus traités spécifiquement puisque ces
techniques, déjà exposées dans le paragraphe consacré à l’héroïne, s’appliquent de la même manière
pour l’analyse de la cocaïne.
Moore et Casale peuvent, par rapport à l’ensemble de leurs publications, être considérés
comme des auteurs centraux dans l’analyse de la cocaïne. En effet, au début des années 70, Moore
[Moore, 1973] étudia deux molécules importantes de la cocaïne, la cis et la trans-cinnamoylecgonine.
Une année plus tard, ses travaux se focalisèrent sur la benzoylecgonine et l’ecgonine [Moore, 1974].
Plus tard en 1987 [Moore et al., 1987], il utilisa un CPG-ECD pour analyser trois acides truxilliques et
deux acides truxiniques. En 1990 [Moore, 1990], il publia un document très complet sur la
dérivatisation en CPG et HPLC. En 1993, il introduisit une nouvelle catégorie de molécules, les
hydroxycocaïnes [Moore et al., 1993a] dans la séquence de comparaison d’échantillons. Cette méthode
fut comparée [Moore et al., 1993b] à celles des acides truxilliques et truxiniques [Moore et al., 1987]
et à celle des constituants majeurs développées par Casale et Waggoner [Casale et Waggoner, 1991].
Moore et ses collaborateurs [Moore et al., 1995] publièrent une revue complète réunissant les diverses
techniques de caractérisation et de détection des alcaloïdes de la cocaïne. En 1996, Moore et ses
collaborateurs utilisèrent la méthode d’analyse des truxillines [Moore et al., 1996] afin de donner un
pronostic sur un pays d’origine. Une fois de plus, Moore et Casale [Moore et Casale, 1997] isolèrent
de nouveaux alcaloïdes en traces dans la feuille du cocaïer. Les articles parus en 1996 et 1997 ont fait
l’objet d’une compilation [Casale et al., 1998]. Finalement, la dernière publication en date [Moore et
Casale, 1998] propose une séquence d’analyse comprenant six techniques pour chaque analyse d’un
prélèvement. Il est à noter que certaines techniques proposées par Moore sont extrêmement
compliquées et n’ont pas réellement d’avenir à des fins opérationnelles. Elles semblent réservées à des
affaires nécessitant d’effectuer un dossier destiné aux tribunaux et non à des fins de renseignements.

Casale, quant à lui, débuta ses recherches en publiant un article sur la différentiation de la
pseudoecgonine et de l’ecgonine par CPG-MS, IR et NMR [Casale, 1990] et par l’étude de
N-acétylnorcocaïne [Casale, 1991]. Casale et Waggoner [Casale et Waggoner, 1991] ont également
développé une méthode permettant d’analyser 13 constituants présents dans la cocaïne. Ces traces sont
étudiées à cause de leurs modes de formation et de leurs propriétés. Ces traces sont celles dites
majeures du fait de leur quantité pouvant être assez importante. Dans cet article, une approche
statistique (notamment une analyse en composantes principales) a également été tentée pour effectuer
la comparaison d’échantillons. Casale et Watterson [Casale et Watterson, 1993] étudieront les réseaux
de neurones également dans l’optique d’effectuer des comparaisons d’échantillons. Casale fut
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 48

également au même titre que Moore, un pionnier dans la découverte de nouveaux alcaloïdes de la
cocaïne [Casale et Moore, 1994], [Casale et Moore, 1996a], [Casale et Moore, 1996b], [Casale et al.,
1998].

D’autres auteurs ont également contribué aux développements du profilage de la cocaïne :


Clark [Clark, 1978] en utilisant les rapports entre différentes traces pour comparer des prélèvements de
produits stupéfiants, Cooper & Allen [Cooper et Allen, 1984] en s’intéressant à certaines voies de
synthèses, LeBelle et ses collaborateurs [LeBelle et al., 1988] en travaillant sur la norcocaïne, et
[Janzen et al., 1994] en s’occupant entre autres de la mise en place de processus permettant d’effectuer
des comparaisons. Ils ont tous, d’une manière ou d’une autre, apporté une contribution au profilage de
la cocaïne.

4.3.2. Les constituants majeurs de la cocaïne


Trois méthodes analytiques principalement permettent de mettre en évidence un profil des
constituants majeurs contenus dans la cocaïne. Ces méthodes sont celles rapportées par Janzen
[Janzen, 1987] Casale et Waggoner [Casale J.F.et Waggoner, 1991] et celle de Guéniat [Guéniat,
2003].
La méthode développée par Janzen est la plus simple mais ne permet pas une quantification de
la cocaïne et le profilage de cette dernière en une seule et même analyse. De plus, il n’est pas possible
de chromatographier les différents adultérants et diluants présents dans la matrice de départ.

La méthode de Casale et Waggoner fait, quant à elle, appel à une dérivatisation au BSA (N,O-
bi(triméthilsilyl)acétamide permettant en une seule analyse de chromatographier adultérants, diluants
et constituants majeurs.

La méthode mise au point par Guéniat reprend une partie des critères de chromatographie mis
en place par Casale et Waggoner. Elle permet en une seule analyse de quantifier la substance active, de
séparer les adultérants et les diluants ainsi que les constituants majeurs.
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 49

Figure 19: Exemple d’un chromatogramme représentant les composants majeurs de la cocaïne (les
numéros des pics correspondent aux numéros des composants répertoriés ci-dessous).

La numérotation des composants listés ci-dessous fait référence au numéro des pics de la
Figure 19. Ces traces sont celles choisies dans cette étude pour définir un profil chimique de la cocaïne

1) Acide benzoïque

2) Anhydroecgonine methyl ester

4) Anhydroecgonine

5) Ecgonine méthyl ester

6) Ecgonine

7) Tropacocaïne
8) Heineicosane (standard interne)

9) Cocaïne

10) Benzoylecgonine

11) Norcocaïne
12) Cis-cinnamoylecgonine méthyl ester
MISE EN ÉVIDENCE DES COMPOSANTES DE PROFILAGE 50

13) Acides truxilliques et truxiniques

14) Trans-cinnamoylecgonine méthyl ester


15) N-Formylcocaïne

Les conditions analytiques de la méthode mise au point par Guéniat [Guéniat, 2003] et
utilisées dans ce travail sont les suivantes :
Appareil : GC Perkin Elmer Autosystem

Logiciel : Turbochrom Navigator v4

Colonne : DB1, 30 m, 0.25mm, 0.25 µm

Injecteur : 230°C

DétecteurC 320°C

Four : 180°C, 1min., 275°C, 4°C/min., durant 5.25 min.


Split : 50 :1

He : 1ml/min. (15 psig), H2 45ml/mn, Air 450 ml/mn

Chaque échantillon est préparé pour l’analyse de la manière suivante :


1. Peser environ 8mg du prélèvement.

2. Ajouter 500 microlitres d’une solution contenant 1mg/ml d’heneicosane (standard


interne) dans du chloroforme : Pyridine (5 :1).

3. Ajouter 100microlitresde MSTFA (N-méthyl-N-triméthylsilyl) trifluoroacétamine)

4. Chauffer à 80°C pendant 30 minutes.

5. Laisser reposer 1 heure.


6. Injecter 3microlitresdans le GC.

7. Pour l’analyse quantitative, préparer 5 standards de 1mg, 2mg, 4mg, 6mg, 8mg et
établir la droite de régression.
51
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 52

5. ANALYSES DES RESULTATS : CHOIX


DE LA METHODE (HYPOTHESE 1)
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 53

5.1. Processus de comparaison, méthodes à disposition


5.1.1. Comparaisons entre méthodes
L’énumération des techniques analytiques montre que l’on dispose de plusieurs techniques
éprouvées permettant de mettre en évidence le profil chimique de produits stupéfiants. Ces techniques
sont utilisées dans une séquence selon le schéma suivant :

Saisie de produit
Processus d’identification
stupéfiant
Méthode de comparaison

Test d’orientation

Microcristaux

TLC Solvants

Solvants ICP

GC-MS GC-FID (constituant


majeurs / mineurs)

GC-MS

Figure 20: Schéma illustrant le processus de profilage utilisé à l’IPS


La figure ci-dessus montre que le processus de comparaison en place à l’IPS, impliquant 4
méthodes analytiques différentes, pénalise la capacité opérationnelle vu le temps nécessaire pour
effectuer ces dernières. De plus, l’information supplémentaire véhiculée par les analyses effectuées en
plus de l’analyse des constituants majeurs n’est pas évidente. Dès lors, une étude empirique [Esseiva
et Guéniat, 1997] a été effectuée afin d’estimer la proportion des liens observés avec la méthode jugée
la plus adéquate pour une utilisation en routine (méthodes analysant les constituants majeurs) qui était
par la suite confirmée ou infirmée par les deux autres méthodes de profilage utilisées en routine
(constituants mineurs et inorganiques). Il est à noter que cette étude a été effectuée uniquement pour
l’héroïne du fait qu’actuellement une seule méthode de comparaison, celle des constituants majeurs,
est utilisée pour le profilage de la cocaïne.
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 54

Ces analyses ont été effectuées en choisissant des saisies distinctes et possédant un nombre
conséquent d’échantillons. Dans le cadre de cette étude, 97 échantillons ont ainsi été choisis. Ces
échantillons provenaient de 12 saisies ayant des profils différents donc considérées comme provenant
de lots différents. Chaque prélèvement (3 prélèvements par échantillons) analysé selon les 3 méthodes
décrites auparavant a été comparé à la base ainsi constituée. L’analyse des solvants a été mise de côté
du fait que cette dernière n’était pas utilisée en routine. La réciprocité des liens chimiques entre les
diverses techniques a ainsi pu être testée.

Le schéma ci-dessous représente la systématique de comparaison adoptée dans cette étude.

Saisie

Echantillon Echantillon Echantillon Echantillon


Préparation,
étiquetage
échantillonnage

Prélèv. Prélèv. Prélèv.


Echantillon

Prélèv.
Analyse GC-FID des Analyse,
constituants majeurs comparaison,
classification Prélèv.

Prélèv.

Echantillon
Analyse,
Analyse GC-FID des comparaison, Comparaison des
constituants mineurs classification Prélèv. liens mis en
évidence avec les
différentes
méthodes
Prélèv.

Prélèv.

Analyse,
Echantillon
Analyse ICP-AES des
constituants comparaison,
inorganiques classification Prélèv.

Prélèv.

Prélèv.

Figure 21: Illustration de la démarche utilisée dans cette étude.


ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 55

Cette figure permet de clarifier la systématique de comparaison adoptée ainsi que de définir
les différents termes relatifs à une saisie. Ainsi, la saisie peut être définie comme le matériel séquestré
par la police (par exemple le matériel séquestré chez un revendeurs, à savoir 1 kilo d’héroïne
conditionné dans 10 minigrip® de 100 grammes). Cette saisie peut être constituée de plusieurs
échantillons (par exemple plusieurs pacsons, ou plusieurs minigrip®). Ensuite analytiquement de
chaque échantillon trois prélèvements sont effectués et analysés selon les méthodes analytiques
choisies. Cette méthode de travail implique l’hypothèse d’homogénéité de l’échantillon analysé sans
quoi il ne serait pas possible d’effectuer un appariement des prélèvements à leur échantillon originel.

Cette étude a montré le potentiel des méthodes analytiques choisies pour classer les
prélèvements dans leur échantillon d’origine et respectivement dans leur saisie (il faut être attentif car
une saisie peut être constituée d’échantillons ayant des profils chimiques différents).

Chaque lien établi à l’aide de la méthode des constituants majeurs a été comparé à
l’information fournie par les deux autres types d’analyses (analyses des constituants mineurs et
inorganiques).

La méthode des constituants majeures a ainsi été choisie comme méthode de référence pour
plusieurs raisons : par rapport à la préparation des échantillons, elle est la plus facile et la plus rapide.
D’un point de vue analytique, les constituants majeurs de l’héroïne permettent de quantifier le produit
actif (diacétylmorphine) dans l’échantillon. La méthode permet également de détecter les différents
adultérants et diluants présents dans l’échantillon. Le tableau ci-après résume ces informations. Le
signe + indique la technique la plus avantageuse.

Méthode analytique Temps de Coûts par Facilité de Informations à


préparation pour échantillon préparation disposition
une série d’analyses
(30 échantillons)
Constituants majeurs ++ ++ ++ ++
Constituants mineurs -- - -- -
Constituants inorganiques - -- - -
Tableau 2: Comparaison entre les différentes techniques de profilage (les signes ++ et -- indiquent un
avantage/désavantage certain de la méthode)

Les résultats indiquent que dans plus de 95% des cas, un lien obtenu par l’analyse des
constituants majeurs est confirmé par les analyses successives des constituants mineurs et des
constituants inorganiques. Cette étude empirique montre une corrélation indéniable entre les types de
traces et qu’il suffit dans la grande majorité des cas d’effectuer la seule analyse des constituants
majeurs pour avoir une information intéressante, pratiquement un temps réel. En cas de série
identifiée, une vérification détaillée de l’ensemble peut être envisagée sur demande spécifique.

Ces constatations de lien effectuées à l'aide de la fonction cosinus [Keto, 1989] ont été
confirmées à l'aide d'une méthode de classification différente. Les techniques de clustering ou analyse
de groupement [Legendre P. et Legendre L., 1998]; [Klemenc, 2001], ont été choisies pour tester les
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 56

liens établis à l'aide de notre méthodologie de travail. Les résultats (voir figures ci-après) pour les
saisies jugées différentes (plusieurs échantillons ont été analysés) montrent que le classement effectué
est similaire et ceci pour les trois types de variables considérées (traces mineures, majeures et
inorganiques).

1.0 0.8 0.6 0.4 0.2 0.0


BE00023.D

BE00023.C

BE00022.D

BE00022.C

BE00023.B

BE00023.A

BE00022.B

BE00022.A

BE00021.D

BE00021.C

BE00021.B

BE00021.A

95JU113.D

95JU113.C

95JU112.C

95JU113.B

95JU113.A

95JU110.C

95JU110.D

95JU112.B

95JU112.A

95JU110.B

95JU110.A

95JU111.D

95JU111.C

95JU111.B

95JU111.A

196FR22.D

196FR22.C

196FR22.B

196FR22.A

196FR12.A

196FR21.D

196FR21.A

196FR21.B

196FR12.D

196FR12.C

196FR21.C

196FR12.B

Figure 22 : Dendrogramme montrant la classification de 5 différentes classes chimiques en utilisant


les techniques de groupage hiérarchiques (hierarchical cluster analysis). Ce résultat
illustre la classification effectuée à l’aide des constituants majeurs de l’héroïne.
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 57

1.0 0.8 0.6 0.4 0.2 0.


BE00023.D

BE00023.A

BE00022.D

BE00022.C

BE00023.C

BE00022.B

BE00022.A

BE00023.B

95JU111.D

95JU111.C

95JU111.B

95JU111.A

95JU113.D

95JU113.C

95JU112.C

95JU112.B

95JU113.B

95JU113.A

95JU112.A

95JU110.C

95JU110.B

95JU110.A

95JU110.D

196FR22.D

196FR21.D

196FR22.C

196FR22.B

196FR22.A

196FR21.C

196FR21.B

196FR21.A

196FR12.D

196FR12.C

196FR12.B

196FR12.A

BE00021.D

BE00021.B

BE00021.C

BE00021.A

Figure 23: Dendrogramme montrant la classification de 5 différentes classes chimiques en utilisant


les techniques de groupage hiérarchiques (hierarchical cluster analysis). Ce résultat
illustre la classification effectuée à l’aide des constituants mineurs de l’héroïne.
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 58

1.0 0.8 0.6 0.4 0.2 0.


BE00023.D

BE00023.C

BE00023.B

BE00023.A

BE00022.B

BE00022.A

BE00022.D

BE00022.C

BE00021.D

BE00021.C

BE00021.B

BE00021.A

95JU113.D

95JU113.C

95JU113.B

95JU113.A

95JU112.C

95JU112.B

95JU112.A

95JU110.D

95JU110.C

95JU110.B

95JU110.A

196FR22.D

196FR22.C

196FR22.B

196FR22.A

196FR12.D

196FR12.C

196FR12.B

196FR12.A

196FR21.D

196FR21.C

196FR21.B

196FR21.A

95JU111.D

95JU111.C

95JU111.B

95JU111.A

Figure 24 : Dendrogramme montrant la classification de 5 différentes classes chimiques en utilisant


les techniques de groupage hiérarchiques (hierarchical cluster analysis). Ce résultat
illustre la classification effectuée à l’aide des constituants inorganiques de l’héroïne.
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 59

Ces trois figures confirment les observations effectuées lors de l’étude préliminaire: Les
constituants mineurs et inorganiques n’amènent pas d’informations supplémentaires ou de manière
limitée, leur analyse n’est donc pas pertinente dans une perspective de renseignement.

Ces constatations empiriques on conduit à analyser ces résultats par l’intermédiaire de


techniques statistiques comme l’analyse canonique puisqu’elle permet de déterminer les liens existants
entre deux ou plusieurs ensembles de variables.

5.1.2. Théorie de l’analyse canonique


Ce paragraphe résume de manière assez simplifiée les différents principes de l’analyse
canonique que l’on trouve développé dans des ouvrages spécifiques [Gittins, 1985], [Legendre P. et
Legendre L., 1998], [Vandeginste et al., 1998], [Saporta, 1990]. Certaines notions font appel au calcul
matriciel qui fait l’objet d’un résumé fourni en annexe (cf. Annexe 3).

L’analyse canonique traite de façon simultanée deux, éventuellement plusieurs, groupes de


données selon le schéma ci-dessous (cf. Figure 25). Elle permet d’effectuer une comparaison directe
de deux matrices de données. L’analyse canonique est utilisée lorsque n individus sont décrits par
deux ensembles de variables et que l’on cherche à examiner les liens existant entre ces deux ensembles
pour déterminer s’ils ont les mêmes propriétés. Pour qu’une analyse canonique puisse être envisagée,
il est nécessaire que chaque ensemble de variables soit constitué d’au moins deux variables ou plus.
L’analyse canonique consiste à trouver un résumé de chaque groupe de variables ayant le maximum de
corrélations avec un résumé d’un autre groupe de variables. Si ces deux espaces sont confondus, cela
prouve que l’on peut se contenter d’un seul des deux ensembles de variables, car ils ont alors un même
pouvoir de description ; s’ils sont orthogonaux, c’est que les deux ensembles de variables
appréhendent des phénomènes totalement différents. Ces deux cas extrêmes étant exceptionnels, on
étudiera les positions géométriques des deux matrices de données obtenues en cherchant la corrélation
maximale entre les jeux de données. Pour des ensembles apparemment liés cette valeur sera élevée
dans le cas contraire, elle sera basse.
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 60

L’analyse canonique implique l’existence d’une matrice réponse Y et d’une matrice


exploratoire X [Gittins, 1985]. Comme pour l’analyse en composante principale, l’analyse canonique
produit des axes orthogonaux.

Variables y1 ... y p Variables x1 ...x m

Matrice Matrice
réponse exploratoire
Y X

Figure 25: Schématisation de l’analyse canonique. Les deux matrices représentées sont celles
utilisées dans l’équation 1

L’analyse canonique peut être représentée par la matrice de dispersion résultant de la fusion
des données de X et Y . Elle se présente sous la forme suivante :

⎡ S y1 , y1 ... S y1 , y p S y1 , x1 ... S y1 , xm ⎤
⎢ . . . . ⎥⎥

⎢ . . . . ⎥
⎢ ⎥
⎢ . . . . ⎥
⎢S y , y ... S y p , y p S y p , x1 ... S y p , xm ⎥ ⎡S YY S YX ⎤ ⎡ S YY S YX ⎤
S Y+X =⎢ p 1 ⎥= = (Équation 1)
⎢ S x1 , y1 ... S x1 , y p S x1 , x1 ... S x1 , xm ⎥ ⎢⎣S XY S XX ⎥⎦ ⎢⎣S' YX S XX ⎥⎦
⎢ . . . . ⎥
⎢ ⎥
⎢ . . . . ⎥
⎢ . . . . ⎥
⎢ ⎥
⎢ S xm , y1 ... S xm , y p S xm , x1 ... S xm , xm ⎥⎦

ou S YY (ordre p x p) et S XX concerne respectivement chaque groupe de descripteur et S XY (p

x m) et sa transposée S' XY = S XY (m x p) explique la covariance pour les descripteurs (variables) des


deux groupes de données.
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 61

5.1.3. L'analyse de corrélation canonique


L’analyse de corrélation canonique analyse deux groupes de descripteurs (variables)
quantitatifs. En reprenant la formule ci-dessus et en considérant deux groupes de variables, on peut
déduire la matrice de dispersion S de ces p + m variables qui est composée de quatre blocs :

⎡S S12 ⎤
S = ⎢ '11 (Équation 2)
⎣S 12 S 22 ⎥⎦

Les sous-matrices S11 et S 22 se réfèrent respectivement à un des deux groupes de variables,

alors que S12 et sa transposée S'12 renseignent sur les interactions entre les deux groupes.

La problématique consiste à maximiser la dispersion entre les groupes tout en minimisant la


dispersion interne. L’expression à maximiser est S12S-1 22S'12S-111 puisque S12 S'12 /S11S 22 (cf. Equation
1) n’existe pas en algèbre matricielle. Trouver une solution pour optimiser ce problème fait appel aux
vecteurs propres et aux valeurs propres. La corrélation canonique est obtenue en résolvant l’équation
caractéristique suivante (voir Annexe 3, calcul matriciel):

S12S-1 22S'12 S-111 − λk I = 0 (Équation 3)

qui correspond à une des équations suivantes résultant de la multiplication de chaque membre
de l’équation précédente par S11 ou S 22

S12S-1 22S'12 − S11λk I = 0 (Équation 4)

et

S12S'11S-112 − S 22 λk I = 0 (Équation 5)

( )
La corrélation canonique rk est la racine carrée des valeurs propres λk λ k = rk2 . Les mêmes

valeurs de λk sont trouvées en résolvant les deux équations. La suite consiste à calculer les vecteurs
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 62

propres des deux équations correspondants à chaque valeur propre. Les deux vecteurs propres donnent
les combinaisons linéaires des deux groupes de variables de départ correspondantes à chaque valeur
propre. Pour la valeur propre λk , les vecteurs propres u k et v k sont calculés en utilisant les équations

matricielles suivantes :

(S
12 )
S-1 22 S'12 − S11λk u k = 0 (Équation 6)

et

(S
12 )
S'11S-112 − S 22 λk v k = 0 (Équation 7)

Pour faciliter les calculs, les vecteurs propres sont normalisés en divisant chaque u k par le

(
scalaire résultant du calcul u 'S11 u k )1/ 2
(
et chaque v k par v 'S 22 v k )
1/ 2
ce qui fixe la variance des

variables canoniques à 1.
Les deux matrices des positions sur un axe d’ordination canonique sont :

[ ]
Tu = Y1 U = yi1u1k + ... + y ip u pk (Équation 8) pour une matrice Y1 avec p variables

et

Tv = Y2 U = [ y i1u1k + ... + y im u mk ] (Équation 9) pour une matrice Y2 avec m variables

Ces équations contiennent les coordonnées des différents objets dans les deux systèmes d’axes
principaux. Les vecteurs colonnes dans Tu ne sont pas corrélés entre eux, la même affirmation peut

être émise pour les vecteurs colonnes de Tv .

L’utilité principale de cette technique consiste à explorer la structure multidimensionnelle des


données et mettre en évidence les corrélations qui peuvent être trouvées entre des fonctions linéaires
de deux groupes de variables. Il est important de noter qu’une forte corrélation canonique ne signifie
pas nécessairement que le vecteur d’ordination scoré Tu et Tv explique une large fraction de la

variance de Y1 ou Y2 .
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 63

Afin de palier à ce problème, il est nécessaire de calculer les coefficients de redondances. Ces
derniers sont utilisés en analyse de corrélation canonique pour mesurer la proportion de variance de
Y1 ou Y2 qui est expliquée par une combinaison linéaire des variables Y1 ou Y2 .

La redondance est en fait le synonyme de l’explication de la variance. Le calcul de la


redondance est effectué en multipliant la corrélation canonique rk par la variance totale extraite par

les variables canoniques (cf. exemple ci-dessous).

5.1.4. Utilisation de l’analyse canonique dans l’analyse d’échantillons d’héroïne


L’analyse canonique a été expérimentée pour comparer si l'information amenée par l'analyse
des constituants majeurs (6 variables) était similaire (degré de redondance) à celle mise en évidence
dans l’analyse des constituants mineurs acides (12 variables). Cette étude a été menée sur un
échantillonnage de 66 saisies supposées provenir de lots de production différents (choisis en fonction
de leur différence de profil chimique) à l’aide du logiciel S-PLUS® 2000 Professional Edition for
Windows. Le même type de recherche a été effectué entre les variables des constituants majeurs (6
variables) et les variables analysées lors de l’établissement d’un profil inorganique (8 variables). Un
échantillonnage de 100 saisies a été effectué.

5.1.4.1. Les résultats et interprétation de l’analyse canonique


Les résultats obtenus sont résumés dans les deux tableaux ci-dessous:

U1 U2 U3 U4 U5 U6 Somme des
redondances
MEC -0.164 -0.255 0.02 -0.033 -0.36 -0.088
ACETYLCOD -0.922 0.297 0.212 -0.108 -0.042 -0.042
MAM 0.69 -0.016 0.121 -0.405 -0.582 0.082
THEB -0.008 0.01 0.019 -0.573 -0.804 0.158
PAP -0.272 0.701 -0.536 0.016 -0.381 -0.05
NOSC -0.189 0.758 -0.38 -0.469 -0.0002 -0.161
VARIANCE EXTRAITE 0.243 0.203 0.082 0.120 0.210 0.011
REDONDANCE 20.546 11.586 2.391 1.982 2.180 0.054 38.741
Rk 0.918 0.755 0.54 0.405 0.322 0.217
Rk2 0.842 0.570 0.2916 0.1640 0.103 0.047
2
Rk *100 84.272 57.002 29.16 16.4025 10.368 4.708

Tableau 3: Résultats de l’analyse canonique entre le groupe de variables des constituants majeures et
le groupe de variables des constituants mineurs générés lors de l’analyse de 66 saisies
d’héroïne.
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 64

U1 U2 U3 U4 U5 U6 Somme des
redondances
MEC -0.42 0.373 -0.065 -0.266 -0.75 0.216
ACETYLCOD -0.377 0.471 0.648 -0.028 -0.007 -0.464
6MAM 0.105 0.796 0.039 -0.365 0.469 0.01
THEB 0.329 0.679 -0.332 -0.281 0.138 -0.472
PAP 0.783 -0.004 -0.036 -0.52 -0.098 0.325
NOSC 0.919 0.061 -0.05 -0.225 -0.151 0.276
VARIANCE EXTRAITE 0.315 0.243 0.08 0.100 0.138 0.111
REDONDANCE 29.4 16.3 5.8 6.1 4.1 2.7 64.8
Rk 0.933 0.672 0.651 0.614 0.3 0.25
Rk2 87.04 45.158 42.380 37.6996 9 6.25

Tableau 4: Résultats de l’analyse canonique entre le groupe de variables des constituants majeurs et
le groupe de variables des constituants inorganiques générés lors de l’analyse de 100
saisies d’héroïne.

De ces tableaux, plusieurs conclusions peuvent être tirées : Les valeurs Rk représentent les
coefficients de corrélations canoniques, c'est-à-dire, le degré de corrélation linéaire entre uk et vk. Le
carré de Rk (Rk2), exprime la proportion de la variance de la kème Uk qui est expliquée par sa
conjuguée Vk et vice versa. Ainsi pour le Tableau 3, on peut donc dire qu’environ 84% de la variation
dans la combinaison linéaire des variables initiales des constituants majeures représentées par U1 est
attribuable à la combinaison linéaire des variables initiales des constituants mineurs représentés par
V1. Le même type de constatation peut être effectué avec U2, U3, U4, U5, U6.

L’analyse des redondances apporte des éléments importants dans l’interprétation de l’analyse
canonique. La mise en évidence de la redondance en analyse canonique permet d’exprimer le pouvoir
exploratoire des variables canoniques d’un domaine (par exemple les constituants majeures) par
rapport aux variables observées dans l’autre domaine (par exemple les constituants mineures).
La somme des redondances exprime la proportion de la variance totale d'une série de variables
caractérisant un ou des échantillons qui peut être prédite par les variables canoniques d'un autre groupe
de variables caractérisant le même échantillon ou série d'échantillons. On peut donc dire, dans le cas
du premier tableau, que 39% (38.741) de la variabilité observée par les constituants majeures est
prédictible par les variations observées par les constituants mineures dans l’échantillonnage analysé.
Le même genre de conclusions peut être fait pour le Tableau 4 à savoir, qu’environ 65% de la
variabilité observée par les constituants majeures est prédictible par les variations observées par les
constituants inorganiques.

En confrontant ces résultats avec les résultats empiriques de l’enquête préliminaire, on


remarque certaines divergences. L’étude préliminaire suggérait qu’une grande partie de l’information
contenue en effectuant l’analyse des constituants mineures et inorganiques se trouvait contenue dans
l’analyse des constituants majeures puisque dans environ le 95% des cas un lien établi par la méthode
des constituants majeures était confirmé par l’analyse des constituants mineures et des constituants
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 65

inorganiques. L’analyse canonique relativise ces résultats puisqu’au mieux les constituants majeurs
prédisent le 65% de la variabilité observée par les constituants inorganiques.
Afin de trouver une explication à ces divergences, il est nécessaire de comprendre la manière
de mettre en évidence les liens que nous avons adoptée dans l’étude préliminaire.
La première étape consiste, à l’aide de la fonction du cosinus à classifier les candidats ayant
des profils chimiques similaires. Les seuils sont fixés de manière empirique en comparaison des
valeurs prises lorsque l’on compare par la fonction cosinus des échantillons issus de la même saisie.
Ensuite, la seconde étape consiste en une comparaison visuelle deux à deux, afin de confirmer le lien
préalablement mis en évidence. Cette dernière étape est subjective, principalement pour des techniques
analytiques extrayant plusieurs variables. En effet, on arrive à comprendre que, lors d’une
comparaison visuelle, notre œil opère d’une manière sélective en choisissant comme critère les
variables dominantes dans un chromatogramme ou dans un graphique comme critère de décision. Au
contraire, l’analyse canonique, elle, prend en compte la totalité des informations donc des variables à
disposition. Cette différence peut expliquer en partie les divergences observées. De plus, il ne faut pas
perdre de vue que les saisies de stupéfiants ne sont pas toujours très homogènes ; des variations sont
observables même lorsque l’on analyse deux fois le même prélèvement. Cette inhomogénéité
influence également à la baisse les valeurs des sommes de redondances.

En conclusion, on ne peut pas dire que l’analyse des constituants majeurs englobe toute
l’information véhiculée par l’analyse des constituants mineures et inorganiques, mais l’importance des
redondances est confirmée. Dans l’optique policière opérationnelle où la rapidité de l’information
transmise aux enquêteurs est primordiale, le fait de choisir l’analyse des constituants majeurs comme
analyse de référence constitue un compromis intéressant dans le sens que le contenu informatif est
important et qu’il y a peu de chances qu’il soit modifié de manière significative par une analyse plus
poussée qui ne se justifie que dans la perspective éventuelle de dispute judiciaire.

On doit également être conscient qu’il est extrêmement compliqué de gérer une trop grande
quantité de données. Il vaut mieux dans un premier temps, se contenter de faire l’analyse des
constituants majeures et de mettre en place une systématique de comparaison cohérente au lieu de
vouloir tout analyser et d’être submergé de données non exploitées, voire inexploitables ou
majoritairement corrélées. Néanmoins, le choix de cette méthode analytique a été dicté par le type
d’héroïne saisis dans notre pays. Cette dernière est quasi toujours sous forme basique, riche en
constituants. Lors de l’analyse d’héroïne ayant une origine géographique connue, il a été observée
(voir Annexe 2) que tel n’était pas la règle, puisque la majorité des saisies d’héroïne analysées (Asie
du sud Est et Amérique du Sud par exemple) était sous forme de sel hydrochloré, pauvre en
constituants majeurs (seule 3, l’acétylcodéine, la 6-monoacétylmorphine et l’acétylthébaol sont
présentes). Dès lors, vu le nombre restreint de variables, il n’est pas exclu qu’il faille revoir le choix de
la méthode analytique dans un autre contexte opérationnel.
ANALYSE DES RESULTATS : CHOIX DE LA METHODE (HYPOTHÈSE 1) 66

5.1.5. Conclusion
Les différentes techniques de profilage empiriquement puis à l’aide de l’analyse canonique ont
permis d’estimer la perte d’information due à la limitation au choix d’une des méthodes analytiques
utilisées. La décision d’effectuer une seule technique de profilage découle également du souci de
s’orienter plus spécifiquement vers une gestion efficace et réaliste d'analyse de produits stupéfiants en
routine. Il est ainsi nécessaire d’appliquer une systématique éprouvée et rapide. C’est pourquoi la
séquence d’analyse en routine de nos échantillons a été délibérément simplifiée. Cette simplification
implique nécessairement une perte d’information, dans des limites acceptables et dont l’effet est
minime sur le résultat puisque la quasi totalité des liens existants sont mis en évidence par la méthode
que nous avons choisie mais est essentielle sur un plan opérationnel (gain de temps !). Le fait de
sélectionner la méthode (constituants majeurs) la plus simple (prix, mise en œuvre, instrumentation) et
la plus efficace du point de vue du contenu d’informations, constitue un bon compromis et permet de
confirmer l’hypothèse N°1 affirmant que les constituants majeurs offrent une information suffisante
pour créer un profil chimique utilisable dans une optique opérationnelle.

.
67
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 68

6. ALGORITHMES DE COMPARAISON
(HYPOTHESES 2.1, 2.2)
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 69

6.1. Introduction
La notion de lien utilisée dans l’analyse de produits stupéfiants est complexe. D’une manière
intuitive, lorsque deux échantillons sont considérés comme liés, ces derniers présentent entre eux des
caractéristiques communes.

Cette notion est très vaste et renferme des définitions multiples. Ceci découle de plusieurs
facteurs notamment du fait qu’un lien peut être mis en évidence à plusieurs niveaux et à l’aide de
plusieurs descripteurs.

On peut également citer des liens effectués à l’aide de profil de solvant ou d’un profil
inorganique. Au niveau chimique, la complexité du problème est déjà bien réelle. Ce dernier se
complique encore lorsque l’on prend en considération l’organisation même d’un trafic qui est organisé
de manière tentaculaire. Dès lors, en présence d’un lien, il devient extrêmement aléatoire de vouloir le
replacer dans le cadre esquissé ci-dessus. C’est pourquoi la situation a été simplifiée en se focalisant
sur l’information que nous maîtrisons, s’affranchissant ainsi de toute la partie abstraite et sujette à de
nombreuses discussions.

Ainsi, nous avons adopté la démarche suivante : nous pouvons aisément estimer la variabilité
d’une saisie en effectuant une série d'analyses d'échantillons la constituant. En partant de ces valeurs
mesurées, nous pouvons estimer son homogénéité. Ensuite au sein des bases de données regroupant les
résultats des analyses des échantillons de produits stupéfiants, nous recherchons les candidats dont les
caractéristiques chimiques entrent dans la variabilité de la saisie mesurée au préalable. Dès lors,
lorsque des échantillons satisfont aux critères précités, nous pouvons conclure qu'ils sont liés à cette
nouvelle saisie et qu’ils appartiennent donc au même lot de production. On a donc restreint la
définition du lien à un seul niveau.
En plus de la complexité inhérente à la notion de lien, il faut encore prendre en considération
les diverses problématiques engendrées par les méthodes de mesures de distances utilisées pour
effectuer le "groupage" des échantillons présentant des profils proches. Une description des fonctions
les plus utilisées et une comparaison de leur efficacité à classer les échantillons de produits stupéfiants,
constituent une étape importante pour permettre une utilisation des données analytiques.

6.2. Méthodes de mesure de distance


Chaque prélèvement analysé fournit des données (par exemple les pics des différentes traces)
qui constituent une signature chimique. Les algorithmes de comparaison utilisent le postulat suivant :
des échantillons similaires possèdent une signature chimique similaire, qui peut être utilisée pour
identifier ou caractériser des groupes d’échantillons similaires.

Les différentes méthodes étudiées peuvent être groupées en deux classes principales, les
techniques dites non supervisées et celles supervisées. Les techniques non supervisées comme les
techniques de mesure de distance entre échantillons n’ont pas d’informations sur l’éventuelle
distribution des données en groupes, classes prédéfinies. Ces méthodes sont généralement utilisées
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 70

comme mesures préliminaires avant d’utiliser des techniques réputées supervisées qui elles nécessitent
une connaissance de la structure des données. Le software SIMCA (Soft Independant Modelling of
Class Analogy) est l’une de ces méthodes. Celui-ci consiste en une utilisation de l'analyse en
composante principale pour effectuer un groupage à partir d'une série de données. En effet, dans
l’article de Jonson et Strömberg [Jonson and Strömberg, 1994] la méthode du quotient (cf. ci-dessous)
est considérée comme une méthode de classification préliminaire avant de créer un modèle de
classification à l’aide du software SIMCA.

Ces différentes techniques de mesures métriques sont définies ci-dessous :

6.2.1. Distance Euclidienne


L’utilisation de la distance euclidienne pour comparer deux spectres a et b a été utilisée par
de nombreux auteurs [Tanaka et al., 1994], [Janzen et al., 1992], [Perkal et al., 1994].

y21 X1

Descripteur y2 D1=(X1,X2)

y22 X2

y12 y11
Descripteur y1

Figure 26 : Schématisation de la distance euclidienne.

La distance euclidienne est définie comme suit :

p
D1 = ( x1, x 2 ) = ∑(y
j =1
1j − y2 j ) 2 (Équation 10)

y1j : rapport de l’aire du pic j sur l’aire du standard interne dans le chromatogramme a

y2j : rapport de l’aire du pic j sur l’aire du standard interne dans le chromatogramme b

Cette méthode est particulièrement sensible aux erreurs dues aux contaminants, aux erreurs
chromatographiques ou aux pics manquants.

D’autres techniques de mesures de distances ont été dérivées à partir la distance Euclidienne à
savoir la distance de Chord et la mesure géodésique.
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 71

La distance de Chord et la distance géodésique

La distance de Chord

X1 La distance géodésique
1

X2

Figure 27: Schématisation de la distance de Chord.

La distance de Chord a une valeur maximale de 2 pour des échantillons étant à l’opposé
l’un de l’autre et une valeur de 0 lorsque les deux échantillons sont similaires. Cette mesure est en fait
la mesure de la distance Euclidienne après avoir normalisé les vecteurs à une valeur de 1. La distance
de Chord est définie par la formule suivante :

⎛ p ⎞
⎜ ⎟
⎜ ∑ y1 j y 2 j ⎟
D 2 ( x1 , x 2 ) = 2⎜1 −
j =1
⎟ (Équation 11)
⎜ p p

⎜ ∑y ∑y 2
1j
2
2j ⎟
⎝ j =1 j =1 ⎠
L’intérieur de cette équation correspond au cosinus de l’angle (θ) entre les deux vecteurs. La
distance de Chord peut donc s’écrire comme :

D2 = 2(1 − cos θ ) (Équation 12)

Cette formule peut également être modifiée pour mesurer la longueur de l’arc entre les deux
vecteurs c'est-à-dire la distance géodésique (cf figure ci-dessus). La formule est la suivante :

⎡ D 22 ( x1 , x 2 ) ⎤
D3 ( x1 , x 2 ) = arccos⎢1 − ⎥ (Équation 13)
⎣ 2 ⎦

6.2.2. Mesure de Manhattan et le coefficient métrique de similarité de Canberra


La mesure de Manhattan consiste à dire que pour deux échantillons, la distance les séparant est
constituée par la distance en abscisse (y1) additionnée de la distance en ordonnée (y2), par analogie à
la distance parcourue par un taxi dans une ville avec un plan orthogonal comme dans la ville de
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 72

Manhattan. Cette mesure est également sensible aux problèmes des données manquantes. La mesure
de Manhattan est la suivante :

p
D4 ( x1 , x2 ) = ∑ y1 j − y2 j (Équation 14)
j =1

Cette formule a donné lieu à différentes variantes comme le coefficient métrique de similarité
de Canberra employée par Thornton [Thornton, 1975] pour la comparaison d’indices matériels en
sciences forensiques (verre, cheveux, terre).

p ⎡ y ⎤
1 j − y2 j
D5 (x1, x 2 ) = ∑ ⎢ ⎥ (Équation 15)
j =1 ⎢ ( y1 j + y 2 j )⎥
⎣ ⎦

6.2.3. La méthode du quotient (quotient method)


Cette technique de classement a été utilisée avec succès pour classifier des échantillons de
produits stupéfiants [Jonson and Strömberg, 1993], [Jonson and Strömberg, 1994], [Perkal et al.,
1994].

La méthode du quotient est utilisée pour rechercher des liens entre objets à l’intérieur d’une
base de données. La base de cette méthode consiste à calculer les quotients des aires des pics :

qi = xi/yi i = 1, 2,…, p
Où xi et yi sont les pics correspondants entre deux chromatogrammes et p est le nombre de
pics sélectionnés ou de variables utilisées pour la comparaison. S’il existe un lien entre deux profils,
les quotients auront une valeur proche de l’unité. Par la suite, un indice de similitude est calculé pour
chaque paire de quotient selon la formule suivante :

rik = 100* abs (qi – qk) / ( qi + qk) ; i,k = 1,2,…p


Deux paramètres fondamentaux sont également utilisés pour effectuer une comparaison, il
s’agit du rmax qui est une valeur prédéfinie (sorte de seuil) qui détermine si les deux pics sont
similaires. Donc pour chaque quotient, on contrôle l’équation suivante :

rik < rmax


La somme des quotients satisfaisant à la formule ci-dessus définit la notion de N. Si N est plus
petit que la valeur de Nmin prédéfini, les deux profils ne correspondent pas. Par exemple, pour un
chromatogramme ayant 14 pics intéressants pour effectuer une comparaison, le Nmin peut être fixé à
10. Ceci implique qu’il suffit que 10 pics (N) vérifient l’équation ci-dessus pour que deux échantillons
soient considérés comme provenant du même groupe. Cette méthode permet de limiter les problèmes
liés aux pics manquants, aux erreurs chromatographiques et aux contaminations.
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 73

Variable A B C D E F G N
A q1 0 8.2 12.3 1.2 9.5 4.2 14.9 3
B q2 8.2 0 5.6 15.7 4.8 17.3 3.1 4
C q3 12.3 5.6 0 16.1 7.3 11.5 2.3 4
D q4 1.2 15.7 16.1 0 2.7 16.7 5.5 4
E q5 9.5 4.8 7.3 2.7 0 6.2 3.6 6
F q6 4.2 17.3 11.5 16.7 6.2 0 7.4 4
G q7 14.9 3.1 2.3 5.5 3.6 7.4 0 6
Tableau 5 : Exemple de matrice 7 × 7 avec comme conditions : rmax = 8% et Nmin = 6.

6.2.4. Les distances de Minkowski


La distance de Minkowski entre 2 objets k et l est donnée par :

1
⎛ n ⎞ r
Dr (k , l ) = ⎜⎜ ∑ x kj − xlj
r
⎟ (Équation 16)

⎝ j =1 ⎠
où r est plus grand ou égal à 1.
Pour r = 2, on retrouve la distance Euclidienne.

Lorsque des variables sont corrélées, la distance Euclidienne conduit à des conclusions
erronées. Pour éliminer ce problème, 3 procédures peuvent être envisagées :

• enlever une des variables fortement corrélées à ou aux autre(s) (méthode la plus
simple mais peu robuste),

• introduire une distance qui prenne en compte les corrélations comme la distance de
Mahalanobis. Pour ce faire, on introduit la matrice de corrélation dans l’équation
correspondant à la notation vectorielle de la distance Euclidienne :
n
Dkl2 = ∑ ( x kj − xlj ) 2 = ( x k . − xl . )( x k . − xl . )' où (xk. − xl.)' est la transposée du vecteur
j =1

ligne ( x k . − xl . ) . On obtient alors : Dkl = ( x k − xl )C −1 ( x k − xl )' où C est la matrice

de covariance.

• Combiner les variables de façon à obtenir de nouvelles variables non corrélées.

6.3. Les corrélations


Si, par analogie avec la distance, on veut que les valeurs numériques des mesures de similarité
augmentent quand les objets sont de moins en moins similaires, il faut alors choisir 1 − rk 1 où rkl est

le coefficient de corrélation. On a :
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 74

∑ (x
j =1
kj − x k . )( xlj − xl . )
rkl = (Équation 17)
n n

∑ (x
j =1
kj − xk . ) 2
∑ (x
j =1
lj − xl . ) 2

La signification géométrique de ce coefficient correspond à la mesure de l’angle α entre deux


r r
vecteur xk et xl , il s’agit de la formulation du coefficient de Pearson. Plus l’angle est faible, plus les

vecteurs sont corrélés. Quand k et l sont complètement corrélés, leur direction coïncide complètement.
L’angle et, en particulier son cosinus, est une mesure de corrélation (et une mesure de
similarité) :

∑x
j =1
kj xlj
cos α = 1/ 2
(Équation 18)
⎡ n ⎤ n

⎢∑ x kj ⋅ ∑ xlj ⎥
2 2

⎣ j =1 j =1 ⎦

L’équation 18 présente une structure proche de l’équation 17. Dans l’équation 18 les valeurs
brutes sont utilisées alors que dans l’autre équation, les valeurs sont comparées à leur moyenne
(valeurs centrées). On peut donc dire que r est le cosinus de l’angle entre des vecteurs centrés. Cette
fonction cosinus a été utilisée par Keto [Keto, 1989] traitant de la comparaison de spectres de
pyrogramme. Elle a été légèrement modifiée pour prendre la forme suivante :


C = 100 × ⎢ 2
(a1b1 + a2b2 + ... + anbn )
2

2 ⎥
(Équation 19)
( 2 2 2 2
⎣ a1 + a2 + ... + an × b1 + b2 + ... + bn ⎦ ) ( )

Cette formule est actuellement utilisée à l’IPS pour effectuer la comparaison 2 à 2


d’échantillons d’héroïne et de cocaïne. Cette phase a également été automatisée à l’aide de macros
écrites en visual basic ® pour excel ®. Le détail de cette programmation et des bases de données
répertoriant ces résultats est fourni en annexe (cf. Annexe 4).

Le choix de la mesure de type distance ou corrélation dépend entièrement de ce que


l’utilisateur considère comme étant similaire ou non. En général, les distances détectent mieux les
différences alors que les corrélations trouvent plus facilement les similarités.
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 75

6.4. Les méthodes de clustering


Les méthodes de clustering ou de groupages sont considérées comme des techniques
exploratoires permettant de mettre en évidence des groupes présentant une identité qualitative au sein
d’un ensemble de données. La présentation de ce type de résultat est le plus souvent effectuée à l’aide
de dendrogrammes facilitant la mise en évidence des différents groupes. Il s’agit d’une représentation
en forme de branche construite à partir des distances existantes entre les différents échantillons
analysés (voir Figure 22, Figure 23, Figure 24 chapitre 5).
Dans cette recherche nous avons utilisé la méthode de clustering hiérarchique. Cette technique
calcule et compare la distance entre chaque échantillon. Lorsque les distances entre échantillons sont
relativement faibles, les échantillons sont considérés comme similaires. Il existe plusieurs types
d’algorithmes mathématiques déterminant le processus de groupage des divers échantillons. « Le plus
proche voisin » (Nearest neighbour linking), « le voisin le plus éloigné » (Farthest neighbour linking)
« Mesure centrale » (Centroidal linking) sont les techniques les plus souvent utilisées [Legendre P. et
Legendre L., 1998] [Kaufmann et Rousseeuw, 1990]. La méthode du « Le plus proche voisin » est la
plus simple, elle est basée uniquement sur la mesure de son voisin le plus proche. L’échantillon est
assigné au groupe qui contient ce voisin le plus proche. Le schéma suivant illustre ce qui précède :

Nouveau candidat X

Groupe B

Groupe A

Figure 28: Représentation du « plus proche voisin ». Dans ce cas le nouveau candidat X sera
rattaché au groupe B car sa distance à ce dernier est plus petite qu’à celle du groupe A.
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 76

La méthode du « le voisin le plus éloigné » rattache l’échantillon au groupe dont le voisin le


plus éloigné est le plus proche.

Nouveau candidat X

Groupe B

Groupe A

Figure 29: Représentation du « voisin le plus éloigné ». Dans ce cas le nouveau candidat X sera
rattaché au groupe B car sa distance à l’échantillon le plus éloigné de ce groupe est plus
petite qu’à celui du groupe A.

Au contraire des deux autres algorithmes, la « Mesure centrale » rattache l’échantillon au


groupe dont le centre (centre de gravité) est le plus proche

Nouveau candidat X

Groupe B

Groupe A

Figure 30: Représentation de la « Mesure centrale ». Dans ce cas le nouveau candidat X sera
rattaché au groupe B car sa distance au centre de ce dernier est plus faible que celle du
centre du groupe A.

Dans le cadre de ce travail, la technique de la mesure « Mesure centrale » a été choisie lors de
l’utilisation de technique de « clustering ». La justification de ce choix peut être motivée du fait que
cette méthode est un bon compromis par rapport aux deux autres et devrait éviter les difficultés
causées par des groupes ayant une grandes dispersion.
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 77

6.5. SIMCA et techniques neuronales


Comme décrits auparavant ces techniques s’inscrivent dans le prolongement des techniques
non supervisées. Ces dernières sont utilisées lorsque les données brutes ont été analysées et que des
classes d’échantillons similaires ont été crées. Grâce à ces classes chimiques, il est possible d’entraîner
ces techniques afin de créer des modèles capables de classifier rapidement et de manière fiable un
nouvel échantillon de stupéfiant. Le software SIMCA utilisé par Jonson et Strömberg [Jonson and
Strömberg, 1994] ainsi que les réseaux de neurones [Kingston, 1992] [Casale et Watterson, 1993],
[Esseiva et al., 2003b] ont été évalués et feront l’objet d’un développement ultérieur.

6.6. Choix d’une métrique pour la comparaison d’échantillons d’héroïne


Le processus de comparaison entre différentes métriques a été testé dans le cas de l’héroïne
[Esseiva et al, 2003a]. Des recherches actuellement en cours utilisant la même méthodologie mais
concernant des saisies de cocaïne montre le même type de résultats. Nous avons testé 3 mesures de
distances : la distance Euclidienne [Klemenc, 2001], la distance de Manhattan [Myors et al., 2001] et
celle de Canberra [Thornton, 1975], 2 coefficients de corrélation : le coefficient de Pearson et le
cosinus au carré [Killeen et al., 1980] et la méthode du quotient [Jonson and Strömberg, 1994].
Une manière originale de comparer l’efficacité effective de ces diverses méthodes de
comparaison d’échantillons de produits stupéfiants est présentée ci-dessous.
Afin de pouvoir comparer ces différentes techniques le plus objectivement possible, deux
échantillonnages ont été sélectionnés, l'un regroupant des échantillons provenant de mêmes saisies et
l'autre constitué d'échantillons provenant de saisies distinctes ayant des profils différents.
Pour chaque échantillonnage les distributions des valeurs obtenues lors de la comparaison 2 à
2 de chaque échantillon choisi ont été représentées, pour les deux groupes de départ (échantillons liés
et non liés) et pour chaque fonction de comparaison testée.
En ce qui concerne les échantillons provenant d'une même saisie, considérés donc comme liés,
4 saisies distinctes constituées respectivement de 27 échantillons (351 paires), 20 échantillons (190
paires), 12 échantillons (66 paires), et 60 échantillons (1770 paires) ont été sélectionnées, ce qui
correspond donc à 2377 comparaisons effectuées 2 à 2.

En ce qui concerne les saisies non liées 71 candidats (profil différent) ont été sélectionnés, ce

qui représentent 2485 comparaisons (


(n × (n + 1)) ).
2
Afin d’apprécier la performance de chaque fonction mathématique, les valeurs obtenues pour
la comparaison des échantillons liés et non liés ont été présentées sur un même graphique. Les
résultats des différentes comparaisons fournissent des résultats contrastés présentés graphiquement ci-
après :
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 78

6.6.1. Résultats
Fonction cosinus carré Coefficient de corrélation de Pearson
200 100
saisies liées
BNL random BNL random
saisies liées

80
150

60

100

40

50
20

0
0
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97
-27 -19 -11 -3 5 13 21 29 37 45 53 61 69 77 85 93
Corrélation Corrélation

Distance Euclidienne Distance de Canberra


1200

saisies liées saisies liées


400 BNL random BNL random
1000

300 800

600
200

400

100
200

0 0
6 19 32 45 58 71 84 97 110 123 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 3.2 3.4 3.6 3.8 4 4.2 4.4

Distance Distance

Distance de Manhattan Méthode du Quotient


250 250

BNL random saisies liées


saisies liées BNL random

200 200

150 150

100 100

50 50

0 0
0.6 2.2 3.8 5.4 7 8.6 10.2 11.8 13.4 15 16.6 18.2 19.8 21.4 23 24.6 2 7 12 17 22 27 32 37 42 47 52 57 62 67 72 77 82 87 92 97
r
Distance ikmax

Figure 31: Représentation des courbes de distributions des valeurs de comparaison obtenues pour
des échantillons liés (courbe rouge) et des échantillons non liés (courbe bleue).
Les graphiques ci-dessous représentent un agrandissement des zones de recouvrements des
courbes formées par la distribution des valeurs de comparaison obtenues pour des échantillons liés
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 79

(courbe rouge) et des échantillons non liés (courbe bleue). L’intersection des deux courbes et les zones
de recouvrements de ces dernières permettent d’évaluer le taux de faux positifs et de faux négatifs.

Fonction cosinus carré Coefficient de corrélation de Pearson


50 100

BNL random BNL random


saisies liées saisies liées

40 80

30 60

20 Faux négatifs 40

Faux positifs 97.8

10 20 98.1

0 0
96.9 97.1 97.3 97.5 97.7 97.9 98.1 98.3 98.5 98.7 98.9 99.1 99.3 99.5 95.9 96.3 96.7 97.1 97.5 97.9 98.3 98.7 99.1 99.5

Corrélation Corrélation

% faux négatifs = 2.70 (zone 97.8 – 99.5) % faux négatifs = 3.10 (zone 98.1 – 99.7)
% faux positifs = 0.71 (zone 96.9 – 97.8) % faux positifs = 1.30 (zone 95.8 – 98.1)
Distance Euclidienne Distance de Canberra
40 100

saisies liées
BNL random
35 BNL random
saisies liées

80
30
8.6
25
60

20

15 40

10

20
0.42
5

0
0
0.4 1.6 2.8 4 5.2 6.4 7.6 8.8 10 11.2
0.2 0.26 0.32 0.38 0.44 0.5 0.56 0.62 0.68 0.74 0.8
Distance
Distance
% faux négatifs = 15.29 (zone 1.6 – 8.6) % faux négatifs = 1.13 (zone 0. – 0.42)
% faux positifs = 3.87 (zone 8.6 –12) % faux positifs = 2.82 (zone 0.42 – 0.90)
Distance de Manhattan Méthode du Quotient
100 200

BNL random saisies liées


saisies liées BNL random

80
150

60
3.6
100

40

27
50
20

0 0
1.1 1.4 1.7 2 2.3 2.6 2.9 3.2 3.5 3.8 4.1 3 9 15 21 27 33 39 45 51 57 63
Distance r
ikmax

% faux négatifs = 13.08 (zone 1.60 – 3.60) % faux négatifs = 1.13 (zone 1.00 – 27.00)
% faux positifs = 4.54 (zone 3.60 – 4.20) % faux positifs = 6.25 (zone 27.00 – 67.20)
Figure 32: Agrandissement des courbes valeurs de comparaison obtenues pour des échantillons liés
(courbe rouge) et des échantillons non liés (courbe bleue). Les taux de faux positifs et faux
négatifs sont également représentés en estimant l’aire des zones de recouvrements de ces
dernières.
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 80

Les valeurs des moyennes, les écart-types et les écarts entre maximum et minimum sont
donnés sous forme de tableau. Dans le cas des distances Euclidienne et de Manhattan, les résultats ont
été reportés sans et avec standardisation. Le tableau suivant regroupe les constatations effectuées lors
de la comparaison des différentes méthodes. Les pourcentages de faux positifs et négatifs ont
également été répertoriés. Ces valeurs ont été estimées en déterminant l'aire de la courbe formée par
les échantillons liés qui se confond avec celle des échantillons non liés, c'est-à-dire des faux négatifs,
et vice et versa, pour estimer les faux positifs. Le tableau ci-dessous récapitule les différents résultats
obtenus.
Valeur Ecart-type Max – Min Max – Min % faux % faux
moyenne comp. échant. comp. comp. négatifs positifs
comp. échant. liés (%) échant. liés échant. non
liés liés

D Euclidienne 2.65 57.10 6.88 12.62 15.29 3.87


D Manhattan 1.96 27.34 2.20 1.33 13.08 4.54
D Canberra 0.16 54.97 0.42 0.78 1.13 2.82
Cosinus2*100 99.66 0.43 2.32 16.70 2.70 0.71
Cor Pearson*100 99.62 0.48 2.59 19.12 3.10 1.30
Quotient (rik max) 11.27 98.66 66.12 85.31 1.13 6.25
D Euclid Stand 3.15 45.54 7.26
D Manh Stand 2.50 24.64 3.98

Tableau 6: Résumé des valeurs obtenues par la comparaison des différentes fonctions
mathématiques pour un même échantillonnage. Les deux dernières lignes du tableau
représentent les valeurs obtenues pour la distance Euclidienne et de Manhattan obtenues
avec des valeurs standardisées. Aucune différence notoire n’a été observée en
comparaison des valeurs obtenues avec ces mêmes distances mais pour les valeurs
normalisées.

6.6.2. Discussion des résultats


Les informations répertoriées dans le Tableau 6 ont été discutées afin de sélectionner le plus
objectivement possible la méthode la plus adaptée pour comparer les données d’analyses de
stupéfiants. Les écart-types mesurés lors de la comparaison d’échantillons liés nous renseigne sur la
reproductibilité des mesures effectuées sur des saisies considérées comme liées ainsi que
l'homogénéité de ces dernières. On remarque que les méthodes ayant un écart-type le plus faible sont
les mesures de corrélation (fonction cosinus au carré et Pearson). Plus cette valeur est grande, plus la
répartition des valeurs générées par la comparaison d’échantillons liés sera dispersée et plus les risques
de chevauchement avec les valeurs obtenues lors de la comparaison d’échantillons non liés seront
élevés.
Les différences entre les valeurs minimales et maximales obtenues par la comparaison
d’échantillons non liés ont été reportées afin de nous informer sur la dispersion des courbes et par là
même nous donner une indication quant au pouvoir discriminant de la méthode. Intuitivement, une
grande dispersion des valeurs obtenues lors de la comparaison d’échantillons non liés augmente le
pouvoir discriminant de la méthode puisque les valeurs prises par cette mesure sont plus nombreuses.
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 81

En comparant les différents résultats, la meilleure méthode est celle du quotient suivi des mesures de
corrélations.
Les critères les plus importants à prendre en considération lors de la comparaison des divers
algorithmes mathématiques présentés ci-dessus sont le pourcentage de faux positifs et de faux négatifs.
Dans l’optique de l’information que l’on veut fournir aux enquêteurs, la formule nous donnant le plus
faible taux de faux positifs va être privilégiée. Cette stratégie a pour but d’éviter de donner aux
inspecteurs de police des informations erronées. En fonction de ce critère, il ressort que la méthode du
cosinus carré donne les résultats les plus fiables avec des risques d’erreur qui peuvent être minimisés
en fixant un seuil (> 99.4) tout en ne risquant qu’un pourcentage de faux négatifs de moins de 3%.

La distance de Canberra quant à elle ne possède pas de seuil où le recouvrement n’existe plus.
Néanmoins, elle montre le taux de recouvrement le plus faible pour le % de faux négatifs. De plus,
bien qu’elle possède une échelle de dispersion assez réduite (de 0 à 4.5), toutes les valeurs
correspondant aux saisies non liées se distribuent de manière homogène le long de cette échelle. C’est
donc une distance intéressante à retenir pour l’analyse de nos données. Les distances Euclidiennes et
de Manhattan ont un taux de recouvrement très important en plus d’un écart-type élevé, c’est pourquoi
elles ne seront pas prises en considération pour la suite des travaux.

Concernant la méthode du quotient, les indices de similitude maximaux rik max dans le cas
des saisies non liées présentent une bonne dispersion sur l’échelle des valeurs (de 0 à 100). Si l’on
agrandit la partie de superposition, seuls de faibles pourcentages de faux négatifs et de faux positifs
(1.13 et 6.25) sont observés. Lorsque la valeur de rik max est fixée inférieure à 15%, il n’y a plus
recouvrement et le risque d’obtenir des faux négatifs est minimisé. C’est donc une méthode
intéressante pour comparer des chromatogrammes dont certains pics sont manquants comme c’est
souvent le cas pour les échantillons de cocaïne par exemple.

6.6.3. Conclusion
Ce chapitre a permis de confronter diverses fonctions de comparaisons d'échantillons utilisées
dans le domaine du profilage de produits stupéfiants. La fonction cosinus carré a montré son utilité en
mettant en évidence ses avantages (principalement son faible taux de faux positifs) par rapport aux
autres méthodes. Néanmoins, d’autres fonctions comme la distance de Canberra, la corrélation de
Pearson et la méthode du quotient ont présenté des résultats comparables à ceux obtenus avec la
méthode du cosinus carré. Le choix d’une méthode est fonction des données que l’on a à comparer, si
ces dernières présentent par exemple une forte proportion d’informations manquantes, le choix de la
méthode de comparaison s’en trouvera affecté. Dans tous les cas, la méthode de sélection exposée
dans ce travail permet d’effectuer un choix objectif en se basant sur des critères pertinents (taux de
faux positifs, de faux négatifs,…). Dès lors, pour la suite de cette recherche, la méthode du cosinus
carré a été choisie pour effectuer la comparaison 2 à 2 d’échantillons de stupéfiants provenant de
saisies.
ALGORITHMES DE COMPARAISON (HYPOTHÈSES 2.1, 2.2) 82

Sa confrontation à diverses autres méthodes de mesures de distances permet de valider


l’hypothèse 2.1 concernant son potentiel à regrouper des échantillons similaires de produits stupéfiants
et réponds également positivement à l’hypothèse 2.2 concernant sa propension à limiter les faux
positifs et négatifs. Cette hypothèse sera également discutée dans le prochain chapitre relatif à l’étude
plus spécifique de cette mesure de distance.
83
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 84

7. ETUDE DE LA FONCTION COSINUS


(HYPOTHESE 2.2)
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 85

7.1. Distribution des différentes variables


La distribution des différents constituants de l’héroïne et de la cocaïne a été étudiée afin de
déterminer si ces variables suivent une loi normale. Les valeurs des différents constituants ont été
représentées sous forme de « scatter plot » ou graphique en points afin d’éliminer les valeurs extrêmes
ou aberrantes (Outliers). La normalité de ces distributions empiriques a ensuite été testée. Cette phase
est importante puisqu’elle conditionne l’utilisation de techniques statistiques paramétriques (données
suivant une loi normale) ou non paramétriques (données ne suivant pas une loi normale).

7.1.1. Tests de normalité.


Un des tests les plus utilisés pour valider la normalité d’une distribution consiste à utiliser la
méthode de Kolgomorov-Smirnov qui contrôle le degré de superposition entre la courbe empirique et
la courbe normale théorique [Saporta, 1990].

La distribution normale théorique des échantillons est confrontée à la distribution empirique.


Ensuite, la plus grande distance entre les deux courbes (D) est recherchée. Si D est plus grand qu’une
valeur critique définie en fonction du nombre d’observations n et du seuil de signification α que l’on a
fixé, l’hypothèse de la normalité est rejetée (voir Figure 33).

Une seconde technique largement utilisée pour tester la normalité d’un jeu de données est
basée sur la vérification graphique de l’adéquation d’un modèle de distribution qui s’appelle « normal
probability plotting » [Legendre P. et Legendre L., 1998]. L’objectif est de représenter les données
d’une telle manière que si elles appartiennent à une population distribuée selon une loi normale, elles
vont suivre une ligne droite

Supposons que la variable aléatoire X ait une distribution cumulative F . La distribution


cumulative empirique Fn de x1 ,..., xn est une estimation de F . Supposons de calculer les centiles

ck = k = 1...100 de F et les centiles c~k de Fn . La représentation graphique des points

(ck , c~k ), (k = 1...100) est alors un ensemble de points approximativement alignés le long de la droite
de pente 1 qui passe par l’origine. On remarque que les observations ordonnées

x[1] ≤ x[2 ] ≤ ... ≤ x[n ] .


ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 86

sont des estimations des percentiles p k / n , k = 1,..., n en pratique, on représente alors les

( )
points p k / n , x[k ] . Cette représentation est une courbe de probabilité. Sous SPSS® elle se nomme

« QQ-plot ». La Figure 34 illustre une de ces représentations correspondant à des valeurs répondant
aux critères d’une loi normale.

Fréquence mesurée

Fréquence attendue

20 5%

Valeur critique du test de


Kolgomorov-Smirnov

Figure 33: Schématisation du test de Kolgomorov-Smirnov.


ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 87

10

0
ACOD

-5

-10

-15
-3 -2 -1 0 1 2 3
Normal Distribution

Figure 34: Schématisation de la représentation « Normal QQ-Plot ».

7.1.2. Mesures de la corrélation entre différentes variables


Suite à la détermination des distributions des différentes traces, la corrélation existant entre les
différentes variables utilisées pour caractériser le profil d’une saisie de produit stupéfiant a été
mesurée. Deux coefficients sont à disposition, celui de « Pearson » et de Spearman. Le premier étant
utilisé pour mesurer la corrélation entre variables lorsque leur distribution suivent une loi normale. Le
second est un test non paramétrique ayant l’avantage de ne faire aucune hypothèse sur la distribution
des données à analyser, le rendant ainsi valable pour n’importe quel type de distribution.

7.1.3. Résultats et discussion


Les techniques de statistique exploratoire, principalement les représentations des données à
l’aide de graphique de points ont permis de mettre en évidence les valeurs extrêmes qui gênent
passablement la suite des traitements statistiques si ces dernières ne sont pas éliminées. Cette
opération a été effectuée initialement pour toutes les variables.

Les tests de normalité appliqués aux constituants de la cocaïne et de l’héroïne ont montré que
ces dernières, de manière générale, ne suivaient pas des lois normales. L’acétylcodéine est la variable
dont les données se rapprochent le plus d’une distribution normale. Comme la condition nécessaire à
l’utilisation de techniques paramétriques est que les données à traiter aient une distribution normale,
nous ne pouvons pas dans notre cas utiliser de telles techniques. C’est pourquoi notre choix s’est porté
prioritairement sur des méthodes non paramétriques.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 88

L’étude des corrélations entre variables a été effectuée à l’aide du calcul de la corrélation de
Pearson et du rho de Spearman afin d’évaluer les différences engendrées par ces deux techniques
applicables à des groupes de données dont les distributions sont différentes. Nos données nécessitent
l’utilisation du rho de Spearman pour le calcul de la corrélation à cause de leur comportement.
Néanmoins comme explicité précédemment Pearson a été appliqué simultanément dans une
perspective comparative.

Corrélation de Pearson MEC ACODTHEBAOL MAM Papavérine Noscapine


MEC Corrélation de Pearson 1
Sig. (test bilatéral) .
N 238
ACOD Corrélation de Pearson .385** 1
Sig. (test bilatéral) .000 .
N 238 238
THEBAOL Corrélation de Pearson .065 .124 1
Sig. (test bilatéral) .320 .056 .
N 238 238 238
MAM Corrélation de Pearson .442** .653** .041 1
Sig. (test bilatéral) .000 .000 .533 .
N 238 238 238 238
Papavérine Corrélation de Pearson .136* .132* .017 .200** 1
Sig. (test bilatéral) .035 .042 .792 .002 .
N 238 238 238 238 238
Noscapine Corrélation de Pearson .031 .044 .028 .108 .799** 1
Sig. (test bilatéral) .633 .498 .662 .096 .000 .
N 238 238 238 238 238 238
** La corrélation significative à un niveau de 0.01 (test bilatéral).
* La corrélation significative à un niveau de 0.05 (test bilatéral).

Tableau 7: Tableau des résultats des valeurs de corrélation calculées à l’aide de la formule de
Pearson pour les constituants majeurs de l’héroïne.

Rho de Spearman MEC ACODTHEBAOL MAM Papavérine Noscapine


MEC Coefficient de corrélation 1.000
Sig. (2-tailed) .
N 238
ACOD Coefficient de corrélation .417** 1.000
Sig. (2-tailed) .000 .
N 238 238
THEBAOL Coefficient de corrélation .276** .277** 1.000
Sig. (2-tailed) .000 .000 .
N 238 238 238
MAM Coefficient de corrélation .490** .610** .229** 1.000
Sig. (2-tailed) .000 .000 .000 .
N 238 238 238 238
Papavérine Coefficient de corrélation .185** .167** .372** .282** 1.000
Sig. (2-tailed) .004 .010 .000 .000 .
N 238 238 238 238 238
Noscapine Coefficient de corrélation -.004 .059 .318** .095 .790** 1.000
Sig. (2-tailed) .954 .361 .000 .144 .000 .
N 238 238 238 238 238 238
** La corrélation significative à un niveau de 0.01 (test bilatéral).

Tableau 8: Tableau des résultats des valeurs de corrélation calculées à l’aide rho de Spearman pour
les constituants majeurs de l’héroïne.
Les résultats répertoriés dans le Tableau 7 et le Tableau 8 montrent qu’il n’y a pas de grandes
différences entre les valeurs de corrélation obtenues par Spearman ou Pearson. Le rho de Spearman
sera privilégié du fait de la distribution des variables utilisées pour le profilage de l’héroïne. La plus
forte corrélation enregistrée entre les différentes variables revient au couple formé par la noscapine et
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 89

la papavérine (0.79). Etant donné ce résultat, il semble légitime de dire qu’un des deux constituants
peut être négligée. Afin de vérifier cette hypothèse, une saisie a été comparée à quatre autres (une de
ces quatre est liée à la saisie de comparaison). Le résultat obtenu est illustré dans la Figure 35.

Le fait d’éliminer un constituant sur les six de départ fait perdre une partie de l’information,
principalement au niveau des échantillons qui ne sont pas liés (cf. courbe bleue en regard de la rouge).
Ainsi, pour l’héroïne il n’a pas été jugé judicieux d’éliminer cette variable, d’autant plus que leur
nombre est déjà peu important.
En effet, la systématique de la mise en évidence des liens telle qu’elle est appliquée en routine
à l’IPS n’est pas influencée par le traitement d’une variable supplémentaire.

Comparaison des valeurs de corrélation

100

95
Valeurs de corrélation

90

85

Toutes impuretés
80 Sans noscapine

75
0 50 100 150 200
Numéro échantillon

Figure 35: Représentation graphique de la suppression d’une variable (la noscapine).


ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 90

Une démarche similaire a été appliquée pour les variables de la cocaïne. La première opération
a été de déterminer quelles étaient les constituants que l’on retrouvait le plus souvent dans les saisies
de cocaïne, tant il est vrai que certaines d’entres-elles ne se trouvent quasiment jamais dans les saisies
de cocaïne analysées à l’IPS. La Figure 36 représente le pourcentage d’échantillons contenant les
diverses constituants majeurs de la cocaïne.

100
90
Nombre de cas contenant l'impureté (%)

80
70
60
50
40
30
20
10
0
ne

e
e

ne

er

e
e

e
E

E)

in
ïn

qu
in

ïn
M

st
M
ni

ai

on
n
ca

ca
lE

lE


le
(E
go

oc
go
oy

oy

cg
co

co

nz
hy
ac
ec

Ec
er
m

am

oe
or

yl

be
et
op
st
yl

rm
na

dr
m
zo

le
nn

e
Tr

Fo
in

hy
id
e
n

hy
ci
-c

Ac
in
Be

An
-
s-

N
ét
is

on
an
C

cg
Tr

ne

oe
ni

dr
go

hy
Ec

An

Figure 36: Graphique présentant le pourcentage d’échantillon contenant les diverses constituants.

Mise à part la Cis-cinnamoylecgonine méthyl ester, la Trans-cinnamoylecgonine méthyl ester,


la benzoylecgonine et l’ecgonine méthyl ester, la norcocaïne, l’ecgonine et la tropacocaïne, les autres
constituants sont présentes dans moins de 20% des cas (en fait, ont été pris en compte les constituants
présents dans des proportions significatives et non sous forme de traces).

En consultant la Figure 36 ont été choisis pour l’analyse des données les traces les plus
souvent présentes dans les saisies de cocaïne. Notre choix s’est porté sur la Cis-cinnamoylecgonine
méthyl ester, la Trans-cinnamoylecgonine méthyl ester, la benzoylecgonine et l’ecgonine méthyl ester,
la norcocaïne, l’ecgonine et la tropacocaïne. Les autres traces ont été ignorées dans cette étude du fait
de leur faible représentation.

L’étude des corrélations entre les différents constituants majeurs de la cocaïne formant le
profil chimique de cette dernière a montré des résultats comparables à ceux obtenus pour l’héroïne.
Une forte corrélation a également été mise en évidence entre la Cis-cinnamoylecgonine méthyl ester et
la Trans-cinnamoylecgonine méthyl ester. Il n’a pas été jugé pertinent d’éliminer une de ces deux
variables, pour les raisons évoquées ci-dessus. Le nombre de variables limité (7) et la diminution de la
discrimination constituent des arguments de poids.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 91

EME EC Tropa BenzoylEc Nor CIS TRANS


EME Corrélation de Pearson 1 .409** .180*3 .333** .117 .231** .197**
Sig. (2-tailed) . .000 .007 .000 .081 .001 .003
N 224 224 224 224 224 224 224
EC Corrélation de Pearson .409** 1 .126 .287** .163* .029 -.025
Sig. (2-tailed) .000 . .060 .000 .014 .663 .714
N 224 224 224 224 224 224 224
Tropacocaine Corrélation de Pearson .180** .126 1 .139* .094 .184** .171*
Sig. (2-tailed) .007 .060 . .038 .160 .006 .011
N 224 224 224 224 224 224 224
BenzoylEc Corrélation de Pearson .333** .287*3 .139* 1 .221** .420** .310**
Sig. (2-tailed) .000 .000 .038 . .001 .000 .000
N 224 224 224 224 224 224 224
Nococaïne Corrélation de Pearson .117 .163* .094 .221** 1 .071 -.003
Sig. (2-tailed) .081 .014 .160 .001 . .287 .960
N 224 224 224 224 224 224 224
CIS Corrélation de Pearson .231** .029 .184** .420** .071 1 .904**
Sig. (2-tailed) .001 .663 .006 .000 .287 . .000
N 224 224 224 224 224 224 224
TRANS Corrélation de Pearson .197** -.025 .171* .310** -.003 .904** 1
Sig. (2-tailed) .003 .714 .011 .000 .960 .000 .
N 224 224 224 224 224 224 224
** La corrélation significative à un niveau de 0.01 (test bilatéral).
* La corrélation significative à un niveau de 0.05 (test bilatéral).

Tableau 9: Tableau des résultats des valeurs de corrélation calculées à l’aide de la formule de
Pearson pour les constituants majeurs de la cocaïne.
Rho de Spearman EME EC Tropa BenzoylEc Nor CIS TRANS
EME Coefficient de corrélation 1.000 .392** .272** .352** .213** .333** .312**
Sig. (2-tailed) . .000 .000 .000 .001 .000 .000
N 224 224 224 224 224 224 224
EC Coefficient de corrélation .392** 1.000 .173** .409** .155* .120 .057
Sig. (2-tailed) .000 . .010 .000 .021 .074 .395
N 224 224 224 224 224 224 224
Tropacocaine Coefficient de corrélation .272** .173** 1.000 .231** .132* .249** .255*
Sig. (2-tailed) .000 .010 . .000 .049 .000 .000
N 224 224 224 224 224 224 224
BenzoylEc Coefficient de corrélation .352** .409** .231** 1.000 .204** .443** .331*
Sig. (2-tailed) .000 .000 .000 . .002 .000 .000
N 224 224 224 224 224 224 224
Norcocaïne Coefficient de corrélation .213** .155** .132** .204** 1.000 .004 -.026
Sig. (2-tailed) .001 .021 .049 .002 . .948 .695
N 224 224 224 224 224 224 224
CIS Coefficient de corrélation .333** .120 .249** .443** .004 1.000 .934**
Sig. (2-tailed) .000 .074 .000 .000 .948 . .000
N 224 224 224 224 224 224 224
TRANS Coefficient de corrélation .312** .057 .255** .331** -.026 .934** 1.000
Sig. (2-tailed) .000 .395 .000 .000 .695 .000 .
N 224 224 224 224 224 224 224
** La corrélation significative à un niveau de 0.01 (test bilatéral).
* La corrélation significative à un niveau de 0.05 (test bilatéral).

Tableau 10: Tableau des résultats des valeurs de corrélation calculées à l’aide de la formule de
Spearman pour les constituants majeurs de la cocaïne.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 92

7.2. La fonction cosinus pour la comparaison des chromatogrammes.


7.2.1. Introduction
La méthode choisie pour comparer des chromatogrammes est la fonction cosinus carré utilisée
par R. O. Keto [Keto, 1989] dans la comparaison de résidus de tir.

La comparaison de profils chimiques d’échantillons d’héroïne et de cocaïne nécessite dans un


premier temps par ll’analyse d’un profil chimique d’une saisie. Ce dernier est caractérisé par n
variables. Ces variables peuvent être représentées comme un vecteur dans un espace à n dimensions
dont les composantes représentent les n variables. Dans la Figure 37 ci-dessous, les n variables sont
définies comme l’aire des 6 constituants majeurs de l’héroïne (N° 1, 3, 4, 5, 7, 8).

Paracetamol Internal Standard Diacetylmorphine


260

240

220 Caffeine

200

180 6-monoacetylmorphine

160

140

120

100

80

60

Acetylcodeine Noscapine
40

Papaverine
20
Acetylthebaol

0
Meconine
-20

-40

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Figure 37: Chromatogramme typique des constituants majeurs de l’héroïne. 1) Méconine, 2)


Heineicosane (standard interne), 3) Acétylcodéine, 4) Acétylthébaol, 5) 6-
monoacétylmorphine, 6) Diacétylmorphine, 7) Papavérine, 8) Noscapine.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 93

7.2.2. Développement de la fonction cosinus


Afin d’estimer la proximité de deux vecteurs, il est possible de calculer l’angle existant entre
ces derniers :

Figure 38 : Représentation de l’angle entre deux vecteurs.

Le produit scalaire de deux vecteurs s’écrit :

r r r r
a ⋅ b = a × b × cosθ (Équation 20)

Sachant que l’expression du produit scalaire en fonction des composantes des vecteurs
relativement à une base orthonormée dans l’espace est,

⎛ a1 ⎞ ⎛ b1 ⎞
⎜ ⎟ ⎜ ⎟
r ⎜ a2 ⎟ r ⎜ b2 ⎟ r r
si a = ⎜ ⎟ et b = ⎜ ⎟ alors a ⋅ b = a1b1 + a2b2 + ... + anbn (Équation 21)
... ...
⎜ ⎟ ⎜ ⎟
⎜a ⎟ ⎜b ⎟
⎝ n⎠ ⎝ n⎠

et que la norme d’un vecteur en fonction de ses composantes dans l’espace est :

r
a = a12 + a22 + ... + an2 (Équation 22)
alors, le carré du cosinus de l’angle entre 2 vecteurs est :

cos θ = r 2
2 (ar ⋅ br )r
2

⇒ cos θ =
2 (a1b1 + a2b2 + ... + anbn )2
a ×b
2
(a
2
1 + a22 + ... + an2 )× (b12 + b22 + ... + bn2 )
(Équation 23)

Le cosinus de l’angle entre deux variables centrées et réduites n’est autre que leur coefficient
de corrélation linéaire.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 94

La valeur de corrélation C entre 2 chromatogrammes est donnée par [Keto 1989] :


C = 100 × ⎢ 2
(a1b1 + a2b2 + ... + anbn )2 ⎤
2 ⎥
(Équation 19)
⎣ a(
1 + a2
2
+ ... + an
2
) (
× b1
2
+ b2
2
+ ... + b)
n ⎦

où a1 , a 2 ,..., a n représentent respectivement les valeurs des variables 1 à n pour le

chromatogramme A et b1 , b2 ,..., bn représentent respectivement les valeurs des variables 1 à n pour le

chromatogramme B.
La valeur de corrélation est un nombre sans dimension, auto-normalisé et indépendant de la
longueur du vecteur (c’est à dire de la taille de l’échantillon).

L’avantage de la fonction cosinus réside dans sa possibilité de traiter facilement le résultat du


calcul puisque ce dernier se présente comme une valeur chiffrée unique et non sous forme d’une
représentation graphique (clustering)

7.2.3. Evaluation des valeurs prise par la fonction cosinus carré lors de la
comparaison d’échantillons non liés.
Pour cette étude nous avons sélectionné aléatoirement dans la base de données répertoriant les
saisies d’héroïne, 178 saisies réputées non liées chimiquement (profils différents). Nous avons ensuite
calculé les valeurs de corrélation obtenues en comparant chaque saisie avec les 177 autres (15931
comparaisons). La même opération a été effectuée avec 143 saisies de cocaïne possédant des profils
chimiques différentes (10296 comparaisons). Les figures suivantes illustrent la distribution de ces
résultats.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 95

120

100

80
Fréquence

60

40

20

0
0
3.5
7
10.5
14
17.5
21
24.5
28
31.5
35
38.5
42
45.5
49
52.5
56
59.5
63
66.5
70
73.5
77
80.5
84
87.5
91
94.5
98
Valeur de corrélation

Figure 39: Représentation de la fréquence d’apparition de la valeur de corrélation C pour des


échantillons d’héroïne réputés non liés et esquisse de la courbe de tendance.

250

200

150
Fréquence

100

50

0
0

10

15

20

25

30

35

40

45

50

55

60

65

70

75

80

85

90

95

100

Valeur de corrélation C

Figure 40: Représentation de la fréquence d’apparition de la valeur de corrélation C pour des


échantillons de cocaïne réputés non liés et esquisse de la courbe de tendance.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 96

En observant cette représentation, on peut faire les remarques suivantes :

• les valeurs de corrélation oscillent dans une proportion importante vers les valeurs
comprises entre 85 et 100. Ces constatations indiquent qu’une proportion importante
des saisies d’héroïne et de cocaïne analysées à l’IPS possède un profil chimique
proche. Cette observation semble indiquer une proximité de production et
méthodologique proche voire unique. Cela n’est pas surprenant si l’on admet que
l’héroïne saisie en Suisse provient majoritairement des laboratoires du Croissant d’or
(Afghanistan), ainsi que les renseignements de police et de l’UNDCP (United Nations
International Drug Control Programme) semblent l’indiquer, dont les matières
premières et les méthodes de production ne sont pas radicalement différentes de l’un à
l’autre. On se trouve donc en présence d’une production de stupéfiants endogène dont
les signatures chimiques sont peu diversifiées. Des constations similaires peuvent
également être faites pour la cocaïne dont la production est majoritairement assurée
par la Colombie. Cependant, une variation plus importante est observées.

• Néanmoins une différentiation est possible lorsque l’on compare cette distribution à
celle des échantillons considérés comme liés (voir chapitre précédent lors du choix de
la fonction de comparaison).

• La dispersion des valeurs de C est importante. Les valeurs de corrélation résultant des
comparaisons effectuées entre les différents échantillons à priori non liés s’étalent
donc sur une plage importante. Cette observation permet de valider la méthode de
classification quant à son aptitude à mettre en évidence des liens entre saisies ou, au
contraire, mettre en évidence la variété qui existe entre saisies non liées
chimiquement. On peut, en quelque sorte, comparer cette dispersion avec le pouvoir
discriminant de la méthode. En effet, si toutes les valeurs de corrélation étaient
comprises entre 90 et 100 par exemple, on risquerait d’obtenir des résultats présentant
un fort taux de faux positifs.

• Les constituants majeurs de l’héroïne et de la cocaïne permettent d’observer les


mêmes résultats illustrés ci-après. Les représentations graphiques ci-dessous illustrent
cette réflexion.
Fréquence Fréquence Fréquence

0
20
40
60
80
100
120
0
10
20
30
40
50
60
0
20
40
60
80
100

Figure 41 :
0 0 0
0.2
0.2 0.2
0.4
0.4 0.4
0.6
0.6 0.8
0.6
0.8 1
0.8
1 1.2
1 1.4
1.2
1.2 1.6
1.4
1.8
1.4 1.6 2
1.6 1.8 2.2
1.8 2 2.4
2.2 2.6

Classes
Classes
2

Classes
2.8
Meconine

Papavérine
2.2 2.4
3
2.6
2.4 3.2
2.8 3.4
2.6
3 3.6

6-Monoacétylmorphine (MAM)
2.8
3.2 3.8
3 4
3.4
3.2 4.2
3.6
4.4
3.4 3.8 4.6
3.6 4 4.8

Fréquence Fréquence Fréquence

0
20
40
60
80
100
120
140
0
10
20
30
40
50
60
70
80
0
5
10
15
20
25
30
35

0 0 0
0.2
0.2
0.2 0.4
0.4 0.6
0.4 0.8
0.6
1
0.6
0.8 1.2
0.8 1.4
1 1.6
1.2 1 1.8
2
1.4 1.2 2.2
1.6 2.4
1.4
2.6
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2)

Classes
1.8

Classes
2.8
Classes

1.6

Noscapine
3
2
Acétylthebaol
Acétylcodéine

1.8 3.2
2.2 3.4
2 3.6
2.4
3.8
2.2
2.6 4

Représentation des répartitions des aires des constituants majeurs de l’héroïne.


2.4 4.2
2.8 4.4
3 2.6 4.6
4.8
3.2 2.8 5
5.2
97
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 98

Ecgonine Methyl Ester Norcocaine


250 400

350

200
300

250
150

Fréquence
Fréquence
200

100
150

100
50

50

0 0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9

1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9

0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9

1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
0

2
Classes Classes

Benzoylecgonine Tropacocaine Ecgonine


500 500 300

250
400 400

200

300 300

Fréquence
Fréquence

Fréquence

150

200 200
100

100 100
50

0 0 0
0 0.10.20.30.40.50.60.70.80.9 1 1.11.21.31.41.51.61.71.81.9 2 2.12.2 0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9

1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
0.4
0.8
1.2
1.6

2.4
2.8
3.2
3.6

4.4
4.8
5.2
5.6

6.4
6.8
7.2
7.6

1
0

Classes Classes Classes

Trans-cinnamoylecgonine methyl ester Cis-cinnamoylecgonine methyl ester

120 140

120
100

100
80

80
Fréquence

Fréquence

60

60

40
40

20
20

0 0
0.2
0.4
0.6
0.8

1.2
1.4
1.6
1.8

2.2
2.4
2.6
2.8

3.2
3.4
3.6
3.8

4.2
4.4
4.6
4.8

5.2
5.4
5.6
5.8
0

0.2
0.4
0.6
0.8

1.2
1.4
1.6
1.8

2.2
2.4
2.6
2.8

3.2
3.4
3.6
3.8

4.2
4.4
4.6
4.8

5.2
5.4
5.6
5.8
0

Classes Classes

Figure 42 : Représentation des répartitions des aires des constituants majeurs de la cocaïne.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 99

On remarque à l’aide de ces différentes figures que l’acétylcodéine et la monoacétylmorphine


pour l’héroïne, la cis et la trans cinnamoylecgonine methyl ester pour la cocaïne sont les constituants
les plus discriminants à cause de leurs dispersions les plus importantes.

• La courbe de tendance esquissée en rouge sur les Figure 39 et Figure 40 montre une
périodicité dans sa construction indiquant peut être que la courbe délimitait des
groupes de saisies proches les unes des autres. Si cette hypothèse est vérifiée, il serait
théoriquement possible de fixer un échantillon comme standard de mesure
(échantillon de référence). Chaque échantillon serait comparé à ce dernier et sa valeur
de corrélation ainsi obtenue (valeur de corrélation standardisée) serait utilisée pour
sélectionner les échantillons de la base de données ayant des caractéristiques proches
(cette sélection s’effectuerait en choisissant les échantillons dont la valeur de
corrélation standardisée se situe dans un intervalle proche de celui du nouveau
candidat). L’étude de ce phénomène sera présentée ci-dessous

7.2.4. Utilisation d’un échantillon référence


Afin de tester cette ’hypothèse l’exemple suivant est utilisé : imaginons que notre nouveau
candidat ait une valeur de corrélation de 40 par rapport à notre échantillon fixe. Une première
opération consiste à choisir les échantillons ayant une valeur de corrélation comprise par exemple
entre 35 et 45 regroupant ainsi selon l’hypothèse précitée les chromatogrammes ayant un profil proche
du nouveau candidat.

Afin d’estimer la validité d’un tel critère, il est nécessaire de considérer les éléments suivants :
Dans un premier temps, il faut étudier le comportement de la fonction cosinus carré qui peut
être représenté graphiquement comme suit :
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 100

100
0.97
90

80

70
Valeurs de corrélation

60

50

40

30

20

10
10 170 190 350
0
1

21

41

61

81

101

121

141

161

181

201

221

241

261

281

301

321

341

361
Angle (°)

Figure 43 : Représentation de la fonction cosinus avec en rouge 4 angles ayant les mêmes valeurs.

Le tableau suivant représente les valeurs prises par C suivant l’angle séparant deux vecteurs:

Angle Radian cos coscarre Fonction cosinus


0.00 0.00 1.00 1.00 100.00
10.00 0.17 0.98 0.97 96.98
20.00 0.35 0.94 0.88 88.30
30.00 0.52 0.87 0.75 75.00
40.00 0.70 0.77 0.59 58.68
50.00 0.87 0.64 0.41 41.32
60.00 1.05 0.50 0.25 25.00
70.00 1.22 0.34 0.12 11.70
80.00 1.40 0.17 0.03 3.02
90.00 1.57 0.00 0.00 0.00
100.00 1.75 -0.17 0.03 3.02
110.00 1.92 -0.34 0.12 11.70
120.00 2.09 -0.50 0.25 25.00
130.00 2.27 -0.64 0.41 41.32
140.00 2.44 -0.77 0.59 58.68
150.00 2.62 -0.87 0.75 75.00
160.00 2.79 -0.94 0.88 88.30
170.00 2.97 -0.98 0.97 96.98
180.00 3.14 -1.00 1.00 100.00

Tableau 11: Valeurs prises par la fonction cosinus suivant l’angle pris entre 2 chromatogrammes.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 101

On remarque que pour la valeur de C égale à 96.98, il existe des valeurs d’angle de 10° et 170°
modulo 2π satisfaisant à ces conditions. Ceci est dû à la périodicité de la fonction cosinus.

V1
V3 β
−α2 α1
γ α2 V0
-α1
V2
V4

Figure 44 : Représentation de la périodicité de la fonction cosinus à l’aide d’un cercle trigonométrique.

La Figure 44 permet de se représenter schématiquement le problème. V0 est le vecteur fixe.


Les chromatogrammes représentés par les vecteurs V1 et V2 possèdent la même valeur de C puisque
l’on a α2 = α 1 - 360°. Dans ce cas de figure, les deux chromatogrammes sont similaires. Par contre, si
l’on considère V2 comme vecteur standard, il est évident que le lien entre V2 et V1 n’existe pas puisque
les deux chromatogrammes sont distants d’un angle de α 2 + α 1.

Le choix du vecteur standard influence donc les valeurs de corrélation attribuables aux divers
chromatogrammes de la base. Ce moyen n’est pas valable pour effectuer une sélection cohérente.

7.2.5. Analyse des fractions de l’héroïne et de la cocaïne


7.2.5.1. Introduction
Les différentes saisies de produits stupéfiants transmises pour analyse peuvent être présentes
sous des formes physiques différentes (poudre, caillou,…). Lors de la préparation des échantillons
pour analyse et afin d’assurer une homogénéité de la substance analysée, un broyage à l’aide d’un
mortier et d’un pilon est effectué. Néanmoins, même après cette opération, alors que la poudre obtenue
semble être homogène, les résultats de l’analyse chromatographique montrent souvent des variations
importantes.

Afin de comprendre cette problématique, des saisies d’héroïne et de cocaïne ont été tamisées.
Cette opération s’est effectuée sur un vibreur de marque RETSCH VS 1000. Les tamis utilisés sont
calibrés de la manière suivante :
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 102

0.75 mm, 0.40 mm, 0.30 mm, 0.25 mm, 0.20 mm, 0.10 mm, < 0.10mm. Les différentes
fractions ainsi récupérées ont été analysées par la suite par les techniques analytiques présentées
précédemment.

7.2.5.2. Les diagrammes en boîtes ou box-plot


L’utilisation des diagrammes en boîte ou box-plot a été privilégiée pour la présentation des
résultats de ces analyses de fractions Ces diagrammes représentent schématiquement les principales
caractéristiques d’une variable numérique en utilisant les quartiles. Afin de mieux comprendre les
notions impliquées dans cette représentation, la médiane et les quantiles sont brièvement décrits ci-
dessous [Selvin, 1998].
a) La médiane

Les valeurs étant rangées par ordre croissant, la médiane est le nombre qui partage la série en
deux parties de même effectif. Il y a autant de valeurs inférieures à la médiane que de valeurs
supérieures. La médiane diffère de la moyenne principalement du fait des propriétés suivantes :

• La moyenne dépend de la valeur de tous les nombres composant la série alors que la
médiane dépend essentiellement de leur ordre.

• la moyenne présente le défaut d’être très sensible aux valeurs exceptionnelles ou


aberrantes alors que la médiane n’est pas influencée par ces valeurs.

b) Les quantiles, les percentiles


Ces paramètres sont en fait des paramètres de position qui peuvent être aussi utilisés pour
analyser la dispersion. Les valeurs étant rangées par ordre croissant, et p étant un nombre compris
entre 0 et 1, le quantile d’indice p de la série de valeurs, noté Qp, est un nombre qui doit vérifier les
deux conditions suivantes:

• le pourcentage de valeurs inférieures à Qp de la série est inférieur ou égal à 100p %.

• le pourcentage de valeurs supérieures à Qp de la série est inférieur ou égal à 100(1-p)


%.

Le quantile de p est la valeur de rang p(n+1). Quand p = 0,5, alors il s’agit de la médiane,
valeur de rang (n+1). Dans ce cas, la fréquence a été partagée en deux parties égales. Les quartiles sont
les 3 quantiles de 0.25, 0.50, 0.75: Q0.25, Q0.5, Q0.75 notés aussi Q1, Q2, Q3. On peut aussi définir
les déciles (p variant de 0.1 à 0.9, soit 9 en tout), et les centiles (p variant de 0.01 à 0.99, soit 100 en
tout). Ainsi, par exemple, le 25ème centile (ou le 1er quartile, noté Q1) est la valeur telle que 25% des
données lui sont inférieures et donc 75% lui sont supérieurs. Ceci signifie que 33% de l’aire sous la
courbe de distribution se trouve à gauche de la valeur Q1.
c) Le diagramme en boîte (box-plot)

Les principaux paramètres que nous venons de voir peuvent aussi faire l’objet d’une
représentation graphique. Le diagramme en boîte donne en effet les informations suivantes :

• L’échelle horizontale (ou verticale) a une longueur égale à l’étendue de la série.


ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 103

• Sur cette échelle sont placés les trois quartiles.

• Parallèlement à l’échelle, un rectangle dont la longueur est égale à Q3- Q1 est


représenté.

• Le rectangle est partagé en largeur par une ligne indiquant la médiane.

• Le rectangle est prolongé par deux lignes parallèles à l’échelle, indiquant les valeurs
maximales et minimales.

Cette représentation est aussi appelée "boîte à moustaches" dans certains logiciels utilisés en
statistique.

Il existe des "variantes" dans la façon dont les logiciels génèrent ces diagrammes, notamment
au niveau de la représentation des valeurs éloignées ou extrêmes. Pour les identifier visuellement, ces
dernières sont alors représentées en dehors de la ligne horizontale. Cette dernière n’a donc plus comme
longueur l’étendue de la série. Dans le logiciel SPSS® par exemple, une valeur est définie comme
éloignée ("outlier") si sa distance au 75ième percentile (ou au 25ième) est supérieure à 1,5 x (Q3-Q1).
Une valeur est définie comme extrême si sa distance au 75ième percentile (ou au 25ième) est
supérieure à 3 x (Q3-Q1).

Les propriétés fondamentales d’une représentation sous forme d’un box-plot sont les
suivantes : elle est utilisable pour tout type de distribution (validité), elle n’est pas influencée par des
valeurs extrêmes (robuste) et elle permet de mettre en évidence ces données
Cette représentation est particulièrement utile pour comparer les caractéristiques de plusieurs
distributions

Valeur maximale

75% percentile

Médiane

25% percentile

Valeur minimale

Figure 45: Schématisation d’un box-plot.


ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 104

7.2.5.3. Homogénéité des saisies d’héroïne et de cocaïne, l’utilisation des fractions.


Les résultats des différentes comparaisons sont fournis en annexes (voir Annexe 5). Dans tous
les essais effectués, la fraction la plus importante (constituant environ le 25% du poids de la saisie
initiale) est celle que l’on retrouve dans le dernier tamis à savoir celui récoltant les fractions plus
petites que 0.10 mm.

Les résultats sont présentés en utilisant la méthode des diagrammes en boîte afin de pouvoir
comparer les distributions des différentes fractions. Cette manière de faire a été utilisée pour les 6
constituants majeurs de l’héroïne et les 7 constituants majeurs de la cocaïne pris en compte lors de la
comparaison d’échantillons en routine, ainsi que pour les valeurs de quantification du principe actif, à
savoir la diacétylmorphine et la cocaïne.

On remarque en analysant les différents résultats mis en évidence que pour chaque constituant
analysé (voir Annexe 5) il existe des différences significatives entre les différentes fractions Ainsi, par
exemple, pour l’analyse 1 de l’héroïne (cf. Annexes 5), la fraction Hero_poudre (fraction < 0.10 mm)
possède systématiquement une valeur plus élevée. De manière générale, on peut également remarquer
que les fractions les plus grandes et, plus particulièrement celle de 0.75 mm, présentent la plus grande
dispersion (inhomogénéité) de leurs données.

7.2.5.4. Discussion des résultats


La fraction de 0.75mm est la plus inhomogène : il faut donc éviter d’utiliser ces particules
pour l’analyse si l’on veut avoir des résultats avec un écart-type le plus faible possible.
Les graphiques des différentes distributions permettent de donner des pistes pour expliquer les
différences rencontrées lors des analyses de saisies d’héroïne et de cocaïne répétées. En effet, tant les
constituants majeurs que la pureté du produit stupéfiant, présentent des écarts pouvant être importants
lorsque des aliquotes d’un échantillon sont analysés. Souvent, ces différences sont attribuées à des
problèmes analytiques ou à une préparation non optimale de l’échantillon (homogénéisation à l’aide
d’un pilon). Ces résultats montrent que les problèmes de reproductibilité peuvent également être mis
sur le compte des différentes grandeurs granulométriques de la poudre. Ainsi, même une
homogénéisation «optimale» du stupéfiant ne permet vraisemblablement pas d’obtenir une seule
fraction homogène. Ceci implique que lors de la pesée de la poudre, aucun contrôle de la fraction
prélevée n’est possible.

Ces résultats peuvent expliquer les différences rencontrées lors de la comparaison de profils
chimiques résultant de l’analyse d’échantillons provenant d’une même saisie. Ce genre de problème
peut être évité par la dissolution de la poudre dans un solvant approprié (dichlorométhane par
exemple) et laisser évaporer ce dernier. Le résidu ainsi obtenu devrait être le plus homogène possible.

Les différentes fractions ont ensuite été comparées les unes par rapport aux autres à l’aide de
la fonction cosinus. Intuitivement, les valeurs de ces comparaisons devraient être très élevées et
devraient permettre de les lier entre-elles puisqu’au départ ces dernières proviennent de la même
matrice. Or les résultats obtenus sont tout autre puisque comme représenté dans les Figure 46 et Figure
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 105

47 les données résultant des fractions élevées (> 40 mm) fournissent lors de l’analyse des « faux
négatifs ». Cette phase à granulométrie élevée possède donc des proportions des constituants majeurs
différents de celles de faible granulométrie. Une hypothèse pouvant expliquer ce phénomène pourrait
être recherchée dans le mélange des différents lots de cocaïne et d’héroïne pour créer un stock de ces
substances. En effet, si deux poudres de formes physiques différentes (une sous forme pulvérulente
fine et l’autre sous forme de petits cailloux par exemple) sont mélangées, il y a fort à parier qu’il ne
sera pas possible d’obtenir un produit homogène. Dès lors, un tamisage comme montré précédemment
permet de séparer deux stupéfiants ayant des caractéristiques physiques différentes.

100.00
99.00
98.00 Auto26599B.10.1
Valeurs de corrélation

97.00 Auto26599B.20.1
96.00 Auto26599B.25.1
Auto26599B.30.1
95.00
Auto26599B.40.1
94.00 Auto26599B.75.1
93.00 Auto26599B.Mix1
92.00 Auto26599B.Poudre1

91.00
90.00
Auto26599B.Mix1
Auto26599B.10.1

Auto26599B.20.1

Auto26599B.25.1

Auto26599B.30.1

Auto26599B.40.1

Auto26599B.75.1

Auto26599B.Poudre1

Fraction

Figure 46 : Représentation des comparaison entre les différentes fractions d’héroïne à l’aide de la
fonction cosinus. A noter le décrochement des valeurs de corrélation obtenus pour la
fraction plus grande que 0.75 mm.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 106

100

99.8

99.6 Coc_10_1.1
Valeurs de corrélation

Coc_20_1.1
99.4 Coc_25_1.1
Coc_30_1.1
99.2
Coc_40_1.1
99 Coc_75_1.1
Coc_Mix_2.1
98.8 Coc_poudre_1.1

98.6

98.4

Coc_Mix_2.1
Coc_10_1.1

Coc_20_1.1

Coc_25_1.1

Coc_30_1.1

Coc_40_1.1

Coc_75_1.1

Coc_poudre_1.1
Fraction

Figure 47: Représentation des comparaison entre les différentes fractions de cocaïne à l’aide de la
fonction cosinus. A noter le décrochement des valeurs de corrélation obtenus pour la
fraction plus grande que 0.75 mm.

Une solution permettant d’assurer une homogénéité optimale consisterait à passer au tamis les
différentes poudres afin de sélectionner la fraction inférieure à 10mm. Néanmoins, cette manière
d’opérer prête à discussion puisque l’on sélectionne une partie de l’échantillon qui n’est pas
représentative de la totalité de la matrice à analyser.
S’est alors posée la question de savoir si la méthodologie de travail adoptée dans ce travail
était adéquate. En effet, lors de la pesée d’un échantillon, seul 7 mg de poudre sont prélevés. Il se peut
donc que sur trois prélèvements par exemple, un de ceux-ci soit représenté majoritairement par une
des fractions qui diffère de la moyenne. Afin d’estimer l’influence de la faible quantité de poudre
pesée, 10 fois plus de poudre ont été pesées (70 mg), diluées et les distributions de ces pesées ont été
comparées. Les graphiques suivants résument les résultats obtenus.

Légende des graphiques :

L’échantillon nommé dil 6599B représente l’échantillon dont on a pesé 10 fois plus de
substance que les autres et que l’on a dilué 10 fois afin de garantir une proportionnalité
dans la quantité mesurée.
Les échantillons 6599B essai 1, 6599B essai 2, 6599B essai 3 sont des échantillons de la
même saisie que l’échantillon dil 6599B mais que l’on a analysé de la manière habituelle.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 107

10.4

10.2

10.0

9.8

9.6

9.4

9.2

9.0

8.8
N= 3 3 3 3

Dil. 6599B 6599B essai 1 6599B essai 2 6599B essai 3

Figure 48 : Distribution de la méconine.

2.4

2.2

2.0

1.8

1.6

1.4
N= 3 3 3 3

Dil. 6599B 6599B essai 1 6599B essai 2 6599B essai 3

Figure 49 : Distribution de l’acétylcodéine.


ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 108

40

30

20
N= 3 3 3 3

Dil. 6599B 6599B essai 1 6599B essai 2 6599B essai 3

Figure 50 : Distribution de l’acétylthébaol.

13

12

11

10

8
N= 3 3 3 3

Dil. 6599B 6599B essai 1 6599B essai 2 6599B essai 3

Figure 51 : Distribution de la 6-MAM.


ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 109

13

12

11

10

8
N= 3 3 3 3

Dil. 6599B 6599B essai 1 6599B essai 2 6599B essai 3

Figure 52 : Distribution de la papavérine.

50

40

30

20
N= 3 3 3 3

Dil. 6599B 6599B essai 1 6599B essai 2 6599B essai 3

Figure 53 : Distribution de la noscapine.


ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 110

Les résultats illustrés ci-dessus montrent que la pesée d’un échantillon plus important semble
stabiliser la dispersion des données. Néanmoins en comparant les résultats, il ne semble pas que la
dilution améliore de manière très sensible la reproductibilité des analyses.

Afin de vérifier ce qui précède, une comparaison a été effectuée entre les échantillons dilués et
les échantillons préparés selon la méthode standard. La figure ci-dessous montre que les valeurs prises
par ces comparaisons sont comparables (pas de présence de faux positifs)

6
Echantillon dilué
Echantillon méthode standard
5

4
Fréquence

00
0

0
.0

.2

.4

.6

.8

.0

.2

.4

.6

.8

.0

.2

.4

.6

.8

0.
97

97

97

97

97

98

98

98

98

98

99

99

99

99

99

10
Valeurs de corrélation

Figure 54: Comparaison effectuée à l’aide de la fonction cosinus entre les échantillons dilués et ceux
préparés selon la méthode standard. Aucune différence notable n’a pu être notée.

De plus, la mise en routine d’une systématique de dilution n’est pas aisément applicable
puisque le temps dévolu à cette préparation est conséquent.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 111

7.2.6. Mélange de deux saisies de produits stupéfiants


En partant de l’hypothèse que des lots d’héroïne peuvent être mélangés, deux saisies ont été
mélangées dans les proportions ¼ B ¾ A (Mel. C), ½ B, ½ A (Mel. B), ¾ B ¼ A (Mel. A) puis les
différents mélanges ainsi créés ont été comparés. Le résultat est présenté dans le tableau ci-dessous :

A.1
A.1 100.00
A.2 99.98
A.3 99.97
MelC.2 94.58
MelC.1 94.25
MelC.3 94.00
MelB.2 83.78
MelB.1 83.34
MelB.3 81.40
MelA.3 73.80
MelA.2 73.07
MelA.1 71.79
B.1 66.09
B.2 65.53
B.3 64.39

Tableau 12: Résultat de la comparaison à l’aide de la fonction cosinus entre la saisie A et les différents
mélanges préparés en combinant cette saisie avec la saisie B.

Lorsque l’on mélange deux saisies ayant des profils différents, il est évident qu’une nouvelle
saisie ayant des caractéristiques chimiques différentes de celles des saisies initiales est obtenue.

7.2.7. Evaluation des faux positifs


Comme le montre la Figure 44, il existe pour une valeur de corrélation C donnée plusieurs
angles susceptibles de donner le même résultat. Néanmoins dans la pratique, lorsque deux
chromatogrammes possèdent des valeurs de corrélation C très proches, ils possèdent un profil
similaire. Le cas de figure présentant deux chromatogrammes dont les vecteurs représentés par leurs
variables forment un angle de 180°C ne s’est encore jamais présenté après plus de 8000 analyses. En
observant la répartition des aires des différentes variables prises en compte dans l’analyse des
constituants majeurs, ces dernières ont une dispersion de leurs valeurs assez restreintes (cf. figures 4)
ne permettant pas d’obtenir le cas de figure cité ci-dessus. On peut expliquer ces observations du fait
que les différentes saisies d’héroïne effectuées en Suisse proviennent d’une région géographique
limitée dont les laboratoires produisent une héroïne selon des recettes proches.

De plus, les tableaux de corrélation entre les différentes variables (cf. Tableau 7 et Tableau 8)
montrent que les corrélations observées entre ces dernières sont toujours positives ce qui implique que
lorsque la valeur d’une variable augmente, les autres augmentent également. Ces considérations
montrent que les valeurs prises par les différentes variables sont assez bien délimitées et permettent
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 112

d’expliquer que les valeurs de corrélations se concentrent dans la partie du cercle trigonométrique
comprise entre 0° et 90°.
Afin d’étayer ce raisonnement, la fonction de cosinus a été modifiée afin de mesurer le cosinus
à la place du cosinus carré. La Figure 55 représente les deux fonctions précitées :

0.8

0.6

0.4

0.2

cos x
0
cos2 x
0
16
32
48
64
80
96
112
128
144
160
176
192
208
224
240
256
272
288
304
320
336
352
-0.2

-0.4

-0.6

-0.8

-1

Angle (°)

Figure 55: Représentation du cosinus2 en regard du cosinus.

Dans le cas du cosinus, les angles supérieurs à 90° donnent des valeurs négatives alors que
pour le cosinus carré elles sont positives. A partir de ceci, il est donc possible de calculer les angles
obtenus entre des chromatogrammes. Le cosinus entre les vecteurs résultants des 2 échantillons non
liés est calculé de la manière suivante :

r r r r
a ⋅ b = a × b × cos θ

r
cos θ = r
(ar ⋅ b r)
⇒ cos θ =
(a1b1 + a 2 b2 + ... + a n bn )
(Équation 24)
a ×b (a2
1 + a 22 + ... + a n2 × ) (b 1
2
+ b22 + ... + bn2 )
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 113

Les angles obtenus à partir de la base des échantillons non liés sont représentés sur la figure
suivante

800

700

600

500
Occurence

400

300

200

100

0
90
88
85
83
81
78
76
74
71
69
66
64
61
59
56
53
50
47
44
41
37
33
28
23
16

0
Angle(°)

Figure 56: Représentation des saisies d’héroïne réputées non liées à l’aide de la fonction cosinus
modifiée.

Il apparaît que sur la totalité de la base de données, aucune valeur supérieure à 90 ° n’a été
retrouvée. Cette constatation confirme l’hypothèse selon laquelle, les valeurs de C occupent le premier
quart du cercle trigonométrique. Les risques de faux positifs semblent donc être limités voire
inexistants.

7.2.8. Etude de l’effet de compensation :


Les traces prises en considération sont des substances pouvant subir des dégradations. Par
exemple, il est connu que la diacétylmorphine (DAM) se transforme en 6-Monoacétylmorphine
(MAM) par hydrolyse au fil du temps. Lors de cette dégradation, une diminution du pic de la DAM est
observée avec une augmentation proportionnelle de celui de la MAM.

Afin d’estimer l’importance de ces dégradations, des simulations ont été effectuées en
supposant que le 100% de la dégradation de la DAM se transforme en MAM.

Ces simulations ont pour objectif de déterminer si la dégradation des échantillons due à leur
stockage ou à leur vieillissement influence la valeur de corrélation C de manière significative. Ces
tests sont intéressants puisqu’ils permettront de déterminer s’il faut s’attendre à des variations
significatives en analysant un échantillon à un temps t et si ce même échantillon est analysé une
nouvelle fois ultérieurement. Il en va de même concernant des saisies provenant d’un même lot, mais
saisies à un intervalle de temps de plusieurs mois par exemple.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 114

Les résultats concernant la variation de la valeur de corrélation C en fonction de la dégradation


de la DAM en MAM (la somme des aires des deux composés est conservée) sont mis en évidence sur
la Figure 57.

100

98

96
Valeur de corrélation

94

92

90

88

86

84

82
0 10 20 30 40 50 60 70 80 90
Variation de la MAM (%)

Figure 57: Variation de la valeur de corrélation en regard de la variation de la 6 mono-


acétylmorphine (MAM).
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 115

Les valeurs numériques sont :

Valeur de C %var MAM % de variation sur


l’aire total du chromatogramme
100.00 0.00 0.00
99.89 6.12 0.98
99.56 12.23 1.95
99.02 18.35 2.93
98.27 24.46 3.90
97.33 30.58 4.88
96.20 36.70 5.85
94.91 42.81 6.83
93.45 48.93 7.80
91.85 55.05 8.78
90.13 61.16 9.75
88.30 67.28 10.73
86.38 73.39 11.70
84.39 79.51 12.68

Tableau 13: Valeurs numériques extraites de la Figure 57.

Le graphique et le tableau ci-dessus illustrent les variations de la valeur de C lorsque l’on fait
varier les valeurs des aires de la DAM et de la MAM. Les valeurs de corrélation sont peu influencées
par des grandes variations de l’aire d’une trace lorsque cette variation est reportée sur une autre
substance (la diacétylmorphine par exemple). Il faut donc se référer au pourcentage de variation que
l’on effectue par rapport à l’aire totale du chromatogramme.
D’après ces simulations, il semble que les variations mineures pouvant provenir de la
dégradation d’un composé sont peu visibles. Par exemple avec une dégradation de 35.21% de la MAM
qui représente qu’une variation de 0.46% sur l’aire totale, la valeur de corrélation est quasiment
inchangée.

Valeur de %var MAM % de variation sur


corrélation l’aire total du chromatogramme
100.00 0.00 0.00
99.97 35.21 0.46
99.93 62.30 0.81

Tableau 14: Illustration de la variation de C en fonction de la variation de l’aire totale due à une
dégradation d’un constituant.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 116

7.2.9. Inversion entre deux constituants, que se passe-t-il ?


Le cas de figure où deux chromatogrammes ont des profils identiques à la différence près que
les valeurs de deux pics sont inversées (cf. Tableau 15 avec l’inversion entre les valeurs de l’aire de la
papavérine et de la noscapine). Dans ce cas, en comparant ces deux chromatogrammes à l’aide de la
fonction cosinus, la valeur de corrélation C est différente.

No Méconine Acétyl- Acétyl Acetyl DAM Papavérine Noscapine Valeur de


codéine thébaol morphine corrélation
g00339.71b 0.52 1.55 1.27 1.64 123.64 1.86 5.00
g00339.71b 0.52 1.55 1.27 1.64 123.64 5.00 1.86 55

Tableau 15: Présentation du problème d’inversion d’aire entre deux constituants.

Ce résultat peut être expliqué de la manière suivante :

Valeurs papavérine

5 1.86

Valeurs noscapine
1.86

Figure 58: Explication graphique du phénomène d’inversion d’aire entre deux constituants.

Les vecteurs résultants de la noscapine et la papavérine divergent considérablement si leurs


valeurs sont inversées comme l’illustre le graphique ci-dessus.

Ainsi, en présence de chromatogrammes ayant des aires similaires mais distribuées


différemment entre les variables, les valeurs de corrélation C seront différentes, évitant ainsi le risque
de faux positifs.
ETUDE DE LA FONCTION COSINUS CARRÉ (HYPOTHÈSE 2.2) 117

7.2.10. Conclusions
Les tests effectués ci-dessus ont permis d’apporter des éclairages importants sur la validité de
la fonction cosinus que nous utilisons pour comparer les échantillons de produits stupéfiants.
Ainsi, l’origine mathématique de la fonction ainsi que sa représentation graphique, son
comportement et ses avantages par rapport aux autres fonctions utilisées fréquemment pour la
comparaison de produits stupéfiants ont pu être validés.

Une observation importante exclut la possibilité de fixer un échantillon standard et d’effectuer


des comparaisons et un classement à partir de ce dernier. La méthode de comparaison a finalement pu
être validée en montrant l’étendue des valeurs obtenues. De même, les craintes concernant les risques
de faux positifs et négatifs se sont avérées être surestimées.

Ainsi l’hypothèse 2.2 relative à l’efficacité de la fonction cosinus carré à minimiser le taux de
faux positifs et faux négatifs est confirmée par les résultats obtenus dans ce chapitre.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 118

8. LES TECHNIQUES DE
RECONNAISSANCE DE GROUPE OU
« PATTERN RECOGNITION »
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 119

8.1. Introduction
Afin d’apprécier la structure des informations répertoriées dans les bases de données de
l’héroïne et de la cocaïne et dans l’optique de mettre en évidence d’éventuelles classes chimiques,
diverses techniques de reconnaissances de groupe ont été testées. Premièrement, il est nécessaire de
définir la notion de classe chimique. Une classe chimique est définie comme une collection d’objet
(dans notre cas des échantillons de produits stupéfiants) ayant des caractéristiques similaires.

La connaissance a priori de l’appartenance de différents objets à une classe chimique n’est pas
toujours disponible, dans ce cas des techniques non supervisées sont appliquées. Ces dernières sont
souvent utilisées pour analyser et représenter la distribution de ces données en divers groupes sans
imposer une appartenance de classe à ces échantillons. L’analyse en composante principale est l’une
de ces techniques statistiques qui est évaluée dans ce chapitre. Il s’agira d’apprécier l’hypothèse 2.3
qui dit que les techniques non supervisées ont un potentiel de tri initial intéressant.

Les méthodes supervisées quant à elles utilisent les informations d’appartenance à une classe
chimique. Le but de ces méthodes est de construire un modèle permettant de prédire l’appartenance
d’échantillons futurs à une éventuelle classe chimique. Ces méthodes impliquent nécessairement une
phase d’apprentissage permettant de développer le modèle le plus adapté à la classification des
échantillons à disposition. Cette phase permet de répondre à l’hypothèse 2.4 concernant l’utilisation de
ces méthodes mathématiques afin de confirmer les liens obtenus à l’aide de la systématique de
comparaison proposée dans cette recherche.

Afin de guider le praticien quant au choix de ces techniques analytiques un arbre de décision a
été schématisé dans la figure suivante [Beebe et al., 1998] :
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 120

Voulez-vous
développer un modèle Non
pour prédire Techniques non supervisées
l’appartenance d’un
échantillon à une classe
spécifique ?
Analyse de groupe
hiérarchique (Hierarchical
Cluster Analysis)

Puis
Oui

Analyse en composante
principale (ACP)

Est-ce que les Oui


classes sont Techniques supervisées
discrètes ?

Analyse de groupe
Non
hiérarchique et ACP pour
un examen initial des
Calibrations multivariées données

SIMCA Y a-t-il > 10


Modèle en ACP pour déterminer la Oui échantillons
région dans l’espace occupé par une indépendants par
classe classe?

Non

K-Nearest Neighbours (KNN)


L’appartenance à une classe est
définie par la proximité dans un
espace linéaire

Figure 59: Arbre décisionnel utilisable pour sélectionner les techniques de reconnaissance de
groupes. Les formes remplies en gris montrent le chemin adopté dans le cadre de ce
travail.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 121

La figure ci-dessus permet selon les données à disposition de définir les techniques statistiques
exploratoire et prédictive à privilégier. La première étape a principalement été effectuée pour étudier la
structure des données à disposition et valider les classes définies à l’aide de la fonction cosinus.
L’analyse en composante principale a été utilisée comme élément de sélection préliminaire à l’analyse
des échantillons 2 à 2 à l’aide de la fonction cosinus. SIMCA (Soft Independent Modelling of Class
Analogy) a ensuite été utilisée comme validation d’un lien préalablement mis en évidence.

Afin d’améliorer la base de données regroupant les résultats des saisies de produits stupéfiants,
des techniques empruntées à la statistique exploratoire ont été testées dans l’optique de simplifier la
comparaison en synthétisant, résumant et structurant l’information des données à disposition.

Les deux principaux groupes de techniques statistiques exploratoires sont les suivants:

• les méthodes de classifications non supervisées, tel que les mesures de distances ou
l’analyse en composante principale permettant soit de sélectionner et regrouper des
échantillons ayant des caractéristiques chimiques proches [Derde and Massart, 1982].

• les méthodes de classifications supervisées, tel que SIMCA permettant de valider les
classifications effectuées au préalable par les techniques non supervisées.

8.2. L’analyse en composante principale (ACP)


L’analyse en composante principale permet d’effectuer une représentation simplifiée d’une
série de variables inter corrélées. Cette technique utilise comme principe une transformation des
variables initiales en de nouvelles variables non corrélées. Ces nouvelles variables sont appelées les
composantes principales. Chaque composante principale est une combinaison linéaire des variables
initiales. La mesure de la quantité d’informations représentée par chaque composante principale
représente sa variance. Les variances associées à chaque composante principale sont classées par ordre
décroissant. La composante principale la plus informative est donc la première, et la moins
informative la dernière.

L’analyse en composante principale est utilisée pour réduire la dimension (le nombre de
variables) d’un problème. Cette diminution du nombre de variables doit s’effectuer en perdant le
minimum d’information. L’analyse des premières composantes principales (celles qui renferment le
plus d’information) permet dans la majorité des cas de représenter de manière suffisante l’information
véhiculée par les variables initiales. Les composantes principales secondaires ne représentent que peu
d’information puisque leur variance est moindre.

On peut également relever que les composantes principales ne sont pas corrélées entre-elles. Il
en résulte que si l’on choisit les deux premières composantes principales pour représenter des
échantillons caractérisés par 6 variables, on assure que l’information véhiculée par la première
composante principale est totalement indépendante de celle véhiculée par la seconde.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 122

8.3. Aperçu théorique de l’analyse en composante principale


8.3.1. Introduction
Comme pour l’analyse canonique, l’analyse en composante principale fait appel à des notions
d’algèbre linéaire qui sont présentées en annexe (cf. Annexe 3). La partie théorique présentée ci-après
a été tirée des ouvrages suivants : [Afifi et Clark, 1996], [Legendre P. et Legendre L., 1998], [Saporta,
1990].

8.3.2. Les axes principaux


La recherche des axes principaux consiste à chercher la droite maximisant l’inertie d’un nuage
de points projeté sur cette droite. Afin de faciliter l’explication de ce problème la représentation de ce
nuage de points a été réduite à une ellipse.

Le premier axe principal d’une distribution ellipsoïdale est la ligne qui passe à travers la plus
grande dimension de l’ellipse. L’axe principal suivant passe par la deuxième dimension la plus grande
et ainsi de suite. En deux dimensions le premier axe principal correspond à l’axe principal de la
concentration de l’ellipse (donc la première composante principale qui explique la majorité de
l’information des données initiales) et le second axe principal correspond à l’axe mineur qui est en fait
celui de la seconde composante principale. Ces deux axes sont perpendiculaires l’un par rapport à
l’autre. De manière similaire, on peut penser en p-dimension où il y a p axes consécutifs qui sont
perpendiculaires les uns par rapport aux autres.

8.3.3. Rotation des axes translatés en axes principaux


Les axes principaux coupent les centres p-dimensionnels µ = µ1 µ 2 ...µ p [ ] des ellipses et
[ ]
croisent la surface de l’ellipse à un point appelé y = y1 y 2 ... y p . Les valeurs de µ et y définissent

un vecteur de dimension p. La longueur de l’axe de µ à la surface de l’ellipse est calculée en utilisant


le théorème de Pythagore :

[( y
1 − µ1 ) + ( y 2 − µ 2 ) + ... + ( y p − µ p )
2 2 2
] = ([y − µ ][y − µ ] )
1
2 '
1
2
(Équation 25)

Le premier axe principal est la droite qui passe par le centre µ de l’ellipse et qui la traverse
dans sa plus grande dimension. Le second axe principal passe aussi par µ , c’est une droite
perpendiculaire au premier axe principal. Donc le demi-premier axe principal de l’ellipse est celui qui
maximise la distance d’un point de l’ellipse au centre µ de cette ellipse. Soit :

[ y − µ ][ y − µ ]' sachant que [ y − µ ]Σ −1 [ y − µ ]' = α qui est l'équation spécifique de l'ellipse

ou Σ est la matrice de covariance des différents échantillons.


LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 123

Les multiplicateurs de Lagrange ( λ ) sont utilisés pour calculer les valeurs minimales et
maximales d’une fonction à plusieurs variables lorsque les relations entre ces différentes variables sont
connues. Dans le cas présent, l’équation à maximiser est la suivante :

f ( y) = [ y − µ ][ y − µ ] − λ
' ∂
∂y
{ }
[ y − µ ]Σ −1 [ y − µ ]' − α (Équation 26)

Les valeurs qui maximisent cette fonction sont trouvées en calculant la dérivée partielle et en
la fixant à 0


f ( y)
∂y


∂y
{
[ y − µ ][ y − µ ]' − λ ∂ [ y − µ ]Σ −1 [ y − µ ]' − α
∂y
}

( )
Il est important de se rappeler ici que y est un vecteur à p-dimension, y1 , y 2 ,..., y p ce qui

implique que l’équation est successivement dérivée par y1 , y 2 ,..., y p .

Le développement de cette formule fournit le résultat suivant

(Σ − λI )[ y − µ ] = 0 (Équation 27)

I étant une matrice unité


L’équation générale définissant les vecteurs propres est u (A − λI ) = 0 . En remplaçant dans

cette équation A par Σ et u par [ y − µ ] on obtient l’équation ci-dessus. Or il ressort de cette


expression qu’il s’agit de la formule permettant de calculer les vecteurs propres. Donc on peut
conclure que le vecteur qui spécifie le premier axe principal est un vecteur propre [y −µ ] de la matrice

Σ.
Pour trouver les vecteurs déterminants des axes principaux p successifs, il est nécessaire de
classer les valeurs propres de la matrice Σ en ordre décroissant λ1 〉 λ2 〉...〉 λ p ≥ 0

L’étape suivante consiste à calculer les nouvelles variables. Ces nouvelles variables (v) sont
reliées aux variables primitives par la transformation suivante :

v = [ y − µ ]U (Équation 28)
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 124

où chaque colonne p de la matrice U est normalisée au vecteur u k correspondant au kème axe


principal. Du fait que tous les vecteurs u k sont deux à deux orthogonaux et normalisés, la matrice U
est orthonormale (de cette propriété découle le fait que les différentes composantes principales ne sont
pas corrélée entre elles) . Cette transformation consiste à déplacer l’origine du système à un point à p-
dimension µ , suivi d’une rotation des axes translatés en axes principaux qui forment la matrice V .

y2

(µ1 , µ 2 )

y1

Figure 60 : Système originel constitué des ellipses de concentration.


LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 125

[ y2 − µ 2 ]

y2

(µ1 , µ 2 )

[ y1 − µ1 ]

y1

y1

Figure 61 : Translation des origines.

v1 = [ y − µ ]u 1
y2

v 2 = [ y − µ ]u 2

(µ1 , µ 2 )

y1

Figure 62: Rotation des axes translatés en axes principaux.


LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 126

8.3.4. L’analyse en composante principale


L’axe principal d’une matrice de dispersion S (matrice formée par la variance et la covariance
des n descripteurs) est trouvé en résolvant l’équation

u k (S − λk I ) = 0 (Équation 29)

dont l’équation caractéristique est

S − λk I = 0 (Équation 30)

qui est utilisée pour calculer les valeurs propres λk . Les vecteurs propres u k associés aux λk
sont calculés en introduisant les différents u k dans l’équation 30. Les vecteurs propres sont les axes
principaux de la matrice de dispersion S . Ces vecteurs propres sont normalisés avant de calculer les
composants principaux, qui donnent les coordonnés des objets sur les axes principaux successifs.
L’analyse en composante principale possède les propriétés suivantes:

• Les matrice de dispersion étant symétrique, les axes principaux sont orthogonaux les
uns par rapport aux autres

• Le vecteur propre λk de la matrice de dispersion donne la quantité de variance


correspondante aux axes principaux successifs.

• Suite aux deux premières propriétés, l’analyse en composante principale peut souvent
résumer dans une dimension plus petite la plus grande partie de la variabilité de la
matrice de dispersion d’un grand nombre de descripteurs. Elle permet donc de mesurer
la quantité de la variance expliquée par ces quelques axes indépendants.

8.3.5. Exemple numérique :

L’exemple ci-dessous est volontairement choisi simple pour des raisons évidentes de calcul. Il
s’agit de calculer les vecteurs propres de deux analyses d’héroïne (composées des six composants
majeurs). Y est la matrice construite à l’aide des valeurs obtenues pour chaque composant (chaque
ligne regroupe les valeurs prises par un composant spécifique).
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 127

⎡2 1⎤
⎢3 4⎥⎥

Y = ⎢5 0⎥
⎢ ⎥
⎢7 6⎥
⎢⎣9 2⎥⎦

en centrant cette matrice sur la moyenne on obtient

⎡ − 3.2 − 1.6 ⎤
⎢− 2.2 1.4 ⎥
⎢ ⎥
[y - y] = ⎢− 0.2 − 2.6⎥
⎢ ⎥
⎢ 1.8 3.4 ⎥
⎢⎣ 3.8 − 0.6⎥⎦

La matrice de dispersion peut être directement calculée en multipliant la matrice des données

centrées [ y − y ] par sa transposée [ y − y ] :


'

[ y − y ]' [ y − y ] = ⎡⎢
1 8.2 1.6 ⎤
S= ⎥
n −1 ⎣1.6 5.8⎦

La matrice [ y − y ]' [ y − y ] est appelée la matrice de dispersion et S la matrice de


covariance. En fait, une matrice de covariance est simplement une matrice de dispersion divisée par
(n − 1) .

L’équation caractéristique lui correspondant est la suivante :

⎡8.2 1.6 ⎤ ⎡λk 0⎤


S − λk I = ⎢ ⎥−⎢ =0
⎣1.6 5.8⎦ ⎣ 0 λk ⎥⎦

la résolution de cette équation fourni les deux valeurs propres λ1 = 9 et λ 2 = 5 . La variance


totale reste la même, mais elle est divisée d’une manière différente. La somme de la variance dans la
diagonale principale de la matrice S est de (8.2+5.8 =14), alors que la somme des vecteurs propres
est de (9+5=14). λ1 = 9 participe à l’explication de 64.3% de la variance totale et λ 2 = 5 explique
le reste de la variance soit le 35.7%. Il y a autant de valeurs propres qu’il y a de variables. Les
valeurs propres successives expliquent des fractions de valeurs de plus en plus petites.

En introduisant les λk successivement dans l’équation 30


LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 128

u k (S − λk I ) = 0

on obtient les vecteurs propres associés à ces valeurs. Une fois que ces vecteurs ont été
normalisés ils deviennent les colonnes de la matrice U :

⎡ 0.8944 -0.4472⎤
U=⎢ ⎥
⎣-0.4472 0.8944 ⎦

L’orthogonalité peut facilement être vérifiée en contrôlant que

u1u 2 = (0.8944 × (− 0.4472 )) + (− 0.4472 × 0.8944 ) = 0

8.3.6. Calcul et représentation des composantes principales


Les éléments des vecteurs propres sont donc des poids ou des « loadings » des variables
originelles, dans un système de combinaisons linéaires de ces variables lorsque l’on calcule les
composantes principales. Les composantes principales donnent la position des objets par rapport au
nouveau système d’axes. Il en ressort que la position de l’objet x i sur le premier axe principal est
donné par la fonction suivante ou la combinaison linéaire suivante :

f i1 = ( y i − y1 )u11 + ... + ( y ip − y p )u p1 = [ y − y ]u 1 (Équation 31)

Les valeurs ( yij − y ) sont les coordonnées de l’objet i par rapport aux différentes variables

centrées j alors que les valeurs u j1 correspondent aux « loadings » des variables sur les premiers
vecteurs propres. Le positionnement de tous les objets par rapport au nouveau système d’axes est
donné par la matrice F des variables transformées. Elle est appelée la matrice des composés scorés :

F = [ y − y ]U (Équation 32)

Ou U est la matrice des vecteurs propres et [ y− y ] est la matrice des observations centrées.

En reprenant l’exemple numérique ci-dessus, la composante principale est calculée de la


manière suivante :
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 129

⎡ − 3.2 − 1.6 ⎤ ⎡− 3.578 0 ⎤


⎢− 2.2 1.4 ⎥ ⎢ − 1.342 2.236 ⎥
⎢ ⎥ ⎡ 0.8944 − 0.4472⎤ ⎢ ⎥
F = ⎢ − 0.2 − 2.6⎥ ⎢ ⎥ = ⎢ − 1.342 − 2.236 ⎥
⎢ ⎥ ⎣− 0.4472 0.8944 ⎦ ⎢ ⎥
⎢ 1.8 3.4 ⎥ ⎢ 3.130 2.236 ⎥
⎢⎣ 3.8 − 0.6⎥⎦ ⎢⎣ 3.130 − 2.236⎥⎦

Les deux colonnes de la matrice des composés scorés constituent les coordonnées des 5 objets par
rapports au nouveaux axes principaux, il peuvent être utilisés pour les représenter graphiquement
respectivement par rapport aux axes principaux I et II.

y2 y2
(a) ( y2 − y2 ) (b)

( y1 − y1 )

y1

y1
y2 ( y2 − y2 ) (d)
II (c)
II

I ( y1 − y1 )
I

y1

Figure 63: Exemple des transformation appliquée lors d’une analyse en composantes principales.
(a) 5 objets sont représentés graphiquement par rapport aux variables y1 et y 2 . (b)
Après avoir centré les données, les objets sont alors représentés en respectant les axes
( y1 − y1 ) et ( y 2 − y 2 ) sous forme d’axes discontinus. (c) les objets sont décrits par
rapport aux axes principaux I et II. (d). Les deux systèmes d’axes peuvent être superposés
en effectuant une rotation des axes principaux.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 130

On peut vérifier dans cet exemple à deux variables que les objets sont positionnés dans un
système utilisant les composantes principales d’une même manière que le système original d’axe.
L’analyse en composante principale a seulement effectué une rotation des axes d’une manière telle que
les nouveaux axes correspondent aux deux composantes principales de la variabilité.

Lorsqu’il y a plus de deux variables, comme c’est souvent le cas dans le type de données
étudiées, l’analyse en composante principale effectue également une rotation du système des axes des
variables en plusieurs dimensions. Dans ce cas, les composantes principales I et II définissent le plan
permettant la représentation de la quantité la plus importante de la variance initiale. Les objets sont
projetés sur ce plan pour préserver, autant que possible, la distance euclidienne qu’ils avaient les uns
par rapport aux autres dans l’espace multidimensionnel formé par les descripteurs initiaux.

8.3.7. Proposition d’utilisation de la composante principale dans la comparaison


d’échantillons d’héroïne et de cocaïne
8.3.7.1. Introduction
Pour cette étude, 270 saisies possédant des profils chimiques différents ont été choisies.
Chaque saisie est représentée par un échantillon. En fait, la base contient au 31.12.2002 environ 5000
analyses d’héroïne sur une période s’échelonnant entre 1998 et 2002. Trois techniques analytiques
principales permettent d’obtenir un profil chimique utilisé dans la comparaison d’échantillons
d’héroïne.
Concernant la cocaïne, 125 saisies possédant des profils chimiques différents ont été
sélectionnées. Chaque saisie est représentée par un échantillon. En fait, la base contient au 31.12.2002
environ 2400 analyses de cocaïne sur une période s’échelonnant entre 1998 et 2002.

8.3.7.2. Résultats et discussions


a) Logiciels :

Les traitements statistiques ont été effectués sur S-PLUS® 2000 Professional Edition for
Windows et Pirouette 3.10 d’Infometrix. L’utilisation systématique des composantes principales est
effectuée dans l’environnement FileMaker Pro 5 pour Windows.
b) Calcul de la composante principale

I) L’héroïne
La première opération consiste à épurer la base des différents répliquats et entrées aberrantes.
Afin d’illustrer cette étape, on peut dire qu’une saisie est souvent composée de plusieurs échantillons.
La procédure d’analyse se déroule de la manière suivante : 3 prélèvements d’environ 8mg sont
préparés pour chaque échantillon d’une saisie. Chaque prélèvement est analysé 2 fois soit un total de 6
analyses par échantillon. Un prélèvement par saisie a été sélectionné afin d’éviter qu’un poids trop
important soit attribué aux saisies constituées de nombreux échantillons.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 131

La variance extraite par chaque composante principale est calculée: Le premier exemple
illustre les résultats obtenus avec les constituants majeurs effectués à l’aide du programme S-PLUS®
2000. Dans ce programme statistique les données sont centrées et réduites (xi = (xi - moyenne de x /
écart-type de x). L’unité de mesure n’a ainsi plus d’importance puisque les variables sont sans
dimension. Surtout cette métrique donne à chaque caractère la même importance, quelles que soient
les valeurs prises par ces dernières, en leur attribuant une variance de 1. Ainsi, prenons l’exemple de
l’acétylthébaol dont la valeur moyenne se situe bien au-dessous de celle de l’acétylcodéine, l’opération
décrite précédemment aura comme effet de rendre comparable des deux variables puisque les deux
distributions seront centrées en 0 avec une variance de 1.

Les différentes lignes illustrent les différentes étapes nécessaires pour calculer les
composantes principales.
> y<-scale(herototalepurZSCORE,center=T)
> bdata<-scale(y,center=T)
> p.objet2<-prcomp(bdata)
> v<-p.objet2$sdev^2
> round(v,2)
[1] 2.90 1.20 0.87 0.71 0.29 0.04
> round(100*v/sum(v),1)
[1] 48.3 20.1 14.5 11.8 4.8 0.6
> round(100*cumsum(v)/sum(v),1)
[1] 48.3 68.4 82.9 94.6 99.4 100.0

100

90

80

70
Pourcentage cumulé

60

50

40

30

20

10

0
0 1 2 3 4 5 6
Composante principale N°

Figure 64 : Pourcentage cumulé de la variance totale expliquée par les composantes principales des
constituants majeurs de l’héroïne.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 132

Les résultats présentés dans la Figure 64 ci-dessus montrent que la première composante
principale résume 48.3% de la variabilité contenues dans les données initiales. En utilisant la même
démarche on peut montrer qu’en utilisant une représentation en deux dimensions basée sur les deux
premières composantes principales, on obtient un système prenant en compte le 68.4% de la variabilité
des observations initiales. On peut donc conclure que les deux premières composantes principales
réduisent les observations initialement représentées dans un espace à six dimensions en un espace à
deux dimensions avec une perte d’information de 32.6% (100-68.4).

La même systématique de calcul a été effectuée pour les variables caractérisant les
constituants mineurs et les constituants inorganiques :

> bdata<-scale(donneesOG35Mineure, center=T)


> p.object<-prcomp(bdata)
> v<-p.object$sdev^2
round(v,2)
[1] 7.12 2.20 1.42 0.56 0.25 0.17 0.15 0.07 0.04 0.01 0.01 0.00
> round(100*cumsum(v)/sum(v),1)
[1] 59.3 77.7 89.5 94.1 96.2 97.6 98.9 99.5 99.8 99.9 100.0 100.0

100
90
80
Pourcentage cumulé

70
60
50
40
30
20
10
0
0 2 4 6 8 10 12
Composantes principales N°

Figure 65 : Pourcentage cumulé de la variance totale expliquée par les différentes composantes
principales des constituants mineurs de l’héroïne.

Dans le cas des constituants mineurs, la première composante principale ″explique″ le 59.3%
de la variabilité des données de départ. La seconde composante principale ″explique″ quant à elle le
18.4%. Ensemble, elles représentent le 77.7% de la variabilité des variables initiales. Il est donc
possible de conclure que les deux premières composantes principales réduisent les observations
représentées en un espace à deux dimensions (initialement à 12) avec une perte d’information de
22.3% (100-77.7).
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 133

Le troisième exemple est tiré de l’analyse des constituants inorganiques :


> bdata<-scale(ICP177, center=T)
> p.object<-prcomp(bdata)
round(v,2)
[1] 3.77 1.63 1.23 0.74 0.68 0.64 0.62 0.47 0.20 0.02
> v<-p.object$sdev^2
> round(100*cumsum(v)/sum(v),1)
[1] 37.7 53.9 66.3 73.7 80.5 86.9 93.1 97.8 99.8 100.0

100
90
80
Pourcentage cumulé

70
60
50
40
30
20
10
0
0 1 2 3 4 5 6 7 8 9 10
Composantes principales N°

Figure 66 : Pourcentage cumulé de la variance totale expliquée par les composantes principales des
constituants inorganiques de l’héroïne.

La représentation bidimensionnelle de la première et de la seconde composante principale


englobe le 53.9% de la variabilité des variables initiales. Les deux premières composantes principales
réduisent donc les observations représentées d’un espace à 10 dimensions à un espace à 2 dimensions
avec une perte d’information de 46.1%.
II) La cocaïne
L’exemple suivant illustre les résultats obtenus avec les constituants majeurs de la cocaïne.
Les différentes lignes illustrent les différentes étapes nécessaires au calcul de ces composantes
principales.
> bdata<-scale(PCABRUTCOCprinc, center=T)
> p.object<-prcomp(bdata)
> v<-p.object$sdev^2
> round(100*cumsum(v)/sum(v),1)
[1] 48.6 76.3 87.4 93.4 97.6 99.0 100.0
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 134

100
90
80
Pourcentage cumulé

70
60
50
40
30
20
10
0
0 1 2 3 4 5 6 7
Composante principale N°

Figure 67: Pourcentage cumulé de la variance totale expliquée par les composantes principales des
constituants majeurs de la cocaïne.

Dans le cas présent, la combinaison des deux premières composantes principales permettent
d’obtenir une représentation des données initiales dans un espace à deux dimensions (initialement sept
avec une perte d’information de 32.6% (les variances cumulées des deux premières composantes
principales est de 67.4).

8.3.7.3. Nombre de composantes à prendre en considération


Un des objectifs de l’analyse en composante principale consiste à réduire la dimension des
observations. Les composantes principales étant classées dans un ordre décroissant de variance, les
premières représentent donc le plus grand potentiel de modélisation des données initiales. Le nombre
de composantes sélectionnées doit être déterminé en examinant la proportion de variance totale
expliquée par le cumul des variances relatives à chaque composante principale. La proportion cumulée
de la variance totale indique à l’investigateur le degré d’adéquation entre le modèle initial et le
nouveau modèle généré par les composantes principales.

Différentes règles ont été édictées afin de décider du nombre de composantes à prendre en
considération, mais aucune d’entre elles ne fonctionne en toutes les circonstances. Un critère souvent
avancé consiste à sélectionner autant de composantes principales nécessaires pour expliquer le 80% de
la variance des données initiales. Néanmoins, ce critère nécessite souvent la sélection d’un nombre
important de composantes principales rendant ainsi caduque l’utilité première de l’analyse en
composante principale qui est de diminuer la dimension d’un problème spécifique.
Une autre manière de concevoir cette sélection consiste à écarter les composantes principales
expliquant une variance trop faible. Ainsi certains auteurs [Legendre P. et Legendre L., 1998]
proposent d’éliminer les composantes principales expliquant une variance de moins de 70/P ou P est le
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 135

nombre de variables utilisées pour caractériser un échantillon. Il est également possible d’utiliser le
seuil 100/P. Il existe également des variations des critères susmentionnés qui stipulent qu’il ne faut pas
prendre en compte les variations expliquant de petites proportions de la variance totale, les dernières
représentant simplement des variations aléatoires dans les données à disposition. En suivant ce concept
les composantes principales expliquant moins de 5% de la variance totale sont éliminées.

Le tableau suivant résume le nombre de composantes à prendre en compte suivant le modèle


choisis :

80% 100/P 75/P -5%


Constituants majeurs héroïne (6 dimensions) 3 2 3 4
Constituants mineurs héroïne (12 dimensions) 3 3 3 3
Constituants inorganiques héroïne (10 dimensions) 5 3 3 6
Constituants majeurs cocaïne (7 dimensions) 2 2 3 4
Tableau 16: Nombre de composantes à prendre en considération.

Les valeurs données dans le tableau ci-dessus montrent qu’il n’y a pas réellement de règles strictes
quant au choix du nombre de composantes principales à prendre en considération. Ce nombre dépend
de l’utilisation de ces dernières. Il ne faut pas oublier que l’analyse en composante principale est une
technique exploratoire et à ce titre le nombre de composantes principales sélectionné doit permettre
une analyse facilitée des données à disposition en mettant en évidence le comportement de ces
dernières (groupe de données, données aberrantes,…). Nous le verrons par la suite, nous choisirons de
retenir deux composantes pour effectuer notre premier tri.

8.3.7.4. Mesures des composantes principales pour chaque prélèvement


I) L’héroïne
Les constituants majeurs de l’héroïne ont été utilisés pour illustrer l’utilité de ces
combinaisons linéaires. Dans un premier temps le calcul des coefficients des différentes composantes
principales a été effectué. Le programme S-PLUS® offre la possibilité de calculer ces derniers :

> round(p.objet2$rotation,2)
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 0.34 0.13 -0.49 0.79 0.07 -0.01
[2,] 0.41 0.47 -0.10 -0.38 0.67 0.03
[3,] 0.27 0.15 0.86 0.39 0.07 0.01
[4,] 0.43 0.48 -0.05 -0.23 -0.73 -0.06
[5,] 0.49 -0.49 -0.02 -0.12 -0.06 0.71
[6,] 0.47 -0.52 0.01 -0.13 0.04 -0.70

Dans cet exemple, la première colonne contient les coefficients de la première composante
principale, la seconde colonne les coefficients de la seconde composante principale et ainsi de suite.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 136

Il est donc possible de construire l’équation de la première composante principale comme


suit :
Pi1 = 0.34xi1 + 0.41xi2 + 0.27xi3 + 0.43xi4 + 0.49xi6 + 0.47xi6

La deuxième s’écrit donc :

Pi1 = 0.13xi1 + 0.47xi2 + 0.15xi3 + 0.48xi4 - 0.49xi6 - 0.52xi6

et ainsi de suite.

En résumé, la première composante principale d’un prélèvement ayant les caractéristiques


suivantes :

Méconine : 2.4
Acétylcodéine : 4.5
Acétylthebaol : 1.2
6-Mono-acétylmorphine : 5.3
Noscapine : 3.4
Papavérine : 3.9

Est égale à :

Pi1 = 0.34*2.4 + 0.41*4.5 + 0.27*1.2 + 0.43*5.3+ 0.49*3.4 + 0.47*3.9

Dans le cas présent, les deux premières composantes principales (expliquant 68.4% de la
variance des données initiales) ont été prises en compte pour effectuer un premier tri au sein de la base
de données. Le fait de s’être restreint à deux composantes peut être justifié de diverses manières. En
choisissant 2 composantes, on respecte le seuil généralement fixé par les statisticiens (critère de 100/P
du tableau du nombre de composantes à prendre en compte). Comme il ne faut pas perdre de vue que
la première approche visée en utilisant l’analyse en composante principale consiste à trier la structure
des données à disposition (le premier tri est ainsi basé sur 68.4% de la variabilité). Cette systématique
permet d’éliminer les échantillons n’ayant aucune similarité avec un nouveau candidat. La
visualisation de cette structure est possible et aisée, car la représentation est en deux dimensions. Il
faut également remarquer que les différentes composantes principales ne sont pas corrélées (cf. théorie
sur l’orthogonalité entre les différentes composantes principales). Dans notre cas la première
composante principale n’est donc pas corrélée avec la deuxième, il n’existe donc pas de redondance
quant à l’information apportée par ces deux mesures. Afin d’illustrer cette étape, six saisies réputées
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 137

différentes (ayant des profils chimiques différents) ont été sélectionnées. L’analyse de clustering
hiérarchique menée sur ces 6 saisies montre leurs différences.

Figure 68: Exemple de la répartition de 6 saisies d’héroïne réputées comme non liées à l’aide de la
méthode de clustering à l’aide du programme Infometrix®.

On a ensuite représenté ces saisies dans un espace à deux dimensions construit à l’aide de la
première et de la deuxième composante principale.

Les groupes sont formés de la manière suivante : Groupe I 8 échantillons

Groupe II 4 échantillons

Groupe III 44 échantillons

Groupe IV 16 échantillons

Groupe V 3 échantillons

Groupe VI 4 échantillons
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 138

Représentation de 6 saisies d'héroïne par rapport à leur deux premières composantes


principales

30
I
25

20
PC2

15

II
10
IV
VI
5 III
V
0
0 5 10 15 20 25 30 35 40
PC1

Figure 69 : Exemple de la répartition de 6 saisies d’héroïne réputées comme non liées à l’aide des
deux premières composantes principales.

On remarque aisément à l’aide du graphique ci-dessus, que l’utilisation des deux premières
composantes principales calculées à l’aide des constituants majeurs de l’héroïne permet de séparer ces
différentes saisies. L’idée de tri associée à cette méthode consiste à replacer un nouvel échantillon
dans l’espace ainsi créé et, selon sa position, de sélectionner les échantillons se situant dans son
environnement proche. Cela donne une hypothèse d’association qui peut ensuite être analysée plus
finement si nécessaire.

8.3.8. Validation des résultats par la fonction cosinus


Une analyse à l’aide de la fonction cosinus permet d’observer que la classification effectuée à
l’aide du clustering et des composantes principales est identique. La figure ci-dessous illustre le
résultat obtenu en soumettant les 6 saisies au prototype de classification développé dans cette étude :
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 139

Figure 70 : Extrait du classement des 6 saisies à l’aide de la fonction cosinus.

Les 3 techniques de classification utilisées ont permis de grouper les différentes saisies d’une
manière similaire. L’analyse en composante principale, telle que nous l’avons définie, convient donc
parfaitement pour classifier les saisies d’héroïne en classes.
Fort de ces constatations, cette technique de classification non-supervisée a été implantée au
sein de la base de donnée renfermant les résultats des analyses d’héroïne. Une automatisation a été
programmée sur FileMaker Pro 5® permettant d’effectuer un premier tri, sélectionnant ainsi les
candidats possédant un profil proche de celui du nouveau candidat. La mise en place de cette
systématique a pour but de diminuer le nombre d’échantillons que l’on va comparer par la suite deux à
deux avec la fonction cosinus. Il est vrai, qu’avec le nombre croissant d’échantillons se trouvant
stockés dans la base de données, il est important de pouvoir effectuer cette première sélection afin
d’accélérer le processus de comparaison et d’interprétation. La base de données présente une
architecture incluant un calcul automatique des deux premières composantes principales ainsi que la
sélection découlant de ces deux valeurs. Une page de cette base se présente comme suit :
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 140

Bouton de recherche des candidats Valeurs de la première et seconde


répondants aux critères de sélection composante principale calculées
automatiquement

Classe
chimique

Valeurs normalisées pour


chaque variable présente dans
la base

Figure 71 : Exemple de l’architecture de la base de données héroïne avec les PC1 et PC2.

Le premier tri s’effectue par la sélection initiale des différents prélèvements de la saisie. Les
moyennes des PC1 et PC2 ainsi que leur écart type sont calculés. Enfin une recherche comprise entre
PC1moy ± 3*écart type et PC2moy ± 3*écart type (règle des 3 sigmas) permet d’effectuer le tri.

Il faut également tenir compte du fait qu’une saisie peut être composée d’échantillons qui ne
sont pas tous du même lot. Dans cette situation, il est nécessaire de séparer les différents lots et
d’effectuer une recherche pour chaque lot permettant ainsi parfois de lier des cas apparemment non
liés.

II) La Cocaïne

Les coefficients des différentes composantes principales sont calculés de la même manière que
pour l’héroïne. Le programme S-PLUS® offre la possibilité de calculer ces derniers :
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 141

> round(p.object$rotation,2)
[,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,] -0.50 -0.09 -0.16 0.18 -0.53 0.07 0.64
[2,] -0.51 -0.08 -0.12 0.09 -0.36 -0.01 -0.76
[3,] -0.46 -0.08 -0.14 0.49 0.72 -0.04 0.06
[4,] -0.27 0.15 0.95 0.04 -0.01 -0.06 0.03
[5,] -0.41 -0.25 -0.04 -0.83 0.26 -0.01 0.09
[6,] -0.14 0.67 -0.10 -0.12 0.08 0.71 -0.02
[7,] -0.13 0.67 -0.18 -0.11 -0.01 -0.70 0.05

Dans cet exemple, la première colonne contient les coefficients de la première composante
principale, la seconde colonne les coefficients de la seconde composante principale et ainsi de suite.

Il est donc possible de construire l’équation de la première composante principale comme


suit :

Pi1 = - 0.50xi1 -0.51xi2 -0.46xi3 -0.27xi4 + -0.41xi5 - 0.14x6 + - 0.13x7


et ainsi de suite.

Dans le cas présent pour les analyses effectuées avec les constituants majeurs de la cocaïne, on
a choisi de prendre en compte les deux premières composantes principales (expliquant 76.3% de la
variance des données initiales) pour effectuer un premier tri au sein de la base de données. Pour
illustrer le potentiel de classification de ce système 6 saisies de cocaïne présentant des profils
chimiques ont été sélectionnées.

Ces saisies sont formées de la manière suivante : Groupe I 3 échantillons

Groupe II 5 échantillons
Groupe III 8 échantillons
Groupe IV 10 échantillons
Groupe V 5 échantillons

Groupe VI 5 échantillons
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 142

Une analyse de clustering hiérarchique menée sur ces 6 saisies montre le caractère différent
(profil chimique) des 6 saisies prises en considération.

1.0 0.8 0.6 0.4 0.2 0.0


g00197.1a

g00197.1b

g00197.3b

g00197.3c

g00196.4b

g99252.6b

g99252.6c

562575-1-1

638138.2-1A

638138.1-1A

638138.1-1B

g99222.10b

g99222.13b

g99222.14b

g99222.11b

g99222.10c

g99222.13a

g99222.12c

g99222.13c

g99222.14a

g99222.14c

671171.1-2

671171.1-1

671171.1-3
G
562575-1-1 C

N
562575-1-1

562575-1-1

Figure 72: Exemple de la répartition de 6 saisies de cocaïne réputées comme non liées à l’aide de la
méthode de clustering à l’aide du programme Infometrix®.

Ensuite, ces dernières ont été représentées selon leurs deux premières composantes
principales. Les résultats ont été observés :
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 143

Représentation de 6 saisies de cocaïne par rapport à leur deux


premières composantes principales

1
Groupe III Groupe V
0.5
Groupe II
Groupe I Groupe IV 0

-0.5
PC1

-1

-1.5

-2 Groupe VI
-2.5

-3
-0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8
PC2

Figure 73: Exemple de la répartition de 6 saisies de cocaïne réputées comme non liées à l’aide des
deux premières composantes principales.
La Figure 73 met en évidence que les différentes saisies réputées non liées forment des
groupes séparés en représentant leurs deux premières composantes principales.

On a également effectué une analyse à l’aide de la fonction cosinus. Les résultats obtenus
confirment les classifications obtenues ci-dessus.
Les 3 techniques de classification utilisées ont permis de grouper les différentes saisies d’une
manière similaire. L’analyse en composante principale, telle que nous l’avons définie, convient donc
parfaitement pour classifier des échantillons de cocaïne.

Ce constat conforte notre analyse et les résultats comparables aux performances observées sur
l’héroïne, permettent une application aux saisies de cocaïne répertoriées dans la base FileMaker Pro®.

8.3.9. Interprétation des composantes principales des constituants majeurs de


l’héroïne et de la cocaïne
I) L’héroïne
La sélection du nombre de composantes principales décidée, la corrélation existant entre les
coefficients permettant de construire les composantes principales et les variables initiales peuvent être
mesurées. Normalement un coefficient élevé d’une composante principale pour une variable donnée
est un indicateur d’une forte corrélation entre cette variable et la composante principale.

Il s’agit dans ce cas de transformer les coefficients des composantes principales en corrélation.
Les variables initiales ont été standardisées avant d’effectuer le calcul de la composante principale. Il
en résulte une situation où la variance totale est simplement le nombre de variables (P) et la proportion
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 144

de la variance expliquée par chaque composante principale est sa variance divisée par P. La corrélation
entre la ième composante principale Ci et la jème variable xj est :

1
rij = aij (VarCi ) 2
(Équation 33)

PC1 PC2 PC3 PC4 PC5 PC6


MECONINE 0.573 0.138 -0.462 0.661 0.04 -0.003
ACETYLCODEINE 0.702 0.519 -0.091 -0.316 0.36 0.006
THEBAOL 0.463 0.164 0.805 0.331 0.039 0.002
MAM 0.733 0.522 -0.049 -0.189 -0.39 -0.012
PAPAVERINE 0.826 -0.537 -0.016 -0.103 -0.03 0.134
NOSCAPINE 0.802 -0.572 0.006 -0.108 0.02 -0.131

Variance de la composante 2.9 1.2 0.87 0.71 0.29 0.04


principale (Ci)
0.8/(Ci) puissance ½ (cf. 0.469 0.730 0.857 0.943 1.481 4
équation 34)

Tableau 17 : Analyse des composantes principales des constituants majeurs pour l’héroïne.

Dans le Tableau 17 la corrélation existant entre les variables initiales et les composantes
principales est recherchée. En utilisant l’équation 33 et en fixant l’indice de corrélation à 0.8 il est
possible de fixer un seuil (voir dernière ligne du tableau) permettant d’estimer la corrélation existante
entre les variables initiales et les composantes principales. Dans le cas qui nous occupe les valeurs qui
montrent une corrélation supérieure à 0.7 sont mises en exergue. On remarque que 4 variables initiales
sur 6 sont fortement corrélées avec la première composante principale. Ces corrélations sont positives.
La première composante principale peut être vue comme une représentation pondérée ou un résumé
des variables initiales.

II) La cocaïne
La mesure de la corrélation existante entre les coefficients utilisés pour construire les
composantes principales et les variables initiales est identique à celle obtenue pour l’héroïne. Le
tableau ci-dessous résume ces calculs.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 145

PC1 PC2 PC3 PC4 PC5 PC6 PC7


Ecgonine méthyl ester -0.933 -0.130 -0.095 0.112 -0.267 0.052 0.128
Ecgonine -0.956 -0.095 -0.045 0.115 -0.194 -0.023 -0.154
Tropacocaïne -0.849 -0.066 -0.394 -0.301 0.171 0.011 -0.002
Benzoylecgonine -0.892 0.018 0.078 0.303 0.319 -0.062 0.026
Norcocaïne -0.795 -0.277 0.470 -0.265 0.019 0.017 0.006
Cis-cinnamoylecgonine méthyl ester -0.256 0.945 0.058 0.029 0.055 0.182 -0.023
Trans-cinnamoylecgonine méthyl ester -0.245 0.945 0.033 -0.107 -0.100 -0.170 0.026

Variance de la composante principale (Ci) 4.058 1.893 0.398 0.291 0.253 0.070 0.042
0.8/(Ci) puissance ½ (cf. équation 34) 0.397 0.581 1.269 1.484 1.590 3.034 3.903

Tableau 18: Analyse des composantes principales des constituants majeurs de la cocaïne.

Dans le tableau ci-dessus la corrélation existant entre les variables initiales et les composantes
principales est recherchée. En utilisant l’équation 33 et en fixant l’indice de corrélation à 0.8 il est
possible de fixer un seuil (voir dernière ligne du tableau) permettant d’estimer la corrélation existant
entre les variables initiales et les composantes principales. Dans le cas qui nous occupe les valeurs qui
montrent une corrélation supérieure ou égale à 0.8 sont mises en évidence. 5 variables initiales sur 7
sont fortement corrélées avec la première composante principale. La première composante principale
peut être vue comme une représentation pondérée ou un résumé des cinq premiers constituants. La
seconde composante principale quant à elle représente un résumé de la proportion de Cis-
cinnamoylecgonine méthyl ester et de la Trans-cinnamoylecgonine méthyl ester.

8.3.10. Evolution des coefficients des composantes principales dans le temps


I) L’héroïne
Il est également important de se rendre compte de l’évolution des coefficients des
composantes principales lors de l’évolution de la base de données. En d’autres termes, il s’agit
d’estimer cette variation au fil du temps afin d’apprécier si l’augmentation des données influence la
stabilité du système. Le calcul de ces coefficients a été effectué après chaque 50 nouvelles saisies afin
de pouvoir estimer cette variation. Les résultats suivants ont pu être mis en évidence:
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 146

Coefficients des composantes principales pour 50 échantillons

[,1] [,2] [,3] [,4] [,5] [,6]


[1,] 0.47 0.02 0.09 -0.83 0.26 0.07
[2,] 0.39 -0.47 0.38 0.03 -0.69 -0.04
[3,] 0.16 -0.51 -0.85 -0.02 -0.03 0.01
[4,] 0.44 -0.34 0.25 0.47 0.64 -0.03
[5,] 0.45 0.44 -0.17 0.25 -0.16 0.69
[6,] 0.45 0.46 -0.20 0.14 -0.12 -0.72

Coefficients des composantes principales pour 100 échantillons

[,1] [,2] [,3] [,4] [,5] [,6]


[1,] 0.46 0.07 -0.22 0.85 0.08 -0.03
[2,] 0.42 0.44 -0.16 -0.36 0.69 -0.01
[3,] 0.24 0.26 0.93 0.10 -0.03 -0.02
[4,] 0.42 0.44 -0.22 -0.25 -0.72 0.07
[5,] 0.44 -0.51 0.04 -0.21 -0.06 -0.70
[6,] 0.43 -0.53 0.07 -0.15 0.02 0.71

Coefficients des composantes principales pour 150 échantillons

[,1] [,2] [,3] [,4] [,5] [,6]


[1,] 0.46 0.10 -0.12 0.83 0.28 0.01
[2,] 0.40 0.45 -0.25 -0.50 0.56 0.02
[3,] 0.24 0.19 0.95 -0.04 0.06 0.01
[4,] 0.42 0.45 -0.15 -0.05 -0.77 -0.08
[5,] 0.45 -0.50 -0.02 -0.17 -0.11 0.71
[6,] 0.44 -0.54 -0.01 -0.17 0.00 -0.70

Coefficients des composantes principales pour 200 échantillons

[,1] [,2] [,3] [,4] [,5] [,6]


[1,] 0.34 0.16 -0.49 0.79 0.09 -0.01
[2,] 0.41 0.46 -0.09 -0.40 0.66 0.03
[3,] 0.27 0.15 0.87 0.38 0.08 0.01
[4,] 0.44 0.46 -0.05 -0.22 -0.73 -0.07
[5,] 0.48 -0.49 -0.02 -0.10 -0.06 0.71
[6,] 0.47 -0.53 0.00 -0.11 0.05 -0.70

Coefficients des composantes principales pour toute la base

[,1] [,2] [,3] [,4] [,5] [,6]


[1,] 0.34 0.13 -0.49 0.79 0.07 -0.01
[2,] 0.41 0.47 -0.10 -0.38 0.67 0.03
[3,] 0.27 0.15 0.86 0.39 0.07 0.01
[4,] 0.43 0.48 -0.05 -0.23 -0.73 -0.06
[5,] 0.49 -0.49 -0.02 -0.12 -0.06 0.71
[6,] 0.47 -0.52 0.01 -0.13 0.04 -0.70
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 147

Les représentations graphiques ci-dessous illustrent cette variation.

Evolution des coefficients de la première


composante principale dans le temps (héroïne)

0.5

0.45
Coefficient d'ACP pour chaque variable

0.4

0.35
1er variable
2ème variable
3ème variable
0.3 4ème variable
5ème variable
6ème variable

0.25

0.2

0.15
50 100 150 200 Base entière

Nombre d'analyses

Evolution des coefficients de la deuxième


composante principale dans le temps (héroïne)

0.6

0.4
Coefficient d'ACP pour chaque variable

0.2

0
2ème variable
3ème variable
4ème variable
5ème variable
-0.2 6ème variable
1er variable

-0.4

-0.6
50 100 150 200 Base entière

Nombre d'analyses

Figure 74: Evolution des coefficients de la première et de la deuxième composante principale dans le
temps (héroïne).
On remarque que les coefficients se stabilisent lorsqu’ils sont calculés avec un nombre de
saisies suffisantes (environ 100). Il semble donc qu’il ne soit pas nécessaire de modifier ces
coefficients dès qu’ils sont calculés avec un nombre statistiquement important d’échantillons.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 148

II) La cocaïne

L’estimation de la variabilité des coefficients pour la cocaïne a été estimée en les calculant
tous les 25 nouvelles saisies. Les résultats suivants ont pu être mis en évidences :

Evolution des coefficients de la première


composante principale dans le temps (cocaine)

0.2
1er variable
2ème variable
0.1 3ème variable
4ème variable
Coefficient d'ACP pour chaque variable

5ème variable
0 6ème variable
7ème variable

-0.1

-0.2

-0.3

-0.4

-0.5

-0.6
25 50 75 100 Base entière

Nombre d'analyses

Evolution des coefficients de la deuxième


composante principale dans le temps (cocaine)

0.8

0.6
1er variable
Coefficient d'ACP pour chaque variable

2ème variable
3ème variable
0.4 4ème variable
5ème variable
6ème variable
7ème variable
0.2

-0.2

-0.4
25 50 75 100 Base entière
Nombre d'analyses

Figure 75: Evolution des coefficients de la première et deuxième composante principale dans le
temps (cocaïne).
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 149

On remarque comme pour l’héroïne que les coefficients se stabilisent lorsqu’ils sont calculés
avec un nombre de saisies suffisantes (environ 75). Il semble donc qu’il ne soit pas nécessaire de
modifier ces coefficients dès qu’ils sont calculés avec un nombre statistiquement important
d’échantillons.

8.4. Mise en place des classes


Une fois les liens validés chaque échantillon lié se voit attribuer une classe qui regroupe tous
les échantillons chimiquement similaires. Ensuite, une définition des modèles mathématiques pour
chaque classe permet de déterminer rapidement si un nouveau candidat est proche ou non d’une classe
existante. La moyenne des valeurs de chaque constituant a ainsi été calculée pour chaque classe. Puis
les deux premières composantes principales pour chaque classe ont été déterminées. Le graphique
suivant présente ces résultats.

40
cl17

cl6 cl16
30 cl4

cl3
cl15
PC1

20 cl20 cl2
cl9 cl18
cl19 cl10

cl14
cl12
10 cl11

0
-10 0 10 20 30

PC2
Figure 76: Représentation des différentes classes mise en évidence pour les saisies d’héroïne.

Dans la plupart des cas les classes sont bien définies sauf pour deux couples (classes 12 et 14
ainsi que 18 et 20) où les valeurs de leurs deux premières composantes principales se recoupent. Dans
ces cas le calcul de la troisième composante principale permet de les séparer. Ainsi dans notre
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 150

processus de comparaison d’échantillons, un moyen rapide permet de déterminer la proximité d’un


nouvel échantillon par rapport à la classe la plus proche.
Le tableau suivant montre les valeurs des cosinus carrés des comparaisons 2 à 2 des
différentes classes dans le but de valider ce qui a été présenté ci-dessus. En effet, si les différentes
classes sont bien délimitées les unes par rapport aux autres, leurs valeurs de corrélation doivent
également être différentes. On remarque également que les classes 12, 14 et 18, 20 qui présentaient des
valeurs proches lors du calcul de leurs deux composantes principales respectives sont différenciées par
la fonction cosinus (rappel : qui prend en compte pour rappel la variance totale des données de
départs).

cl.11 cl.12 cl.14 cl.15 cl.16 cl.17 cl.18 cl.19 c.l2 cl.20 cl.3 cl.4 cl.6 cl.9
cl.11 100.00
cl.12 92.79 100.00
cl.14 62.31 59.10 100.00
cl.15 53.84 64.06 38.09 100.00
cl.16 53.47 78.14 41.05 70.05 100.00
cl.17 39.21 52.25 29.08 97.55 68.95 100.00
cl.18 64.32 78.37 44.21 96.53 83.98 92.32 100.00
cl.19 51.37 53.59 34.93 95.23 49.82 90.76 86.15 100.00
cl.2 75.36 92.64 50.52 79.65 93.80 72.93 92.26 64.36 100.00
cl.20 71.39 81.10 49.67 96.24 78.06 89.38 98.83 89.23 90.66 100.00
cl.3 66.14 85.97 43.52 83.66 95.74 79.66 94.62 67.28 98.72 91.33 100.00
cl.4 57.28 75.75 40.38 92.99 90.48 91.41 98.48 78.67 93.29 94.88 96.97 100.00
cl.6 52.83 75.65 36.67 82.57 97.05 82.15 92.47 63.80 94.10 86.74 97.74 97.20 100.00
cl.9 65.81 72.56 46.23 97.93 68.87 91.81 96.25 95.35 82.78 98.31 84.37 90.89 79.52 100.00

Tableau 19: Tableau des valeurs de corrélation obtenues pour les différentes classes d’échantillon
d’héroïne mises en évidence.

Ce tableau montre que les différentes classes dont les valeurs de corrélation ont été calculées à
partir des valeurs moyennes de chaque constituant majeur pris en considération se différencient les
unes des autres au niveau du seuil que l’on s’était fixé (99.5) même si les classes 18, 20 sont assez
proches.

Cette manière de procéder permet d’esquisser une approche de type supervisée puisque chaque
classe chimique est en quelque sorte modélisée par un échantillon représentatif de cette dernière. La
démarche est la suivante, lorsqu’un nouveau candidat doit être analysé, il est d’abord comparé à
l’ensemble des classes mises en évidence. Cela permet un gain de temps puisqu’on ne compare plus
les échantillons de la saisie à tous les échantillons de la base (+ de 5000 échantillons à ce jour). Une
proximité d’appartenance à une classe (cf. exemple suivant) est exprimée en pourcentage. Enfin les
échantillons de la nouvelle saisie sont comparés avec les échantillons des saisies appartenant au sous-
groupe le plus proche, déterminant une proximité qui permet d’évaluer un lien entre cette nouvelle
saisie et celles provenant de cas précédents.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 151

Exemple :
Une nouvelle saisie v01265 est constituée de 8 échantillons, 3 répliquats par échantillons
portent à 24 le nombre total d’analyses. Les 24 objets sont comparés avec les différents
sous-ensembles en utilisant la méthode du cosinus carré. Les valeurs moyennes du
cosinus carré sont calculées pour chaque comparaison avec un sous-ensemble. Les
résultats sont les suivants :

v01265
cl.9 99.90
cl.20 98.63
cl.15 98.11
cl.18 96.56
cl.19 95.24
cl.17 91.78
cl.4 91.12
cl.3 84.55
cl.2 83.12
cl.6 79.99
cl.12 73.03
cl.16 69.18
cl.11 66.27
cl.14 46.78

Tableau 20: % d’appartenance de la saisie v01265 aux différents sous-ensembles.

La saisie appartient visiblement à la classe 9.


Cette nouvelle saisie comparée ensuite à celles appartenant à la classe 9 permet d’affiner
les valeurs de corrélation et l’association selon le tableau ci-dessous :

v01265
v01264 99.96
t00206 99.75
n01205 99.71
t00207 99.67
g01063 99.57
g00210.1a 99.31
g00339 99.30
G99207.20a 99.25
n01290.1a 99.23
Tableau 21: Valeurs de cosinus carré entre la nouvelle saisie v01265et les saisies appartenant à la
classe 9,
La saisie v01265 appartient donc bien à la classe 9. La démarche de comparaison est
grandement simplifiée puisque la sélection des échantillons proches du nouveau candidat
est très sélective.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 152

Néanmoins, la modélisation des différentes classes n’est pas optimale dans le prototype
présenté ci-dessus puisque cette dernière est représentée par une seule valeur. L’utilisation de
techniques dites supervisées est censée palier à ce problème.

8.5. SIMCA (Soft Independant Modeling of Class Analogies)


8.5.1. Introduction
SIMCA utilise l’analyse en composantes principales pour modéliser chaque classe chimique.
Sa manière de fonctionner peut être schématisée en imaginant que pour chaque classe chimique
correspond une boîte multidimensionnelle et que l’appartenance d’un nouvel échantillon à une classe
préexistante est réalisée en déterminant à l’intérieur de quelle boîte, s’il y en a une, l’échantillon peut
être englobé. Afin de construire ces boîtes multidimensionnelles, on a besoin de groupes
d’entraînement constitués d’échantillons dont on connaît l’appartenance à une classe chimique
déterminée. Chaque classe chimique a son propre groupe d’entraînement et une analyse en
composantes principales est effectuée pour chacune d’entres-elles. Le nombre de composantes
principales à prendre en considération est déterminé pour chaque classe et les modèles SIMCA
définissent les limites des classes pour chaque modèle d’ACP.

La figure ci-dessous empruntée d’un exemple présenté dans Beebe [Beebe et al., 1998]
explique d’une manière assez claire le fonctionnement du SIMCA. Dans cet exemple la classe A est
représentée par une boîte tridimensionnelle, la classe B est représentée sur un plan alors que la classe
C sur une ligne. Ce concept peut être élargi à des dimensions plus grandes ou des « hyper cubes » sont
dessinés autour des données.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 153

A
Y
A
A
A
A
A A
A
C
A
C
B
B
X
B
C B
B B

Figure 77 : Exemple tridimensionnel de la fonction SIMCA. A, B et C représentent des échantillons


provenant de deux différentes classes et les échantillons X et Y sont inconnus.
Afin de déterminer à quelle classe un inconnu peut appartenir, il est nécessaire de déterminer
quelle région de l’espace il occupe. Cette action est effectuée en projetant le vecteur du nouvel
échantillon dans chaque modèle SIMCA. Cette opération peut être visualisée dans la Figure 77 ou
l’inconnu X serait classifié dans la classe C alors que l’inconnu Y dans aucune. Dans l’absolu il est
possible qu’un échantillon appartienne à plus d’une classe. Dans ce cas de figure les enveloppes des
différentes classes créées par SIMCA se recoupent. Le modèle n’a donc pas un pouvoir discriminant
suffisant pour distinguer ces dernières.

Les limites des classes dans SIMCA sont fixées par les nouveaux systèmes d’axes calculés par
l’analyse en composantes principales. L’ACP définit l’orientation des boîtes en mesurant l’espace et
ses « limites » (voir ci-dessous) fixant les bords de la boîte. Pour calculer l’appartenance d’un inconnu
à une classe, SIMCA utilise une combinaison de la distance de cet inconnu au modèle ACP ainsi que
de sa distance aux « limites ». Ceci est illustré par la figure suivante pour la détermination de Y à la
classe C.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 154

a
c

C C
C C C
C C b

YACP
Modèle SIMCA
Limites de la classe « C »

Figure 78 : Prédiction de l’appartenance de l’inconnu Y dans un classe chimique à une dimension. La


distance C correspond à la valeur de ACP résiduelle, la distance B est la distance de limite
de la classe jusqu’à la projection sur la composante principale (point YACP).
La valeur permettant de déterminer la proximité de Y à la classe C est fonction de a2 (ou a2 =
b2 + c2). a2 est converti en une variance et divisé par la variance observée pour les échantillons de la
classe C pour former une valeur F (F de Fischer ) appelée Fcal. Une valeur critique (Fcrit) est choisie
de manière empirique ou d’une table F et est comparée à Fcal . L’échantillon inconnu peut être classé
dans la classe C si la valeur de Fcal est inférieure à la valeur critique Fcrit.

8.5.2. Mise oeuvre de la technique


Les différences phases de construction d’un modèle SIMCA peuvent être résumées de la
manière suivante :

• Centrage et standardisation des aires de chaque composant.

• Calculer les composantes principales pour chaque échantillon de chaque classe


chimique.

• Contrôler à l’aide de techniques non supervisées (HCA ou ACP) pour tous les
échantillons que les différentes classes ne sont pas confondues.

• Diviser chaque classe chimique en groupes d’entraînement et en groupes tests.

• Utiliser les groupes d’entraînement pour générer les modèles SIMCA pour chaque
classe en notant les différents critères choisis (limites des boîtes multidimensionnelles,
nombre de composantes principales prises en compte,…).

• A l’aide des modèles définis plus haut prédire la classe des groupes tests.

• Evaluer les résultats.

• Si les résultats sont concluants, on valide le modèle, sinon on évalue les différents
critères ainsi que les groupes d’entraînement et de tests.

En reprenant les 6 saisies utilisées comme exemple dans les parties relatives à l’analyse en
composante principale et la fonction cosinus il est possible de montrer, en appliquant un modèle
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 155

SIMCA, que la différenciation entre saisies s’effectue de manière optimale. A noter dans la figure
suivante que les points noirs situés à proximité des différentes saisies, définissent l’espace (enveloppe)
occupé par les différentes classes. Ainsi un nouveau candidat est attribué à une classe existante si sa
localisation spatiale dans le modèle sélectionné est englobée dans l’enveloppe d’une des classes.

BE00021.D
BE00021.C
BE00021.B

PC3

BE00022.B
BE00022.A
BE00023.B
BE00024.C
BE00023.A
BE00022.C
BE00024.A
BE00022.D
BE00024.B
BE00025.A
BE00023.D
BE00025.C
BE00023.C
BE00025.D
BE00024.D
BE00025.B 96AGR31.B
96AGR31.D
96AGR31.C
96AGR31.A

PC1
96NED11.D
96NED11.C
96NED11.B
96NED11.A

196FR21.C
196FR22.D
196FR22.C
196FR21.B
196FR21.D
196FR22.B
196FR21.A
196FR22.A

t00161.1Ea
t00161.2Dc
t00161.1Bb
t00161.1Fb
t00161.1Fc
t00161.1Ca
t00161.1Fa
t00161.1Ac
t00161.1Dc
t00161.1Cc
t00161.2Cb
t00161.1Eb
t00161.2Ac PC2
t00161.1Cb
t00161.2Ea
t00161.1Bc
t00161.2Ab
t00161.2Ba
t00161.2Ec
t00161.1Ec
t00161.1Db
t00161.1Gct00161.1Da
t00161.2Eb
t00161.1Ga
t00161.2Db
t00161.1Ba
t00161.2Gb
t00161.1Gb
t00161.2Fa
t00161.2Fb
t00161.2Bc
t00161.2Fc
t00161.2Da
t00161.2Cc
t00161.2Bb
t00161.2Aa
t00161.2Gc
t00161.2Ga
t00161.2Ca
t00161.1Aa

t00161.1Ab

Figure 79 : Représentation dans un espace en trois dimensions de 6 saisies ayant des profils
différents. On remarque qu’il n’y a pas de recouvrement entre saisies.

8.5.3. Généralisation à toute la base de données


La démarche suivante consiste à appliquer SIMCA à la totalité des classes répertoriées
préalablement dans l’ensemble de la base de données. Comme mentionné auparavant dans ce chapitre,
14 classes ont été mises en évidence regroupant plus de 750 échantillons. La méthodologie suivie est
celle proposée au préalable pour laquelle l’analyse en composante principale ainsi que l’analyse de
groupe hiérarchique ont été effectuées pour les différentes classes afin d’estimer la dispersion de ces
dernières et d’identifier les éventuels « outliers ». A nouveau, l’exemple présenté est relatif à
l’héroïne, cependant une démarche similaire est également actuellement en place à l’IPS.
Ensuite les échantillons ont été séparés en deux groupes. Le premier regroupe les échantillons
utilisés pour entraîner le modèle SIMCA, le second regroupe les échantillons « tests » utilisés pour
valider le modèle. Dans notre cas de figure, nous avons divisé les échantillons pour 2/3 échantillons
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 156

d’entraînement et 1/3 échantillons tests. Par souci de facilitation de lecture des modèles, nous avons
séparé les classes en deux groupes et effectué un modèle pour chacun.
Le premier modèle regroupant les classes 11, 12, 14, 15, 16, 17, 18, 19 et le second les classes
2, 3, 4, 6, 9, 20. Les deux tableaux suivants résument le processus d’apprentissage nécessaire à
l’établissement des modèles :
Pred10 Pred11 Pred12 Pred14 Pred15 Pred16 Pred17 Pred18 Pred19
@2 @3 @3 @3 @2 @2 @2 @3 @2
Classe 10 15 0 0 0 0 0 0 0 0
Classe 11 0 18 0 0 0 0 0 0 0
Classe 12 0 1 32 0 0 0 0 0 0
Classe 14 0 0 0 12 0 0 0 0 0
Classe 15 0 0 0 0 20 0 0 0 0
Classe 16 0 0 0 0 0 65 0 0 0
Classe 17 0 0 0 0 0 0 66 6 0
Classe 18 0 0 0 0 0 0 0 6 0
Classe 19 0 0 0 0 0 0 0 0 61

Tableau 22: Tableau représentant le résultat de la classification des différents échantillons à leur
classe chimique respective selon le modèle SIMCA numéro 1. A noter que la classification
s’est effectuée correctement pour environ 98% des échantillons.

Pred2@3 Pred3@3 Pred4@3 Pred6@3 Pred9@3 Pred20@3


Classe2 12 0 0 0 0 0
Classe3 0 12 0 0 0 0
Classe4 0 0 79 0 11 0
Classe6 0 0 0 10 0 0
Classe9 0 0 0 0 146 0
Classe20 0 0 0 0 0 24

Tableau 23 : Tableau représentant le résultat de la classification des différents échantillons à leur


classe chimique respective selon le modèle SIMCA numéro 2. A noter que la classification
s’est effectuée correctement pour environ 96% des échantillons.

Le taux de classification correcte des différents échantillons selon leur appartenance respective
aux différentes classes chimiques avoisine les 97%. Ce résultat montre le potentiel de SIMCA à
modéliser ces dernières. Il est également intéressant de noter que le chiffre suivant le symbole @ à la
première colonne des deux tableaux indique le nombre de composantes principales prises en compte
pour modéliser les différentes classes. Ainsi la classe 10 est modélisée avec 2 composantes principales
et la classe 6 avec 3.

Les distances entre les différentes classes ont également été calculées afin d’estimer celles
présentant des risques de fausses classifications (faux positifs) vu la proximité respective de leurs
enveloppes. Les classes 18 et 17 ainsi que 9 et 4 semblent être proches les unes des autres vu que lors
du processus d’entraînement des fausses classifications sont apparues. Ces résultats indiquent que les
enveloppes de ces classes se recoupent. Les distances entre les différentes classes sont résumées dans
les deux tableaux ci-dessous :
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 157

Classe Classe Classe Classe Classe Classe Classe Classe Classe


10 11 12 14 15 16 17 18 19
Classe 10 0.0
Classe 11 24.4 0.0
Classe 12 18.9 1.7 0.0
Classe 14 101.1 55.6 40.6 0.0
Classe 15 12.9 33.1 28.8 44.3 0.0
Classe 16 22.6 20.7 22.1 36.9 6.9 0.0
Classe 17 16.1 61.6 54.8 69.7 7.6 7.0 0.0
Classe 18 18.9 32.7 25.9 69.4 2.0 7.6 3.7 0.0
Classe 19 15.4 37.2 32.3 56.5 2.7 23.2 6.1 5.6 0.0

Tableau 24 : Récapitulatif des distances entre les classes sélectionnées pour le modèle n°1.

Classe2 Classe3 Classe4 Classe6 Classe9 Classe20


Classe2 0
Classe3 22.1 0
Classe4 7.3 9.3 0
Classe6 14.6 19.8 7.7 0
Classe9 6.9 7.2 2.2 7.5 0
Classe20 10.3 6.3 9.1 19.1 4.4 0

Tableau 25: Récapitulatif des distances entre les classes sélectionnées pour le modèle n°2.

Le modèle 1 renferme des classes chimique proches comme la classe 11 et la 12, ainsi que la
15, la 18 et la 19. Quant aux problèmes de classification rencontrés entre les classes 18 et 17 ainsi que
9 et 4, elles peuvent trouver une explication dans le fait que leur distance respective est faible (3.7 et
2.2). Néanmoins, il est intéressant que cette problématique ne soit pas rencontrée pour toutes les
classes chimiques dont les distances respectives sont faibles. Afin de trouver une explication à ce
phénomène, il s’agit de prendre en considération une variable importante, à savoir la dispersion de ces
classes dans l’espace (volume occupé par l’enveloppe). En effet, en comparant deux classes chimiques
positionnées à la même distance d’une troisième, il semble raisonnable d’admettre que celle occupant
le plus grand volume dans l’espace ait plus de chance de chevaucher cette dernière.

8.5.4. Pouvoir discriminant des différentes variables utilisées pour créer le modèle
Le pouvoir de modélisation des différentes variables a été mesuré afin de déterminer celles
ayant peu ou pas d’influence quant à la modélisation de l’information contenue dans les différentes
classes chimiques du groupe d’entraînement. Les résultats synthétisés dans la figure suivante montrent
que pour les deux modèles la noscapine, la papavérine, la monoacétylmorphine ainsi que
l’acétylcodéine sont les variables ayant le plus grand pouvoir discriminant dans les modèles de
classification de l’héroïne mis en évidence.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 158

Pouvoir de modélisation pour le modèle 1


1

0.95

Pouvoir de modélisation

0.9

0.85

0.8

0.75
Meconin COD Thebaol MAM Pap Nosc

Variable

Pouvoir de modélisation pour le modèle 2


1

0.95
Pouvoir de modélisation

0.9

0.85

0.8

0.75
Meconin COD Thebaol MAM Pap Nosc

Variable

Figure 80: Pouvoir de modélisation pour les 6 variables et pour les deux modèles utilisés. A noter
que les variables apportant le plus d’informations sont la l’aétylcodéine (COD) la
papavérine (Pap) la noscapine (Nosc) et la 6-monoacétylmorphine (MAM).
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 159

8.5.5. Evaluation des modèles quant à leurs potentiels de classification


La phase suivante a permis d’évaluer les différents modèles en utilisant les échantillons
« tests ». Ces derniers sont alors classifiés en utilisant les modèles développés et comme on connaît les
résultats qui doivent être fournis, il est possible d’estimer le pourcentage de faux positifs. Il est
également important d’estimer le pourcentage de faux négatifs du modèle. Cette estimation a été
effectuée en choisissant 300 échantillons n’appartenant à aucune des classes chimiques mises en
évidence. Ces derniers ont alors été introduits dans les modèles et le nombre de fois qu’ils ont été
faussement attribués à une de ces classes chimiques a fourni le nombre de faux positifs. Les résultats
suivants ont pu être mis en évidence :

Entraînement Entraînement Test correct (vrai Test incorrect Faux positif (%)
correct (%) incorrect (%) positif %) (faux négatif %) (test sur 300
601 échantillons 601 échantillons 163 échantillons 163 échantillons échantillons)
Modèle 1 97.7 2.3
Modèle 2 96.3 3.7
Ensemble
97.0 3.0 92.0 8.0 2.0
des modèles
Tableau 26 : Récapitulation des résultats obtenus avec le modèle SIMCA.

Le Tableau 26 montre que le modèle SIMCA mis en place donne de très bons résultats. Tant la
phase d’entraînement que la phase de test ont permis de valider cette méthode. De plus, avec un taux
de faux positif de 2%, on limite le nombre d’informations erronées que l’on va transmettre aux
organes d’enquête.

8.6. Technique neuronales


8.6.1. Introduction
Une seconde technique d’analyse statistique supervisée a été testée, à savoir celles des réseaux
de neurones à l’aide du programme Trajan Neural Network Simulator 6®. Deux architectures de
réseaux de neurones ont été évaluées, les réseaux de neurones non bouclés à couches, dont les
neurones cachés ont une fonction d’activation sigmoïde (appelés perceptron multicouche et abrégé
MLP) et les réseaux de fonctions radiales de base (RBF) [Dreyfus et al, 2002]. Un réseau de neurones
comme illustré dans la Figure 81 est représenté par un ensemble de neurones connectés entre eux,
l’information circulant des entrées vers les sorties sans retour en arrière. Les neurones qui effectuent le
dernier calcul de la composition de fonctions sont les neurones de sorties ; ceux qui effectuent les
calculs intermédiaires sont les neurones cachés.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 160

Neurones Neurones
cachées de sorties

x1 y1
1 1

Sorties
Entrées

x2 y2
2 2

x3 y3


Figure 81 : Architecture d’un MLP.

Brièvement les réseaux testés dans le cadre de ce travail fonctionnent de la manière suivante :
dans un premier temps toutes les variables d’entrées sont été normalisées et centrées. Cette opération
est importante puisqu’elle permet d’éviter que des entrées ayant des grandeurs très différentes soient
dominantes par rapport à celles ayant des valeurs plus petites. Ensuite, il s’agit d’effectuer la phase
d’apprentissage. Cette phase consiste à estimer les paramètres des neurones du réseau, afin que celui-
ci remplisse au mieux la tâche qui lui est affectée. Dans notre cas, les échantillons composant nos
différentes classes chimiques ont servi « d’exemples » afin d’entraîner le système à classifier
automatiquement de nouveaux échantillons. Les algorithmes utilisées dans la présentes recherche
(back propagation et conjugate gradient descent) sont présentés en détail dans les articles [Esseiva et
al., 2003b], [Casale et Watterson, 1993] et [Kingston, 1992].

8.6.2. Résultats
La phase d’apprentissage a été effectuée avec approximativement 1000 échantillons regroupés
en 20 classes chimiques. Les échantillons ont été divisés en un groupe d’entraînement (330 unités) et
un groupe de vérification (168 unités). Le groupe de vérification permet de contrôler que le réseau lors
de sa phase d’apprentissage ne souffre pas de surapprentissage (overlearning) [Bishop, 1995]. 60
échantillons supplémentaires appartenant aux 20 classes chimiques ont été utilisés comme échantillons
tests afin de valider la prédiction d’appartenance de ces derniers à l’une des 20 classes chimiques
respectives. De plus, 370 échantillons n’appartenant à aucune des 20 classes chimiques précitées ont
également introduits dans le réseau de « neurones optimal » afin de déterminer si ces derniers
produisent des faux positifs.

Le tableau suivant présente les performances des 8 meilleurs réseaux :


LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 161

Réseaux Entraînement Entraînement Entraînement Test correct Test incorrect Test inconnu Faux positifs
correct (%) incorrect (%) inconnu (%) (%) (%) (%) (%)
MLP 6:35:20 98.68 0.00 1.32 88.14 3.39 8.47 1.88
MLP 6:23:20 98.95 0.26 0.79 91.53 1.69 6.78 51.08
MLP 6:22:20 97.63 0.53 1.84 88.14 3.39 8.47 35.48
MLP 6:20:20 97.63 0.79 1.58 72.88 3.39 23.73 19.35
RBF 6:120:20 97.38 0.40 2.20 83.05 16.95 0.00 5.01
RBF 6:116:20 96.78 0.40 2.81 84.74 15.26 0.00 5.30
RBF 6:126:20 96.58 0.40 3.01 83.05 1.69 15.25 5.60
RBF 6:121:20 97.38 0.60 2.00 96.61 1.69 1.69 4.12

Tableau 27 : Représentation des performances des 8 meilleurs réseaux de neurones mis en évidence par
le programme Trajan Neural Network Simulator 6®.

Comme présenté ci-dessus le réseau donnant les meilleures performances est un réseaux de
type RBF constitué de 6 entrées (les 6 constituants majeurs de l’héroïne), d’une couche cachées (121
noeuds) et de 20 sorties (les 20 classes chimiques). Ce réseau de neurones classifie correctement
97,4% des échantillons ainsi que 96,6% des échantillons tests. De plus, son taux de faux positifs est de
l’ordre de 4%, ce qui est acceptable dans l’optique opérationnelle présenté dans cette recherche.
L’architecture de ce réseau est représentée de la manière suivante :

Entrées (6 constituants
majeurs) Sorties
(20 classes
chimiques)

1 couche cachée
(121 noeuds)

Figure 82 : Architecture du réseau de neurones le plus performant.


LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 162

8.6.3. Conclusions
L’utilisation des réseaux de neurones, en tant que méthodes statistiques supervisées pour la
classification des échantillons de produits stupéfiants, a été démontrée dans le cadre de ce travail.
Cette technique se rapproche de par sa philosophie à SIMCA. Cependant, l’avantage majeur de cette
technique consiste en la possibilité de traduction de l’algorithme neuronale de classification en code
C++. Cette fonctionnalité permet de créer un programme exécutable pouvant être implémenté sur
n’importe quel système. Cette démarche est intéressante d’un point de vue de l’harmonisation de
méthodes analytique entre laboratoires. En effet, si les laboratoires utilisent une méthode analytique
standardisée, il est envisageable de développer un site Internet sur lequel on pourrait tester
l’appartenance d’une saisie à une classe chimique existante. Un prototype a déjà été créé et évalué à
satisfaction.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 163

8.7. Proposition d’une séquence d’analyse


La séquence d’analyse proposée permettant de déterminer si un échantillon appartient à une
classe chimique se présente sous la forme suivante :

Nouvel
échantillon,
nouveau candidat

Mise en évidence du profil


chimique (Chromatographie en
phase gazeuse)

Stockage de
l’information dans
base de données

Utilisation de l’analyse en
composante principale (tri)

Sélection des
échantillons avec
profils « similaires »

Analyse de la sélection 2 à 2 à
l’aide de la fonction cosinus. Seuil
élevé, éviter les faux positifs

Si lien entre deux saisies mais pas de classe existante Si appartient à une classe existante

Création d’une nouvelle classe, Validation par la méthode SIMCA


implémentation dans le modèle ou réseaux de neurones
SIMCA

Figure 83 : Proposition d’une séquence d’analyse pour les échantillons de produits stupéfiants de
type héroïne et cocaïne.
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 164

En résumé, la mise en place de la séquence d’analyse a été pensée dans l’optique de mettre à
disposition un outil permettant d’effectuer un travail de routine. Le choix de la technique d’analyse,
permettant premièrement d’obtenir des informations d’un bon niveau général (pureté de la substance
active, produit de coupage et profil chimique) en un temps minimum. Il en est de même pour le
traitement statistique où les diverses étapes ont été automatisées le plus possible et en essayant de
limiter au maximum le taux de faux positifs fournissant des informations erronées aux organes
d’enquête.

8.8. Conclusions
Le tri au sein de nos bases de données par composantes principales est efficace ainsi que nous
l’avons montré. Cette étape est importante puisque le nombre d’enregistrements est toujours plus
important. En effet, une comparaison deux à deux de toute la base de données à l’aide de la fonction
cosinus prendrait énormément de temps. En choisissant d’inclure cette possibilité de tri, une sélection
préliminaire regroupe les échantillons proches du nouveau candidat. En appliquant ce principe on
réduit grandement le nombre d’échantillons à comparer deux à deux (fonction cosinus) de même que
le temps et la complexité du processus. L’hypothèse 2.3 est alors confirmée.
Une autre utilité de cette étape réside dans la réduction numérique obtenue par la mesure des
composantes principales. En effet, un échantillon est caractérisé par le résultat de sa première et de sa
deuxième composante. Ainsi un nouveau candidat peut être rapidement classé en comparant ses
composantes principales avec un descripteur des séries présentes dans la base de données (ce
descripteur découlant également des premières et deuxièmes composantes principales de chaque
échantillon constituant la série). Cette manière de procéder implique l’attribution, à chaque série
présente dans les bases de données d’un identificateur sous la forme susmentionnée. Ceci permet de
donner une définition claire d’une série de manière rapide et simple. De plus, lorsqu’un échantillon est
attribué à une classe on peut systématiquement valider ce choix par la méthode SIMCA. Cette manière
de procéder correspond à celle proposée par Beebe [Beebe et al., 1998] (cf. Figure 59) qui, dans en
premier temps, utilise une technique de reconnaissance de groupes non supervisée donc sans préjuger
de l’appartenance de l’échantillon à une éventuelle classe chimique. Cette étape confirme l’hypothèse
2.4 quant au potentiel des méthodes supervisées à valider les liens établis lors de la phase d’analyses
non supervisées.
La méthodologie de mise en évidence des liens chimiques proposée dans le cadre de cette
recherche offre une systématique d’analyse rapide (choix d’une seule méthode analytique nécessitant
une préparation simple), fiable (faible taux de faux positifs et négatifs), peu coûteuse (méthode
analytique standard) et offrant une quantité et qualité d’informations (en une seule analyse, on obtient
des informations précises et utiles sur les constituants majeurs, sur la pureté de la substance active et
sur les produits de coupage) permettant une utilisation opérationnelle du prototype. Les liens mis en
évidence entre les différents échantillons de produits stupéfiants sont effectués à l’aide des constituants
LES TECHNIQUES DE RECONNAISSANCE DE GROUPE OU « PATTERN RECOGNITION » 165

majeurs de l’héroïne et de la cocaïne. Ces données permettent de relier ces échantillons quant et de
formuler des hypothèses raisonnable et pertinentes quant à l’organisation du trafic.
Les problèmes relatifs à l’interprétation de ces liens et à leur utilisation opérationnelle
constituent un problème difficile abordé dans la phase suivante de notre recherche.
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 166

9. INTERPRETATION ET GESTION DES


LIENS CHIMIQUES (HYPOTHESES 3
ET 4)
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 167

9.1. IBase® et l’Analyst Notebook® dans la gestion des liens


9.1.1. Introduction
L'utilisation des informations circonstancielles liées à la saisie de stupéfiants ajoutée à
l'information chimique fournie par le stupéfiant lui-même est une démarche qui permet d'enrichir
l'enquête par l’apport de renseignements complémentaires.

L’analyse de stupéfiants permet d’établir un profil propre à un échantillon (caractéristiques


physico-chimiques), puis, par sa comparaison avec d’autres saisies, de déterminer une proximité ou
une similarité de profil chimique, soit avec un autre échantillon spécifique ou encore avec un groupe
d’échantillons (classe chimique). Le développement d’une véritable stratégie opérationnelle d'enquête
vise à percevoir et comprendre les fonctionnements du marché illicite, son organisation ou sa
dynamique. Cela de développer un renseignement stratégique et/ou tactique dans une démarche par
objectifs.

L’intelligence stratégique se réfère à la notion d’origine générale du procédé de fabrication ;


c’est-à-dire, globalement, où et comment la drogue a été produite ainsi que des voies de distributions
utilisées par les trafiquants pour écouler ces produits illicites. L’intelligence tactique (ou
opérationnelle) fait quant à elle référence à l’origine spécifique du traitement, c’est-à-dire
l'établissement de liens chimiques par la comparaison rigoureuse d’échantillons 2 à 2. Au plan
national, la gestion des liens chimiques permet de reconstituer schématiquement les configurations
générales du marché illicite; au niveau local ou régional, elle permet de mettre en évidence des
associations de trafiquants [Perillo et al., 1994].

La diffusion de l’information concernant les liens chimiques mis en évidence par le procédé
décrit auparavant est une étape cruciale nécessitant une gestion rationnelle et cohérente de ceux-ci.
Elle est avantageusement mise en œuvre par l'utilisation de logiciels informatiques spécialement
conçus pour gérer (Ibase®) et représenter (Analyst Notebook® et Case Notebook®) ce genre de
données qui permettent ensuite de communiquer par l'intermédiaire d'un système de transmission
sécurisé (de l'IPS ne partent que des données non sensibles, complétées par la police, selon les besoins,
avec des informations sur les personnes) et rapide (courrier électronique crypté).

9.1.2. Architecture de la base de données (Ibase®)


L’architecture de la base de données développée sous IBase® est articulée de la manière
suivante :

Chaque échantillon est entré dans la base de données en spécifiant le type de produit
rencontré, sa pureté, ses produits de coupage ainsi que la classe chimique (entité regroupant des
échantillons ayant un même profil chimique) à laquelle il appartient :
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 168

Figure 84 : Exemple d’une page de la base de donnée IBase® adoptée pour les échantillons.

L’échantillon est l’unité centrale de la gestion des liens, il constitue le niveau fondamental. De
ce niveau fondamental se dégage un niveau général défini par l’appartenance de l’échantillon à une
saisie (données circonstancielles) et son appartenance à une classe chimique (donnée analytique,
chimique). Les classes chimiques sont liées directement avec les échantillons d’une saisie et non avec
cette dernière. En effet, une saisie peut être constituée d’échantillons ayant des profils chimiques
différents (plusieurs groupes) pouvant être liés à des classes différentes (cf. saisie C dans figure 2). Le
schéma ci-après illustre ce qui précède.

Figure 85 : Schématisation de la construction des liens. La saisie C est constituée de 2 groupes. Les
échantillons C1, C2, C3 et C4, C5 ont des profils chimiques différents puisque le premier
groupe appartient à la classe chimique N°1 et le second à la classe chimique N°2.
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 169

Une autre entité répertoriée est la saisie. Le masque servant à entrer les informations est le
suivant :

Figure 86: Exemple d’une page de la base de donnée IBase® adoptée pour les saisies.
Les informations enregistrées au sujet des saisies, sont, entres autre, le nom de cette dernière,
sa référence police, sa date et son lieu de saisie.

Enfin la dernière entité représentée concerne les différentes classes chimiques mises en
évidence au sein de la base de données.

Figure 87 : Exemple d’une page de la base de donnée IBase® adoptée pour les classes chimiques.
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 170

Les informations relatives aux classes chimiques concernent principalement les noms donnés à
ces dernières.
A ce stade, il est important de préciser la notion de classe chimique qui est essentielle dans le
cadre de ce travail. En effet, la classe chimique est une dénomination subjective se basant sur des
critères statistiques. Elle informe que deux saisies de produits stupéfiants possèdent un degré de
similitudes répondant aux seuils fixés par le scientifique (voir chapitres précédents). En aucun cas
cette notion donne des renseignements sur l’origine du stupéfiant, sur l’appartenance de saisies à un
même lot de production ou de distribution. Seul la mise en commun de cette notion mathématique
avec les informations policières connexes devrait permettre d’effectuer une interprétation plus
approfondie des liens mis en évidences.

9.1.3. Visualisation : mise en valeur de l’information


L’interaction de IBase® avec l’Analyst Notebook® en fait un outil remarquable de
visualisation et d’interprétation. IBase® permet, avec les différentes entités qu’il répertorie, le
développement de tous les liens en relation avec un élément spécifique de la base de données. Un
exemple de résultat est représenté par la figure suivante:

Figure 88 : Exemple de l’information mise en évidence par l’Analyst Notebook® et transmise au cas
par cas aux enquêteurs.
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 171

La figure ci-dessus présente un exemple où tous les liens relatifs à une classe chimique ont été
développés et organisés en fonctions de leur niveau d’information. On retrouve en vert les liens
chimiques de classes, en rouge les liens indiqua qu’un échantillon appartient à une saisie (information
circonstancielle) et enfin en bleu (un rectangle bleu délimitant au sein d’une classe les échantillons
adultérés de manière identique) les liens relatifs au coupage qui sont des informations permettant
d’émettre des hypothèses quant au niveau du trafic (réseau de distribution).
Il est également possible de représenter les saisies de manière chronologique à l'aide de Case
Notebook®. Cette vision nous permet d'apprécier le taux d'activité d'une filière de manière temporelle.

Prenons un exemple réel regroupant 6 classes chimiques interconnectées (par exemple par une
saisie possédant des échantillons appartenant à deux classes chimiques distinctes) les unes aux autres
que nous avons présentées de cette façon.

Figure 89 : Représentation chronologique des saisies de produits stupéfiants à l'aide de Case


Notebook ®. Durée de la série (août 1999, mars 2000). Chaque ligne de temps est une
classe chimique et chaque boîte correspond à une saisie. L’évolution chronologique est
donnée par la variation horizontale.

La figure 87 montre le début de la série. La première classe chimique à apparaître est la classe
9 dont la première saisie est datée du 24 août 1999. Suivent ensuite la classe chimique 10 et la classe
chimique 2 débutant respectivement le 1er septembre 1999 et le 26 octobre 1999. Il est important de
préciser que lorsqu’une boîte représentant une saisie est relié à deux classes chimique cette dernière
est composée d’échantillons possédant deux profils chimiques différents (cf. saisie 99235 de la Figure
89 qui possède des échantillons rattachés aux classes chimiques 2 et 3 ).
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 172

Figure 90 : Représentation chronologique des saisies de produits stupéfiants à l'aide de Case


Notebook ®. Suite de la série dans l’intervalle de temps situé entre avril 2000 et août
2000.

Figure 91 : Représentation chronologique des saisies de produits stupéfiants à l'aide de Case


Notebook ®. Suite de la série dans l’intervalle de temps situé entre août 2000 et
septembre 2000.
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 173

Figure 92 : Représentation chronologique des saisies de produits stupéfiants à l'aide de Case


Notebook ®. Fin de la série (septembre 2000 et février 2001).
La première constatation que l’on peut effectuer en analysant les 4 figures précédentes
concerne le temps de vie d’une classe chimique. Dans cet exemple, des saisies ayant un profil
chimique similaire ont été observées sur le marché à presque deux ans et demi d’intervalle. En partant
de l’hypothèse que chaque lot d'héroïne produit présente un profil chimique unique, les saisies
appartenant à une classe chimique appartiennent donc à un même lot.

La notion de lot est définie dans le cas présent comme une quantité de stupéfiant regroupée à
un temps t en une seule matrice dont le profil chimique des traces est similaire. L’appartenance à un
même lot peut donc fournir une information relative à un laboratoire, si ce dernier produit un lot de X
kilos qui est par la suite distribué dans la rue, ou à un grossiste s’il crée son propre produit en
mélangeant des lots d’héroïne acquis auprès de divers laboratoires (voir en détail par la suite).

Afin d’expliciter cette hypothèse de l’unicité chimique d’un lot, on part du principe que la
fabrication d’un lot d’héroïne ou de cocaïne produit des quantités comprises entre 5 et 10 kilogrammes
ainsi que montré par Guéniat [Guéniat 2001]. Aucune donnée précise n’est actuellement disponible
mais il semble raisonnable d’admettre que cette estimation est proche de la réalité puisque cette
transformation s’effectue dans des laboratoires clandestins qui, principalement par mesure de
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 174

discrétion, ne disposent pas d’une infrastructure permettant de traiter en une seule fois des dizaines,
voire des centaines de kilogrammes de morphine ou de coca. Ainsi, chaque lot produit dans un
laboratoire, traité avec la même méthodologie de fabrication d’héroïne, possède un profil chimique
propre dépendant de facteurs influençant de manière drastique le produit final. Ces facteurs sont, d’une
part, la matière première (pavot ou feuilles de coca) dont la composition peut varier fortement, les
produits chimiques entrant dans le processus de purification/extraction tels que les solvants et les
réactifs oxydants et réducteurs qui sont souvent de qualité inégale et réutilisés le plus souvent possible
pour réduire les frais. D’autre part, les recettes utilisées afin d’extraire les différents alcaloïdes sont
souvent empiriques et rarement standardisées. Les temps de réactions ainsi que les quantités de
réactifs/solvants utilisés peuvent varier fortement d’une extraction à l’autre. Les proportions des
différents constituants utilisés pour le profilage du stupéfiant étant dépendantes de telles conditions, il
est raisonnable de considérer que chaque lot préparé est différent. Ceci est confirmé par la recherche
menée par Aalberg et ses collaborateurs [Aalberg et al., 2001]) où il a été montré que l’obtention de
lots de production d’amphétamines ayant des profils chimiques similaires nécessitait une
standardisation stricte des diverses phases de synthèses.
Cependant, il a été démontré que certaines classes chimiques (donc un profil chimique
spécifique) se retrouvent sur le marché pendant presque 3 ans. Ceci implique que des dizaines de
kilogrammes de cette héroïne aient été vendus dans toute la Suisse (lien entre différents cantons).
Cette valeur sous-estime encore la production réelle puisque nous n’avons qu’une vision reflétant
l’action policière (ce que la police saisit) et non une vision globale du marché. Deux hypothèses
pouvant expliquer ces observations peuvent être émises. La première consiste à imaginer que les
trafiquants rassemblent et mélangent les différents lots d’héroïne qu’ils reçoivent de leurs fournisseurs.
Ce faisant, ils créent une nouvelle entité d’héroïne de grande taille ayant des caractéristiques
chimiques similaires (voir chapitre 3 § 3 où il a été montré qu’en mélangeant deux héroïnes ayant un
profil X et Y, on obtient une héroïne Z ayant un profil différent). Par la suite, ce stock est conditionné
pour la vente et expédié vers les différents marchés. Cette manière de faire a été observée en Australie
où des volumes importants (des centaines de kilogrammes) d’héroïne possédant des caractéristiques
chimiques similaires ont été saisis par la police fédérale [Anglada et al., 2002]. Cette notion de stock a
déjà été évoquée suite au décret du Molah Omar chef des Talibans interdisant la culture du pavot en
Afghanistan. Ce décret a fait chuter de près de 95% la production de pavot mais cette diminution n’a
pas été ressentie sur l’offre d’héroïne ainsi que sur son prix. Il est donc raisonnable de penser que la
demande en produit stupéfiant ait pu être remplie par les stocks existants.

La seconde hypothèse expliquant la persistance de certaines classes chimique dans le temps


trouve ces fondements à la source même de la production d’héroïne. En effet, l’héroïne alimentant le
marché Suisse provient majoritairement du croissant d’or (principalement l’Afghanistan). On se trouve
donc devant une production endogène, tant au niveau de la source, qu’au niveau des précurseurs et des
méthodes (rustiques) d’extraction et de raffinage utilisées. De plus, la majorité du trafic vers la Suisse
transite par la Turquie puis les Balkans, ce qui induit une configuration de type entonnoir, limitant les
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 175

réseaux d’alimentation. Dès lors toutes les conditions sont réunies pour obtenir des profils chimiques
peu variables. Cette seconde hypothèse semble être la plus probable car, vu la consommation
importante d’héroïne en Suisse (en estimant le nombre de toxicomanes en Suisse (env. 10000) ainsi
que leur consommation quotidienne (env. 1gr.), il est possible d’évaluer à une dizaine de kilos la
consommation d’héroïne par jour), il est peu imaginable que des stocks avoisinant la tonne soit
constitués par mélanges de centaines de lots de production.
Finalement, peu importe quelle hypothèse est la privilégiée, l’existence sur le marché de de
profils chimiques présents sur une longue période donne au profilage sa raison d’être. Sans cette
persistance dans le temps, les liens seraient moins fréquents du fait de la disparition rapide des classes
chimiques du marché.

9.1.4. Interaction liens chimiques/informations policières


L’utilité d’une telle démarche réside principalement dans la confrontation de cette information
opérationnelle avec celle à disposition des brigades stupéfiants afin de fournir à l’enquêteur des
éléments objectifs mettant en évidence des connexions insoupçonnées par les moyens habituels
d’enquête, car souvent volontairement dissimulés par les consommateurs et les trafiquants. Combinés
aux données de police traditionnelles, les liens chimiques permettent, par exemple, de confirmer des
soupçons (« ont été vus ensemble », « se contactent téléphoniquement »,…) ou de mettre en évidence
de nouvelles connexions entre trafiquants. La réciproque est aussi envisageable : des données de
police peuvent permettre de lier deux classes chimiques comme dans la Figure 93.

Lien par informations policières


traditionelles
•Contrôles téléphoniques
•Informations d’enquête

Figure 93 : Intégration des informations policières.


INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 176

Figure 94 : Exemple de priorité d’intervention que l’on pourrait effectuer en choisissant


d’investiguer en premier lieu les informations relatives à la saisie entourée en rouge.
Les liens chimiques peuvent également déterminer des priorités d’intervention. Par exemple
dans la Figure 94, la saisie, donc la personne (qui lui est associée…) entourée de rouge joue un rôle
central puisqu’elle relie deux classes chimiques. Elle devient donc un personnage clé de ce micro-
marché sur lequel il faut se focaliser en premier lieu. A ce niveau, les liens chimiques sont utilisés
pour fixer des priorités d’enquête. On peut également fournir des données pertinentes en renseignant
l’enquêteur des différentes saisies qui sont en relation. Par exemple dans la Figure 94, l’enquêteur X
demandant le schéma relationnel des liens chimiques pour la saisie entourée de rouge, aura à
disposition l’organigramme de toutes les saisies liées chimiquement à cette dernière. La démarche
suivante visant à combiner les informations investigatrices aux données chimiques implique
nécessairement la mise en place d’une entité au sein de la police à même de pouvoir gérer ce type
d’information qui, dans la plupart des cas, dépasse la vision de l’enquêteur. Imaginons d’inclure les
informations relatives aux relevés rétroactifs effectués sur les appareils téléphoniques des différentes
personnes ayant un lien dans cette affaire ainsi que des informations relatives à des versements
bancaires, la représentation devient très rapidement difficile à gérer et déborde du cadre de l’enquête
de l’inspecteur X.
De plus, les relations mises en évidence dans ce travail l’ont souvent été entre les différents
cantons dont l’IPS analyse les échantillons. Ces liens corroborent les flux de trafic d’héroïne mis en
évidence dans le chapitre 2. Entre autres, des saisies d’héroïne de grande taille effectuées au Tessin
possèdent des liens avec Genève, Vaud et Neuchâtel. Or, la dynamique de distribution suisse montre
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 177

que la drogue entrant par le Tessin approvisionne Berne et Zurich qui sont avec Bâle, les principaux
centres de stockage de produits stupéfiants. Dès lors, il paraît essentiel d’étendre la vision actuelle
pour obtenir une évaluation plus pertinente de la taille et de la dynamique du marché suisse. La mise
en place d’une entité en charge de récolter cette information et possédant une vision plus générale,
plus globale des connexions pouvant intervenir entre les différentes affaires est selon nous une
condition nécessaire au succès d’une telle entreprise. Cette entité, à la manière du CICOP (Concept
Intercantonal de Coordination Opérationnel et Préventif) au niveau des cambriolages, aurait la tâche
de gérer ces informations en redistribuant aux différents organes judiciaires concernés la synthèse
effectuée.

La principale pierre d’achoppement à la mise en place d’un tel processus consiste à trouver les
interlocuteurs adéquats pour gérer et interpréter cette nouvelle information. Bien que destinée aux
enquêteurs des brigades stupéfiants, il semble utopique de demander à ces derniers de gérer ces
données. Ceci pour deux raisons principales : la première relève d’un point de vue purement pratique
qui découle de la charge de travail importante qui incombe déjà aux investigateurs et la seconde du fait
de la complexité de cette information. Cette complexité nécessite une formation spécifique ainsi que
du temps afin d’extraire tout le potentiel de ce nouvel outil.
Idéalement la création d’une entité fonctionnant à la manière d’une cellule d’analyse
criminelle qui centralise, analyse et redistribue l’information serait souhaitable. Elle devrait permettre
d’émettre des hypothèses relatives à la structure des associations criminelles et d’en expliquer les
relations. En adoptant une logique abductive (dépassent les simples faits), en émettant certaines
hypothèses de travail fondées sur les informations récoltées et traitées dans un cas particulier ainsi que
sur les enseignements récoltés lors d’anciennes enquêtes, elle devrait permettre l’utilisation rationnelle
de ces données.
Actuellement, la notion de lien chimique et son utilité au sein des corps de police n’ont pas
encore été évaluées. Il serait intéressant de confronter les liens mis en évidence ainsi que leurs
structures avec les relations faites par les enquêteurs et d’estimer l’apport de ces liens s’ils avaient été
transmis à l’enquêteur pendant l’affaire en cours. Pour ce faire, il est nécessaire d’effectuer une
analyse rétrospective afin de déterminer qu’elles hypothèses auraient pu être émises et quels critères
permettent de les émettre.

Ainsi le schéma de gestion et d’interprétation des liens peut être représenté de la manière
suivante :
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES (HYPOTHÉSES 3 ET 4) 178

Réception des échantillons,


préparation à l’analyse

Récolte info chimique


Détermination des profils
chimiques, récolte de l’info

Construction, mise à jour des


classes chimiques

Récolte info police


Information police, écoute Evaluation,
téléphonique, renseignements classements des
divers, brigade observation informations

Interprétation des informations

Formulation d’hypothèses

ACTION
Figure 95 : Schéma de gestion et d’interprétation des liens chimiques.
En résumé, les différents liens gérés dans IBase® fournissent une vision actualisée de
l’évolution du marché de distribution des produits stupéfiants cibles de la police. Ainsi, lors de la mise
en évidence de l’activité d’un réseau de distribution, représentée par une classe d’échantillons, il est
possible d’effectuer des liens entre différentes saisies et, par extension et prudence, aux personnes
impliquées dans les saisies de produits stupéfiants et par conséquent d’obtenir une représentation aussi
proche et complète que possible de la situation réelle. La démarche visant à gérer des liens entre des
saisies de stupéfiants permet aux forces de police de fixer des priorités sur les actions à mener dans le
temps et dans l'espace, de même que de fournir une information consolidée de l’étendue du réseau lors
d’une arrestation. Tout cela est vrai à la condition que l’information de lien chimique soit obtenue en
temps réel ! Cela n’est de loin pas facilement acquis vu le nombre d’échantillons à analyser.

9.1.5. Exemple réel :


L’exemple suivant illustre parfaitement le potentiel des liens chimiques combinés aux
informations d’enquêtes.
INTERPRÉTATION ET GESTION DES LIENS CHIMIQUES 179

Figure 96 : Exemple concret de l’utilisation des liens chimiques.


INTERPRÉTATION ET GESTION DES LIENS 180

Il s’agit d’un trafic de cocaïne entre la Suisse et la Bolivie traité par la brigade des stupéfiants
de Lausanne. Cette affaire a montré que les saisies XXX et YYY, faites sur des passeurs de cocaïne en
provenance de la Bolivie, possédaient un profil chimique similaire. Ces deux saisies ont également pu
être reliées à la saisie ZZZ, cette dernière étant chimiquement indifférentiable des deux autres. Cette
information a été fournie aux enquêteurs qui ont déterminé que les personnes transportant les saisies
XXX et YYY étaient payées par ZZZ en tant que « mules » pour alimenter ce dernier en cocaïne. Dans
ce cas précis, le lien chimique confirmé par les données d’enquête, a apporté une information
importante à la police en l’aiguillant sur le commanditaire de ces deux livraisons. De plus, un autre
lien intéressant a été mis en évidence avec la saisie AAA effectuée sur une personne de nationalité
bolivienne ayant résidé en Suisse. Cette information a été exploitée par les enquêteurs qui ont pu
déterminer que AAA avait fourni de la cocaïne à ZZZ en 1999 lorsque ce dernier était en rupture de
stock (à nouveau des liens ont été mis en évidence à plus d’une année et demie d’intervalle confortant
l’idée d’existence de stock). Cet exemple démontre clairement l’utilité opérationnelle des liens
chimiques qui ont permis de mettre en évidence des relations qui ne l’auraient pas nécessairement été
par l’enquête. De plus, un nombre important d’informations non traitées est encore disponible. Ainsi,
des relations avec des cas genevois ont été mises en évidence et mériteraient d’être approfondies, de
même que toutes les informations traditionnelles de police.

9.1.6. Interprétation des liens, qu’est-on en mesure de conclure ?


Les exemples suivants schématisent la complexité des liens mis en évidence et la manière
arbitraire de qualifier le niveau de trafic auquel ils se situent. On constate que, même si deux
personnes sont arrêtées avec le même produit stupéfiant (même profil), cela n’implique pas
nécessairement qu’ils ont été fournis par le même réseau de distribution [Guéniat 2001]. La figure
suivante illustre les diverses configurations pouvant être rencontrées.
INTERPRÉTATION ET GESTION DES LIENS 181

Producteur /
laboratoire Trafiquant Grossiste Vendeur Utilisateur

1 Cas 1 : liés par la source


et la distribution. Profils
indifférentiables
2a

2b Cas 2 : liés par la source.


Même profil de traces
naturelles et de
production
2c

3 Cas 3 : liés par le réseau


de distribution, même
produits de coupage

4 Cas 4 : liés par le réseau


de distribution mais ayant
des profils chimiques
différents
Produit de
Impuretés naturelles coupage
/ production

Figure 97 : Représentation simplifiée de la chaîne de distribution des produits stupéfiants et de son


impact sur les liens pouvant être mis en évidence.
Le fait de mettre en évidence deux profils chimiques similaires peut découler d’une source
commune mais peut également indiquer une connexion au niveau du réseau de distribution. Le
contraire est également vrai puisque deux profils chimiques différents peuvent être reliés à un même
réseau de distribution. Afin de tenter d’apprécier plus en détail la complexité de cette information,
diverses configurations organisationnelles sont présentées ci-dessous.

L’exemple suivant montre le cas simple où un laboratoire fournit un grossiste et ce dernier


distribue le lot 1 à deux organisations différentes. Il est tout à fait envisageable que les deux
organisations ne se connaissent pas et que le lien soit effectué à un niveau différent représenté par le
grossiste 1.
INTERPRÉTATION ET GESTION DES LIENS 182

Grossiste 1 Grossiste 2

Organisation 1 Organisation 2

Figure 98 : Exemple d’une structure simple ou un laboratoire fournit des stupéfiants à un grossiste
qui alimente deux organisations différentes.
La figure suivante représente la division d’un lot d’héroïne qui est distribué à plusieurs
revendeurs. Dans ce cas de figure, le laboratoire 1 a divisé un lot en deux parties qu’il a distribuées à
deux revendeurs différents. Le lien chimique ne se situe donc plus au niveau du grossiste mais du
laboratoire. Le fait que deux organisations vendent un stupéfiant ayant les mêmes caractéristiques
chimiques n’implique pas que ces dernières appartiennent à un même réseau de distribution, mais
plutôt, dans cet exemple-ci, qu’elles ont un même réseau d’approvisionnement.
INTERPRÉTATION ET GESTION DES LIENS 183

Grossite1 Grossiste 2

Organisation 1 Organisation 2

Figure 99 : Exemple d’une structure simple ou un laboratoire fournit des stupéfiants à deux
grossistes différents qui alimentent deux organisations différentes.

Grossiste 2
Grossiste 1

Organisation 1 Organisation 2

Figure 100 : Exemple d’un grossiste qui mélange des lots d’héroïne provenant de deux laboratoires ou
de deux lots différents.
La situation se complique encore (voir Figure 100) dans le cas où un mélange de lots
différents est réalisé pour créer un nouveau lot d’héroïne ayant un profil chimique spécifique. Cette
opération peut se faire à divers niveaux, à savoir au lieu même de production en rassemblant la totalité
de la production journalière, ou au niveau du grossiste qui regroupe l’héroïne qu’il a reçue de plusieurs
fournisseurs. Dans ce contexte, la classe peut relier des saisies à un lieu de fabrication ainsi qu'un
réseau de distribution.
INTERPRÉTATION ET GESTION DES LIENS 184

Pour illustrer cette problématique, un schéma de distribution simple a été choisi, mais la réalité
est vraisemblablement plus complexe, avec une multiplication des intermédiaires, brouillant ainsi les
pistes et augmentant les possibilités et la complexité de l’interprétation. Le point crucial de la
transmission d’information aux policiers consiste à rendre ces derniers attentifs au fait que si deux
personnes sont arrêtées avec un produit stupéfiant ayant les mêmes caractéristiques chimiques cela ne
signifie pas nécessairement qu’il y ait un lien entre elles; il faut plutôt les informer qu'il existe un lien
au niveau de la filière. Le degré de participation de ces personnes ainsi que leur « rôle » au sein de
l'organisation doivent être définis à l'aide des informations policières (rétroactifs, renseignements,
brigade d'observation).

La problématique se complique encore passablement lorsque l’on prend en considération


l’adultération des échantillons. On peut émettre une série d’hypothèses concernant le coupage de ces
derniers. Il peut être effectué directement sur le lieu de production. Dans ce cas, une adultération
atypique, par exemple de l’héroïne contenant de la griséofulvine nous fournirait un lien concernant un
réseau de distribution [Guéniat 2001]. On peut également imaginer que les produits de coupage sont
ajoutés par le grossiste ou le petit revendeur (ceci est particulièrement vrai pour la cocaïne). La rareté
de certains composants ainsi que la combinaison de ces derniers permet la mise en évidence d’une
signature chimique qui peut être assimilée à celle obtenue par les impuretés majeures de l’héroïne ou
de la cocaïne. Néanmoins, l’interprétation de ce type de classe chimique est également complexe
puisque le processus de coupage peut se dérouler à tous les niveaux du trafic, de la production à la
distribution. Là encore, le potentiel de ces classes chimiques devra être évaluer en regard des
informations globales relatives à l’enquête policière.

9.2. Conclusions
Ce chapitre a permis de valider l’hypothèse 3 relative à l’utilisation des programmes de type
IBase®, Analyst Notebook® et Case Notebook® pour la visualisation des liens chimiques. Comme
démontré ci-dessus sans l’aide de ces outils, il est illusoire de vouloir transmettre et intégrer cette
information de manière opérationnelle dans le processus d’investigation. De même l’hypothèse 4
concernant le potentiel de la mise en commun des liens chimiques avec les informations traditionnelles
de police a également été partiellement confirmée en montrant leur utilité dans des cas réels.
Néanmoins, il reste un travail important à effectuer concernant une intégration plus systématique basée
sur une interprétation des schémas de liens mis en évidence permettant d’émettre des hypothèses quant
à l’organisation d’un réseau de distribution.
185
DISCUSSION GÉNÉRALE DES RÉSULTATS 186

10. DISCUSSION GENERALE DES


RESULTATS
DISCUSSION GÉNÉRALE DES RÉSULTATS 187

10.1. Introduction
Cette recherche s’insère dans la continuité de celle menée par Guéniat [Guéniat 2001]. Ce
dernier avait traité les problématiques liées au profilage de l’héroïne et de la cocaïne. Il avait
notamment abordé de manière détaillée les différentes méthodes analytiques permettant d’établir un
profil chimique ainsi que la conceptualisation et l’interprétation des liens chimiques. Ce travail
reprend certaines de ces notions en poursuivant les pistes de recherche mises en évidence.

Le but principal du présent travail consistait à mettre sur pied un outil rapide et efficace
permettant d’effectuer le profilage des saisies de produits stupéfiants de type héroïne et cocaïne. Il
s’agissait de valider les choix effectués et de s’assurer que les directions prises permettaient de
minimiser les faux positifs et faux négatifs au niveau des liens chimiques. La gestion de ces derniers
ainsi que leur intégration dans une optique d’analyse criminelle opérationnelle ont également été
abordés. Ces différentes étapes vont être discutées dans les paragraphes suivants.

10.2. Choix de la méthode analytique


Il n’y a pas de profilage sans profil. La première étape de la recherche a ainsi consisté à
déterminer une méthode efficace et robuste pour obtenir un profil. Le chapitre III est consacré à
l’évaluation de la méthode la plus efficace dans le cadre du profilage d’échantillons d’héroïne et de
cocaïne. Trois critères ont été utilisés pour guider ce choix : la complexité de la méthode analytique,
les informations fournies par cette dernière et son aptitude à mettre en évidence des liens chimiques
ont ainsi été évalués. Trois méthodes analytiques (les constituants majeurs, les constituants mineurs et
les constituants inorganiques) ont été confrontées les unes aux autres en tenant compte des critères
définis ci-dessus. Du point de vue de la complexité de la méthode analytique, il n’y a pas de
discussions possibles : la méthode des constituants majeurs est la plus favorable. En effet, la
préparation des échantillons est simple et rapide. Il suffit de peser et de diluer la poudre, contrairement
aux deux autres méthodes qui nécessitent l’évaporation de solvant ou un filtrage de solutions. Il en va
de même pour le critère de la capacité informative, puisque la méthode des constituants majeurs
permet d’identifier les produits de coupage présents dans la matrice analysée ainsi que de quantifier la
substance illicite (diacétylmorphine ou cocaïne). De plus, il a été démontré de manière empirique qu’il
n’existait pas de différences significatives quant aux liens mis en évidence par chacune des trois
méthodes analytiques. Une validation de ces observations a été effectuée à l’aide de l’analyse
canonique. Cette méthode statistique s’applique à deux séries de variables caractérisant une classe
d’individus. Par exemple, cette méthode est utilisée en botanique pour comparer l’information fournie
par des analyses topographiques (recensement de plante sur un territoire donné) et des analyses
génétiques. L’idée étant de comparer ces deux sources de données afin de déterminer si l’information
extraite de l’analyse topographique n’est pas contenue dans l’analyse génétique. Si tel est le cas, on
peut donc se passer de l’analyse topographique qui est plus coûteuse en temps et en argent. C’est ce
genre de réflexions qui a guidé l’évaluation des méthodes analytiques. La méthode des constituants
majeurs a été successivement comparée à celle des constituants mineurs et inorganiques. Il a été
DISCUSSION GÉNÉRALE DES RÉSULTATS 188

montré que 60% de l’information véhiculée par les variables inorganiques était contenue dans les
variables des constituants majeurs. Ce pourcentage baissait à environ 40% pour les constituants
mineurs. On remarque qu’en choisissant de n’utiliser qu’une seule méthode analytique, on perd
sciemment de l’information. Cependant, cette perte est acceptable en regard des avantages évidents
énoncés précédemment et dans une optique opérationnelle.

Actuellement, la tendance des recherches documentées dans les journaux spécialisés est
principalement axée sur le développement de nouvelles techniques analytiques de plus en plus
poussées alors que peu de réflexion n’est entamée sur leur potentiel d’utilisation et d’insertion dans un
processus de profilage. Cette démarche s’explique par une optique de procédure accusatoire
(principalement en vigueur dans les pays anglo-saxon) où les résultats des expertises de produits
stupéfiants sont souvent sujets à contre-expertise ou à être défendus devant un tribunal. La pseudo
parade mise en place par les différents laboratoires mandatés pour ce genre de travail a souvent été de
multiplier le nombre de méthodes analytiques utilisées pour le profilage afin de « jeter de la poudre au
yeux » des avocats et des juges. Cependant, comme l’a montré notre étude, il est à notre sens plus
judicieux d’évaluer l’apport d’une nouvelle méthode analytique au processus de profilage en place en
terme d’information apportée, de corrélation avec les méthodes déjà en place ainsi que du coût en
argent et en temps engendré par cette dernière. Au stade actuel de nos recherches, cette surenchère
analytique n’a pas montré de réels avantages par rapport à la systématique proposée dans ce travail.
L’intérêt du profilage de produits stupéfiants se trouve principalement dans son intégration
opérationnelle ou du moins dans l’évaluation de son potentiel informatif. Cette phase, plus complexe,
a jusqu’à présent fort peu été discutée. L’intégration de cette connaissance à un niveau opérationnel
passe obligatoirement par le développement d’une collaboration avec les personnes auxquelles les
résultats sont destinés. Il s’agit de créer un besoin en montrant l’utilité d’une telle démarche. Ce travail
est souvent fastidieux et les résultats concrets prennent du temps à se manifester et à être reconnus.
Néanmoins, cette direction est sans doute celle à adopter, sinon le profilage de produits stupéfiants n’a
pas réellement de raison d’être à un niveau forensique ; il ne servirait qu’à fournir des résultats
d’analyse au cas par cas (demande spécifique d’un juge) et l’aspect d’analyse criminelle serait négligé.
Cela revient à une pure routine ne nécessitant pas d’apport intellectuel ajouté.

Cependant, il faut être conscient que le choix de cette méthode s’est basé sur la forme
chimique des produits stupéfiants saisis en Suisse et pourrait être adaptée si la qualité du produit
entrant dans notre pays venait à changer. Par exemple la quasi totalité de l’héroïne saisie en Suisse se
trouve sous sa forme basique riche en éléments en trace. Par contre, en analysant de l’héroïne saisie en
Australie, il s’est avéré que cette dernière était sous forme de sel hydrochloré pauvre en traces; seuls
l’acétylcodéine, l’acétylthébaol et la 6-mono-acétylmorphine étaient présents. Cette différence est due
à la méthode de fabrication où les divers processus de purification et de transformation en sel
hydrochloré éliminent la papavérine, la noscapine et la méconine. Une recherche a été effectuée en
appliquant la méthode des constituants majeurs à des échantillons d’héroïne hydrochlorée. Bien que
seulement trois constituants étaient présents, il a été possible de mettre en évidence des liens
DISCUSSION GÉNÉRALE DES RÉSULTATS 189

chimiques. Il serait donc intéressant de confronter cette méthode avec celle utilisée en routine pour ce
genre d’échantillons, à savoir la méthode des constituants mineurs. S’il est possible de prouver que les
liens mis en évidence pour des échantillons d’héroïne hydrochlorée par la méthode des constituants
mineurs le sont aussi par la méthodes des constituants majeurs, alors il serait tout à fait envisageable
de n’utiliser que la méthode la plus simple et la plus informative (cette dernière est déjà utilisée en
routine à des fins d’analyse stratégique pour la détermination de la provenance géographique d’un
échantillon d’héroïne).

10.3. Méthode de comparaison des chromatogrammes


Cette étape est importante puisqu’elle permet la mise en évidence des liens chimiques entre
deux échantillons de produits stupéfiants. La comparaison de chromatogrammes peut s’effectuer à
l’aide de plusieurs mesures de distances ou de corrélation. Afin de déterminer quelle technique est la
plus adaptée à nos données, diverses méthodes proposées dans la littérature ont été évaluées. Ainsi,
trois méthodes de distance métrique (Canberra, Manhattan et Euclidienne) et deux méthodes de
corrélation (Pearson et fonction cosinus) ainsi que la méthode du quotient ont été confrontées. Ces
méthodes ont été testées avec le même jeu de données constitué d’échantillons liés et non liés. Le
pourcentage de faux négatifs et positifs a ensuite été évalué. Le critère déterminant pris en compte
pour la sélection de la méthode la plus efficace fut le taux de faux positifs. Il a été décidé de minimiser
ce taux car, d’un point de vue opérationnel, il est préférable de ne pas donner un lien plutôt que d’en
fournir un erroné qui pourrait mettre les enquêteurs sur une mauvaise voie. Il est en effet important
dans un premier temps de minimiser ces erreurs afin d’éviter que les utilisateurs dénigrent trop
rapidement ce nouvel outil. Il est également possible d’argumenter dans le sens inverse en disant qu’il
faut favoriser l’émission d’hypothèses. Cette manière de faire est justifiée lorsque l’outil proposé est
déjà bien adopté par les utilisateurs. Dans une phase de tests et d’acceptation du prototype, la
minimisation des fausses pistes de recherche doit être privilégiée.

Le cadre étant fixé, des simulations ont été effectuées et la fonction cosinus s’est montrée
comme la plus adaptée puisque cette dernière présente un taux de faux positifs inférieur à 1%.
Chacune de ces méthodes nécessite l’utilisation de seuils permettant à l’utilisateur de déterminer si
deux échantillons sont liés ou non. Dans cette recherche, ces limites ont été fixées empiriquement.
Ainsi des séries de saisies de grande taille (par exemple une saisie de 500 gr.) ou composées de
plusieurs échantillons (plusieurs minigrip®) ont été analysées. Plusieurs prélèvements ont été
effectués et analysés au sein de ces dernières. Les diverses valeurs obtenues ont permis de fixer un
seuil au-dessus duquel on considère les échantillons comme liés et au-dessous duquel ils ne le sont
plus. On a en quelque sorte calculé une variabilité intra-saisie et lors du processus de comparaison de
deux échantillons, on détermine si la valeur obtenue pour ces échantillons se situe au-dessus ou au-
dessous du critère décisionnel fixé.

Néanmoins ce seuil pose un problème connu sous le nom de « fall of the cliff effect ». En
effet, lorsqu’une valeur de comparaison se situe à la limite il devient alors difficile de se prononcer. La
DISCUSSION GÉNÉRALE DES RÉSULTATS 190

littérature propose une manière élégante de répondre à cette problématique consistant à utiliser une
approche continue dite probabiliste. L’utilisation de cette approche a été validée dans une recherche
menée à l’IPS [Dujourdy et al., 2003]. Afin de déterminer si deux saisies sont liées entre elles, on
calcule un rapport de vraisemblance connu sous la locution anglaise Likelihood Ratio (LR). Ce LR
représente en fait le rapport entre deux hypothèses concurrentes. Il calcule le poids entre la probabilité
que les deux saisies soient liées si elles le sont vraiment et la probabilité inverse à savoir la valeur de
probabilité si elles ne le sont pas. Le dénominateur est calculé en estimant la probabilité d’observer la
fréquence de corrélation (le C de la fonction cosinus) obtenue par la comparaison entre deux saisies si
elles sont réellement liées (l’estimation s’effectue en calculant la probabilité d’observer cette valeur de
corrélation dans la population des valeurs de corrélation obtenues en comparant les échantillons
constituants une des deux saisies). Le numérateur s’obtient quant à lui en estimant la probabilité
d’observer la fréquence de corrélation obtenue par la comparaison entre les deux saisies si elles ne
sont pas liées (l’estimation s’effectue en calculant la probabilité d’observer cette valeur dans une
population de valeurs de corrélation obtenues entre saisies non liées). Il faut remarquer que cette
approche bien qu’étant considérée comme continue souffre également du syndrome « fall of the cliff
effect ». En effet, divers auteurs ont proposé l’utilisation d’une échelle verbale pour qualifier la nature
du lien. En ce faisant on retombe également dans le même travers rencontré avec les fonctions
standards de mesures de distances ou de corrélations entre deux chromatogrammes. Si l’on définit par
exemple qu’une valeur de LR comprise entre 10 et 100 soutient l’hypothèse que deux saisies sont liées
ou qu’au dessous de 1 les échantillons ne sont plus liés, il est difficile de conclure lorsque l’on est
confronté à une valeur de LR de 9.8 ou de 0.9. On se retrouve donc confronté à la même situation ou
l’approche choisie aide l’expert à réfléchir sur la valeur des indices à disposition. Cependant, dans le
cadre de cette recherche, la priorité n’a pas été donnée à la comparaison d’échantillons au cas par cas
dans une perspective probatoire, mais plutôt de fournir un outil de travail et d’analyse supplémentaire
et complémentaire aux forces d’enquête.

Une autre préoccupation importante concernait la méthode de comparaison elle-même. La


méthode choisie est celle documentée par Keto [Keto, 1989] connue sous le nom de fonction cosinus
qui mesure l’angle entre deux vecteurs constitués en l’occurrence par les variables des
chromatogrammes à comparer (on mesure en fait une valeur de corrélation). Cette comparaison ne
pouvait raisonnablement pas être effectuée de manière systématique pour chaque nouveau candidat
avec tous les échantillons répertoriés dans la base de données. En effet, ces dernières contiennent
environ 5000 échantillons d’héroïne et 2400 de cocaïne. Ainsi, une comparaison 2 à 2 prendrait un
temps considérable qui n’est pas en adéquation avec la rapidité et la fonctionnalité recherchées. Dès
lors, l’introduction du calcul automatique des premières et deuxièmes composantes principales pour
chaque échantillon a permis d’effectuer une première sélection éliminant les échantillons n’ayant pas
de similitudes avec la nouvelle saisie à comparer. Ainsi cette phase préliminaire permet d’éliminer en
moyenne entre 80 et 90% des candidats. Il va sans dire que le nombre et donc le temps de comparaison
DISCUSSION GÉNÉRALE DES RÉSULTATS 191

subséquent avec la fonction cosinus (comparaison deux à deux) s’en trouvent alors grandement
diminués.
Un autre élément fort intéressant a été mis en évidence lors de cette recherche concernant la
matrice même du produit stupéfiant. En effet, lors d’une étude menée sur les diverses fractions
présentes dans une saisie d’héroïne (cf. Annexe 5) il a été montré que les proportions en constituants
majeurs peuvent varier considérablement selon la fraction étudiée (pour rappel, chaque fraction était
séparée par un crible dont les mailles ont des dimensions connues). Ces résultats montrent que le
stupéfiant saisi par la police n’est pas une substance homogène. Ceci est explicable, d’une part, par la
fabrication de ces stupéfiants et, d’autre part, par le conditionnement du produit final (pain, bloc,
d’héroïne ou de cocaïne) prêt à la distribution. La fabrication est artisanale et/ou sans application de
critères stricts comme il peut être observé en milieu industriel licite. Comme nous l’avons vu
précédemment, les trafiquants et/ou les grossistes concentrent vraisemblablement en un moment donné
des quantités de produits stupéfiants importantes qu’ils devront conditionner par la suite. Cette
substance, la plupart du temps sous forme pulvérulente, ne possède pas toujours les mêmes propriétés
physiques (poudre plus ou moins fine ou grossière). Il est donc probable que lors de la préparation des
lots de 0.5 à 1 kilo, la matrice utilisée ne soit pas totalement homogène et soit constituée de différents
gradients, comme nous l’avons observé. Ces constations sont importantes du point de vue du profilage
de produits stupéfiant, puisqu’elles influent directement sur l’intra-variabilité des produits analysés. Il
est donc important de prendre en considération cette notion d’inhomogénéité sans quoi les liens mis en
évidence ne refléteront pas la réalité. De même, au niveau de l’échantillonnage cette problématique
devrait être prise en compte, car elle pourrait jouer un rôle important dans les modèles d’aide à
l’échantillonnage actuellement en développement [Coulson et al., 2001] ; [Aitken et Lucy, 2002].

10.4. Les classes chimiques


La manière la plus efficace de répertorier des échantillons de profils chimiques similaires
consiste à les regrouper dans des classes chimiques. L’utilisation de ces entités nous a permis de
travailler à deux niveaux différents. Le premier a permis d’utiliser des techniques de classifications
mathématiques dites supervisées (fondées sur une connaissance préalable de la répartition des
échantillons dans les diverses classes chimiques) et le second nous a fourni une base de classification
gérable (utilisation de Ibase® et de l’Analyst Notebook®).

La mise en oeuvre de techniques de classification dites supervisées était une suite logique à la
phase initiale d’analyse de données qui s’était basée sur des techniques telles que l’analyse en
composantes principales et les mesures de distance qui sont des techniques de classifications non
supervisées puisqu’elles fonctionnent sans connaissance à priori de la distribution des différentes
saisies étudiées.

Le potentiel de classification de techniques dites supervisées telle que la méthode SIMCA


(Soft Independent Modelling of Class Analogy), utilisant des algorithmes de classification basés sur le
calcul des composantes principales, a été évalué. Les avantages de cette méthode sont multiples.
DISCUSSION GÉNÉRALE DES RÉSULTATS 192

Premièrement, lors du processus d’apprentissage, chaque classe est traitée séparément, permettant
ainsi d’obtenir un modèle propre à cette dernière. Par exemple, certaines classes chimiques sont plus
dispersées (intervariabilité plus importante) que d’autres. SIMCA prend en considération ces
informations et modélise chaque classe en conséquence. De plus, lorsque le prototype a été
« entraîné » (processus d’apprentissage où des saisies de différentes classes chimiques sont implantées
dans le programme afin qu’il puisse en définir correctement les caractéristiques), il est possible
d’émettre un pronostic d’appartenance pour un nouveau candidat. Cette phase de prédiction est utile
puisque, très rapidement, il est possible de déterminer si un nouvel échantillon possède les
caractéristiques nécessaires pour entrer dans une classe chimique préalablement répertoriée. La
création de nouvelles classes chimiques, ainsi que l’augmentation de la population de celles qui
existent, nécessite la mise à jour du modèle. Cette phase est rapide et intuitive. Les différents tests
effectués ont montré que la classification était correctement effectuée dans plus de 95% des cas. Cette
technique est donc tout à fait utilisable dans le contexte de profilage de produits stupéfiants. Dans le
même ordre d’idée, des techniques de réseaux de neurones artificiels (Trajan Neural Network®) ont
également été testées sur le même type de données. Les résultats sont comparables à ceux obtenus
avec la méthode SIMCA [Esseiva et al., 2003b].

Ces techniques de classification offrent des possibilités d’automatisation qui s’avèrent être très
intéressantes. SIMCA ainsi que Trajan Neural Network® possèdent une fonctionnalité permettant
l’accès au code C++ généré dans la phase d’apprentissage. Il est dès lors possible de compiler ce code
afin de créer un programme exécutable. Dès lors, il n’est plus nécessaire de posséder le programme en
question pour effectuer une classification d’une saisie de produit stupéfiant. L’interface permettant
d’effectuer cette tâche est très simple, il suffit à l’utilisateur de télécharger ses données, que le
programme traitera instantanément. Ce dernier fournira un résultat sous la forme d’appartenance ou
non à une classe chimique répertoriée dans le prototype (il est également possible d’inclure cette
comparaison sur une interface Internet). A ce stade, il n’est plus nécessaire d’être un spécialiste des
composantes principales ou des réseaux de neurones pour effectuer ce travail de classification.
Toutefois, il est primordial de garder à l’esprit les fonctionnements de ces procédures de classification
si l’on veut être capable de fournir une interprétation correcte des données obtenues en « output ». Ce
processus est enclin à fournir des faux positifs et des faux négatifs même si leur taux est faible. Ces
méthodes de classifications sont utiles pour confronter les résultats obtenus avec les méthodes non
supervisées. En effet, lors du processus de profilage proposé dans cette étude, une première sélection
est effectuée à l’aide d’une analyse en composante principale. Les échantillons de cette sélection sont
alors comparés à l’aide de la fonction cosinus, mettant en évidence les saisies similaires au nouveau
candidat. Si ces saisies appartiennent déjà à des classes chimiques existantes, les méthodes SIMCA et
neuronale sont alors utilisées pour confirmer ce résultat. Cette combinaison de méthodes de
classifications indépendantes permet de minimiser les taux de faux positifs et négatifs.
DISCUSSION GÉNÉRALE DES RÉSULTATS 193

10.5. Gestion des liens


Les liens chimiques étant identifiés, la phase suivante consiste à mettre en place une
systématique permettant une gestion cohérente de ces derniers puis la formulation d’hypothèses de
travail. Afin de mener à bien cette tâche, le programme Ibase® spécialement conçu pour gérer ce
genre d’information a été utilisé. IBase®, lié à l’Analyst Notebook® et au Case Notebook®, permet
également d’effectuer une représentation claire et compréhensible de l’information ainsi qu’une
visualisation optimale nécessaire à l’interprétation des relations mises en évidence.
Plusieurs résultats pertinents ont été relevés. Premièrement un nombre important de liens et de
classes chimiques a été mis en évidence. Grâce au Case Notebook®, il a été possible d’observer que
certaines classes chimiques étaient présentes sur le marché pendant plus de 3 ans. La longévité de ces
dernières est remarquable puisqu’à elle seule elle valide la notion de profilage par l’existence de
« stock » d’héroïne et de cocaïne de même profil chimique. En effet, du fait de la quantité de
stupéfiants distribué quotidiennement, s’il n’existait pas de quantités importantes d’héroïne possédant
des caractéristiques chimiques similaires, les liens seraient peu nombreux, vu la demande quotidienne
inhérente à ce type de produits que l’on peut estimer à une dizaine de kilogrammes d’héroïne et de
cocaïne.
De plus, les liens chimiques apparaissaient souvent entre saisies effectuées dans des cantons
différents. Ceci trouve une explication plausible en observant la dynamique suisse
d’approvisionnement en produits stupéfiants (cf. Figure 12 et Figure 13) ou les grandes villes
stratégiques (Zürich, Berne, Bâle et Lugano) concentrent les zone de stockage principaux. L’héroïne et
la cocaïne (concernant ce type de stupéfiant, on peut ajouter Genève comme plaque tournante du
trafic) proviennent donc de ces centres névralgiques ou y sont étroitement associés. Ainsi, afin
d’obtenir des informations complètes et utilisables tant d’un point de vue stratégique qu’opérationnel,
il serait nécessaire d’avoir accès aux données des saisies effectuées dans ces régions clé.

Dès lors, se pose la question récurrente de l’harmonisation des méthodes analytiques. En effet,
si l’on désire actuellement comparer chimiquement une saisie de produits stupéfiant effectuée à Zurich
ou à Bâle avec une saisie analysée à l’IPS, il est nécessaire de faire un nouvel examen complet de ces
échantillons en utilisant la méthodologie actuellement en place dans notre laboratoire. Cette
problématique est importante car la différence au niveau de l’instrumentation et des méthodes
analytique utilisées dans les divers laboratoires rendent incomparable les données à disposition ne
permettant pas leur utilisation d’une manière opérationnelle. Il est certes envisageable de sélectionner
un nombre de laboratoires et leur proposer une systématique analytique, cependant en multipliant les
sites, il devient très difficile de sensibiliser les divers intervenants quant aux buts poursuivis. Toute
une série de critères mis en évidence dans ce travail, comme la préparation de l’échantillon
(homogénéisation), le choix de la méthode et de l’appareil [Aalberg et al., 2001], sont des conditions
critiques qu’il faut absolument contrôler et maîtriser. En multipliants le nombre d’intervenant, on
augmente les problèmes relatifs à une harmonisation des conditions méthodologiques. De ce fait, il
semble important de mettre en place une gestion supra cantonale voire nationale. La mise sur pied
DISCUSSION GÉNÉRALE DES RÉSULTATS 194

d’un laboratoire central devrait minimiser les problèmes mis en exergues en réunissant l’infrastructure
analytique ainsi que le personnel employé. Intuitivement, il semble plus aisé d’assurer la qualité
nécessaire au profilage (contrôle des conditions analytiques, extractions des variables pertinentes,…)
ainsi que la sensibilisation à la problématique dans une entité unique plutôt que dans un système
multiple.

Afin de mieux comprendre les organisations criminelles responsables du trafic de stupéfiants,


ainsi que les besoins des trafiquants en produits de coupage, il avait été question d’analyser des saisies
d’héroïne et de cocaïne effectuées aux frontières. Dans le cadre de ce travail, il a été jugé peu pertinent
de continuer les investigations dans cette direction du fait du nombre restreint de telles saisies
effectuées par les gardes-frontière. En effet sur une période de deux ans, soit sur un total de 7000
saisies enregistrées dans toute la Suisse, plus de 80 % concernent des produits cannabiques et seul
environ 4% représentent des saisies de cocaïne et respectivement 3% des saisies d’héroïne. De plus,
dans plus de deux cas sur trois ces saisies d’héroïne et de cocaïne ont un poids inférieur à 10 grammes.
Ces dernières semblent donc plus être du ressort de la consommation personnelle que l’œuvre
d’organisation criminelle.

10.6. Perspective
Les buts de ce travail relatif au profilage de produits stupéfiants sont de préparer le terrain à
une implantation plus systématique des résultats obtenus dans un contexte d’actions opérationnelles.
Les réponses apportées aux différentes questions concernant la mise en place d’une stratégie de
profilage ont trouvé des réponses satisfaisantes et préparent la voie à la phase d’intégration
méthodologique. Des recherches doivent encore être effectuées quant à la manière d’intégrer ces
résultats dans un environnement d’informations policières. Il s’agira entre autre de déterminer quelles
hypothèses ces liens chimiques nous permettent d’émettre. Lors de ces travaux, il y a fort à parier que
de nouvelles questions vont être soulevées, comme par exemple celles relatives à l’information
véhiculée par d’autres types de liens tels que ceux fourni par l’adultération (qui fait l’objet d’une autre
étude à l’IPS).

Comme décrit dans le chapitre précédent, la problématique la plus importante à relever


consiste en la mise sur pied d’une infrastructure à même de gérer cette nouvelle information tant à un
niveau régional que national. Il existe plusieurs possibilités de mener à bien une telle entreprise. Par
exemple il serait envisageable de mettre sur pied une structure similaire à celle développée dans
d’autres secteurs. Cette entité de coordination a ainsi déjà été créée dans le domaine des cambriolages.
Suite aux recherches menées par les Dr. O. Ribaux [Ribaux, 1997] et F. Taroni [Taroni, 1996] qui ont
montré le potentiel important d’une gestion systématique et cohérente de l’information récoltée dans le
cadre des cambriolages, il a été décidé de mettre en place une unité à même de tirer parti de ces
données souvent négligées. Il ressort au niveau des résultats obtenus jusqu’à présent dans le domaine
du profilage des produits stupéfiants qu’un potentiel informatif important à plusieurs égards transparaît
et donnerait une information importante et pertinente pour comprendre/appréhender l’une des
DISCUSSION GÉNÉRALE DES RÉSULTATS 195

criminalités les plus importantes et des plus organisées (liées à des conflits, de la criminalité
économique et à des organisations criminelles puissantes). On pourrait donc envisager la mise en place
d’une infrastructure comparable en charge soit des cantons, ou chapeauté par la police fédérale. Ceci
d’autant plus que depuis l’entrée en vigueur le 1er janvier 2002 de l’article 340bis du code pénal Suisse
la juridiction fédérale est compétente pour traiter les infractions décrites à l’article 260ter relatif aux
organisations criminelles, dont le trafic de stupéfiants fait partie intégrante.
Idéalement, l’insertion de la notion de classe chimique au sein de la base de données JANUS
qui est actuellement gérée par la confédération et à disposition des cantons serait optimale. En effet,
chaque saisie de produits stupéfiants correspond à une personne qui est répertoriée dans le système en
question. Dès lors, si cette dernière était en possession de produits stupéfiants appartenant à une classe
chimique X, cette information pourrait être insérée dans la base. L’enquêteur pourrait ainsi vérifier si
cette classe chimique est déjà répertoriée dans la mémoire du système et, si tel est le cas, relier son
affaire à d’autres par l’intermédiaire d’un lien au niveau du produit stupéfiant.

.
CONCLUSION 196

11. CONCLUSION
CONCLUSION 197

11.1. Conclusion
L’usage de psychotropes est universel ; dans chaque culture et à chaque période de l’histoire,
ils ont été utilisés pour influencer les humeurs, stimuler les rêves, donner du courage, rechercher de la
détente ou une excitation. Pendant longtemps, ils ont été le monopole d’un savoir mystique ou médical
en main d’une élite initiée à leur utilisation. A partir du XIXe siècle, les stupéfiants naturels ont connu
une mutation suivant le processus de la révolution industrielle occidentale. Depuis, ils ont été
transformés chimiquement pour être consommés de manière massive et parfois même ont été
remplacés par des produits de synthèse (amphétamines et analogues). Les psychotropes se sont
multipliés s’éloignant toujours plus du contexte et des rituels qui avaient donné naissance à leur usage.
A l’heure actuelle, la problématique du trafic de stupéfiants connaît auprès des services de
renseignements et des décideurs un regain d’intérêt important et ceci principalement depuis le 11
septembre 2002, suite aux attentats du World Trade Center. En effet, il semble établi qu’il existe des
liens entre le trafic illicite de stupéfiants et le terrorisme international. Ce trafic serait l’une des
principales sources de financement de ces organisations criminelles. Des efforts importants ont été
consentis principalement par les USA (par l’intermédiaire du DEA) et les Nations Unies (par
l’intermédiaire de UNODC, l’United Nation Office on Drug and Crime) pour fournir une image
internationale des tendances du trafic de produits stupéfiants (les voies de distribution) ainsi que des
principaux pays producteurs. Une approche stratégique a ainsi été mise en place déterminant
principalement au niveau analytique la source des produits stupéfiants. Cette information, combinée
aux données des services de renseignements douaniers et policiers internationaux, permet la
détermination des routes de distribution de ces substances ainsi que les évolutions de ces dernières
pour s’adapter aux diverses mutations de notre monde, qu’elles soient géographiques ou culturelles.
Cette vision permet, à ces organes puissants politiquement d’exercer des pressions politiques envers
ces états impliqués activement dans ce trafic illicite afin d’influencer leur politique de lutte en matière
de stupéfiants.

L’impact politique de la Suisse n’est évidement pas comparable à celui d’une grande
puissance. C’est dans ce contexte particulier que cette recherche a été effectuée. Plus spécifiquement,
il a été décidé de mettre en place un processus axé sur une action opérationnelle, utilisable directement
par les brigades stupéfiants des organes locaux de poursuites pénales (brigades stupéfiants,
magistrats,..). Premièrement, l’aspect profilage, incluant les méthodes analytiques, statistiques et
informatiques a été testés et développés afin de comprendre la mise en évidence rapide de liens entre
échantillons de stupéfiants. Le défi consistait à gérer ces liens chimiques d’une manière cohérente tout
en offrant la possibilité d’une visualisation optimale de la configuration de ces derniers, indispensable
à l’interprétation et la distribution de cette information.

Le prototype mis en place s’est révélé efficace et a permis de gérer des volumes importants
d’échantillons (environ 5000 échantillons d’héroïne et 2800 de cocaïne). Les résultats prometteurs ont
été confirmés et utilisés par les organes judiciaires. L’étape suivante devrait se focaliser sur
CONCLUSION 198

l’implémentation de ce modèle de manière plus systématique. Néanmoins, il faut être conscient que
cette phase n’est pas aisée. Ne serait-ce que du point de vue de la standardisation des méthodes
analytiques, qui posent déjà de nombreux problèmes. Si la même substance est analysée dans le même
laboratoire et sur deux machines de même marque, il n’est pas facile d’obtenir des résultats
comparables. Il est souvent nécessaire d’effectuer une standardisation rigoureuse sans quoi les
résultats diffèreront sensiblement rendant tout profilage illusoire. La problématique s’intensifie encore
si l’on considère que des analyses peuvent se faire dans des laboratoires différents possédants des
appareils différents. Certain dirons que la solution réside dans une centralisation des analyses, mais sur
ce point d’autres problématiques, de nature principalement politique, apparaissent même si aucun
organe d’analyse n’a, à ce jour, envisagé une utilisation systématique des informations matérielles
telle que nous la préconisons. Elle sera pourtant abordée dans le cadre d’un projet transfrontalier avec
la France voisine.
199
BIBLIOGRAPHIE 200

12. BIBLIOGRAPHIE
BIBLIOGRAPHIE 201

12.1. Bibliographie

[Aalberg et al., 2001] Aalberg L., Anderson K., Ballany J., Bertler C., Caddy B., Cole M. D., Dahlén
J., Dujourdy L., Finnon Y., Huizer H., Janhunen K., Kaa E., Kopp I., Lock E., Lopes A.,
Margot P., Poortman A., Sippola E., "Development of a Harmonised Pan-European Method
for the Profiling of Amphetamines", Science and Justice, 41/3, pp. 193-196, 2001

[Afifi et Clark, 1996], Afifi A.A., Clark V., ″Computer-Aided Multivariate Analysis″, Chapman
&Hall, London, 1996

[Aitken et Lucy, 2002] Aitken C., Lucy D.″Estimation of the Quantity of a Drug in a Consignment
from Measurements on a Sample″, Journal of Forensic Sciences, 47/5, pp.968-975, 2002

[Allen et al.,1984] Allen A.C., Cooper D.A., Moore J.M., Gloger M., Neumann H, ″Illicit Heroin
Manufacturing By-products : Capillary Gas Chromatographic Determination and Structural
Elucidation of Narcotine-and Norlaudanosine-Related Compounds″, Analytical Chemistry,
vol. 56, pp. 2940-2947, 1984

[Anglada et al., 2002] Anglada F., Dujourdy L., Esseiva P., Du Pasquier E., Lennard C., Evans I. ″
Chemical Profiling of Heroin Blocks to Assist with the Development of a Statistically
Correct and Practical Sampling Procedure for Large Drug Seizures″ Rapport de stage,
communication interne, Institut de Police Scientifique et de Criminologie, Lausanne, 2002

[Baker et Gough, 1981] Baker P., Gough T. ″The Separation and Quantification of the Narcotics
Components of Illicit Heroin Using HPLC″, Journal of Chromatographic Science, 19, pp.
483-489, 1981

[Barnfield et al., 1988] Barnfield C., Burns S., Byrom D.L., Kemmenoe A.V., ″The Routine Profile of
Forensic Heroin Samples″, Forensic Science International, 39 , pp.107-117, 1988

[Baugh et Liu, 1991] Baugh L.D., Liu R.H, ″Sample Differentiation: Cocaine Example″, Forensic
Science Review, vol. 3, n°101, pp. 101-115, 1991

[Beebe et al., 1998] Beebe K., Pell R., Seasholtz M., ″Chemometrics : a Practical Guide″, Wiley,
New-York, 1998

[Besacier et al., 1997] Besacier F., Guilluy R., Brazier J.L., Chaudron-Thozet H., Girard J., Larnoue
A., ″Isotopic Analysis of 13C as a Tool for Comparison and Origin Assignment of Seized
Heroin Samples″, Journal of Forensic Sciences, 42/3, pp.429-433, 1997

[Bishop, 1995].Bishop C, ″Neural Networks for Pattern Recognition″, Oxford: University


Press, 1995

[Brewer et Allen, 1991] Brewer L.M, Allen A., ″N-Formyl Cocaine: A Study of Cocaine Comparison
Parameters″, Journal of Forensic Sciences, 36/3, pp. 697-707, 1991

[Brochmann-Hanssen et Svendsen, 1962] Brochmann-Hanssen E., Svendsen A. B., ″Gas


Chromatography of Alkaloids, Alkaloidal Salts, and Derivatives″, Journal of Pharmaceutical
Science, 51, pp. 1095-1105, 1962

[Bruneton, 1993] Bruneton, J., ″Pharmacognosie ,phytochimie, plantes médicinales″, Technique et


documentation – Lavoisier, 1993, Paris

[Cartier et al., 1997] Cartier J., Guéniat O., Cole M.D., ″Headspace Analysis of Solvents in Cocaine
and Heroin Samples″, Science and Justice, 37/3, pp. 175-181, 1997
BIBLIOGRAPHIE 202

[Casale, 1990] Casale J.F, ″Detection of Pseudoecgonine and Differentiation from Ecgonine in Illicit
Cocaine″, Forensic Science International, 47/3, pp. 277-287, 1990

[Casale, 1991] Casale J.F, ″N-Acetylnorcocaine: A New Cocaine Impurity from Clandestine
Processing″ , Journal of the Clandestine Laboratory Investigating Chemists Association, 1/4,
pp. 23-26, 1991

[Casale et Waggoner, 1991] Casale J.F, Waggoner R.W., ″A Chromatographic Impurity Signature
Profile Analysis for Cocaine Using Capillary Gas Chromatography″, Journal of Forensic
Sciences, 36/5, pp. 1312-1330, 1991

[Casale et Watterson, 1993] Casale J.F, Watterson J.W., ″A Computerized Neural Network Method
for Pattern Recognition of Cocaine Signatures″, Journal of Forensic Sciences, 38/2, pp. 292-
301, 1993

[Casale et Klein, 1993] Casale J.F, Klein R.F.X., ″Illicit Production of Cocaïne″, Forensic Science
Review, 5/2, pp. 95-107, 1993

[Casale et Moore, 1994] Casale J.F, Moore J.M., ″ 3’,4’,5’-Trimethoxy-Substituted Analogs of


Cocaine, Cis-/Trans-Cinnamoylcocaine and Tropacocaine : Characterization and
Quantitation of New Alkaloids in Coca Leaf, Coca Paste and Refined Illicit Cocaine″,
Journal of Forensic Sciences, 5/2, pp. 95-107, 1993

[Casale et Meyers, 1996] R.P., Casale J.F., Meyers R.P., ″The Stability of Cocaine in Agua/Rica″,
Microgram, vol. XXIX, n°7, pp. 175-178, 1996

[Casale et Moore, 1996a] Casale J.F, Moore J.M, ″Lesser Alkaloids of Cocaine Bearing Plants Part II.
3-Oxo-Substituted Tropane Esters : Detection and Mass Spectral Characterization of Minor
Alkaloids Found in South American Erythroxylum coca var. coca″, Journal of
Chromatography A, 749, pp. 173-180, 1996

[Casale et Moore, 1996b] Casale J.F, Moore J.M, ″Lesser Alkaloids of Cocaine-Bearing Plants Part
III. 2-carbomethoxy-3-oxo Substituted Tropane Esters : Detection and Gas
Chromatrographic-Mass Spectrometric Characterization of New Minor Alkaloids Found in
South American Erythroxylum coca var. coca″, Journal of Chromatography A, 756, pp. 185-
192, 1996

[Casale et al., 1998] Casale J.F, Moore J.M, Odeneal N.G, ″Comparative Determination of 2-
Carbomethoxy-3-Alkyloxy- and Heteroaroyloxy-Substituted Tropanes in Illicit South
American Cocaine Using Capillary Gas Chromatography Single Ion Monitoring″, Journal of
Forensic Sciences, 43/1, pp. 125-132, 1998

[Cashman et Thornton, 1972] Cashman P.J., Thornton J.I., ″High Speed Liquid Adsorption
Chromatography in Criminalistics. II. The Separation of Heroin, O6-Monoacetylmorphine
and Morphine″, Journal of the Forensic Science Society, 12, pp. 417-420, 1972

[Chiarotti et al., 1983] Chiarotti M., Carnevale A., De Giovanni N., ″Capillary Gas Chromatography
Analysis of Illicit Diamorphine Preparations″, Forensic Science International, 21, pp. 245-
252, 1983

[Chiarotti et al., 1991] Chiarotti M., Fucci N., Furnari C., ″Comparative Analysis of Illicit Heroin
Samples″, Forensic Science International, 50/1, pp. 47-55, 1991

[Clark, 1978] Clark C.C., ″Cocaine Comparison Parameters″, Micrograms, 11, pp. 184-187, 1978
BIBLIOGRAPHIE 203

[Coulson et al., 2001] Coulson S., Coxon A., Buckleton J., ″How Many Samples from a Drug Seizure
Need to Be Analyzed ″, Journal of Forensic Sciences, 46/6, pp. 1456-1461, 2001

[Cooper et Allen, 1984] Cooper D.A, Allen A.C., ″Synthetic Cocaine Impurities″, Journal of Forensic
Sciences, 29/4, pp. 1045-1055, 1984

[DEA Resources 1998-2003] Drug Enforcement Administration, For Law Enforcement Officers,
Intelligence Reports, WWW.DEA.GOV, 1998-2003

[Demedts et al., 1983] Demedts P., VanDerVerren J., Heyndrickx A., ″Recent Developments in GC
Column Technology. An Illustration of Its Interest in Forensic Toxicology″, Forensic
Science International, 23, pp.137-142, 1983

[Derde and Massart, 1982], Derde M., Massart D., ″Extraction of Information from Large Data Sets by
Pattern Recognition″, Fresenius Z Analytical Chemistry, 313, pp. 484-495, 1982

[Dreyfus et al, 2002], Dreyfus J-M., Martinez M., Samuelides M., Gordon F., Badran F., Thiria S.,
Hérault L., ″Réseaux de neuronnes″, Editions Eyrolles, 2002, Paris

[Dujourdy et al., 2003] Dujourdy L., Barbati G., Taroni F, Guéniat O., Esseiva P., Anglada F., Margot
P., “Evaluation of Links in Heroin Seizures”, Forensic Science International, 131, pp. 171-
183, 2003

[Esseiva et Guéniat, 1997] Esseiva P.and Guéniat O., ″The Concept of Drug Intelligence in Heroin
Investigation: The problem of the Evaluation of a Sequence of Analysis and a Scheme of
Interpretation for Court Purposes″, 1st European Meeting of Forensic Science, Lausanne,
Switzerland, 17-19 september, 1997

[Esseiva et al, 2003a] Esseiva P., Anglada F., Dujourdy L., Taroni F., Margot P, ″ A Methodology for
Illicit Heroin Seizures Comparison in a Drug Intelligence Perspective Using Large
Databases″, Forensic Science International, 132, pp.139-152, 2003.

[Esseiva et al., 2003b] Esseiva P., Anglada F., Dujourdy L., Taroni F., Margot P, Du Pasquier E.,
Dawson M., Roux C., Doble P, ″ Chemical Profiling and Classification of Illicit Heroin by
Principal Component Analysis, Squared Cosine Function and Artificial Neural Network″
Forensic Science International, 2003, accepted

[Gittins, 1985], Gittins R., ″Canonical Analysis. A Review with Applications in Ecology″, Springer-
Verlag, Berlin Heidelberg, 1985

[Gloger et Neumann, 1983] Gloger M. et Neumann H., ″Analysis of Heroin Samples by Capillary Gas
Chromatography. Comparison of Glass Capillary Column and Packed Column″, Forensic
Science International, 22, pp. 63-74, 1983

[Guéniat et Esseiva 2002] Guéniat O., Esseiva P., ″Histoire, production et trafic de la cocaïne″,
Dépendances, No 18, pp. 4-12, 2002

[Guéniat, 2003] Guéniat, O., ″L’établissement et la notion de liens dans l’analyse d’échantillons de
cocaïne et d’héroïne″, Thèse de doctorat, Institut de Police Scientifique et de Criminologie,
Lausanne, PPUR, 2003 à paraître

[Huizer, 1988] Huizer, H., ″Analytical Studies on Illicit Heroin″, Thèse de doctorat, Forensic science
Laboratory of the Ministry of Justice, Rijswijk, Netherlands, 1988
BIBLIOGRAPHIE 204

[Huizer, 1994] Huizer H., ″A Contribution to Comparison″, Forensic Science International, 69, pp. 17-
22, 1994

[Janzen, 1987] Janzen K.E, ″Cross-Matching of Cocaine Samples. A Case Study″, Canadian Society
of Forensic Science Journal, 20/2, pp. 77-82, 1987

[Janzen et al., 1992] Janzen K.E., Walter L., Fernando A.R., ″Comparison Analysis of Illicit Cocaine
Samples″, Journal of Forensic Sciences, 37/2, pp. 436-445, 1992

[Janzen et al., 1994] Janzen K.E, Fernando A.R., Walter L., ″A Database for Comparison Analysis of
Illicit Cocaine Samples″, Forensic Science International, 69, pp. 23-29, 1994

[Johnston et King, 1998] Johnston A., King L.A., ″Heroin profiling : Predicting the Country of Origin
of Seized Heroin″, Forensic Science International, 95, pp. 47-55, 1998

[Jonson et Strömberg, 1993] Jonson C.S.L., Strömberg L., ″Computer Aided Retrieval of Common-
Batch Members in Leuckart Amphetamine Profiling″, Journal of Forensic Sciences, 38/6, pp.
1472-1477, 1993

[Jonson et Strömberg, 1994] Jonson C.S.L., Strömberg L, ″Two-level classification of Leuckart


amphetamine″, Forensic Science International, 69, pp.31-44, 1994

[Kaa et Bent, 1986] Kaa E., Bent K., ″Impurities, Adulterants and Diluents of Illicit Heroin in
Denmark″, Forensic Science International, 31, pp. 195-210, 1986,

[Kaufmann et Rousseeuw, 1990] ″Finding Groups in Data : an Introduction to Cluster Analysis″,


Wiley, New-York, 1990

[Keto, 1989] Keto R.O., ″Comparison of Smokeless Powders by Pyrolysis Capillary Gas
Chromatography and Pattern Recognition″, Journal of Forensic Sciences, 34/1, pp. 74-82,
1989

[Killeen et al., 1980] Killeen T. J., Eastwood D., Hendrick M. S., ″ Oil-matching by Using a Simple
Vector Model for Fluorescence Spectra ″, Talanta, 26, pp. 1-6,1980

[Kingston, 1992] Kingston C., ″Neural Networks in Forensic Sciences″, Journal of Forensic Sciences,
37, pp. 252-264, 1992

[Klemenc, 2000] Klemenc S., ″Noscapine as an Adulterant in Illicit Heroin Samples ″, Forensic
Science International, 2000,108, pp. 45-49.

[Klemenc, 2001] Klemenc S., ″In Common Batch Searching of Illicit Heroin Samples – Evaluation of
Data by Chemometrics Methods ″, Forensic Science International, 2001,115, pp. 43-52.

[Koutouzis et Perez, 1996] Koutouzis M., Perez P. ″Atlas mondial des drogues″, Presse Universitaires
de France, Paris, 1996

[Kumar et Kiser, 1995] Kumar A., Kiser W.O., ″Identification and Quantitation of Norcocaine in
Illicit Cocaine Samples″, Journal of Forensic Sciences, 40/3, pp. 464-466, 1995

[Labrousse et Koutousis, 1996] Labrousse A., Koutouzis M., ″Géopolitique et Géostratégies des
Drogues″, Ed. Economica, Paris, 1996
BIBLIOGRAPHIE 205

[Law et al., 1983] Law B., Joyce J.R, Bal T.S, Goddard C.P., Japp M., Humphreys I.J., ″The
Characterisation and Comparison of Illicit Heroin by Gas Chromatography and High-
performance Liquid Chromatography″, Analytical Proceedings, 20, pp. 611-613, 1983

[LeBelle et al., 1988] LeBelle M., Lauriault G., Callahan S., Latham D., Chiarelli C., Beckstead H.,
″The Examination of Illicit Cocaine″, Journal of Forensic Sciences, 33/3, pp. 662-675, 1988

[Legendre P. et Legendre L., 1998] Legendre P., Legendre L. ″Numerical Ecology″, Elsevier, Second
English Edition, Amsterdam, 1998

[Lim et Chow, 1978] Lim H.-Y., Chow S.-T, ″Heroin Abuse and a Gas Chromatographic Method for
Determining Illicit Heroin Samples in Singapore″, Journal of Forensic Sciences, 23/2, pp.
319-328, 1978
[Moore, 1973] Moore J.M, ″Identification of cis- and trans-Cinnamoylcocaine in Illicit Cocaine
Seizures″, Journal of the Association of Official Analytical Chemists, 56, pp. 1199-1205,
1973

[Moore, 1974] Moore J.M, ″Gas Chromatographic Detection of Ecgonine and Benzoylecgonine in
Cocaine″, Journal of Chromatography, 101, pp. 215-218, 1974

[Moore et al., 1984] Moore J.M, Allen A.C., Cooper D.A., ″Determination of Manufacturing
Impurities in Heroin by Capillary Gas Chromatography with Electron Capture Detection
After Derivatization with Heptafluorobutyric Anhydride″, Analytical Chemistry, 56/4, pp.
642-646, 1984

[Moore et al., 1986] Moore J.M., Allen A.C., Cooper D.A., ″Determination of Neutral Manufacturing
Impurities in Heroin by Capillary Gas Chromatography with Electron Capture Detection
after Reduction with Lithium Aluminium Hydride and Derivatization with
Heptafluorobutyric Anhydride″, Analytical Chemistry, 58, pp. 1003-1007, 1986

[Moore et al., 1987] Moore J.M, Cooper D.A, Lurie I.S., Kram R.C., Carr S., Harper C., Yeh J.,
″Capillary Gas Chromatography-Electron Capture Detection of Coca-Leaf Related
Impurities in Illicit Cocaine: 2,4-Diphenylcyclobutane-1,3-Dicarboxylic Acids, 1,4-
Diphenylcyclobutane-2,3-Dicarboxylic Acids, and Their Alkaloidal Precursors, the
Truxillines″, Journal of Chromatography, 410, pp. 297-318, 1987

[Moore, 1990] Moore J.M, ″The Application of Chemical Derivatization in Forensic Drug Chemistry
for Gas and High-Performance Liquid Chromatography Methods of Analysis″, Forensic
Science Review, 2/2, pp. 79-124, 1990

[Moore et al., 1993a] Moore J.M, Cooper D.A., ″The Application of Capillary Gas Chromatography-
Electron Capture Detection in the Comparative Analyses of Illicit Samples″, Journal of
Forensic Sciences, 38/6, pp. 1286-1304, 1993

[Moore et al., 1993b] Moore J.M, Meyers R.P., Jimenez M.D., ″The Anatomy of a Cocaine
Comparison Case: A Prosecutorial and Chemistry Perspective″, Journal of Forensic
Sciences, 38/6, pp.1305-1325, 1993

[Moore et Casale, 1994] Moore J.M, Casale J.F, ″In-depht Chromatographic Analyses of Illicit
Cocaine and its Precursor, Coca Leaves″, Journal of Chromatography, 674, pp. 165-205,
1994

[Moore et al., 1995] Moore J.M, Casale J.F, Fodor G., A.B. Jones A.B., ″Detection and
Characterization of Cocaine and Related Tropane Alkaloids in Coca Leaf, Cocaine, and
Biological Specimens″, Forensic Science Review, 7/2, pp.78-101, 1995
BIBLIOGRAPHIE 206

[Moore et al., 1996] Moore J.M, Casale J.F, Cooper D.A., ″Comparative Determination of Total
Isomeric Truxillines in Illicit, Refined, South American Cocaine Hydrochloride using
Capillary Gas Chromatography Electron Capture Detection″, Journal of Chromatography ,
756, pp. 193-201, 1996

[Moore et Casale, 1997] Moore J.M, Casale J.F, ″Lesser Alkaloids of Cocaine Bearing Plants Part I :
Nicotinoyl-,2’-Pyrroloyl, and 2’- and 3’-Furanolyecgonine Methyl Ester – Isolation and
Mass Spectral Characterisation of Four New Alkaloids of South American Erythroxylum
coca Var. coca″, Journal of Forensic Sciences, 42/2, pp. 246-255, 1997

[Moore et Casale, 1998] Moore J.M, Casale J.F, ″Cocaine Profiling Methodology – Recent
Advances″, Forensic Science Review, 10/1, pp. 13-45, 1998

[Morello et Meyers, 1995] Morello D.R., Meyers R.P., ″Qualitative and Quantitative Determination of
Residual Solvents in Illicit Cocaine and Heroin HCl″, Journal of Forensic Sciences, 40/6, pp.
957-963, 1995

[Myors et al., 2001] Myors R.B., Crisp P.T., Skopec S. V., Wells R.J., ″ Investigation of Heroin
Profiling Using Trace Organic Impurities″, Analyst, 126, pp. 679-689, 2001

[Narayanaswami et al., 1979] Narayanaswami K., Golani H.C., Dua R.D., ″Assay of Major and Minor
Constituents of Opium Samples and Studies of Their Origin″, Forensic Science International,
14, pp. 181-190, 1979

[Neumann et Gloger, 1982] H. Neumann, M. Gloger, ″Profiling of Illicit Heroin Samples by High-
Resolution Capillary Gas Chromatography for Forensic Application″, Chromatographia, 16,
pp. 261-264, 1982

[Neumann, 1994] Neumann H., ″Comparison of Heroin by Capillary Gas Chromatography in


Germany″, Forensic Science International, 69, pp. 7-16, 1994

[Office des Nations Unies pour le contrôle des drogues et la prévention du crime, 2002], Office des
Nations Unies pour le contrôle des drogues et la prévention du crime″ Tendances mondiales
des drogues illicites″, Publications des Nations Unies, New York, 2002

[O’Neil et al., 1984] O'Neil P.J, Baker P.B., Gough T.A., ″Illicit Imported Heroin Products: Some
Physical and Chemical Features Indicative of Their Origin″, Journal of Forensic Sciences,
29/3, pp. 889-902, 1984

[O’Neil et Gough, 1985] O'Neil P.J, Gough T.A., ″Illicitly Imported Heroin Products: Some Physical
and Chemical Features Indicative of Their Origin. Part II″, Journal of Forensic Sciences,
30/3, pp. 681-691, 1985

[O’Neil et Pitts, 1992] O'Neil P.J, Pitts J.E., ″Illicitly Imported Heroin Products (1984 to 1989): Some
Physical and Chemical Features Indicative of Their Origin″, Journal of Pharmacy and
Pharmacology, 44/1, pp. 1-6, 1992

[Perillo et al., 1994] Perillo B.A, Klein R.F.X, Franzosa E.S., ″Recent advances by the US Drug
Enforcement Administration in Drug Signature and Comparative Analysis″, Forensic
Science International, 69, pp. 1-6, 1994

[Perkal et al., 1994].Perkal M., Ng Y., Pearson J. ″Impurity Profiling of Methamphetamine in


Australia and the Development of a National Drugs Database″, Forensic Science
International, 69, pp. 77-87, 1994
BIBLIOGRAPHIE 207

[Ribaux, 1997] Ribaux, O., ″La recherche et la gestion des liens dans l’investigation criminelle : le cas
particulier du cambriolage″, Thèse de doctorat, Institut de Police Scientifique et de
Criminologie, Lausanne, 1997

[Saporta, 1990] Saporta G., ″Probabilités, analyse des données et statistiques″, Editions Technip,
Paris, 1990

[Selvin, 1998] Selvin S, ″ Modern Applied Biostatistical Methods Using S-Plus″, New York Oxford,
Oxford university Press, 1998

[Sobol et Sperling, 1975] Sobol S.P., Sperling A.R., ″A Comparison of Heroin Samples″, Forensic
Science, G. Davies Ed., American Chemical Society Symposium Series 13, Washington DC,
pp. 170-182, 1975

[Stead et al., 1991] A.H. Stead, P.G. Ashton, C.A. Owen, J.D. Partridge, M.D. Osselton, ″The
Profiling and Characterisation of Illicit Heroin Samples by Capillary Gas Chromatography″,
Central Research and Support Establishment, Home Office Forensic Science Service,
Aldermaston, Reading, Berkshire, RG7 4PN, pp. 1-42, 1991

[Strömberg, 1972] Strömberg L., ″Minor Components of Cannabis Resin. III. Comparative Gas
Chromatographic Analysis of Hashish″, Journal of Chromatography, 68, pp. 253-258, 1972

[Strömberg et Maehly, 1975] Strömberg L., Maehly A.C., ″Comparative Gas Chromatographic
Analysis of Narcotics III. Phenmetrazine Hydrochloride″, Journal of Chromatography, 109,
pp. 67-72, 1983

[Strömberg et al, 1983] Strömberg L., Bergkuist H., Edringsghe E. ″Comparative Gas
Chromatographic Analysis of Narcotics IV Methamphetamine Hydrochloride″, Journal of
Chromatography, 109, pp. 65-72, 1983

[Strömberg et al, 2000], Strömberg L., Lundberg L., Neumann H., Bobon B., Huizer H., Van
der Stelt N. ″Heroin Impurity Profiling. A Harmonization Study for Retrospective
Comparisons ″, Forensic Science International, 69, pp. 1-6, 1994

[Tanaka et al., 1994] Tanaka K., Takeshi O., Takako I., Sueshige S., ″Impurity Profiling Analysis of
Illicit Methamphetamine by Capillary Gas Chromatography″, Journal of Forensic Sciences,
39,2, pp. 500-511, 1994

[Taroni, 1996] Taroni, F., ″La recherche et la gestion des liens dans l’investigation criminelle : une
étape vers l’exploitation systématique des données de police″, Thèse de doctorat, Institut de
Police Scientifique et de Criminologie, Lausanne, 1996

[Thornton, 1975] Thornton J.I., ″The use of an Agglomerative Numerical Technique in Physical
Evidence Comparisons″, Journal of Forensic Sciences, 19, 4, pp. 873-883, 1975

[Vandeginste et al., 1998] Vandeginste B.M.G, Massart D.L., Buyden L.M.C., De Jong S., Lewi P.J.,
Smeyers-Verbeke J., ″Handbook of Chemometrics and Qualimetrics : Part B ″, Elsevier,
Amsterdam, 1998

[Wells et al., 1995] Wells R.J., Skopec S.V., Iavetz R., Robertson J., ″Trace Element Analysis of
Heroin by ICP-MS″, communication personnelle
BIBLIOGRAPHIE 208

[Zingg et al., 1998] Zingg Ch, Esseiva P., Margot P. “Les composantes de l’héroïne saisie par les
services de police – rapport intermédiare”, Recherches de l’OFSP en matière de
dépendances. 1996-98, volume 1 : recherche fondamentale.
UNIVERSITE DE LAUSANNE

FACULTE DE DROIT
ECOLE DES SCIENCES CRIMINELLES
INSTITUT DE POLICE SCIENTIFIQUE

LE PROFILAGE DE L’HEROÏNE ET DE LA COCAÏNE

MISE EN PLACE D’UNE SYSTEMATIQUE


PERMETTANT UNE UTILISATION
OPERATIONNELLE DES LIENS CHIMIQUES

CAHIER DES ANNEXES


Présentée à

l’Institut de Police Scientifique


de l’Université de Lausanne

Par

PIERRE ESSEIVA
Licencié en sciences forensique
de l’Université de Lausanne

2004
ANNEXE 1 1

Annexe 1
Constituants principaux de la
cocaïne et de l’héroïne
ANNEXE 1 2

Constituants principaux de la cocaïne

H3C COOCH3
H 3C COOCH3 H 3C N
N COOH
N
OH

H H
H
Anhydroecgonine méthyl ester (AME) Anhydroecgonine (AE) Ecgonine méthyl ester

O
H3C OH O H3C
N N

OH O O

H H O
Ecgonine Acide benzoïque Tropacocaïne

O O
H 3C O H3C O
N H H N H
O O
H
H O H O
Cis-cinnamoylecgonine méthyl ester Trans-cinnamoylecgonine méthyl ester

O
O O
H3C OH O
N H N

O O

H O H O
Benzoylecgonine (ecgonine benzoylester) N-formyl cocaïne
O
O
HN

H O
Norcocaïne
ANNEXE 1 3

Constituants principaux de l’héroïne

2
HO
1 CH3O
3

15 10
16
O 9 O
14 N CH3
H N CH3
6 H
8
HO
7 HO

Morphine Codéine (Methylmorphine)

CH3O
O

O N CH3
O
N CH3 H O O
H CH3O
H
CH3O
Noscapine (=narcotine) OMe
Thébaïne

OMe

CH3O

N
CH3O

OMe

Papavérine
OMe
ANNEXE 2 4

Annexe 2
Chromatogrammes de saisies
d’héroïne (différents pays)
d’origine géographique
connue
ANNEXE 2 5

Présentation des chromatogrammes des constituants majeurs


obtenus lors de l’analyse d’échantillons d’héroïne provenant
d’origine géographique connue.

Les chromatogrammes obtenus l’ont été par GC-FID en utilisant la méthode d’analyse des
constituants majeurs décrite dans cette recherche. Les saisies ont été mises à disposition par AGAL
(Australian Gouvernement Analytical Laboratory). L’origine géographique de ces saisies est garantie
puisqu’elles ont été effectuées sur le terrain par le DEA (Drug Enforcement Administration).

Chromatogramme typique d’une héroïne saisie en Suisse

Chromatogramme d’une héroïne provenant de Turquie


ANNEXE 2 6

Chromatogramme d’une héroïne provenant d’Inde

Chromatogramme d’une héroïne provenant du Mexique


ANNEXE 2 7

Chromatogramme d’une héroïne provenant de l’Asie du sud Ouest

Chromatogramme d’une héroïne provenant d’Amérique du Sud


ANNEXE 2 8

Chromatogramme d’une héroïne provenant d’Afghanistan

Chromatogramme d’une héroïne provenant du Pakistan


ANNEXE 2 9

Chromatogramme d’une héroïne provenant de Colombie

Chromatogramme d’une héroïne provenant d’Asie du sud Ouest


ANNEXE 2 10

Chromatogramme d’une d’héroïne provenant d’Asie du sud Est


ANNEXE 3 11

Annexe 3
Notions de base d’algèbre
matricielle
ANNEXE 3 12

Algèbre matricielle

Introduction
Le résumé ci-après a pour but de se familiariser avec quelques notions concernant les opérations
mathématiques que l’on peut effectuer sur des matrices. Ces dernières sont très importantes dans le
cadre du travail qui nous occupe puisque les différentes données à disposition sont souvent
représentées sous cette forme. Les informations synthétisées ci-dessous sont tirées pour la plus grande
partie de [Saporta, 1990], [Bronson., 1994] et [Legendre P. et Legendre L., 1998], [Esbensen, 2001].

Les matrices
Le tableau ci-dessous schématise une matrice que l’on rencontre souvent dans l’analyse des produits
stupéfiants. Les colonnes de la matrice sont construites par les descripteurs qui correspondent aux
variables (méconine, acétylcodéine, ecgonine,…) qui résultent de l’analyse. Les lignes sont construites
par les différents échantillons analysés.

Matrice de données dans le domaine des stupéfiants

DESCRIPTEUR

ECHANTILLON y1 (méconine) y2 (MAM) y3 (…) … yj … yp

x1 y11 y12 y13 … y1j … y1p


x2 y21 y22 y23 … y2j … y2p
x3 y31 y32 y33 … y3j … y3p
. . . . . .
. . . . . .
. . . . . .
xi yi1 yi2 yi3 … yij … yip
. . . . . .
. . . . . .
. . . . . .
xn yn1 yn2 yn3 … ynj … ynp

L’utilisation du calcul matriciel est très importante dans le domaine de l’analyse de produits
stupéfiants puisque la grande majorité des informations que nous récoltons est stockée sous forme de
matrices.

De plus, les techniques d’analyse multidimensionnelles, utilisées de plus en plus souvent pour
répondre aux besoins des chercheurs, font obligatoirement appel aux notions de matrices qui
permettent de conceptualiser et d’expliquer les notions mises en œuvre.

L’avènement de l’informatique a permis d’effectuer des calculs de plus en plus sophistiqués


permettant ainsi de résoudre les systèmes mathématiques complexes générés par les matrices.
ANNEXE 3 13

Une matrice est un tableau rectangulaire d’éléments disposés en lignes horizontales et colonnes
verticales, habituellement mis entre crochets. Une matrice peut être définie comme un ensemble
ordonné de n respectivement p nombres généralement représentés sous forme d’un tableau à n lignes
et p colonnes constitué de ces éléments.

La matrice Y est rectangulaire construite par des lignes et des colonnes remplies par des nombres yij

⎡ y11 y12 . . . y1 p ⎤
⎢y y 22 . . . y 2 p ⎥⎥
⎢ 21
⎢ . . ⎥
Y=⎢ ⎥
⎢ . . ⎥
⎢ . . ⎥
⎢ ⎥
⎣⎢ y n1 yn2 . . . y np ⎦⎥

Lorsque l’on demande l’ordre d’une matrice, on dit quelle est d’ordre (n × p ) .

En algèbre linéaire les nombres ordinaires sont appelés scalaires.

Matrices spéciales

Une matrice diagonale est une matrice dont tous les éléments n’étant pas dans la diagonale sont égaux
à0

⎡3 0 0⎤
⎢0 7 0 ⎥
⎢ ⎥
⎢⎣0 0 1⎥⎦

La matrice diagonale qui contient les valeurs venant du vecteur [x i ] est notée D( x ) . La matrice

diagonale des déviations standard est notée D(∂ ) et la matrice diagonale des valeurs propres D(λ ) est

notée Λ (la notion de valeurs propres sera définie par la suite). Une matrice diagonale où tous les
éléments sont constitués de 1 est une matrice unité ou une matrice identité.

⎡1 0 0 ⎤
⎢0 1 0 ⎥ = I
⎢ ⎥
⎢⎣0 0 1⎥⎦

Cette matrice joue le rôle de matrice neutre dans la multiplication.

Une matrice dont tous les éléments sont égaux à 0 est une matrice nulle ou une matrice 0
ANNEXE 3 14

Le transposé d’une matrice B de format (n × p ) est noté B ' qui est une nouvelle matrice de format

( p × n ) dans laquelle bij' = b ji . En d’autres termes, les lignes d’une matrice sont égales aux colonnes
de l’autre.

⎡1 2 3⎤
⎢4 5 6⎥
B=⎢ ⎥
⎢7 8 9⎥
⎢ ⎥
⎣10 11 12⎦

La transposée est donc

⎡1 4 7 10⎤
B = ⎢⎢2 5 8 11⎥⎥
'

⎢⎣3 6 9 12⎥⎦

La transposition est une opération très importante en algèbre linéaire puisqu’elle permet de calculer les
relations entre objets et suite à la transposition, les relations entre variables.

Une matrice carrée (2 × 2) , (3 × 3) qui est identique lorsqu’on la transpose, est une matrice
symétrique.

Vecteur et produit scalaire

⎡ b1 ⎤
⎢b ⎥
La matrice colonne est une matrice de type (1 × p ) : b = ⎢ ⎥
2

⎢ ... ⎥
⎢ ⎥
⎣bn ⎦

Les n nombres du vecteur constituent les coordonnées d’un point à n-dimension dans un espace
Euclidien qui peut être vu comme le point final d’une ligne partant de l’origine comme illustré par la
figure ci-dessous :
ANNEXE 3 15

(4,3)

En utilisant le théorème de Pythagore, il est aisé de calculer la norme du vecteur (4,3) qui est

42 + 32 = 5 . La norme d’un vecteur b est notée b .

Une opération importante consiste à normaliser un vecteur ; la normalisation s’effectue en divisant


chaque élément du vecteur par sa longueur. Ainsi la longueur d’un vecteur normalisé est égale à 1. La
généralisation de ce calcul pour le vecteur b est la suivante :

⎡ b / b 2 + b 2 + ... + b 2 ⎤ ⎡ b1 ⎤
⎢ 1 1
2
2
2
n
2
⎥ ⎢b ⎥
⎢b2 / b1 + b2 + ... + bn ⎥ 1 ⎢ 2⎥
⎢ ⎥ =
... 2 2 2 ⎢ ... ⎥
⎢ ⎥ b1 / b1 + b2 + ... + bn ⎢ ⎥
⎢⎣bn / b12 + b22 + ... + bn2 ⎥⎦ ⎣bn ⎦
ANNEXE 3 16

Addition, soustraction et multiplication de matrices

L’addition de deux matrices ne peut s’effectuer qu’avec des matrices de même ordre qui peuvent être
additionnées. L’addition des matrices est associative et commutative, l’élément neutre est la matrice 0

A + (B + C) = (A + B ) + C et A + B = B + C

Exemple :

⎡ 1 5 25⎤ ⎡ 2 4 5⎤ ⎡ 3 9 30⎤
⎢14 3 3 ⎥ + ⎢ 4 5 0⎥ = ⎢18 8 3 ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢⎣23 12 5 ⎥⎦ ⎢⎣53 4 3⎥⎦ ⎢⎣76 16 8 ⎥⎦

La soustraction de deux matrices se définit de la même manière que l’addition. Les deux matrices
doivent être de même ordre et il suffit de soustraire les éléments correspondants.

Le produit scalaire de deux vecteurs ayant le même nombre d’éléments s’écrit de la manière suivante :

⎡ c1 ⎤
⎢c ⎥
[ ]
bc = b • c = b1b2 ...b p ⎢ ⎥ = b1c1 + b2 c 2 + ... + b p c p = un scalaire
1

⎢ ... ⎥
⎢ ⎥
⎢⎣c p ⎥⎦

La multiplication matricielle est associative et distributive par rapport à l’addition et à la soustraction.


En général, elle n’est pas commutative. Ainsi :

A (B + C) = (AB ) C A (B + C) = AB + AC (B - C)A = BA − CA
mais en général, AB ≠ BA . De plus, (AB ) = B ' A '
'

En géométrie analytique, on peut montrer que le produit scalaire de deux vecteurs obéit à la relation
suivante :

b • c = (norme de b ) × (norme de c ) × cosθ

Il ressort de cette formule que deux vecteurs dont le produit scalaire est égal à 0 sont orthogonaux.
ANNEXE 3 17

Déterminant
Le déterminant d’une matrice carrée B noté B , est un scalaire. Si l’on écrit cette matrice sous forme

d’un tableau d’éléments, alors on représente son déterminant en remplaçant les crochets par des lignes
verticales.
Le déterminant d’une matrice d’ordre 2 est calculé de la manière suivante :

b11 b12
B = = b11b22 − b12 b21
b21 b22

On calcule les déterminants des matrices n × n , avec n > 2, par le processus suivant de réduction et de
développement utilisant les mineures et les cofacteurs.

La mineure M ij d’une matrice B d’ordre n est le déterminant de la sous-matrice d’ordre n − 1

obtenue après suppression de la i ème ligne et de la j ème colonne de B .


L’exemple suivant illustre le calcul de ces mineures:

⎡0 1 2 ⎤
B = ⎢⎢3 4 5⎥⎥
⎢⎣6 7 8 ⎥⎦

4 5
M 11 = = 4(8) − 5(7 ) = −3
7 8
0 1
M 23 = = 0(7 ) − 1(6) = −3
6 7
1 2
M 31 = = 1(5) − 2(4) = −3
4 5

On définit le cofacteur Bij d’une matrice B d’ordre n en fonction de la mineure associée par

Bij = (− 1)
i+ j
M ij

Alors, quel que soit i ou j (i, j=1,2,…,n),

n n
B = ∑ aik Aik = ∑ a kj Akj
k =1 k =1

L’exemple suivant illustre le calcul :


ANNEXE 3 18

⎡ 2 3 4⎤
A = ⎢⎢− 5 5 6⎥⎥
⎢⎣ 7 8 9 ⎥⎦

A = a11 A11 + a12 A12 + a13 A13

2(− 1) {5(9) − 6(8)} + 3(− 1) {(− 5)(9) − 6(7 )} + 4(− 1)4 {(− 5)(8) − 5(7 )} = −45
2 3

Le rang de la matrice
Le rang d’une matrice est défini comme le nombre de lignes ou de colonnes linéairement
indépendantes que l’on retrouve dans la matrice

⎡− 1 1 1 ⎤
⎢ 3 0 − 2⎥
⎢ ⎥
⎢⎣ 4 1 − 3⎥⎦

(-2 X colonne 1)= colonne 2 + (3 X colonne 3)


ou ligne 1 = ligne 2 – ligne 3
rang = 2

Inversion de matrice
En algèbre matricielle, la division de C par B n’existe pas. L’opération équivalente consiste à
multiplier C par l’inverse ou la matrice réciproque de B. L’inverse la matrice B est noté B-1.
La matrice B-1 doit être unique et la relation B B-1 = B-1 B = I

Vecteur propre, valeur propre


Les données que nous avons à analyser sont constituées d’un grand nombre de variables qui sont
corrélées les unes par rapport aux autres. L’idée de base qui prédomine dans certaines méthodes
d’analyses de données consiste à réduire ces variables corrélées en un petit nombre de « composites »
linéairement indépendants expliquant chacun une partie de la variation initiale. Mathématiquement, le
problème peut être formulé de la manière suivante : pour une matrice carrée A , il faut trouver une
matrice diagonale qui est équivalente à A .
ANNEXE 3 19

⎡ a11 a12 ... a1n ⎤


⎢a a 22 ... a 2 n ⎥⎥
A = ⎢ 21
⎢ ... ... ... ... ⎥
⎢ ⎥
⎣ a n1 an2 ... a nn ⎦

Dans la nouvelle matrice Λ tous les éléments en dehors de la diagonale sont nuls :

⎡λ11 0 0 ⎤
⎢0 λ22 .... 0 ⎥⎥
Λ=⎢
⎢ ... ... ... ... ⎥
⎢ ⎥
⎣0 0 λnn ⎦

La nouvelle matrice est appelée matrice des valeurs propres (eigenvalues). Les nouvelles variables
dont les associations sont décrites dans la matrice Λ sont linéairement indépendantes les unes des
autres. L’utilisation de la lettre grecque λ pour représenter les valeurs propres est expliquée par le fait
que ces valeurs propres sont des multiplicateurs de Lagrange. La matrice Λ est appelée la forme
canonique de la matrice A .

Calcul des valeurs propres


Un vecteur colonne non nul u i est un vecteur propre (à droite) d’une matrice carrée A s’il existe un

scalaire λ tel que


Au i = λu i

λ est alors une valeur propre de A.

Cette équation peut être réécrite de la manière suivante :

Au i − λu i = 0 (différence entre deux vecteurs)

et le vecteur u i peut être mis en évidence, ce qui donne :

u i (A − λI ) = 0

De par la nature des éléments, il est nécessaire d’introduire une matrice unité I à l’intérieur de la
parenthèse permettant d’effectuer la différence de deux matrices carrées. Il en ressort donc qu’en
multipliant la matrice carrée (A − λI ) par le vecteur colonne u i , on obtient le vecteur colonne nul
(0).

Si u i est lui-même un vecteur nul l’équation précédente peut être écrite comme :

A - λi I = 0
ANNEXE 3 20

Cette équation est connue comme étant l’équation caractéristique.


Exemple numérique :
Soit la matrice suivante :

⎡ 2 2⎤
A=⎢ ⎥
⎣2 5⎦

déterminer l’équation caractéristique


il est possible d’écrire :

⎡ 2 2⎤ ⎡1 0 ⎤
⎢ 2 5 ⎥ − λ ⎢0 1 ⎥ = 0
⎣ ⎦ ⎣ ⎦

d’où

⎡ 2 2 ⎤ ⎡λ 0 ⎤
⎢2 5⎥ − ⎢ 0 λ ⎥ = 0
⎣ ⎦ ⎣ ⎦

et enfin

2−λ 2
2 5−λ

en développant la matrice on trouve :

(2 − λ )(5 − λ ) − 4 = 0
ce qui donne

λ 2 − 7λ + 6 = 0
La résolution de cette équation nous donne les deux valeurs propres de A qui sont :

λ1 = 6 et λ2 = 1

L’ordre des vecteurs propres est arbitraire. Il est alors possible de calculer les vecteurs propres u 1 et

u 2 correspondant aux valeurs propres. Les équations sont les suivantes :

⎛ ⎡2 2⎤ ⎡1 0⎤ ⎞ ⎡u11 ⎤ ⎛ ⎡2 2⎤ ⎡1 0⎤ ⎞ ⎡u12 ⎤
⎜⎢ − ⎟ = ⎜⎢ ⎟
6 ⎢
⎜ 2 5 ⎥ ⎢0 1 ⎥ ⎟ u ⎥ 0 et
⎜ 2 5⎥ − 1⎢0 1⎥ ⎟ ⎢u ⎥ = 0
⎝⎣ ⎦ ⎣ ⎦ ⎠ ⎣ 21 ⎦ ⎝⎣ ⎦ ⎣ ⎦ ⎠ ⎣ 22 ⎦
ANNEXE 3 21

⎡− 4 2⎤ ⎡u11 ⎤ ⎡1 2⎤ ⎡u12 ⎤
⎢ 2 1 ⎥ ⎢u ⎥ = 0 et ⎢ ⎥⎢ ⎥ = 0
⎣ ⎦ ⎣ 21 ⎦ ⎣2 4⎦ ⎣u 22 ⎦

ce qui revient à résoudre les deux équations linéaires suivantes :

− 4u11 + 2u 21 = 0 1u12 + 2u 22 = 0
− 2u11 + 1u 21 = 0 2u12 + 4u 22 = 0

Ces équations linéaires sont toujours indéterminées. Pour palier à cette indétermination, une valeur
arbitraire par exemple u = 1 peut être assignée à chaque terme u de chaque groupe d’équations.

étant donné u11 = 1 u12 = 1

ll s’ensuit donc que − 4u11 + 2u 21 = 0 1u12 + 2u 22 = 0

deviennent − 4 + 2u 21 = 0 1 + 2u 22 = 0

de telle manière que u 21 = 2 u 22 = −1 / 2

les vecteurs propres u 1 et u 2 sont donc :

⎡1 ⎤ ⎡ 1 ⎤
⎢ 2⎥ et ⎢ − 1 / 2⎥
⎣ ⎦ ⎣ ⎦

Matrice de dispersion et de corrélation


La corrélation entre des variables y j découle du principe de covariance. La covariance est l’extension

du concept de variance. La variance est une mesure de la dispersion d’une variable aléatoire y j autour

de sa moyenne, elle est notée σ 2j . La covariance mesure la dispersion liée de deux variables aléatoires

y j et y k autour de leur moyenne et est notée σ jk . La matrice de dispersion Y appelée matrice ∑


formée des variances et covariances de p descripteurs.
⎡σ 11 σ 12 ... σ 1 p ⎤
⎢σ ... σ 2 p ⎥⎥
⎢ 21 σ 22
⎢ ... ... ... ... ⎥
∑=⎢ ⎥
⎢ ... ... ... ... ⎥
⎢ ... ... ... ... ⎥
⎢ ⎥
⎣⎢σ p1 σ p 2 ... σ pp ⎥⎦

Les éléments σ jk de la matrice ∑ sont formés des covariances entre toutes les paires des p variables

aléatoires.
ANNEXE 3 22

L’estimation de la variance de y j , notée s 2j est calculée à partir des variables centrées y ij − y j . La ( )


variance s 2j est calculée en utilisant la formule suivante :

n 2

∑ (y )
1
s 2j = ij − yj (Equation 1)
n −1 i =1

( )
Dans le même ordre d’idée, le calcul de la covariance s 2j de y j et y k est effectué en utilisant les

( )
variables centrées y ij − y j et ( y ik − y k ) en utilisant une formule de la « variance bivariée ». La

covariance est donc la suivante :


n

∑ (y )
1
s jk = ij − y j ( y ik − y k ) (Equation 2)
n −1 i =1

Lorsque k = j l’équation 2 est égale à l’équation 1. La racine carrée de la variance est appelée l’écart-

type ( σ j ). L’écart-type (donc la covariance) a l’avantage d’être mesuré sur la même échelle que les

données à l’inverse de la variance.


Contrairement à la variance (mesures concernant une variable) qui est toujours positive, la covariance
(mesures concernant deux variables) peut prendre toutes valeurs positives ou négatives. Afin de
comprendre la signification de la covariance prenons l’exemple que les objets à étudier sont
représentés dans un diagramme en points où les axes sont les descripteurs y j et y k . Une covariance

positive implique que la majorité des points est située dans les quadrants I et III. Ceci correspond à
une relation positive entre les deux descripteurs. L’inverse est vrai pour une covariance négative pour
laquelle la majorité des points est dans les quadrants II et IV. Dans le cas d’une covariance faible ou
nulle, les points sont distribués de manière équitable parmi les quatre quadrants du graphique. La
covariance mesure en quelque sorte leur association linéaire.
Enfin, dérivant directement des fonctions décrites précédemment et afin de déterminer leur
dépendance linéaire, il est utile d’introduire la notion de corrélation qui est la mesure la plus
communément utilisée en pratique.
La corrélation entre deux variables est calculée en divisant la covariance par le produit de leurs
déviations standard. La corrélation est une valeur sans unité. En général, c’est la mesure la plus utile
de l’indépendance entre deux variables. Le coefficient de corrélation de Pearson r , défini ci-dessous,
r 2 est souvent utilisé pour mesurer la fraction de la variance totale qui peut être modélisée par cette
mesure d’association linéaire. Ainsi le r est défini comme suit :

s jk ∑ (y
i =1
ij − y j )( y ik − y k )
r jk = =
s j sk n n

∑ (yij − y j )2 ∑ ( y ik − y k )2
i =1 i =1
ANNEXE 3 23

Comme pour la matrice de dispersion, il est possible de construire la matrice corrélation P (rho) dont
les éléments sont constitués des coefficients de corrélation linéaire ρ jk :

⎡ 1 ρ12 ... ρ1 p ⎤
⎢ρ 1 ... ρ 2 p ⎥⎥
⎢ 21
⎢ . . ... . ⎥
P=⎢ .⎥
⎢ . . ... . ⎥
⎢ . . ... . ⎥
⎢ ⎥
⎣⎢ ρ p1 ρ p2 ... 1 ⎦⎥

La matrice de corrélation est en fait la matrice de dispersion des variables standardisées. On peut
remarquer que les éléments de la diagonale de la matrice P sont égaux à 1. Ceci découle du fait que la
comparaison de n’importe quel élément avec lui-même est un cas de dépendance complète qui donne
une valeur de corrélation égale à 1.
Le coefficient de corrélation de Spearman est utilisé pour analyser des variables ne suivant pas une loi
normale, il s’agit donc d’un test non-paramétrique. Le r statistique de Spearman appelé ρ (rho) est
basé sur l’idée que des descripteurs apportent la même information (sont en parfaite corrélation) si les
rangs de chaque objet sont les mêmes pour les deux descripteurs.
L’exemple suivant illustre le calcul d’un coefficient de corrélation avec la méthode de Spearman:

Exemple numérique. Rangs de quatre objets en regard de deux descripteurs Y1 et Y2

Objets Rangs des objets pour 2 descripteurs


(valeurs observées) Y1 Y2
X1 3 3
X2 4 1
X3 2 4
X4 1 2

∑ (y
i =1
ij − y j )( y ik − y k )
r jk =
n n

∑ (y − yj) ∑ (y − yk )
2 2
ij ik
i =1 i =1

En introduisant les données numériques dans la formule ci-dessus avec les données de l’exemple ci-
dessus, on obtient le calcul suivant :

−2 −2
r12 = = = −0.4
5X 5 5
ANNEXE 3 24

Une corrélation parfaite serait de 1 lorsque tous les points sont alignés.
ANNEXE 4 25

Annexe 4
Description des bases de données
servant à l’extraction des valeurs
des constituants principaux ainsi
que des macros visual basic®
écrites pour la comparaison
d’échantillons
ANNEXE 4 26

Traitement des analyses chromatographiques

Introduction
Cette annexe présente la structure des différents outils (tableur excel ®, File Maker Pro ®) entrant en ligne de
compte dans l’analyse des produits stupéfiants et dans la gestion des informations mises en évidence.

Importation des données présentes sur le GC Perkin-Elmer


La première étape consiste à rapatrier les données analysées sur le chromatographe en phase gazeuse. Le
software gérant les opérations de l’appareil précité est le Turbochrom IV. Les résultats de ces analyses (dans
notre cas le temps de rétention de chaque pic et son aire) sont stockés sous des fichiers de type tx0.
L’idée consistait à extraire ces fichiers tx0 pour pouvoir les traiter sur le software Excel ® de chez Microsoft ®.
Comme un grand nombre d’analyse est effectué quotidiennement il fallait trouver un moyen d’automatiser la
procédure. Pour ce faire, il a été décidé de rapatrier ces données en utilisant le langage de développement visual
basic® de chez Microsoft ®.
L’architecture de cette importation de données peut être résumé de la manière suivante :

Bouton de démarrage
macro

Contrôler les temps de


rétention

Figure 1: Contrôle des temps de rétention, bouton démarrage de la macro.


ANNEXE 4 27

La première opération consiste à vérifier les temps de rétention des substances utilisées pour la comparaison.
Ensuite la macro peut être activée en pressant sur le bouton démarrage macro.
Une fois que l’on a pressé sur le bouton macro la boîte de dialogue suivante apparaît :

Zone d’entrée des


coordonnées
d’emplacement du
fichier à extraire

Bouton démarrant la macro


d’introduction des données
relatives à l’adultération

Bouton démarrant la macro


d’introduction des données
relatives aux constituants choisis
pour effectuer la comparaison

Bouton démarrant une macro de correction sur un ou plusieurs échantillons


lorsque la macro ne trouve pas l’aire d’un constituant (le temps de rétention n’a
par exemple pas été correctement contrôlé dans la première phase)
Bouton d’exportation des données pour
l’introduction dans la base de données
centrale sous File Maker Pro 5

Figure 2: Boîte de dialogue de l’importation des données.

Lorsque la macro d’introduction a été lancée (soit pour les constituants majeurs ou pour les adultérants), les
données relatives aux aires de chaque composé cible ont été introduites dans un classeur Microsoft Excel ®. Il
faut encore contrôler qu’aucune aberration ne se soit produite. Les données se présentent sous cette forme :
ANNEXE 4 28

Introduction pour chaque échantillon de l’aire de chaque substance cible

Figure 3: Exemple de l’introduction d’un échantillon.

Les données ainsi entrées ayant été contrôlées, il faut les exporter pour les introduire dans la base de données
centrale. Pour ce faire, il suffit de presser sur le bouton « Macro mise à jour ». Les fichiers .dif nécessaires sont
alors automatiquement créés.
La phase suivante consiste à compléter la base principale avec ces nouvelles données. La base de données se
présente sous la forme suivante :

Bouton
importer

Bouton
exporter

Figure 4: Base de données File Maker Pro 4 regroupant l’ensemble des échantillons.
ANNEXE 4 29

Pour importer les données, il suffit de cliquer sur le bouton importer. Le masque présenté ci-dessus permet
d’effectuer un certains nombres d’opérations. Dans un premier temps, il nous permet de trier les échantillons
quant à leur pureté en cocaïne ou diacétylmorphine, à leurs adultérations, à leur lieu de saisie,…. Ces tris sont
très utiles car dans certains cas ils nous permettent d’effectuer une première sélection avant l’exportation des
échantillons à comparer.
Une autre option de la base consiste à avoir inclus une rubrique lot de production et profil. Ces rubriques sont
rattachées à une base liée où tous les échantillons possédant un lien chimique (appartenance à une classe
chimique) sont répertoriés. Lorsqu’une valeur apparaît dans une des deux rubriques, il suffit de cliquer sur un
des carrés adjacents pour activer le fichier lié respectif. Cette option permet de se rendre compte très rapidement
si le prélèvement en question possède des liens chimiques et s’il appartient à une classe chimique.
La figure de la page suivante présente un exemple de ce qui est décrit ci-dessus

Figure 5: Base de données regroupant les liens entre les différents échantillons.
ANNEXE 4 30

Par la suite il s’agit d’exporter les échantillons que l’on veut comparer. Pour ce faire, on active le bouton
exporter. Il se crée alors un fichier exportTot.dif qui sera utilisé dans le classeur excel KetoHeroFinal001 pour
effectuer la comparaison.
Le fichier KetoHeroFinal001 se présente de la manière suivante :

Figure 6: Fichier de comparaison des échantillons.


A l’ouverture du fichier on se trouve en présence de ces quatre boutons. Le premier actionne la boîte de
dialogue suivante :

Figure 7: Boîte de dialogue d’introduction des données.

Il suffit d’entrer le nombre d’échantillons et de cliquer sur introduction, la macro se charge d’introduire les
échantillons et de les préparer à la comparaison (les valeurs sont normalisées à l’aire de la diacétylmorphine ou
de la cocaïne).
Le deuxième bouton effectue exactement le même travail. La différence réside dans le fait que les valeurs des
aires ne sont plus normalisées, mais elles sont remplacées par leur valeur de z-score. Lorsque l’on veut travailler
avec des valeurs ayant des unités différentes, il est nécessaire de transformer les valeurs en valeurs sans unités.
Pour ce faire on calcule la moyenne de la variable et son écart-type. On peut alors calculer la déviation absolue
de la moyenne, on obtient alors le z-score [Kaufmann et Rousseeuw, 1990].
ANNEXE 4 31

Lorsque les valeurs ont été introduites on peut alors passez à la comparaison. Il suffit alors de peser sur le
bouton comparaison et la boîte de dialogue suivante apparaît :

Figure 8: Boîte de dialogue pour la comparaison des données.


A ce stade, les 6 valeurs seuils sont entrées dans les cases supérieures pour fixer les critères de la comparaison.
Il ne reste plus qu’à entrer le N° de ligne du premier échantillon et du dernier échantillon et d’activer le bouton
comparaison pour lancer la macro. L’algorithme de comparaison est la fonction cosinus carré.

Une fois la comparaison effectuée il ne reste plus qu’à effectuer la dernière opération qui consiste à l’épuration
des résultats.

Figure 9: Epuration des résultats.


Pour lancer la macro, il faut entrer le nombre d’échantillon que l’on veut “épurer”. Deux boutons sont alors
atteignable, un effectuant une épuration dite de niveau 1 et l’autre une épuration dite de niveau 2. L’épuration de
niveau 1 et de niveau 2 sont complémentaires, il est donc conseillé de les effectuer les deux, l’une après l’autre.
L’activation de ces macros rend lisible de manière simplifiée le résultat de la comparaison. Pour ce faire, il
contrôle un à un tous les liens établis et regroupe tous les prélèvements et tous les échantillons liés
ANNEXE 4 32

Détail des macro Excel écrites en Visual Basic®

Détail de la macro d'extraction des données stockées sur le CPG Perkin Elmer écrite en Visual
Basic®
Private Sub CommandButton1_Click() Déclaration des variables
'macro impuretés
Dim echantillon As Integer
Dim fich As Variant
Dim repertoire As String
Dim No As Integer
Dim echantrech As String
Dim echantrech2 As String
Dim val1 As Variant
Dim val2 As Variant
Dim i As Integer
Dim c As Variant
val2 = "0"

For i = 1 To nbrechantillon.Text Début de la boucle pour introduire les échantillons


dans la base de données

Application.ScreenUpdating = False Permet d'accélérer le programme en n’affichant


If i < 10 Then plus les changements de fenêtre
val1 = "00"
Else Test pour attribuer la valeur à la variable val1
val1 = val2
End if

Windows("INTRO_hero.xls").Activate Activer le classeur INTRO_hero.xls


Sheets("hero-princ").Select Sélectionner la feuille hero-princ
Range("A3").Select Sélectionner la cellule A3
Selection.EntireRow.Insert Insérer une ligne permettant d'entrer les valeurs
d'un nouveau prélèvement
nbrechantillon.Text = echantillon Affectation d'une variable par une valeur contenue
repertoire = repertoir.Text dans une TetxBox elle-même présente dans la
fich = Fichier.Text Userform principale
echantrech = "D:\Gestion données PFS\héroïne\" & idem
repertoire & "\" & fich & val1 & (i) & ".tx0" idem
'resultat.Text = fich & (i) & ".tx0 Affectation de la variable echantrech. Il s'agit de
montrer le chemin d'accès pour ouvrir le dossier tx0
Fonction permettant d'ouvrir le fichier tx0 provenant
FileName = echantrech de l'analyse faite sur le GC Perkin Elmer
Workbooks.OpenText FileName:= _
echantrech, Origin:=xlMacintosh, _
StartRow:=1, DataType:=xlDelimited,
TextQualifier:=xlDoubleQuote, _
ConsecutiveDelimiter:=True, Tab:=True,
Semicolon:=True, Comma:=True, _
Space:=True, Other:=False, OtherChar:="1",
FieldInfo:=Array(Array(1, 1), _ Array(2, 1), Array(3, 1),
Array(4, 1), Array(5, 1), Array(6, 1))
ANNEXE 4 33

Range("B4").Select Copier des données présentes sur le fichier tx0 et


Application.CutCopyMode = False transfert dans la page traitement du classeur
Selection.Copy INTRO_hero.xls
Windows("INTRO_hero.xls").Activate
Sheets("traitement").Select
Range("A1").Select
Selection.PasteSpecial Paste:=xlValues,
Operation:=xlNone, SkipBlanks:= _
False, Transpose:=False
Windows(fich & val1 & (i) & ".tx0").Activate
Range("B8").Select
Application.CutCopyMode = False
Selection.Copy
Windows("INTRO_hero.xls").Activate
Sheets("traitement").Select
Range("B1").Select
Selection.PasteSpecial Paste:=xlValues,
Operation:=xlNone, SkipBlanks:= _
False, Transpose:=False
Windows(fich & val1 & (i) & ".tx0").Activate
Range("C16:D300").Select
Application.CutCopyMode = False
Selection.Copy
Windows("INTRO_hero.xls").Activate
Sheets("traitement").Select
Range("A30").Select
Selection.PasteSpecial Paste:=xlValues,
Operation:=xlNone, SkipBlanks:= _
False, Transpose:=False
Range("D30").Select
Selection.AutoFill Destination:=Range("D30:D300"),
Type:=xlFillDefault

Windows("INTRO_hero.xls").Activate Effacement des valeurs incrémentées en trop pour


Sheets("traitement").Select éviter les problèmes de calcul
Range("D30:D300").Select
Selection.Find(What:="0.0", After:=ActiveCell,
LookIn:=xlValue, _
LookAt:=xlPart, SearchOrder:=xlByColumns,
SearchDirection:=xlNext, _
MatchCase:=False).Activate
empl = ActiveCell.Address
Range(empl, "d300").Select
Selection.ClearContents

Windows(fich & val1 & (i) & ".tx0").Activate


Range("j16:j200").Select
Application.CutCopyMode = False
Selection.Copy

Windows("INTRO_hero.xls").Activate
Sheets("traitement").Select
Range("c30").Select
Selection.PasteSpecial Paste:=xlValues,
Operation:=xlNone, SkipBlanks:= _
False, Transpose:=False
ANNEXE 4 34

Windows("INTRO_hero.xls").Activate
Sheets("traitement").Select
Range("J9:q9").Select
Selection.Copy

Range("C1").Select
Selection.PasteSpecial Paste:=xlValues,
Operation:=xlNone, SkipBlanks:= _
False, Transpose:=False
Range("A1:l1").Select
Application.CutCopyMode = False
Selection.Copy
Sheets("HERO-PRINC").Select
Range("A3").Select
Selection.PasteSpecial Paste:=xlValues,
Operation:=xlNone, SkipBlanks:= _
False, Transpose:=False
Windows("INTRO_hero.xls").Activate
Sheets("Traitement").Select Effacement des valeurs copiées provenant du tx0
actif
Range("A30:C100").Select
Application.CutCopyMode = False
Selection.ClearContents

Ferme le fichier tx0 actif


Windows(fich & val1 & (i) & ".tx0").Activate
ActiveWorkbook.Close

Windows("INTRO_hero.xls").Activate Mise à jour des dates de saisies, des lieux de saisies


et de la nature du stupéfiant
Sheets("HERO-PRINC").Select
Range("o3").Select
ActiveCell.FormulaR1C1 = datesaisie.Text
Range("n3").Select
ActiveCell.FormulaR1C1 = lieusais.Text
Range("m3").Select
ActiveCell.FormulaR1C1 = stupindex.Text

Next i On passe au prochain tx0 par la structure de boucle


for i=1 to… next i

Application.ScreenUpdating = True On repasse on mode normal en affichant les


changements de fenêtres

End Sub
ANNEXE 4 35

Détail de la macro de mise à jour des résultats écrite en Visual Basic®

Private Sub CommandButton3_Click() Macro de mise à jour: elle va créer les


'mise à jour fichiers .dif nécessaire pour pouvoir
introduire les données dans la base
centrale File Maker Pro 4
Dim classnom As Variant Déclaration des variables
Dim sel As Variant
Dim sel1 As Variant
Dim sel2 As Variant
Dim sel3 As Variant
Dim sel4 As Variant

Dim nbeechant As Variant


Dim plageSource As Variant
Dim plageÀremplir As Variant

nbeechant = TextBox1.Text Affectation des variables, on demande à


l'utilisateur le nombre de prélèvements
qu'il veut exporter
sel4 = "o" & nbeechant + 2
sel3 = "l" & nbeechant + 2
sel2 = "b" & nbeechant + 2
sel1 = "r" & nbeechant + 2
sel = "aj" & nbeechant + 2
'partie adnom
Application.DisplayAlerts = False Fonction permettant d'accélérer la macro,
on évite de voir les changements de
fenêtres
Workbooks.Add On ajoute un nouveau classeur
classnom = ActiveWorkbook.Name
Windows("INTRO_hero.xls").Activate
Sheets("final_adult").Select

Set plageSource = Worksheets("final_adult").Range("A2:aj2") On sélectionne la feuille final_adult et on


recopie en incrémentant
Set plageÀremplir = Worksheets("final_adult").Range("A2", sel) (cette opération nous permet de
d'incrémenter les formules présentes
dans les différentes cellules)
plageSource.AutoFill Destination:=plageÀremplir

Range("A3", sel).Select
Selection.Copy Cette partie copie les données qui
Windows(classnom).Activate formeront le classeur adNom.dif qui
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone, regroupe les différents prélèvements
SkipBlanks:= _ analysés et leur adultération
False, Transpose:=False
Application.CutCopyMode = False

'copie de la ligne supérieure avec les étiquettes


Windows("INTRO_hero.xls").Activate
Sheets("final_adult").Select
Rows("1:1").Select
Selection.Copy
Windows(classnom).Activate
Rows("1:1").Select
Selection.Insert Shift:=xlDown
ANNEXE 4 36

Rows("1:1").Select
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False
'enregistrement au format xls et dif
ChDir "D:\Gestion données PFS\Héroïne"
ActiveSheet.SaveAs FileName:= _
"D:\Gestion données PFS\héroïne\adNom",
FileFormat:=xlNormal, _
Password:="", WriteResPassword:="",
ReadOnlyRecommended:=False, _
CreateBackup:=False
ActiveSheet.SaveAs FileName:= _
"D:\Gestion données PFS\héroïne\adnom",
FileFormat:=xlDIF, _
CreateBackup:=False

ActiveWorkbook.Close

'partie adnom2
Workbooks.Add Dans cette partie on procède de la
classnom = ActiveWorkbook.Name même manière que décrite ci-dessus où
l'on va créer un classeur Adult_noms
contenant des informations à introduire
dans la base principale
Windows("INTRO_hero.xls").Activate
Sheets("adult_noms").Select

Set plageSource = Worksheets("adult_noms").Range("A2:r2")


Set plageÀremplir = Worksheets("adult_noms").Range("A2",
sel1)
plageSource.AutoFill Destination:=plageÀremplir

Range("A3", sel1).Select
Selection.Copy
Windows(classnom).Activate
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False

Windows("INTRO_hero.xls").Activate
Sheets("adult_noms").Select
Rows("1:1").Select
Selection.Copy
Windows(classnom).Activate
Rows("1:1").Select
Selection.Insert Shift:=xlDown
Rows("1:1").Select
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False

ChDir "D:\Gestion données PFS\héroïne"


ActiveSheet.SaveAs FileName:= _
"D:\Gestion données PFS\héroïne\adNom2",
ANNEXE 4 37

FileFormat:=xlNormal, _
Password:="", WriteResPassword:="",
ReadOnlyRecommended:=False, _
CreateBackup:=False
ActiveSheet.SaveAs FileName:= _
"D:\Gestion données PFS\héroïne\adNom2",
FileFormat:=xlDIF, _
CreateBackup:=False
ActiveWorkbook.Close

'partie AdC Dans cette partie on procède de la


Workbooks.Add même manière que décrite ci-dessus
où l'on va créer un classeur AdC.dif
contenant des informations à
introduire dans la base principale
classnom = ActiveWorkbook.Name
Windows("INTRO_hero.xls").Activate
Sheets("noms conc").Select

Set plageSource = Worksheets("noms conc").Range("A2:r2")


Set plageÀremplir = Worksheets("noms conc").Range("A2",
sel1)
plageSource.AutoFill Destination:=plageÀremplir

Sheets("concat").Select
Set plageSource = Worksheets("concat").Range("A2:b2")
Set plageÀremplir = Worksheets("concat").Range("A2", sel2)
plageSource.AutoFill Destination:=plageÀremplir
Range("A3", sel2).Select
Selection.Copy
Windows(classnom).Activate
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False

Windows("INTRO_hero.xls").Activate
Sheets("concat").Select
Rows("1:1").Select
Selection.Copy
Windows(classnom).Activate
Rows("1:1").Select
Selection.Insert Shift:=xlDown
Rows("1:1").Select
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False

ChDir "D:\Gestion données PFS\héroïne"


ActiveSheet.SaveAs FileName:= _
"D:\Gestion données PFS\héroïne\adc",
FileFormat:=xlNormal, _
Password:="", WriteResPassword:="",
ReadOnlyRecommended:=False, _
CreateBackup:=False
ActiveSheet.SaveAs FileName:= _
"D:\Gestion données PFS\héroïne\adc", FileFormat:=xlDIF, _
CreateBackup:=False
ANNEXE 4 38

ActiveWorkbook.Close

'partie imp Ici on procède de la même manière


Workbooks.Add que décrite ci-dessus où l'on va créer
un classeur imp.dif contenant des
informations à introduire dans la base
principale
classnom = ActiveWorkbook.Name
Windows("INTRO_hero.xls").Activate
Sheets("hero-princ2").Select

Set plageSource = Worksheets("hero-princ2").Range("A2:l2")


Set plageÀremplir = Worksheets("hero-princ2").Range("A2",
sel3)
plageSource.AutoFill Destination:=plageÀremplir

Windows("INTRO_hero.xls").Activate
Sheets("hero-princ2").Select
Range("A3", sel1).Select
Selection.Copy
Windows(classnom).Activate
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False

Windows("INTRO_hero.xls").Activate
Sheets("hero-princ2").Select
Rows("1:1").Select
Selection.Copy
Windows(classnom).Activate
Rows("1:1").Select
Selection.Insert Shift:=xlDown
Rows("1:1").Select
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False

Windows("INTRO_hero.xls").Activate Cette partie copie les dates de saisie,


les lieux de saisies et le type de
stupéfiant
Sheets("hero-princ").Select
Range("M3", sel4).Select
Selection.Copy
Selection.Copy
Windows(classnom).Activate
Range("M2").Select
Selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Application.CutCopyMode = False
ANNEXE 4 39

'enregistrement des classeurs


ChDir "D:\Gestion données PFS\Héroïne"
ActiveSheet.SaveAs FileName:= _
"D:\Gestion données PFS\héroïne\imp",
FileFormat:=xlNormal, _
Password:="", WriteResPassword:="",
ReadOnlyRecommended:=False, _
CreateBackup:=False
ActiveSheet.SaveAs FileName:= _
"D:\Gestion données PFS\héroïne\imp", FileFormat:=xlDIF, _
CreateBackup:=False

ActiveWorkbook.Close

'effacement des données La fin de la macro remet les


Windows("INTRO_hero.xls").Activate différents classeurs à jour en
Sheets("hero-princ").Select effaçant les données introduites
Range("A3", sel4).Select
Selection.ClearContents

Sheets("hero-princ2").Select
Range("A3", sel4).Select
Selection.ClearContents

Sheets("hero-adult").Select
Range("A3", sel1).Select
Selection.ClearContents

'effacement des données final adult


Windows("INTRO_hero.xls").Activate
Sheets("final_adult").Select
Range("A3", sel).Select
Selection.ClearContents

'effacement des données adnom2


Windows("INTRO_hero.xls").Activate
Sheets("adult_noms").Select
Range("A3", sel1).Select
Selection.ClearContents

'effacement des données ADC


Windows("INTRO_hero.xls").Activate

Sheets("noms conc").Select
Range("A3", sel1).Select
Selection.ClearContents

Sheets("concat").Select
Range("A3", sel2).Select
Selection.ClearContents
Application.DisplayAlerts = True
End Sub
ANNEXE 4 40

Détail de la macro d'introduction des données dans le fichier de comparaison

Private Sub CommandButton1_Click()

Dim nbrechantillon As Integer Déclaration des variables


Dim i As Integer
Dim j As Integer
Dim sel1 As Variant
Dim sel2 As Variant
Dim plagesource As Variant
Dim plageÀremplir As Variant

Application.ScreenUpdating = False On accélère le programme en masquant


les changements de fenêtres

ChDir "D:\Test visual basic"


Workbooks.Open FileName:="D:\Test visual Ouverture du fichier EXPORTTOT.dif
basic\EXPORTTOT.dif" venant de FMPro4
nbrechantillon = TextBox1.Text
sel1 = "ax" & nbrechantillon Définition d'une cellule par la
concaténation (&)
sel2 = "g" & nbrechantillon
Windows("EXPORTTOT.dif").Activate
Sheets("exporttot").Select
Range("A1", sel1).Select
Application.CutCopyMode = False
selection.Copy On copie les données
d'EXPORTTOT.dif pour les coller dans
KetoherFinal001

Windows("KetoherFinal001.xls").Activate
Sheets("Zscores").Select
Range("A2").Select
ActiveSheet.Paste
Sheets("Zscores2").Select
Range("A2:AX2").Select
Set plagesource = Worksheets("Zscores2").Range("A2:ax2")
Set plageÀremplir = Worksheets("Zscores2").Range("A2", sel1)
plagesource.AutoFill Destination:=plageÀremplir On incrémente une plage de cellules, qui
elles-mêmes contiennent des formules
Range("A2", sel1).Select
selection.Copy
Sheets("hero-princ2").Select
Range("A3").Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Sheets("keto").Select
Set plagesource = Worksheets("keto").Range("A2:g2")
Set plageÀremplir = Worksheets("keto").Range("A2", sel2)
plagesource.AutoFill Destination:=plageÀremplir

Sheets("Zscores").Select On efface les données qui ne sont plus


utiles, on prépare la base à recevoir
Range("A2", sel1).Select d'autres données
selection.ClearContents
ANNEXE 4 41

Sheets("Zscores2").Select
Range("A3", sel1).Select
selection.ClearContents

Sheets("hero-princ2").Select On remplace les 0 par 1 pour éviter


des divisions par 0
For i = 2 To nbrechantillon
For j = 2 To 50
If Cells(i, j).Value = 0 Then
Cells(i, j).Value = 1
End If
Next j
Next i

Windows("EXPORTTOT.dif").Activate On ferme EXPORTTOT.dif


ActiveWorkbook.Close

Application.ScreenUpdating = True On réactive la vision du changement


de fenêtre
MsgBox (" la macro d'introduction FID est terminée") On affiche un message lorsque la
macro est terminée
End Sub
ANNEXE 4 42

Détail de la macro de comparaison écrite en Visual Basic®

Private Sub COMPARAISON_Click()


Dim i As Integer Déclaration des variables
Dim j As Integer
Dim nbreacomparer As Integer
Dim selec1 As Variant
Dim cpt As Integer
Dim plagesource As Variant
Dim plageÀremplir As Variant

' cpt = 0

nbreacomparer = dernech.Text - premech.Text Détermination du nombre


d'échantillons à comparer
selec1 = "g" & nbreacomparer + 2 On se réfère aux informations fournies
par l'utilisateur

Workbooks.Add On ajoute un classeur dans lequel on


va stocker les résultats de la
comparaison
ChDir "D:\Test visual basic"
ActiveWorkbook.SaveAs FileName:="D:\Test visual
basic\Comparaison.xls", _
FileFormat:=xlNormal, Password:="", WriteResPassword:="", _
ReadOnlyRecommended:=False, CreateBackup:=False

For i = premech.Text To dernech.Text Boucle de comparaison des


échantillons
Application.ScreenUpdating = False
cpt = 0

Windows("ketoherfinal001").Activate
Sheets("hero-princ2").Select
Rows(i).Select On sélectionne la ligne du prélèvement
que l'on veut analyser
selection.Copy On la copie
Sheets("hero-princ2").Select
Rows(2).Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone, On la colle en position 2 (2ème ligne)
SkipBlanks:= _ dans le classeur hero-princ2
False, Transpose:=False
Sheets("Keto").Select
Set plagesource = Worksheets("Keto").Range("A2:g2")
Set plageÀremplir = Worksheets("Keto").Range("A2", selec1) Dans le classeur Keto, on incrémente
les cellules de la première ligne
plagesource.AutoFill Destination:=plageÀremplir
'Worksheets("hero-princ").Rows(1).Select
Sheets("Keto").Select
Range("A2", selec1).Select
Application.CutCopyMode = False
selection.Copy
Sheets("Keto2").Select On fait la même chose que ci-dessus
mais pour le classeur Keto2
Range("A2").Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
ANNEXE 4 43

False, Transpose:=False
selection.Sort Key1:=Range("B2"), Order1:=xlDescending,
Header:=xlGuess, _
OrderCustom:=1, MatchCase:=False, Orientation:=xlTopToBottom

For j = 2 To nbreacomparer Cette boucle va comparer l'échantillon


cible au reste de la base
Windows("ketoherfinal001").Activate
Sheets("Keto2").Select
If Range("B" & j).Value >= CDbl(ketogc.Value) And Range("c" & Dans cette partie on vérifie si les seuils
j).Value >=_ spécifiés par l'utilisateur sont
respectés
CDbl(ketogc2.Text) And Range("d" & j).Value >=
CDbl(Ketogc3.Text) _
And Range("e" & j).Value >= CDbl(ketoICP.Value) And Range("f"
& j).Value >=
CDbl(ketoadult.Value) And Range("g" & j).Value >=
CDbl(ketototal.Value) Then
Sheets("Keto3").Select Si oui on sélectionne la ligne en
question et on la copie dans Keto 3
Range("A2").Select
selection.EntireRow.Insert
Sheets("Keto2").Select
Range("A" & j, "G" & j).Select
selection.Copy
Sheets("Keto3").Select
Range("A2").Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False

cpt = cpt + 1
End If
Next j

Sheets("Keto3").Select Toutes les lignes (donc tous les


prélèvements) ayant répondus aux
Cells.Select critères de sélection sont copiées dans
le classeur comparaison
selection.Sort Key1:=Range("B2"), Order1:=xlDescending,
Header:=xlGuess, _
OrderCustom:=1, MatchCase:=False,
Orientation:=xlTopToBottom
Range("A1", "g" & cpt + 1).Select
selection.Copy
Windows("comparaison").Activate
Sheets("feuil1").Select
Range("A" & cpt + 1).Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
Windows("ketoherfinal001").Activate
Sheets("Keto3").Select
Range("a2", "A" & cpt + 3).Copy
Windows("comparaison").Activate
Sheets("feuil1").Select
Range("i" & i - 1).Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:=False _
, Transpose:=True
ANNEXE 4 44

Windows("ketoherfinal001").Activate On efface toutes les données


présentes dans keto2 et keto3
Sheets("keto2").Select
Range("A2", selec1).Select
selection.ClearContents

Sheets("keto3").Select
Range("a2", "g" & cpt + 1).Select
selection.ClearContents Les classeurs sont prêts pour une
nouvelle comparaison

Application.ScreenUpdating = True On réaffiche les changements de


fenêtres

Next i
MsgBox ("la macro de comparaison est terminée") Affichage d'un message lorsque la
macro est terminée
End Sub
ANNEXE 4 45

Détail de la macro d'épuration des liens phase 1 écrite en Visual Basic®

Private Sub CommandButton1_Click()


Dim nombreechantillon As Integer Déclaration des variables
Dim nbrligne As Integer
Dim i As Integer
Dim j As Integer
Dim k As Integer
Dim cpt As Integer
nombreechantillon = nbreechep.Text
Dim plagesource As Variant
Dim plageÀremplir As Variant
Dim maximum As Integer
Dim sele2 As Variant
Dim sele As Variant
Dim l As Integer
Dim m As Integer

sele2 = "a" & nombreechantillon


sele = "CC" & nombreechantillon

'ouverture du classeur et premier tri ligne par ligne des doublons


'les résultats sont stockés dans final1

Application.ScreenUpdating = False Accélération de la macro en cachant


les changements de fenêtres

ChDir "D:\Test visual basic"

Workbooks.Open FileName:="D:\Test visual basic\classeur2.xls" On ouvre le classeur2.xls


Sheets("final1").Select
Range("b3:CC400").Select On efface les anciennes données
selection.Delete
Sheets("feuil1").Select
Range("b3:CC400").Select
selection.Delete
Sheets("epur1").Select
Range("b3:CC400").Select
selection.Delete
Sheets("epur2").Select
Range("b3:CC400").Select
selection.Delete
Sheets("final2").Select
Range("b3:CC400").Select
selection.Delete

Workbooks.Open FileName:="D:\Test visual On ouvre le classeur comparaison.xls


basic\comparaison.xls"
nbrligne = Worksheets("feuil1").Range("H1").Value Définition de la variable nbrligne
Sheets("feuil1").Select
Range("i1", sele).Select
selection.Copy

Windows("classeur2.xls").Activate
Sheets("final1").Select
Range("b2").Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False
ANNEXE 4 46

Sheets("epur1").Select Cette partie incrémente les premières


ligne des classeur epur1,epu2 et
Set plagesource = Worksheets("epur1").Range("b2:cc2") feuil1. Les fonctions contenues dans
Set plageÀremplir = Worksheets("epur1").Range("b2", sele) ces cellules sélectionnent les 6
premières lettres du prélèvement, ce
qui correspond à une saisie. En
incrémentant on a alors une vision au
niveau de la saisie
plagesource.AutoFill Destination:=plageÀremplir

Sheets("feuil1").Select

Set plagesource = Worksheets("feuil1").Range("b2:cc2")


Set plageÀremplir = Worksheets("feuil1").Range("b2", sele)
plagesource.AutoFill Destination:=plageÀremplir

Range("b2", sele).Select
selection.Copy
Sheets("epur2").Select
Range("b2").Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False

Windows("classeur2.xls").Activate
Sheets("epur2").Select
Set plagesource = Worksheets("epur2").Range("A2")
Set plageÀremplir = Worksheets("epur2").Range("A2", sele2)
plagesource.AutoFill Destination:=plageÀremplir

For l = 2 To nombreechantillon On élimine les cellules vides


For m = 2 To 80

If Cells(l, m).Value = "" Then


Cells(l, m).Select
selection.ClearContents
End If
Next m
Next l
i=2

For i = 2 To nombreechantillon Cette boucle va éliminer sur une ligne


les prélèvements, échantillons
maximum = Cells(i, 1).Value venant de la même saisie
For cpt = 2 To maximum
For j = 1 To maximum

If Cells(i, cpt).Value = Cells(i, j + cpt).Value And Cells(i, j +


cpt).Value <> "" Then
Cells(i, j + cpt).Select
selection.Delete Shift:=xlToLeft
j=j-1
End If

Next j
Next cpt
ANNEXE 4 47

Next i

Sheets("epur2").Select
Range("a1", sele).Select
selection.Copy
Sheets("final1").Select On copie les résultats contenus dans
epur2 dans final1
Range("A1").Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone,
SkipBlanks:= _
False, Transpose:=False

MsgBox ("La macro épuration 1 est terminée") Message lorsque la macro est
terminée
Application.ScreenUpdating = True On réactive la vision des changements
de fenêtres
End Sub
ANNEXE 4 48

Détail de la macro d'épuration des liens niveau 2 écrite en Visual Basic®

Private Sub commandbutton3_click() Macro appelant trois autres


macro,
nbvalcorrect nbvalcorrect, epurer1 et
sauver
epurer1
sauver
End Sub

Sub nbvalcorrect() Déclaration de variables


Dim plagesource As Variant
Dim plageÀremplir As Variant
Dim i As Integer
Dim j As Integer
Dim k As Integer
Dim l As Integer
Dim echantillon As Integer
Dim sele As Variant
Dim sel As Variant

Windows("classeur2.xls").Activate
echantillon = Worksheets("epur1").Range("a1").Value + 1 Affectation de la variable
échantillon
sele = "CC" & echantillon Affectation de la variable
sele
sel = "a" & echantillon Affectation de la variable
sel

On accélère la macro en
cachant les
Application.ScreenUpdating = False changements de fenêtres

Sheets("epur2").Select
Range("b2", sele).Select
selection.Copy
Sheets("final2").Select
Range("b2").Select
selection.PasteSpecial Paste:=xlValues, Operation:=xlNone, SkipBlanks:= _
False, Transpose:=False

Sheets("final2").Select On active la feuille final2


Range("A1").Select

Set plagesource = Worksheets("final2").Range("a1") On incrémente les formules


Set plageÀremplir = Worksheets("final2").Range("a1", sel) de la première ligne
plagesource.AutoFill Destination:=plageÀremplir
For k = 2 To echantillon
For j = 2 To echantillon

Dans cette boucle on teste


If Cells(k, j).Value = "" Then si une des valeurs est
Cells(k, j).Select égale à un espace vide. Si
tel est le cas on efface le
contenu
selection.ClearContents
ANNEXE 4 49

End If
Next j
Next k
Application.ScreenUpdating = True On réactive la vision des
End Sub changements de fenêtres

sub epurer1()

Dim plagesource As Variant


Dim plageÀremplir As Variant
Dim i As Integer
Dim j As Integer
Dim k As Integer
Dim cpt3 As Integer
Dim cpt As Integer
Dim nbech As Integer
Dim cpt2 As Integer
Dim nbrelien As Integer
Dim cpt4 As Integer
Dim subcpti As Integer
Dim nbrlien2 As Integer
Dim nbrlien1 As Integer
Dim cell2lign As Integer
Dim sel As Variant

subcpti = 1 Affectation des variables


nbech = Worksheets("epur1").Range("a1").Value + 1

sel = "a" & nbech

Windows("classeur2.xls").Activate On active le classeur2.xls


Sheets("final2").Select On active la feuille final2
Range("A1").Select
Set plagesource = Worksheets("final2").Range("a1")
Set plageÀremplir = Worksheets("final2").Range("a1", sel)
plagesource.AutoFill Destination:=plageÀremplir
Windows("classeur2.xls").Activate
Sheets("final2").Select

For cpt = 2 To nbech Boucle recherchant dans


Application.ScreenUpdating = False un premier temps à
For j = 1 To Range("a" & cpt).Value + 1 l'intérieur d'une ligne si on a
des doublons. Si tel est le
For cpt4 = 1 To nbech cas on efface le doublon
Ensuite prélèvement par
For cpt2 = 2 To Range("a" & cpt + cpt4).Value + 1 prélèvement on regarde
s'il apparaît dans une autre
nbrelien = Val(Range("a" & cpt).Value) ligne si tel est le cas
selon le principe que si A
est lié à B et que B
est lié à C donc A est lié à
C, on va recopier la ligne
et réeffectuer une
recherche de doublons.
Cette opération est
effectuée pour tous les
prélèvements
nbrlien2 = nbrelien + 2
nbrlien1 = nbrelien + 1
ANNEXE 4 50

If Cells(cpt, j + 1).Value = Cells(cpt + cpt4, cpt2).Value And Cells(cpt, j +


1).Value <>_
"" And Cells(cpt + cpt4, cpt2).Value <> "" And cpt <> cpt + cpt4 Then
Range(Cells(cpt + cpt4, 2), Cells(cpt + cpt4, nbrlien1)).Copy
Destination:=Worksheets("Final2").Cells(cpt, nbrlien2)

Sheets("final2").Select
Rows(cpt + cpt4).Select
Application.CutCopyMode = False
selection.Delete Shift:=xlUp
If cpt4 < 1 Then
cpt4 = cpt4
Else
cpt4 = cpt4 - 1
End If
If cpt4 = 1 Then
cpt4 = 0
End If
cpt2 = 2

Windows("classeur2.xls").Activate

Sheets("final2").Select
Range("A1").Select
Set plagesource = Worksheets("final2").Range("a1")
Set plageÀremplir = Worksheets("final2").Range("a1", sel)
plagesource.AutoFill Destination:=plageÀremplir

For cpt3 = 2 To Range("a" & cpt).Value


For k = 1 To Range("a" & cpt).Value + 1
If Cells(cpt, cpt3).Value = Cells(cpt, k + cpt3).Value And
Cells(cpt, k + cpt3).Value <> "" Then
Cells(cpt, k + cpt3).Select
selection.Delete Shift:=xlToLeft
k=k-1
End If
Next k
Next cpt3
End If
Next cpt2
Next cpt4
Next j
Next cpt

Application.ScreenUpdating = False On réactive l'affichage des


changements de fenêtre
End Sub

Sub sauver()
ActiveWorkbook.SaveAs FileName:="D:\Test visual basic\comparaison2.xls", _ On sauve le classeur sous
le nom comparaison2.xls
FileFormat:=xlNormal, Password:="", WriteResPassword:="", _
ReadOnlyRecommended:=False, CreateBackup:=False
ANNEXE 4 51

Message indiquant que la


macro est terminé
MsgBox ("la macro de comparaison phase 2 est terminée")
End Sub
ANNEXE 5 52

Annexe 5
Représentation graphique des
tests des fractions
ANNEXE 5 53

Représentation graphique des tests des fractions

Légende des graphiques :


Les échantillons ont été notés de la manière suivante : Le suffixe Mix indique qu’il s’agit de
la poudre non tamisée. Ensuite, les suffixes sont notés de la façon suivante Hero_75 désignant
la fraction qui a été retenue par le tamis de 0.75 mm. Il en va ainsi de suite pour les autres
échantillons.
Les échantillons notés Hero_poudre Coc_poudre constituent la substance pulvérulente qui a
passé le tamis de 0.1mm.
ANNEXE 5 54

2.2

2.0

1.8

1.6

1.4

1.2

1.0

.8
N= 3 3 3 3 3 3 3 3

HERO_MIX HERO_10 HERO_25 HERO_40


Hero_poudre HERO_20 HERO_30 HERO_75

Graphique N° 1 : Analyse 1, résultats des fractions pour la méconine

11.5

11.0

10.5

10.0

9.5

9.0

8.5
N= 3 3 3 3 3 3 3 3

HERO_MIX HERO_10 HERO_25 HERO_40


Hero_poudre HERO_20 HERO_30 HERO_75

Graphique N° 2 : Analyse 1, résultats des fractions pour l’acétylcodéine


ANNEXE 5 55

3.5

3.0

2.5

2.0

1.5

1.0
N= 3 3 3 3 3 3 3 3

HERO_MIX HERO_10 HERO_25 HERO_40


Hero_poudre HERO_20 HERO_30 HERO_75

Graphique N° 3 : Analyse 1, résultats des fractions pour l’acétylthébaol

60

50

40

30

20

10
N= 3 3 3 3 3 3 3 3

HERO_MIX HERO_10 HERO_25 HERO_40


Hero_poudre HERO_20 HERO_30 HERO_75

Graphique N° 4 : Analyse 1, résultats des fractions pour la 6-MAM


ANNEXE 5 56

18

16

14

12

10

6
N= 3 3 3 3 3 3 3 3

HERO_MIX HERO_10 HERO_25 HERO_40


Hero_poudre HERO_20 HERO_30 HERO_75

Graphique N° 5 : Analyse 1, résultats des fractions pour la papavérine

70

60

50

40

30

20
N= 3 3 3 3 3 3 3 3

HERO_MIX HERO_10 HERO_25 HERO_40


Hero_poudre HERO_20 HERO_30 HERO_75

Graphique N° 6 : Analyse 1, résultats des fractions pour la noscapine


ANNEXE 5 57

.5

.4

.3

.2
N= 4 4 4 4 4 4 4 4

Hero_poudre_1.1 Hero_20_1.1 Hero_30_1.1 Hero_75_1.1


Hero_10_1.1 Hero_25_1.1 Hero_40_1.1 Hero_Mix_1.1

Graphique N° 7 : Analyse 2, résultats des fractions pour la méconine

7.8

7.6

7.4

7.2

7.0

6.8

6.6
N= 4 4 4 4 4 4 4 4

Hero_poudre_1.1 Hero_20_1.1 Hero_30_1.1 Hero_75_1.1


Hero_10_1.1 Hero_25_1.1 Hero_40_1.1 Hero_Mix_1.1

Graphique N° 8 : Analyse 2, résultats des fractions pour l’acétylcodéine


ANNEXE 5 58

2.0

1.8

1.6

1.4

1.2

1.0
N= 4 4 4 4 4 4 4 4

Hero_poudre_1.1 Hero_20_1.1 Hero_30_1.1 Hero_75_1.1


Hero_10_1.1 Hero_25_1.1 Hero_40_1.1 Hero_Mix_1.1

Graphique N° 9 : Analyse 2, résultats des fractions pour l’acétylthebaol

40

30

20

10

0
N= 4 4 4 4 4 4 4 4

Hero_poudre_1.1 Hero_20_1.1 Hero_30_1.1 Hero_75_1.1


Hero_10_1.1 Hero_25_1.1 Hero_40_1.1 Hero_Mix_1.1

Graphique N° 10 : Analyse 2, résultats des fractions pour la 6-MAM


ANNEXE 5 59

3.8

3.6

3.4

3.2

3.0

2.8

2.6

2.4
N= 4 4 4 4 4 4 4 4

Hero_poudre_1.1 Hero_20_1.1 Hero_30_1.1 Hero_75_1.1


Hero_10_1.1 Hero_25_1.1 Hero_40_1.1 Hero_Mix_1.1

Graphique N° 11 : Analyse 2, résultats des fractions pour la papavérine

12

11

10

7
N= 4 4 4 4 4 4 4 4

Hero_poudre_1.1 Hero_20_1.1 Hero_30_1.1 Hero_75_1.1


Hero_10_1.1 Hero_25_1.1 Hero_40_1.1 Hero_Mix_1.1

Graphique N° 12 : Analyse 2, résultats des fractions pour la noscapine


ANNEXE 5 60

.35

.34

.33

.32

.31

.30
5

.29

.28

.27
N= 6 6 6 6 6 6 6 6

Coc_poudre COC_20 COC_30 COC_75


COC_10 COC_25 COC_40 COC_MIX

Graphique N° 13 : Analyse 3, résultats des fractions pour l’ecgonine methyl ester

.30

.28

.26

.24

.22

.20

.18
N= 6 6 6 6 6 6 6 6

Coc_poudre COC_20 COC_30 COC_75


COC_10 COC_25 COC_40 COC_MIX

Graphique N° 14 : Analyse 3, résultats des fractions pour l’ecgonine


ANNEXE 5 61

.5

.4 6

.3

.2
N= 6 6 6 6 6 6 6 6

Coc_poudre COC_20 COC_30 COC_75


COC_10 COC_25 COC_40 COC_MIX

Graphique N° 15 : Analyse 3, résultats des fractions pour la benzoïlecgonine

.8

.7

.6

.5
N= 6 6 6 6 6 6 6 6

Coc_poudre COC_20 COC_30 COC_75


COC_10 COC_25 COC_40 COC_MIX

Graphique N° 16 : Analyse 3, résultats des fractions pour la norcocaïne


ANNEXE 5 62

1.4

5
1.3

1.2

1
1.1
1

5
1.0

.9

.8

.7
N= 6 6 6 6 6 6 6 6

Coc_poudre COC_20 COC_30 COC_75


COC_10 COC_25 COC_40 COC_MIX

Graphique N° 17 : Analyse 3, résultats des fractions pour la cis-cinnamoylecgoninemethylester

1.4

1.3

1.2
6

1.1

1.0

.9

.8

.7
N= 6 6 6 6 6 6 6 6

Coc_poudre COC_20 COC_30 COC_75


COC_10 COC_25 COC_40 COC_MIX

Graphique N° 18 : Analyse 3, résultats des fractions pour la trans-cinnamoylecgoninemethylester


ANNEXE 5 63

70

60

50

40

30

20

10
N= 4 4 4 4 4 4 4 4

Hero_poudre_1.1 Hero_20_1.1 Hero_30_1.1 Hero_75_1.1


Hero_10_1.1 Hero_25_1.1 Hero_40_1.1 Hero_Mix_1.1

Graphique N° 19 : Résultats des fractions pour le pourcentage de diacétylmorphine.

62

60

58

56

54

52

50
N= 6 6 6 6 6 6 6 6

Coc_poudre COC_20 COC_30 COC_75


COC_10 COC_25 COC_40 COC_MIX

Graphique N° 20 : Résultats des fractions pour le pourcentage de cocaïne.

Vous aimerez peut-être aussi