These Ai Roux
These Ai Roux
These Ai Roux
UNIVERSITÉ DE HAUTE-ALSACE
UNIVERSITÉ DE STRASBOURG
THÈSE
Pour l’obtention du grade de
DOCTEUR DE L’UNIVERSITÉ DE HAUTE-ALSACE
ÉCOLE DOCTORALE : Mathématiques, Sciences de l’Information et de l’Ingénieur (ED 269)
Discipline : Automatique
Sous la direction du Prof. Jean-Philippe LAUFFENBURGER, du Dr. HDR. Sébastien CHANGEY et du Prof.
Jonathan WEBER.
Ce travail n’aurait pas été possible sans le soutien financier et matériel de l’Institut
franco-allemand de recherches de Saint-Louis (ISL), qui m’a accueilli au sein du groupe
Guidage, Navigation, Contrôle (GNC) et sans le laboratoire IRIMAS de l’Université de
Haute-Alsace (UHA).
3
TABLE DES MATIÈRES
Introduction 9
Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Contributions de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Organisation du manuscrit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Communications scientifiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1 État de l’art 15
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2 Capteurs embarqués dans les projectiles . . . . . . . . . . . . . . . . . . . . 16
1.2.1 Centrale inertielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2.2 Récepteur GNSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.2.3 Électronique embarquée dans un projectile . . . . . . . . . . . . . . 22
1.2.4 Autres types de capteurs pour la navigation des projectiles . . . . . 23
1.3 Méthodes classiques de navigation des projectiles . . . . . . . . . . . . . . 24
1.3.1 Navigation inertielle . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.3.2 Le filtre de Kalman Linéaire . . . . . . . . . . . . . . . . . . . . . . 25
1.3.3 Le filtre de Kalman Étendu . . . . . . . . . . . . . . . . . . . . . . 27
1.3.4 Applications des filtres de Kalman pour la navigation des projectiles 29
1.4 Intelligence artificielle appliquée au domaine militaire . . . . . . . . . . . . 32
1.4.1 Introduction à l’intelligence artificielle . . . . . . . . . . . . . . . . 32
1.4.2 Les réseaux de neurones . . . . . . . . . . . . . . . . . . . . . . . . 33
1.4.3 Entraînement d’un réseau de neurones . . . . . . . . . . . . . . . . 37
1.4.4 Applications de l’IA dans le domaine militaire . . . . . . . . . . . . 40
1.4.5 Applications de l’IA en navigation . . . . . . . . . . . . . . . . . . . 42
1.5 Jeu de données de trajectoires de projectiles . . . . . . . . . . . . . . . . . 47
1.5.1 Aperçu général de BALCO (BALlistic COde) . . . . . . . . . . . . 47
1.5.2 Les systèmes de coordonnées pour la navigation . . . . . . . . . . . 48
1.5.3 Données de simulation BALCO . . . . . . . . . . . . . . . . . . . . 50
1.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5
TABLE DES MATIÈRES
6
TABLE DES MATIÈRES
7
TABLE DES MATIÈRES
Conclusion 243
Conclusion générale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
Annexes 247
Annexe A. Imp.RIEKF pour la navigation des projectiles . . . . . . . . . . . . . 247
Annexe B. Quaternions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
Annexe C. EKF pour la navigation des projectiles . . . . . . . . . . . . . . . . . 250
Annexe D. Imp.RIEKF corrigé par les mesures des magnétomètres . . . . . . . . 251
Références 255
8
I NTRODUCTION
Contexte
La navigation des projectiles se base principalement sur les mesures d’une Unité de
Mesure Inertielle (IMU - Inertial Measurement Unit) et les mesures d’un récepteur GNSS
(Global Navigation Satellite Systems) embarquées. D’une part, l’intégration des mesures
IMU, composée généralement d’accéléromètres, de gyromètres et parfois de magnéto-
mètres, fournit une estimation de la trajectoire précise à court terme, mais dérive à long
terme en raison de l’accumulation des erreurs des capteurs. D’autre part, le récepteur
GNSS, grâce à des constellations de satellites, fournit des informations de positionnement
absolu précises à long terme à une fréquence nettement inférieure à celle de l’IMU. En
raison de leur complémentarité évidente, les mesures de l’IMU et du GNSS sont classique-
ment fusionnées par différents types de filtres de Kalman pour l’estimation des trajectoires.
Néanmoins, les signaux GNSS ne sont pas toujours disponibles du fait de la configuration
du terrain et sont également vulnérables vis-à-vis du brouillage et du leurrage 1 . C’est
pourquoi, il est nécessaire de développer des solutions permettant de s’affranchir de ces
mesures.
De récents travaux ont montré que l’intelligence artificielle (IA) permet de résoudre
des problèmes complexes. En effet, les réseaux de neurones peuvent fournir des résultats
équivalents ou meilleurs que des algorithmes classiques, notamment en limitant l’impact
de mesures erronées ou d’erreurs de modélisation sur la précision des estimations. Néan-
moins, l’IA est principalement utilisée pour résoudre des problèmes de navigation terrestre
et est très peu utilisée pour la navigation appliquée à des projectiles ou des drones aériens,
1. Le leurrage vise à transmettre de faux signaux GNSS au récepteur pour le détourner de sa véritable
position.
9
Introduction
soumis à de fortes contraintes dynamiques. Ainsi, ces travaux se concentrent sur l’utili-
sation des méthodes d’intelligence artificielle pour développer des solutions de navigation
sans GNSS afin de pallier les limitations des modèles et des capteurs embarqués.
Contributions de la thèse
Les problématiques traitées dans ce mémoire de thèse concernent l’estimation de la
trajectoire d’un projectile en combinant des méthodes classiques de navigation et des ré-
seaux de neurones. Différents algorithmes classiques de navigation, principalement basés
sur un filtre de Kalman, sont ajustés dynamiquement par un réseau de neurones afin d’op-
timiser l’estimation de la trajectoire du projectile. L’intelligence artificielle (IA) est donc
utilisée en complément de modèles mathématiques connus, afin notamment de corriger
des erreurs de modélisation, de compléter des mesures manquantes ou erronées, ou de
modéliser des dynamiques complexes. En d’autres termes, ces travaux visent à développer
et à tester des solutions de navigation basées en partie sur l’IA afin d’évaluer l’apport des
réseaux de neurones à l’optimisation des algorithmes classiques de navigation. Pour cela,
un jeu de données de simulation de trajectoires de différents projectiles est utilisé. Seules
les mesures de la centrale inertielle embarquée sont utilisées et aucune mesure GNSS n’est
considérée dans ces travaux pour les raisons mentionnées précédemment.
Trois méthodes hybrides d’estimation de la trajectoire d’un projectile ont été mises en
œuvre. La première approche, illustrée dans la figure 1, consiste à ajuster un paramètre
de bruit d’un filtre de Kalman par un réseau de neurones afin de tenir compte des erreurs
et des corrélations des mesures, délicates à modéliser. Cette solution est appliquée à plu-
Figure 1 – Ajustement d’un paramètre de bruit d’un filtre de Kalman par un réseau de
neurones.
10
Introduction
permet de modéliser des dynamiques complexes par des réseaux de neurones sans avoir
recours à aucun modèle mathématique. Cette solution de navigation est appliquée à dif-
férentes trajectoires de projectiles.
La troisième méthode mise en œuvre, présentée dans la figure 3, vise à remplacer l’un des
Figure 3 – Estimation de l’un des modèles d’un filtre de Kalman par un réseau de
neurones.
modèles mathématiques d’un filtre de Kalman par un réseau de neurones. Cette solution
permet principalement de limiter les erreurs liées à des approximations de modélisation.
11
Introduction
L’ensemble de ces travaux est développé dans le présent document et illustré par des
résultats évalués sur différentes simulations de trajectoires de projectiles.
Organisation du manuscrit
Afin de répondre aux objectifs cités précédemment, le manuscrit de thèse est structuré
en cinq chapitres :
→ Le premier chapitre est dédié à l’état de l’art relatif aux projectiles, aux méthodes
classiques de navigation par estimation d’états et aux approches basées sur l’IA. De
plus, le jeu de données de trajectoires de projectiles, nécessaire au développement
de ces travaux, est présenté.
→ Le second chapitre introduit les filtres de Kalman Invariant Étendus (IEKF - In-
variant Extended Kalman Filter). Il s’agit d’un filtre de Kalman non linéaire qui
exploite les propriétés d’un système défini sur un groupe de Lie et associé à une
erreur non linéaire. Pour cela, la théorie des IEKF ainsi qu’une étude comparative
entre une variante de l’IEKF et un filtre de Kalman standard sont proposées.
→ Le quatrième chapitre détaille l’estimation des trajectoires des projectiles par des
réseaux de neurones récurrents. Cette solution vise à remplacer tous les modèles
mathématiques par un réseau de neurones. Ainsi, à partir des mesures inertielles
notamment, l’IA modélise les contraintes dynamiques du projectile, les erreurs des
capteurs et les éventuelles perturbations afin d’estimer la trajectoire du projectile.
Cette solution est appliquée à plusieurs projectiles caractérisés par des trajectoires
différentes.
12
Introduction
→ Le cinquième chapitre présente des filtres de Kalman où l’un des modèles mathé-
matiques est remplacé par un réseau de neurones, également appelé Deep Kalman
Filter. Cette solution est utilisée afin de suppléer des mesures manquantes dans
un filtre de Kalman ou pour remplacer une étape de modélisation par un réseau
de neurones. Pour cela, plusieurs cas sont étudiés, notamment l’adaptation d’un
modèle linéaire à un modèle non linéaire par un réseau de neurones récurrents dans
le cas où l’étape de modélisation standard est complexe.
Communications scientifiques
Cette thèse a conduit à la publication des communications scientifiques suivantes :
• Revues internationales
Alicia Roux, Sébastien Changey, Jonathan Weber and Jean-Philippe Lauffen-
burger, "LSTM-Based Projectile Trajectory Estimation in a GNSS-Denied En-
vironment", Sensors 23, March 2023.
13
Introduction
14
Chapitre 1
É TAT DE L’ ART
Sommaire
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2 Capteurs embarqués dans les projectiles . . . . . . . . . . . . 16
1.2.1 Centrale inertielle . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2.2 Récepteur GNSS . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.2.3 Électronique embarquée dans un projectile . . . . . . . . . . . 22
1.2.4 Autres types de capteurs pour la navigation des projectiles . . 23
1.3 Méthodes classiques de navigation des projectiles . . . . . . . 24
1.3.1 Navigation inertielle . . . . . . . . . . . . . . . . . . . . . . . . 24
1.3.2 Le filtre de Kalman Linéaire . . . . . . . . . . . . . . . . . . . . 25
1.3.3 Le filtre de Kalman Étendu . . . . . . . . . . . . . . . . . . . . 27
1.3.4 Applications des filtres de Kalman pour la navigation des pro-
jectiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.4 Intelligence artificielle appliquée au domaine militaire . . . . 32
1.4.1 Introduction à l’intelligence artificielle . . . . . . . . . . . . . . 32
1.4.2 Les réseaux de neurones . . . . . . . . . . . . . . . . . . . . . . 33
1.4.3 Entraînement d’un réseau de neurones . . . . . . . . . . . . . . 37
1.4.4 Applications de l’IA dans le domaine militaire . . . . . . . . . . 40
1.4.5 Applications de l’IA en navigation . . . . . . . . . . . . . . . . 42
1.5 Jeu de données de trajectoires de projectiles . . . . . . . . . . 47
1.5.1 Aperçu général de BALCO (BALlistic COde) . . . . . . . . . . 47
1.5.2 Les systèmes de coordonnées pour la navigation . . . . . . . . . 48
1.5.3 Données de simulation BALCO . . . . . . . . . . . . . . . . . . 50
1.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
15
Chapitre 1 – État de l’art
1.1 Introduction
Ce chapitre introduit les concepts fondamentaux nécessaires à la compréhension de
ces travaux. Ainsi, une première partie (1.2) se focalise sur les projectiles et présente les
capteurs embarqués, leurs utilisations et leurs limitations. Une seconde partie (1.3) est
dédiée aux méthodes classiques de navigation des projectiles proposées dans la littérature
et principalement basées sur des filtres de Kalman. Une troisième partie (1.4) se concentre
sur l’utilisation de l’intelligence artificielle dans le domaine militaire et des solutions d’IA
pour la navigation. Enfin, la dernière partie (1.5) présente le jeu de données de simulations
de tirs de projectiles utilisé dans le cadre de cette thèse.
Figure 1.1 – Les différents éléments composant un projectile : illustration avec l’obus
de 155 mm M982 Excalibur.
Comme illustré dans la figure 1.1, un projectile est constitué de différentes parties :
16
1.2. Capteurs embarqués dans les projectiles
Un projectile est soumis à de fortes contraintes dynamiques telles que des chocs im-
portants à l’accélération 1 ou des vitesses de rotation élevées 2 . De plus, un projectile doit
satisfaire des exigences de coût et d’espace, comme illustré dans la figure 1.2. De ce fait,
l’unité électronique de guidage d’un projectile est généralement équipée de deux types
de capteurs nécessaires à sa navigation et à son guidage ; une centrale inertielle (IMU -
Inertial Measurement Unit) et un récepteur GNSS (Global Navigation Satellite Systems).
1. Accélération de 8 000 g pour un mortier de 120 mm, 40 000 g pour un projectile de 40 mm, 25 000
g pour un obus de 155 mm.
2. Vitesse de rotation de 250 à 300 Hz pour un obus de 155 mm.
17
Chapitre 1 – État de l’art
L’accéléromètre
Le gyromètre
18
1.2. Capteurs embarqués dans les projectiles
des contraintes de coûts raisonnables, l’utilisation des gyromètres est limitée, notamment
pour les projectiles à forte rotation [7], [8].
Le magnétomètre
Figure 1.5 – Pointe de projectile, testée en vol, composée de deux magnétomètres radiaux
pour estimer l’angle de roulis du projectile [9].
19
Chapitre 1 – État de l’art
Limitations de l’IMU
Bien que très souvent utilisée pour des problèmes de navigation du fait de sa taille,
de son coût et de sa faible consommation énergétique, la précision de la navigation par
IMU se dégrade à long terme. En effet, la navigation par IMU vise à intégrer les mesures
inertielles et donc les erreurs des capteurs, entraînant ainsi une dérive de cette solution de
navigation à long terme. Les erreurs de l’IMU sont principalement dues aux imperfections
des capteurs telles que des erreurs mécaniques ou électroniques (désalignement, biais,
bruit, sensibilité, facteurs d’échelle, dérive linéaire ...) [10], [11].
20
1.2. Capteurs embarqués dans les projectiles
Limitations du GNSS
Malgré la précision du positionnement par GNSS, ces signaux sont sensibles aux me-
naces extérieures et à la configuration du terrain (interférence, disponibilité et fiabilité
des signaux).
Disponibilité des signaux GNSS : Les signaux GNSS sont parfois indisponibles du fait
de la configuration du terrain (terrains urbains, vallées profondes, tunnels...) ou du fait
de la faible puissance des signaux (dissipation de l’énergie). En effet, des bruits élevés, la
réflexion des signaux ou l’orientation de l’antenne peuvent dégrader les signaux GNSS et
les rendre indisponibles [13], [14].
21
Chapitre 1 – État de l’art
22
1.2. Capteurs embarqués dans les projectiles
23
Chapitre 1 – État de l’art
5. Fréquence d’échantillonnage d’une IMU standard : 1kHz. Fréquence d’échantillonnage d’un récep-
teur GNSS : de 1 à 10Hz
24
1.3. Méthodes classiques de navigation des projectiles
avec
- xk+1 ∈ Rn×1 les états décrivant le système à l’instant k + 1,
- Ak ∈ Rn×n la matrice d’évolution qui relie l’état au temps k à l’état au temps k +1,
- uk ∈ Rl×1 l’entrée de commande connue,
- Bk ∈ Rn×l la matrice qui relie l’entrée de commande uk à l’état xk ,
- wk ∈ Rn×1 ∼ N (0, Qk ) le bruit de modèle supposé blanc centré gaussien où Qk
est la matrice de covariance semi-définie positive, qui modélise l’incertitude sur le
modèle,
- yk ∈ Rm×1 les observations mesurées,
- Hk ∈ Rm×n la matrice d’observation qui relie les observations yk aux états xk ,
- vk ∈ Rm×1 ∼ N (0, Rk ) le bruit de mesure supposé blanc centré gaussien où Rk est
la matrice de covariance définie positive, qui modélise l’incertitude sur les mesures.
T
Les bruits wk et vk sont supposés indépendants, c’est-à-dire E[wk vk+τ ] = 0.
Comme illustré dans la figure 1.12, le filtre de Kalman linéaire débute par une étape
d’initialisation, puis alterne entre une étape de prédiction et une étape de mise à jour afin
d’estimer l’état xbk et la matrice de covariance d’erreur Pk qui représente les incertitudes
dans les estimations.
25
Chapitre 1 – État de l’art
avec xb0|0 l’état estimé, P0|0 la covariance estimée et x0 l’état vrai à l’instant initial.
26
1.3. Méthodes classiques de navigation des projectiles
Le gain de Kalman pondère l’innovation définie comme la différence entre les observations
yk et la prédiction de ces observations H xbk|k−1 , afin de mettre à jour l’état estimé tel que :
La covariance de l’erreur d’estimation Pk|k est mise à jour à partir du gain de Kalman
Kk , de la covariance prédite Pk|k−1 et de la matrice d’observation H tel que :
avec xk+1 ∈ Rn×1 les états du système, yk ∈ Rm×1 les observations mesurées, f (.) et h(.)
des applications non linéaires, wk ∼ N (0, Qk ) et vk ∼ N (0, Rk ) les bruits de modèle et de
mesure supposés gaussiens et indépendants.
L’EKF produit une approximation de l’estimation optimale xk en linéarisant le système
dynamique non linéaire (1.9) - (1.10) autour de la dernière estimation d’état xbk−1|k−1
[23], [24]. Pour cela, les modèles non linéaires d’évolution f (.) et d’observation h(.) sont
27
Chapitre 1 – État de l’art
linéarisés localement au premier ordre par des matrices jacobiennes évaluées telles que :
Matrice d’évolution Ak = ∂f
∂x b (1.11)
xk−1|k−1 ,uk
Matrice d’observation Hk = ∂h
∂x b (1.12)
xk|k−1
Comme dans le cas linéaire, l’EKF est tout d’abord initialisé d’après l’équation (1.3)
puis alterne entre une étape de prédiction et une étape de mise à jour.
Étape de prédiction : L’état xbk|k−1 est prédit à partir du modèle d’évolution (1.9)
dans le cas où le bruit de modèle est nul et la covariance Pk|k−1 est prédite à partir du
modèle d’évolution linéarisé (1.11), de sorte que :
Étape de mise à jour : L’état xbk|k−1 et la covariance Pk|k−1 prédite sont mis à jour
à partir des observations mesurées yk , du modèle d’observation non linéaire h(.) (1.10) et
de la matrice d’observation Hk (1.12) :
Ainsi, l’EKF est un estimateur d’état adapté à des systèmes non linéaires. La linéarisa-
tion du modèle d’évolution et/ou d’observation permet d’appliquer la méthodologie d’un
filtre de Kalman linéaire à partir de ces modèles linéarisés. Néanmoins, la linéarisation
des modèles influe sur plusieurs propriétés vérifiées par du filtre de Kalman linéaire :
• la convergence de l’EKF n’est pas garantie. En effet, les erreurs d’estimation
peuvent être amplifiées par le gain de Kalman, calculé sous l’hypothèse que l’erreur
d’estimation est petite afin que la linéarisation du premier ordre reste valide. La
convergence de l’EKF nécessite de vérifier certaines propriétés restrictives (matrice
de covariance de l’erreur bornée, observabilité, ...) pas toujours valables en pratique
[4], [21], [25], [26]. Ainsi, comparé au filtre de Kalman linéaire, l’EKF n’est pas un
filtre optimal à cause de la linéarisation du système dynamique (1.9) - (1.10).
28
1.3. Méthodes classiques de navigation des projectiles
Figure 1.13 – Couplage des mesures IMU et GNSS dans un filtre de Kalman.
Cette solution est largement employée notamment pour la navigation des projectiles
guidés tels que l’Extended Range Guided Munition (ERGM) et Excalibur [32]. Différents
types de filtre de Kalman peuvent être utilisés pour le couplage [33]-[35].
L’un des défis de la navigation des projectiles est d’estimer avec précision l’attitude.
Pour cela, différentes approches sont employées suivant le type d’application visée.
Utilisations du GNSS : L’orientation des projectiles peut être estimée à partir des
mesures GNSS comme dans [36], qui évalue l’angle de tangage et de lacet d’un projectile en
6. Il existe plusieurs architectures d’intégration pour coupler les mesures IMU et GNSS : le couplage
lâche, le couplage serré et le couplage ultraserré comme détaillé dans [4].
29
Chapitre 1 – État de l’art
utilisant exclusivement les vitesses du projectile mesurées par le récepteur GPS embarqué
et sans considérer aucun autre capteur. Parfois, les mesures GNSS sont couplées à d’autres
capteurs tels que [37] qui valide en vol une méthode d’estimation de la vitesse de roulis
d’un projectile de 122 mm à partir de deux magnétomètres et d’un récepteur GNSS, ou
[38] qui combine les mesures d’un magnétomètre triaxial, de deux gyromètres et d’un
récepteur GPS via un filtre de Kalman pour estimer l’orientation d’un projectile.
Solutions basées sur les magnétomètres : L’orientation d’un projectile peut être déter-
minée sans mesure GNSS. Comme mentionné dans la partie (1.2.1), les magnétomètres
sont peu coûteux, capables de résister aux phases de lancement et fonctionnels sur de
larges plages de variations. C’est pourquoi, ces capteurs sont de plus en plus employés
pour l’estimation de l’orientation des projectiles comme résumé dans le tableau 1.1.
Problématique des gyromètres : Comme mentionné dans la partie (1.2.1), dans des
limites de coût raisonnables, beaucoup de gyromètres saturent en raison des vitesses de
rotation élevées et ne résistent pas aux phases de lancement des projectiles (chocs de 20 000
g à l’accélération). C’est pourquoi, plusieurs auteurs proposent des solutions d’estimation
de l’orientation d’un projectile en excluant ce type de capteur.
30
1.3. Méthodes classiques de navigation des projectiles
L’article [43] présente une méthode, illustrée dans la figure 1.14, d’estimation de l’atti-
tude basée sur un magnétomètre à trois axes, un accéléromètre à deux axes et des filtres de
Kalman en cascade afin de discriminer les différentes dynamiques. Cette solution, testée
en vol libre, montre que des capteurs à faible coût sont suffisants pour estimer l’orientation
d’un projectile, sans que l’utilisation de gyromètres soit nécessaire.
De même, l’article [8] présente un algorithme d’estimation de l’attitude d’un projectile
sans gyromètre en combinant un magnétomètre et des mesures GPS dans un filtre de
Kalman.
Les signaux GNSS sont de moins en moins utilisés pour la navigation des projectiles
du fait de leurs indisponibilités et de la menace de brouillage et de leurrage [14]. Plusieurs
approches sont proposées dans un environnement sans GNSS comme [44] qui propose
une méthode d’estimation de la vitesse d’un projectile balistique à grande vitesse et à
grande vitesse de rotation à partir d’accéléromètres. Une autre solution, présentée dans
[45], propose un algorithme basé sur des filtres de Kalman Étendus pour déterminer la
position, la vitesse et les angles de roulis, d’attaque et de dérapage à partir du champ
magnétique terrestre et d’un magnétomètre trois axes embarqué dans le projectile.
De plus, l’intégration de caméras permet de pallier aux limitations du GNSS comme
les articles [46], [47] qui présentent des méthodes d’estimation de trajectoires de projectiles
basées sur la vision stéréo.
31
Chapitre 1 – État de l’art
Pour conclure l’état de l’art relatif à la navigation des projectiles, plusieurs solutions
de navigation ont été mises en œuvre, basées principalement sur un filtre de Kalman qui
peut être de différentes natures suivant le modèle dynamique considéré. De plus, suivant
le type de projectile considéré et la dynamique associée, certains capteurs ne peuvent être
exploités. C’est le cas des mesures satellites qui sont de moins en moins utilisées du fait
de leurs vulnérabilités importantes ou de certains gyromètres qui saturent au lancement
pour des projectiles spécifiques. Au vu de ces diverses contraintes, l’intelligence artificielle
vise à s’intégrer davantage dans les solutions de navigation afin de limiter l’influence de
ces différentes limitations.
32
1.4. Intelligence artificielle appliquée au domaine militaire
• Le Deep Learning est une branche de l’IA dérivée du Machine Learning. Le Deep
Learning regroupe des algorithmes capables de mimer le fonctionnement du cerveau
humain grâce à des réseaux de neurones artificiels afin de résoudre des tâches
complexes, sans intervention humaine [49]. La phase d’apprentissage permet au
réseau de corriger lui-même ses erreurs.
Le neurone biologique
33
Chapitre 1 – État de l’art
Le neurone artificiel
Comme illustré dans la figure 1.17, le neurone artificiel est une représentation sché-
matique d’un neurone biologique, de sorte que :
- les n données d’entrée d’un neurone x = [x1 , ..., xn ]T modélisent les dendrites,
- la somme Σ et la fonction d’activation f (.) modélisent le fonctionnement du noyau
d’un neurone biologique. La fonction d’activation f (.) est une fonction mathéma-
tique qui convertit la somme des signaux d’entrée pondérés par les poids pour
produire la sortie désirée. Suivant le problème traité, différentes fonctions d’acti-
vation peuvent être utilisées.
- les poids w = [w1,j , w2,j , ..., wn,j ]T pondèrent les données d’entrée xi et modélisent
les synapses d’un neurone biologique. La notation wi,j désigne le poids allant d’un
neurone artificiel i au neurone j et est estimé lors de la phase d’apprentissage. Plus
la valeur d’un poids wi,j est importante, plus l’entrée correspondante est influente.
34
1.4. Intelligence artificielle appliquée au domaine militaire
Ainsi, un neurone artificiel effectue la somme des entrées pondérées par les poids
afin d’être traitée par une fonction d’activation pour produire la sortie y du neurone. Le
fonctionnement d’un neurone artificiel peut être résumé par l’équation suivante :
y = f (b + ω T x) (1.18)
La fonction d’activation f (.) permet de transformer de manière non linéaire les données
d’entrée et peut être de différentes natures suivant le problème à traiter [50]. Les fonctions
d’activation les plus communes sont la fonction seuil, la fonction sigmoïde, la fonction
Rectified Linear Unit (ReLU), la fonction softmax.
35
Chapitre 1 – État de l’art
Figure 1.18 – Représentation d’un réseau de neurones avec une couche cachée.
36
1.4. Intelligence artificielle appliquée au domaine militaire
Figure 1.20 – Structure d’un réseau de neurones convolutifs (Convolutional Neural Net-
work - CNN).
Figure 1.21 – Structure d’un réseau de neurones récurrents (Recurrent Neural Networks
- RNN).
37
Chapitre 1 – État de l’art
Jeu de données
Fonction de perte
La fonction de perte, notée L(y, yb), est une fonction mathématique qui vise à évaluer
l’erreur entre la sortie désirée y et la sortie déterminée par le réseau yb. La fonction d’erreur
indique la précision des prévisions du réseau et donc, quel ajustement doit être apporté
aux poids par l’algorithme d’optimisation à chaque itération. Il en existe plusieurs types
pour des problèmes de régression dont les trois plus utilisés et présentés dans la figure
1.22 sont :
- l’erreur moyenne absolue (MAE - Mean Absolute Error, L1 Loss),
La MAE est facile à calculer, robuste face aux valeurs aberrantes et au bruit mais
n’est pas dérivable en zéro.
- l’erreur quadratique moyenne (MSE - Mean Squared Error, L2 Loss),
La MSE est la fonction de perte par défaut pour des problèmes de régression. Elle
pénalise de façon analogue les grandes et les petites erreurs et est donc peu robuste
face aux valeurs aberrantes.
- la perte d’Huber (Huber loss),
1
2
(y − yb)2 pour |y − yb| ≤ δ
L(y, yb) = (1.21)
δ|y − yb| − 12 δ 2 pour |y − yb| > δ
38
1.4. Intelligence artificielle appliquée au domaine militaire
La perte d’Huber atténue l’importance donnée aux valeurs aberrantes tout en don-
nant de l’importance aux petites erreurs. De plus, elle est dérivable en 0 et le
paramètre δ peut être ajusté pour maximiser la précision du modèle. Néanmoins,
elle est coûteuse.
Algorithme d’optimisation
L’algorithme d’optimisation vise à déterminer de façon itérative les poids wi,j qui mi-
nimisent la fonction de perte L(y, yb). Les algorithmes d’optimisation utilisés pour l’entraî-
nement des réseaux de neurones s’appuient majoritairement sur l’algorithme de descente
du gradient qui permet de trouver le minimum de n’importe quelle fonction convexe en
convergeant progressivement vers celui-ci. Cet algorithme est résumé par trois étapes :
1) Initialisation aléatoire des poids.
2) Après chaque nouvelle observation y, le gradient de la fonction de perte L(y, yb) est
calculé par rapport aux poids du réseau, tel que :
∂L(y, yb)
∇L = (1.22)
∂wi,j
39
Chapitre 1 – État de l’art
Taux d’apprentissage
40
1.4. Intelligence artificielle appliquée au domaine militaire
Exemple : le projet MAVEN [56] présenté par le département américain de la Défense (DoD), ex-
ploite l’IA pour trier des données, dans un but de surveillance et de reconnaissance de zones d’in-
térêts à partir d’images provenant de drones. MAVEN a été déployé dès 2017 au Moyen-Orient
pour aider les militaires à exploiter les vidéos provenant des drones ScanEagle afin d’identifier
les objets d’intérêts.
• L’entraînement militaire où l’IA est utilisée par des simulateurs afin de créer
une multitude de scénarios variés et réalistes, dans le but d’améliorer les formations
des militaires.
Exemple : l’entreprise Aptima travaille pour l’US Air Force Research Laboratory (AFRL) afin de
développer un logiciel de formation des pilotes, pour les entraîner à piloter l’avion dans divers
scénarios et également pour les former à réagir face à des attaques ennemies [58].
• La cybersécurité où l’IA vise à être utilisée pour détecter des intrusions mal-
veillantes, anticiper des menaces, mesurer le niveau de résistance des systèmes et
pour protéger et bloquer les réseaux, les communications, les programmes infor-
41
Chapitre 1 – État de l’art
42
1.4. Intelligence artificielle appliquée au domaine militaire
hybrides les plus employées sont les Deep Kalman Filter ; filtre de Kalman dont l’un
ou plusieurs modèles du filtre sont remplacés par un réseau de neurones. Suivant
le type d’application visée, différents réseaux peuvent être employés.
• La navigation de bout-en-bout vise à exclure tous modèles mathématiques et uti-
liser exclusivement des réseaux de neurones pour la navigation. Généralement, les
réseaux employés sont des réseaux récurrents tels que les LSTM, les GRU ...
La navigation hybride
IMU/GNSS : Comme mentionné dans la partie (1.4), les signaux GNSS ne sont pas
toujours disponibles du fait de la configuration du terrain ou de la trop faible puissance
des signaux. Ainsi, les filtres de Kalman, comme présentés dans la figure 1.13, basés sur
Figure 1.24 – (a) Filtre de Kalman IMU/GNSS pour l’estimation de la trajectoire d’un
corps en mouvement dans le cas où les mesures GNSS sont disponibles. (b) Deep Kalman
Filter proposé pour pallier aux problèmes d’indisponibilité du GNSS.
les mesures de l’IMU et du GNSS divergent lorsque ce dernier n’est plus disponible pour
corriger les prédictions basées sur les mesures de l’IMU. Afin de pallier aux problèmes
d’indisponibilité du signal GNSS, plusieurs Deep Kalman Filter sont proposés dans la
littérature pour remplacer les signaux manquants par un réseau de neurones, comme
illustré schématiquement dans la figure 1.24.
Les articles [64]-[70] proposent des Deep Kalman Filters pour résoudre les problèmes
d’indisponibilité du GNSS à l’aide de réseaux de neurones pour générer des pseudos me-
43
Chapitre 1 – État de l’art
sures dudit GNSS. Ces travaux sont principalement appliqués à la navigation des robots
terrestres et utilisent différents types de réseaux suivant les données d’entrée considérées.
Observations d’un filtre de Kalman : La précision d’un filtre de Kalman est dépen-
dante de la qualité des observations, nécessaires pour l’étape de mise à jour. Or, les
observations ne sont pas toujours fidèles pour corriger les prédictions du filtre. En effet,
pour satisfaire les contraintes financières et d’espace imposées au système, des capteurs
à faible coût sont utilisés produisant des observations bruitées et biaisées. Une seconde
contrainte est le traitement de ces mesures, nécessitant parfois des modélisations com-
plexes et valables que sous certaines hypothèses. C’est pourquoi, l’IA peut être utilisée
afin de générer des observations précises afin de corriger les prédictions du filtre comme
illustré dans la figure 1.25.
Figure 1.25 – Deep Kalman Filter où le réseau de neurones est utilisé pour prétraiter
les mesures des capteurs afin de générer les observations d’un filtre de Kalman.
Les articles [71]-[76] présentent des filtres de Kalman pour la navigation où des réseaux
de neurones sont entraînés pour générer des observations d’après les mesures de capteurs
imparfaits ou complexes à traiter.
Par exemple, l’article [72] propose de déterminer la mesure et l’incertitude de l’angle
de dérive d’un véhicule par des LSTM alimentés par des capteurs embarqués, car cet
angle est complexe à mesurer. Des MLP sont présentés dans [73] afin de générer des
pseudos mesures de l’angle de roulis d’un véhicule à l’aide de l’IMU pour satisfaire des
contraintes de coût. Des CNN sont employés dans [75] pour extraire les caractéristiques
des signaux électriques mesurés par des électrodes placées sur la peau. Sans avoir recours à
un modèle mathématique de régression, le CNN produit ainsi des pseudos observations du
mouvement afin de mettre à jour un filtre de Kalman pour estimer la position de la main.
44
1.4. Intelligence artificielle appliquée au domaine militaire
Ce même article propose également plusieurs LSTM pour estimer le modèle d’évolution
et d’observation, les covariances et le gain d’un filtre de Kalman.
Covariances d’un filtre de Kalman : Un filtre de Kalman est sensible au réglage de la
matrice de covariance du bruit de modèle et du bruit de mesure, qui traduisent la confiance
accordée aux modèles et aux mesures. Dans le cas d’un filtre de Kalman classique, ces
matrices sont constantes et souvent réglées manuellement par l’utilisateur. Dans certaines
applications, il est préférable d’utiliser des matrices de covariance variables et adaptées
au problème de navigation, comme dans le cas où un capteur est dégradé dans une confi-
guration donnée. Pour cela, des réseaux de neurones peuvent être entraînés pour régler
dynamiquement les matrices de covariance du bruit de modèle et du bruit de mesure d’un
filtre de Kalman comme présenté dans la figure 1.26. Pour ce faire, plusieurs solutions
sont présentées dans [77]-[82] utilisant des réseaux de neurones comme le MLP, le CNN
ou le RNN.
Figure 1.26 – Deep Kalman Filter dans le cas où la covariance du bruit de mesure est
ajustée par un réseau de neurones.
Modèles d’un filtre de Kalman : Les différents modèles qui constituent un filtre de Kal-
man sont parfois complexes à identifier et nécessitent plusieurs approximations. C’est
pourquoi, plusieurs articles proposent de modéliser certaines étapes d’un filtre de Kalman
par un réseau de neurones comme illustré schématiquement dans la figure 1.27.
Ainsi, [83] propose de modéliser les erreurs de l’IMU d’un filtre de Kalman pour estimer
la trajectoire d’un véhicule terrestre. L’article [84] présente des réseaux récurrents pour
apprendre à calculer le gain de Kalman d’un filtre. Le modèle d’évolution du filtre peut
également être déterminé par des réseaux de neurones comme dans [85]. Une méthode
45
Chapitre 1 – État de l’art
Figure 1.27 – Deep Kalman Filter pour estimer l’un des modèles d’un filtre de Kalman
tel que le calcul du gain de Kalman.
La navigation de bout-en-bout
La prédiction de la trajectoire d’un objet en mouvement est essentielle pour son gui-
dage. Pour cela, de nombreuses solutions, majoritairement basées sur des réseaux ré-
currents, sont utilisées. Ce type de réseau, parfaitement adapté au traitement de séries
temporelles, permet d’apprendre un modèle à partir des données brutes des capteurs.
Ainsi, le réseau apprend notamment les contraintes physiques du corps en mouvement
ainsi qu’un modèle d’erreur des capteurs. Cette solution, bien que basée exclusivement
sur l’IA, permet de capturer des relations complexes entre les données, ce qui est généra-
lement difficile à modéliser mathématiquement. Des exemples d’utilisation de l’IA pour
la prédiction de trajectoires sont présentés dans la table 1.2.
Le chapitre 4 de ce document présente une méthode de navigation de bout-en-bout
pour estimer les trajectoires de plusieurs projectiles, afin d’évaluer la précision et les
limites de cette approche.
46
1.5. Jeu de données de trajectoires de projectiles
Table 1.2 – Utilisation des réseaux de neurones pour l’estimation des trajectoires de
corps en mouvement.
47
Chapitre 1 – État de l’art
loppé pour simuler les trajectoires de projectiles conventionnels ainsi que des projectiles
guidés dotés d’actionneurs (ailettes, canards ou propulseurs).
Le modèle de trajectoire de BALCO prend en compte plusieurs modèles tels que :
- le modèle terrestre : terre plate (gravité fixe définie par l’utilisateur), sphérique (mo-
dèle de masse ponctuelle STANAG 4355), ellipsoïdale (modèle mondial WGS84),
- le modèle d’atmosphère : atmosphère standard (ISO 2533-1975) ou définie par l’uti-
lisateur,
- le modèle aérodynamique : profil aérodynamique axisymétrique ou non axisymé-
trique (coefficients aérodynamiques dépendant du temps), coefficients aérodyna-
miques décrits par des tables de correspondance ou des fonctions polynomiales,
- le modèle de poussée défini par l’utilisateur ou par le modèle STANAG 4355,
- le modèle d’actionneur : ailettes, canards, spoilers, propulseurs,
- le modèle de guidage, navigation et contrôle (GNC) implémenté sur une plate-forme
indépendante du code à l’aide d’une interface de communication.
La précision de BALCO a été validée par rapport aux programmes de référence PRO-
DAS (Projectile Rocket Ordnance Design and Analysis System) et HTRAJ (US Army
ARDEC) [96]. Pour cela, 400 tests sont effectués en considérant quatre projectiles aux
données aérodynamiques connues : le 50 cal. M8, le Basic Finner 30 mm, le mortier 120
mm M934 et l’obus 155 mm M795. La validation a été effectuée en considérant différentes
conditions initiales (vitesse initiale, élévation du canon, angle d’attaque, vitesse angulaire)
et conditions météorologiques (standard, froid, chaud et vent).
Le repère ECEF
48
1.5. Jeu de données de trajectoires de projectiles
Le repère local de navigation est un repère orthogonal centré sur un point fixe à la sur-
face de la Terre et tangent à sa surface. Les axes xn , yn et zn sont orientés respectivement
selon le nord, l’est et le centre de la Terre (NED - North East Down).
Le repère objet
Le repère objet (body frame) est un repère hypothétique idéal placé exactement au
centre de gravité du projectile. Les axes xb , yb et zb de ce repère sont orientés respective-
ment vers l’avant (direction de déplacement), la droite et le bas (direction de la gravité)
du projectile.
Le repère capteur
Le repère capteur (sensor frame) est rigidement fixé au projectile et est désaxé par
rapport au centre de gravité du projectile. Ce repère est considéré comme le référentiel
où sont effectuées les mesures inertielles.
49
Chapitre 1 – État de l’art
Figure 1.29 – Repère objet (body frame) et repère capteur (sensor frame).
Données de BALCO
50
1.5. Jeu de données de trajectoires de projectiles
- les mesures IMU effectuées dans le repère capteur s (repère vert sur la figure
1.29) issues des mesures IMU parfaites où un modèle d’erreur de capteur est
ajouté.
Ce modèle d’erreur de capteur comprend un modèle de désalignement, un fac-
teur de sensibilité, un biais et un bruit (supposé gaussien de moyenne nulle)
spécifique à chaque axe du capteur.
Ainsi, ce modèle d’erreur modélise avec précision des mesures inertielles pro-
duites par une centrale inertielle embarquée dans un projectile.
- les mesures IMU DYN effectuées dans le repère capteur s (repère vert sur la
figure 1.29) issues de mesures IMU auxquelles une fonction de transfert est
ajoutée pour chacun des trois capteurs. Ainsi, les mesures IMU DYN sont
modélisées par :
1
ycapteur, IM U DY N
(s) = ycapteur, IM U
(s) (1.24)
1 + as + bs2 + cs3
avec ycapteur,IM U les mesures IMU du capteur considéré, ycapteur,IM U DY N les me-
sures IMU DYN correspondantes et avec a, b et c les coefficients de la fonction
de transfert déterminés par BALCO. Ce modèle de capteur permet de modéliser
la réponse des trois capteurs sur leurs plages de fonctionnement respectives.
Les paramètres des modèles d’erreur des capteurs inertiels sont déterminés d’après
les fiches techniques de capteurs MEMS à bas coût disponibles dans le commerce
et d’après des mesures d’étalonnage effectuées par l’ISL.
• le champ magnétique de référence hn ∈ R3×1 exprimé dans le repère de
navigation n (repère noir sur la figure 1.29), supposé constant pendant le vol du
projectile et définit d’après le modèle magnétique mondial.
• les paramètres de vol spécifiques à chaque type de projectile considéré. Ces
paramètres sont détaillés dans la suite de ce document.
• le vecteur temps k∆t où ∆t est la période d’échantillonnage de l’IMU.
• la trajectoire de référence comprenant la position p ∈ R3×1 , la vitesse v ∈ R3×1
et les angles d’Euler Ψ ∈ R3×1 du projectile dans le repère de navigation n à la
fréquence de l’IMU.
51
Chapitre 1 – État de l’art
Projectiles étudiés
Le jeu de données produit par BALCO comprend les trajectoires simulées de quatre
projectiles différents présentés dans la figure 1.31 : le Basic Finner de 30 mm, le projectile
Figure 1.31 – Caractéristiques des trajectoires d’un mortier de 120 mm, d’un obus de
155 mm, d’un Basic Finner de 30 mm et d’un projectile de 40 mm.
52
1.5. Jeu de données de trajectoires de projectiles
de 40 mm, le mortier de 120 mm et l’obus de 155 mm. L’ensemble des trajectoires de ces
quatre projectiles est obtenu en considérant un modèle de Terre sphérique, un modèle
d’atmosphère standard, des coefficients aérodynamiques fonctions du nombre de Mach 7
et sans aucun modèle de poussée.
Le mortier de 120 mm et l’obus de 155 mm sont caractérisés par des trajectoires
balistiques contrairement au Basic Finner et au projectile de 40 mm qui sont caractérisés
par des tirs tendus. Comme présenté dans la figure 1.32, une trajectoire balistique est
une trajectoire parabolique qui permet au projectile d’atteindre un objectif placé derrière
un obstacle. Les tirs tendus sont caractérisés par de faibles portées et les trajectoires se
rapprochent de droites.
53
Chapitre 1 – État de l’art
est caractérisée par un angle d’élévation du canon important alors qu’un tir tendu est
caractérisé par un faible angle d’élévation du canon.
1.6 Conclusion
Ce chapitre a présenté l’état de l’art existant concernant les projectiles, la navigation
des projectiles et l’intelligence artificielle.
Deux types de capteurs sont généralement embarqués dans les projectiles : une centrale
inertielle composée d’accéléromètres, de gyromètres et possiblement de magnétomètres, et
un récepteur GNSS. Les mesures inertielles fournissent une solution de navigation précise
à court terme mais qui dévie à long terme à cause de la dérive des capteurs. À l’inverse,
le récepteur GNSS fournit des informations de positionnement absolu mais les signaux ne
sont pas toujours disponibles. D’après les articles présentés dans ce chapitre, les mesures
de ces capteurs sont habituellement fusionnées par des filtres de Kalman. Toutefois, de
plus en plus de travaux sont proposés dans un environnement sans GNSS.
De plus, les récents progrès de l’intelligence artificielle en font un outil intéressant pour
le domaine militaire. Bien que largement intégrée dans des programmes militaires, l’IA
est très peu employée pour des systèmes de navigation. En effet, la littérature présente
majoritairement des applications de l’IA pour la navigation terrestre.
Enfin, au vu de la diversité du jeu de données de trajectoires utilisé dans le cadre de ces
travaux, l’analyse de plusieurs approches de navigation basées en partie sur l’IA semble
nécessaire, afin de définir leurs apports et leurs intérêts pour estimer les trajectoires des
différents projectiles.
54
Chapitre 2
Sommaire
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2 Le filtre de Kalman Étendu Invariant . . . . . . . . . . . . . . 57
2.2.1 Groupes de Lie matriciels, algèbres et applications . . . . . . . 58
2.2.2 Théorèmes fondamentaux de la théorie des IEKF . . . . . . . . 61
2.2.3 Équations d’un filtre de Kalman Étendu Invariant . . . . . . . 63
2.3 Filtre de Kalman Imparfait Invariant Étendu . . . . . . . . . 66
2.3.1 Introduction à l’Imp.IEKF . . . . . . . . . . . . . . . . . . . . 66
2.3.2 Équations d’un Imp.IEKF . . . . . . . . . . . . . . . . . . . . . 67
2.3.3 Propriétés de l’Imp.IEKF . . . . . . . . . . . . . . . . . . . . . 70
2.4 Application de l’Imp.IEKF à la navigation de projectiles . . 71
2.4.1 Formulation du problème de navigation . . . . . . . . . . . . . 71
2.4.2 Imp.RIEKF pour la navigation de projectiles . . . . . . . . . . 73
2.4.3 EKF pour la navigation de projectiles . . . . . . . . . . . . . . 78
2.4.4 Étude d’observabilité . . . . . . . . . . . . . . . . . . . . . . . . 80
2.4.5 Étude des performances . . . . . . . . . . . . . . . . . . . . . . 86
2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
2.1 Introduction
Les modèles de navigation sont non linéaires, c’est pourquoi, un filtre de Kalman
Étendu (Extended Kalman Filter - EKF) est généralement employé pour l’estimation de
la trajectoire d’un corps en mouvement. Les dynamiques non linéaires sont alors linéari-
sées au premier ordre autour des estimations précédentes afin d’appliquer la méthodologie
55
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
classique d’un filtre de Kalman. Cette étape suppose donc des erreurs d’estimation suffi-
samment petites, ce qui n’est pas toujours vérifié en pratique. C’est pourquoi, du fait de la
linéarisation, l’EKF ne possède aucune garantie de convergence et peut créer des fausses
observabilités. De plus, l’EKF est conçu pour les espaces euclidiens, ce qui rend complexe
la représentation de l’orientation d’un corps en mouvement, plus facilement modélisée sur
un groupe de Lie [99], [100].
Pour cela, une extension de l’EKF a été développée : le filtre de Kalman Étendu
Invariant (Invariant Extended Kalman Filter - IEKF) [82], [99]-[106]. Un IEKF est un
observateur non linéaire asymptotiquement stable défini sur un groupe de Lie matriciel.
En effet, la dynamique de l’erreur invariante de l’IEKF est indépendante des états estimés,
permettant ainsi de prouver les propriétés de stabilité et qu’un IEKF ne crée pas de
fausses observabilités. De plus, l’utilisation des groupes de Lie matriciels permet à l’IEKF
de prendre en compte les non linéarités de l’espace d’état.
L’IEKF est de plus en plus utilisé pour résoudre des problèmes de navigation du fait de
ses propriétés de convergence et d’observabilité. Pour cela, le système doit satisfaire une
propriété fondamentale qui n’est généralement vérifiée que par une partie de la dynamique
du système. Dans ce cas, un filtre de Kalman Imparfait Invariant Étendu (Imperfect
Invariant Extended Kalman Filter - Imp.IEKF) [99] peut être employé. Il s’agit d’une
combinaison entre un EKF et un IEKF dans le sens où une partie des états estimés évolue
dans un groupe de Lie et une seconde partie évolue dans un espace euclidien. L’Imp.IEKF
ne bénéficie pas des propriétés de stabilité de l’IEKF mais présente tout de même des
caractéristiques d’observabilité et de précision meilleures que celles d’un EKF.
Ce chapitre détaille la théorie des Filtres de Kalman Étendu Invariant et de ses drivées.
Ces types de filtres sont employés dans le cadre de cette thèse pour résoudre plusieurs
problèmes de navigation des projectiles. Les objectifs de ce chapitre sont :
→ de présenter la théorie des filtres de Kalman Étendu Invariant et des filtres de
Kalman Imparfait Invariant Étendu, utilisés lorsque la dynamique n’évolue pas
entièrement sur un groupe de Lie matriciel.
→ de vérifier, à travers un exemple d’application employé pour la navigation des pro-
jectiles, les propriétés d’un Imp.IEKF. Pour cela, la précision de l’Imp.IEKF est
comparée à celle d’un EKF standard, dérivé à partir des mêmes modèles dyna-
miques. De plus, les propriétés d’observabilité des deux filtres sont analysées.
La première partie (2.2) présente la théorie associée aux filtres de Kalman Étendu
Invariant. Une seconde partie (2.3) détaille le principe de fonctionnement des filtres de
56
2.2. Le filtre de Kalman Étendu Invariant
Kalman Imparfait Invariant Étendu et ses spécificités. Enfin, une troisième partie (2.4)
se focalise sur les performances d’un Imp.IEKF pour la navigation des projectiles afin
de visualiser leurs pertinences. Ce filtre est comparé à un EKF standard et une étude
d’observabilité est présentée.
Un filtre de Kalman Étendu Invariant (Invariant Extended Kalman Filter - IEKF) est
un observateur invariant non linéaire asymptotiquement stable pour des systèmes définis
sur un groupe de Lie matriciel et possédant des symétries [99]-[105].
Les observateurs invariants, détaillés dans [107], sont une classe d’observateurs 1 ap-
propriée aux systèmes dynamiques possédant des symétries, c’est-à-dire, aux systèmes
ayant le même comportement après avoir subi une transformation. Pour cela, les groupes
de Lie matriciels permettent de préserver les symétries d’un système.
Un IEKF, comme tous filtres de Kalman, vise à minimiser l’erreur d’estimation. Un
IEKF est associé à une erreur invariante sur le groupe de Lie qui est linéarisée autour de
l’élément neutre du groupe. La dynamique d’évolution de l’erreur invariante est totalement
indépendante des estimations et est totalement définie par une équation différentielle
linéaire sur l’algèbre de Lie associée. Les propriétés vérifiées par l’erreur invariante et la
linéarisation autour de l’élément neutre du groupe permettent de démontrer qu’un IEKF
est un observateur non linéaire asymptotiquement stable 2 [99]-[105], [108].
De plus, plusieurs exemples d’applications montrent que l’IEKF surpasse l’EKF pour
résoudre des problèmes de navigation [82], [101]-[104], [106]. En conséquence, l’IEKF est
un estimateur approprié pour les applications de navigation.
Cette partie présente tout d’abord les groupes de Lie matriciels, leurs algèbres et les
applications associées. Puis, les théorèmes fondamentaux vérifiés par l’erreur invariante
des IEKF sont énoncés et les équations des IEKF sont détaillées.
1. Un observateur estime l’état d’un système dynamique à partir de mesures incomplètes et indirectes
de l’état [107].
2. L’erreur d’estimation d’un observateur invariant d’un système évoluant sur un groupe de Lie et pos-
sédant des symétries est indépendante des états estimés, donc les propriétés des groupes de Lie permettent
de concevoir des observateurs convergents [99].
57
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
Définition 2.2.1 (Groupe [109]-[111]). Un groupe G est un ensemble muni d’une loi
de composition interne définie telle que :
(x, y) 7→ x ∗ y (2.1)
Ainsi, l’élément identité du groupe de Lie matriciel est la matrice identité. Le produit et
l’inverse sont lisses (de classe C ∞ ) donc ces fonctions sont indéfiniment dérivables sur
un intervalle donné [109], [110].
Les propriétés d’un groupe de Lie matriciel permettent de définir un espace tangent
au groupe en tout point.
g ∈ Rd×d ⊂ RN ×N (2.3)
58
2.2. Le filtre de Kalman Étendu Invariant
Définition 2.2.4 (Matrice exponentielle expm (.) [99]-[104]). L’algèbre de Lie g est
reliée au groupe de Lie matriciel G par la matrice exponentielle expm (.) classique :
g → G
expm : P+∞ Ak
(2.4)
A 7→ expm (A) = k=0 k!
Définition 2.2.5 (Carte linéaire Lg (.) [99]-[104]). L’algèbre g est identifiée à l’espace
euclidien associé Rd×1 par la carte linéaire Lg (.), tel que :
Rd×1 → g
Lg : (2.5)
ξ 7→ Lg (ξ)
59
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
Il existe plusieurs groupes de Lie matriciels, mais seuls les groupes SO(3) et SE2 (3)
[99]-[104] sont détaillés dans ce document du fait de leurs utilisations pour la navigation.
Le groupe de rotation SO(3) est un groupe de Lie utilisé en navigation pour représenter
l’orientation R d’un corps dans l’espace. Le groupe de rotation SO(3) et son algèbre so(3),
représentant l’espace des matrices asymétriques, sont définis tels que :
n o n o
SO(3) := R ∈ R3×3 , RT R = I3 , det(R) = 1 so(3) = A ∈ R3×3 , A = −AT (2.7)
x
1
x
1
0 −x3 x2
Lso(3) x2 = x2 = x3
0 −x1
(2.8)
x3 x3 × −x2 x1 0
sin(∥ξR ∥) 2
R ∥/2)
expSO(3) (ξR ) = I3 + ∥ξR ∥
[ξR ]× + 2 sin(∥ξ
∥ξR ∥2
[ξR ]2× (2.9)
L’opérateur Lso(3) (.), noté [.]× , vérifie plusieurs propriétés de sorte que ∀ (a, b) ∈ R3×1 ,
∀ R ∈ SO(3),
[a]× = −[a]T× , [a]× [b]× − [b]× [a]× = [−[b]× a]× , [Ra]× = R[a]× RT . (2.10)
Le groupe SE2 (3) est un groupe de Lie matriciel permettant de modéliser l’orientation,
la vitesse et la position d’un corps en mouvement de sorte que :
R v p
SE2 (3) := 01×3
1 0
, R ∈ SO(3), (v, p) ∈ R3×1 (2.11)
0
0 1
1×3
L’opérateur linéaire Lse2 (3) : R9×1 → gse2 (3) et l’application exponentielle expSE2 (3) :
60
2.2. Le filtre de Kalman Étendu Invariant
d
χt = fut ( χt ) (2.15)
dt
L’erreur invariante est au cœur de la théorie des IEKF et permet de mesurer l’écart
entre deux trajectoires sur le groupe de Lie matriciel. Ces erreurs sont invariantes aux
multiplications à gauche ou à droite par un élément du groupe.
d
ηt = gut ( ηt ) (2.18)
dt
61
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
Définition 2.2.9 (Dynamique affine de groupe [99]-[104]). Une dynamique fut (.)
évoluant sur le groupe de Lie matriciel G est dite affine de groupe si elle satisfait :
∀(a, b) ∈ G, fut (ab) = afut (b) + fut (a)b − afut (IN )b (2.19)
L’erreur invariante, associée à une dynamique affine de groupe permet de vérifier deux
propriétés fondamentales qui constituent la base de la théorie des IEKF.
d L
ηt = guLt ( ηt L ) = fut ( ηt L ) − fut (IN )ηt L (2.20)
dt
d R
ηt = guRt ( ηt R ) = fut ( ηt R ) − ηt R fut (IN ) (2.21)
dt
Le théorème 2.2.1 montre que si la dynamique du système (2.15) est affine de groupe,
c’est-à-dire qu’elle vérifie la proposition (2.19), alors l’évolution de l’erreur invariante ηt
est indépendante des états du système.
d
ξt = At ξt (2.22)
dt
Alors,
∀t ⩾ 0, ηt = exp( ξt ) (2.23)
62
2.2. Le filtre de Kalman Étendu Invariant
Le théorème 2.2.2 3 implique que l’erreur non linéaire peut être déterminée à partir
d’une équation différentielle linéaire variant dans le temps. L’application exponentielle
exp(.) permet de linéariser ηt et d’approcher localement ηt par un vecteur ξt ∈ Rd×1
[99]-[104] Ainsi, des problèmes non linéaires impliquent des équations d’erreur linéaires, à
condition que la variable d’erreur soit judicieusement choisie.
d
χt = fut ( χt ) + χt wt (2.24)
dt
avec ut ∈ Rnu l’entrée de commande, χt l’état évoluant sur un groupe de Lie matriciel
G ⊂ RN ×N dont l’algèbre est notée g ∈ Rd×d , wt ∈ g un bruit blanc Gaussien, et avec
fut (.) la fonction d’évolution affine de groupe vérifiant ainsi la proposition (2.19).
Le système (2.24) est associé à des observations invariantes à gauche telles que [101] :
Yt = χ t d + V (2.25)
ηt = χt −1 χbt . (2.26)
d
ηt = gut ( ηt ) − wt ηt = fut ( ηt ) − fut (IN )ηt − wt ηt (2.27)
dt
3. La démonstration des théorèmes 2.2.1 et 2.2.2 sont disponibles dans [101].
63
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
Comme dans un EKF conventionnel, l’erreur invariante est supposée petite afin de
linéariser au premier ordre le système dynamique pour appliquer la méthodologie standard
d’un filtre de Kalman. Lorsque l’erreur invariante est petite, ηt ≈ IN , alors, localement
autour de la matrice d’identité IN , le groupe de Lie matriciel G et son algèbre peuvent
être identifiés à un espace vectoriel Rd×1 . Donc, l’erreur invariante ηt est identifiée par
l’application exponentielle exp(.) à un élément de Rd×1 , nommée erreur linéarisée. L’erreur
linéarisée ξt ∈ Rd×1 est alors définie telle que :
Étape de prédiction d’un LIEKF : La prédiction de l’état estimé χct est obtenue en
considérant la dynamique du système (2.24) avec des bruits nuls et la prédiction de la
covariance Pt est donnée par l’équation de Riccati :
d d
ct = fut (χ
χ ct ), Pt = At Pt + Pt At T + Q
b
t (2.29)
dt dt
ct ∈ G l’état estimé, fut (.) la fonction d’évolution affine de groupe vérifiant l’équation
avec χ
(2.19), Pt ∈ Rd×d la matrice de covariance de l’erreur linéarisée, At ∈ Rd×d la matrice
d’évolution et Qb ∈ Rd×d la matrice de covariance du bruit de modèle modifié w bt ∈ Rd×1
t
Étape de mise à jour d’un LIEKF : Les prédictions sont mises à jour via les observa-
tions invariantes à gauche (2.25) de sorte que :
χbk|k = χbk|k−1 exp Kk (χbk|k−1 )−1 Y − d , Pk|k = (IN − Kk H) Pk|k−1 (2.30)
la matrice d’observation telle que Hξt = −Lg (ξt )d et Nk la matrice de covariance du bruit
c
64
2.2. Le filtre de Kalman Étendu Invariant
Yt = χt −1 d + V (2.31)
d
ηt = gut ( ηt ) − χbt wt χb−1
t η t = f ut ( ηt ) − ηt f ut (IN ) − χ
b t wt χ
b −1
t ηt (2.32)
dt
Dans le cas de petites erreurs, l’erreur invariante ηt peut être linéarisée. Soit ξt ∈ Rd×1
l’erreur linéarisée définie telle que :
d d
ct = fut (χ
χ ct ), Pt = At Pt + Pt At T + Q
b
t (2.34)
dt dt
ct ∈ G l’état estimé, fut (.) la fonction d’évolution affine de groupe (2.19), Pt ∈ Rd×d
avec χ
la matrice de covariance de l’erreur linéarisée, At ∈ Rd×d la matrice d’évolution du système
b ∈ Rd×d la matrice de covariance du bruit de modèle modifié w
et Q bt .
t
d
ξt = At ξt + wbt (2.35)
dt
permet d’identifier At définie telle que gut ( exp( ξt ) ) = Lg ( At ξt ) + o( ∥ξt ∥2 ) et wbt le bruit
de modèle modifié tel que :
65
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
et Adχt est l’opérateur adjoint défini sur l’algèbre de Lie g tel que :
g → g
Adχt : −1
(2.37)
Lg (ξ) 7→ Adχt (Lg (ξ)) = χt Lg (ξ)χt
Étape de mise à jour d’un RIEKF : Les prédictions sont mises à jour via les obser-
vations invariantes à gauches (2.31) de sorte que :
χbk|k = exp Kk χbk|k−1 Y − d χbk|k−1 , Pk|k = (IN − Kk H) Pk|k−1 (2.38)
66
2.3. Filtre de Kalman Imparfait Invariant Étendu
L’autre partie des états est embarquée dans un vecteur réel auquel est associée une erreur
linéaire. La concaténation et la linéarisation de ces erreurs permettent d’obtenir l’erreur
d’estimation associée au système non linéaire et d’identifier les matrices jacobiennes de
linéarisation. Ainsi, la théorie classique du filtre de Kalman est appliquée mais la mise à
jour exponentielle est utilisée pour les états embarqués dans les groupes de Lie matriciels.
De nombreuses propriétés de l’IEKF ne sont pas vérifiées par l’Imp.IEKF car la propa-
gation de l’erreur dépend désormais des états estimés, mais l’Imp.IEKF présente toutefois
plusieurs avantages comparés à un EKF.
Un Imp.IEKF estime les états d’un système dynamique non linéaire et les corrige par
des observations modélisées de la façon suivante [99], [102], [104] :
d χt f(θ,ut ) (χt ) + wχt
Équation d’état = (2.39)
dt θt g(θt ) + wθ
Modèle d’observation yn = h(χt , θt , wy ) (2.40)
avec χt ∈ G la partie des états à estimer embarquée dans un groupe de Lie matriciel,
θ ∈ Rp×1 l’autre partie des états à estimer embarquée dans un vecteur réel, et avec f (.),
g(.) et h(.) les modèles d’évolution et de mesures non linéaires. La dynamique f (.) est
affine de groupe uniquement pour des valeurs fixes de θ. Le bruit de modèle wt ∼ N (0, Qt )
est défini comme une concaténation de wχt et de wθ et wy ∼ N (0, Rt ) représente le bruit
de mesure.
67
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
L’erreur non linéaire associée au système (2.39) - (2.40) est définie telle que :
ηt
et = b (2.41)
θt − θt
avec ηt l’erreur invariante associée aux états χt conformément à la théorie des IEKF et
ϵθ = θbt − θt l’erreur linéaire associée aux états θt conformément à la théorie des EKF.
Afin de développer la méthodologie d’un filtre de Kalman classique, l’erreur (2.41) doit
être linéarisée. De bonnes estimations de l’état χbt impliquent que ηt est proche de In×n .
Ainsi, localement autour de l’élément identité du groupe de Lie G et par un développement
en série de Taylor de l’application exponentielle expm (.), l’erreur invariante ηt est linéarisée
de sorte que :
d
eξ = At (χbt , θbt )eξ + Adχ (χbt , θbt )wt + o(eξ ) + o(wt ) (2.44)
dt
La matrice d’évolution linéarisée At (χbt , θbt ) est alors fonction des estimations comme la
dynamique d’évolution n’est pas affine de groupe.
La prédiction des états est donnée, comme tous filtres de Kalman, par la dynamique
d’évolution dans le cas où aucune perturbation n’est présente :
d χt f(θ,ut ) (χt )
= (2.45)
dt θt g(θt )
68
2.3. Filtre de Kalman Imparfait Invariant Étendu
d T
Pt = At (χbt , θbt )Pt + Pt At (χbt , θbt ) + Adχ (χbt , θbt )Qt Adχ (χbt , θbt )T (2.46)
dt
avec les matrices At (χbt , θbt ) et Adχ (χbt , θbt ) identifiées d’après la dynamique d’évolution de
l’erreur linéarisée et Qt la matrice de covariance du bruit de modèle wt .
Les prédictions obtenues à l’étape précédente sont mises à jour par des observations
yt modélisées par (2.40) :
yt = h(χt , θt , wy ) (2.47)
h(x, wy ) − h(xb, 0) = H(χbt , θbt )eξ + N (χbt , θbt )wh + o(eξ ) + o(wy ) (2.48)
Sk = H(χbt , θbt )Pk|k−1 H(χbt , θbt )T + N (χbt , θbt )RN (χbt , θbt )T
(2.49)
Kk = Pk|k−1 H(χbt , θbt )T (Sk )−1
Suivant le type d’erreur invariante, les états et la matrice de covariance sont mis à
jour d’après les équations suivantes :
ξ
k|k = Kk (yk − ybk ) (2.50)
ϵθk|k
χbk|k χbk|k−1 exp(ξk )
Imp L-IEKF b = b
θ
k|k
θ
k|k−1
+ ϵθk|k
(2.51)
χbk|k exp(ξk )χbk|k−1
Imp R-IEKF b = b
θ k|k θk|k−1 + ϵθk|k
Pk|k = (In×n − Kk H(χbt , θbt ))Pk|k−1 (2.52)
69
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
Influence de la mise à jour exponentielle : Dans le cas d’un EKF, l’état et la cova-
riance sont mis à jour dans l’espace tangent à l’état estimé précédent du fait de la mise à
jour linéaire. Donc, comme présenté dans la figure 2.3, les estimations mises à jour évo-
luent dans un sous-espace qui ne correspond pas nécessairement à celui de l’état vrai.
70
2.4. Application de l’Imp.IEKF à la navigation de projectiles
Figure 2.3 – État mis à jour par une application linéaire comme l’EKF (en noir). État
mis à jour par une application exponentielle (en rouge).
D’après les résultats proposés dans [99], [100], les estimations d’un EKF basé sur une
erreur non linéaire et une mise à jour exponentielle évoluent dans le même sous-espace
que l’état vrai. En effet, la mise à jour exponentielle permet aux états estimés de corres-
pondre à l’espace non euclidien dans lequel évolue l’état du système. Donc, un Imp.IEKF
est adapté à des problèmes non linéaires évoluant dans des espaces non euclidiens.
71
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
Comme présenté dans la figure 2.4, l’Imp.RIEKF et l’EKF visent à estimer, à partir
des mesures bruitées et biaisées de l’accéléromètre et du gyromètre :
- l’orientation R ∈ SO(3) du repère capteur s par rapport au repère local de navi-
gation n, la vitesse v ∈ R3×1 et la position p ∈ R3×1 du repère capteur s dans le
repère local de navigation n,
- le biais des gyromètres bωs ∈ R3×1 et des accéléromètres bas ∈ R3×1 dans le repère
capteur s,
- l’orientation Rb ∈ SO(3) et la position pb ∈ R3×1 du repère objet b par rapport
au repère capteur s. Ces deux grandeurs modélisent le désalignement entre l’IMU
et le centre de gravité du projectile bien qu’une phase de calibration puisse être
envisagée [114], [115]. Par conséquent, les états Rb et pb sont associés à de faibles
dynamiques.
Les mesures des accéléromètres et des gyromètres, effectuées dans le repère capteur s
sont biaisées et bruitées. Le modèle de mesure de ces deux capteurs est alors :
avec ω̃s et ãs ∈ R3×1 les modèles de mesure des gyromètres et des accéléromètres dans s,
ωs et as ∈ R3×1 les mesures des gyromètres et des accéléromètres dans s, bωs et bas ∈ R3×1
les biais des gyromètres et des accéléromètres dans s, et Wωs et Was ∈ R3×1 les bruits des
mesures supposés blancs Gaussien.
72
2.4. Application de l’Imp.IEKF à la navigation de projectiles
Le modèle d’évolution des biais des accéléromètres et des gyromètres est un mouvement
brownien modélisé par les équations suivantes :
avec [.]× l’opérateur linéaire du groupe de Lie SO(3) et g le vecteur gravité supposé
constant pour la durée de vol du projectile.
La dynamique de l’orientation Rb et de la position pb du repère objet b par rapport au
repère capteur s est approximativement constante et définie par les équations suivantes :
D’après les modèles présentés dans la partie (2.4.1), l’Imp.RIEKF vise à estimer, à
partir d’une configuration initiale donnée, les états suivants :
x ≜ R, v, p, bωs , bas , Rb , pb (2.60)
73
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
L’entrée de commande représente les mesures des capteurs inertiels telles que ut =
h iT
ω̃sT ãTs ∈ R6×1 et les observations considérées sont la vitesse du repère objet b par
rapport au repère capteur s.
Le bruit de modèle wt associé à la dynamique d’évolution (2.54) - (2.58) est alors :
h iT
wt = WωTs WaTs 0T3×1 WbTωs WbTas WRTb WpTb ∈ R21×1 . (2.61)
Selon la méthodologie des Imp.IEKF [102], [104], une partie des états évolue dans un
groupe de Lie matriciel, associée à une erreur invariante (à droite). Ainsi, l’orientation,
la vitesse et la position du projectile sont représentées par une matrice du groupe de Lie
matriciel SE2 (3) car R ∈ SO(3), v ∈ R3×1 et p ∈ R3×1 . De même, l’orientation Rb du
repère objet b est modélisée par un élément du groupe de Lie matriciel SO(3) telle que :
R v p
χt = 01×3 1 0 ∈ SE2 (3), Rc ∈ SO(3). (2.62)
01×3 0 1
Les biais bωs et bas des capteurs inertiels et la position pb du repère objet b sont des
éléments de R3×1 .
Conformément à la méthodologie des Imp.IEKF, les erreurs associées aux états évo-
luant dans des groupes de Lie sont invariantes à droite alors que des erreurs linéaires
sont associées aux états évoluant dans un espace euclidien. Ainsi, l’erreur non linéaire
d’estimation de l’Imp.RIEKF est :
avec ξbωs = bbωs − bωs , ξbas = bbas − bas , ξpb = pbb − pb ∈ R3×1 respectivement les erreurs
linéaires du biais des gyromètres, des accéléromètres et de la position pb .
L’erreur invariante à droite ηχt ∈ SE2 (3) associée aux états (R, v, p) est par définition :
−1
Rb vb pb R v p b T v
RR b T v pb − RR
b − RR b Tp
ηχt = χbt χ−1 = 01×3 1 0 01×3 1 0 = 01×3 1 0 (2.64)
t
01×3 0 1 01×3 0 1 01×3 0 1
74
2.4. Application de l’Imp.IEKF à la navigation de projectiles
b RT ∈ SO(3)
η Rb = R (2.65)
b b
Une bonne estimation de χbt signifie que ηt est proche de I5×5 . Ainsi, localement autour
de l’élément neutre du groupe et en utilisant un développement en série de Taylor de
premier ordre de l’application exponentielle expm (.), l’erreur invariante χbt est linéarisée
telle que :
b T ≈I
ηR = RR b T v ≈ ξ , η = pb − RR
b − RR b Tp ≈ ξ .
3×3 + [ξR ]× , ηv = v v p p (2.67)
b RT ≈ I
η Rb = Rb b 3×3 + [ξRb ]× (2.68)
La prédiction de l’état x (2.60) est donnée par le système d’évolution (2.54) - (2.58)
dans le cas où aucune perturbation n’est présente :
χb
t
f (χ
c)
ut t
bωs 03×1 R[ω̃ − b ] R(ã − b ) + g v
b b b b b
s ωs × s as b
d
bas = 03×1 , avec fut (χt ) = 0 0 0 (2.70)
b
c 1×3
dt
Rb 03×3 0 0 0
b
1×3
pbb 03×1
75
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
Remarque 2.4.1. Contrairement à un IEKF classique, l’évolution fut (.) est fonction des
états estimés.
b
b
ωs,k|k−1 = bbωs,k−1|k−1 , bbas,k|k−1 = bbas,k−1|k−1 , R
b
bk|k−1 = Rbk−1|k−1 , p
b (2.74)
bbk|k−1 = pbbk−1|k−1 .
76
2.4. Application de l’Imp.IEKF à la navigation de projectiles
Les prédictions obtenues à l’étape précédente sont mises à jour par la mesure de la
vitesse du repère objet b par rapport au repère capteur s modélisée telle que :
La mesure de vb ne peut pas être formulée comme une observation invariante à droite
donc, contrairement à un IEKF, le terme de correction de l’Imp.RIEKF est calculé par
addition vectorielle standard telle que K(vb − vbb ).
R
b
k|k = ξRk|k Rk|k−1 , v
b bk|k = ξvk|k + ξRk|k v
bk|k−1 , pbk|k = ξpk|k + ξRk|k pbk|k−1 (2.80)
b
b
ωs k|k = bbωs k|k−1 + ξbωs k , b
b
as k|k = bbas k|k + ξbas k , (2.81)
R bk|k = expSO(3) (ξRbk|k )Rbk|k−1 , pbbk|k = ξpbk + pbbk|k−1 (2.82)
b b
77
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
avec xk ∈ R23×1 les états à estimer par l’EKF, f (.) le modèle d’évolution et wk les bruits
de modèle.
78
2.4. Application de l’Imp.IEKF à la navigation de projectiles
avec ϕk la matrice jacobienne du modèle d’évolution f (.) en temps discret définie telle
que :
1
2
Ω(ω˜sk− bωsk ) 04×3 04×3 − 12 E(qk ) 04×3 04×7
∂ ∗
∂q (q ⊗ (ãs − bas ) ⊗ q ) 03 03 03 −Rk 03×7
ϕk = I23×23 +
∆t (2.89)
03×4 I3 03 03 03 03×7
013×23
Comme pour l’Imp.RIEKF, les observations considérées pour mettre à jour les prédic-
tions de l’EKF sont :
vb = RbT RT v + [ω̃s − bωs ]× pb + wy (2.90)
Les états et la covariance sont alors mis à jour d’après la méthodologie standard d’un
EKF tel que :
−1
Kk = Pk|k−1 HkT Hk Pk|k−1 HkT + Rk (2.91)
xbk|k = xbk|k−1 + Kk (03×1 − vbbk ) (2.92)
Pk|k = (I − Kk Hk )Pk|k−1 (2.93)
∂h
H= |
∂x x
=
h i (2.94)
∂
RbT ∂q (q ∗ ⊗ v ⊗ q) RbT RT 03×3 [pb ]× 03×3 ∂
(q ∗
∂qb b
⊗ RT v ⊗ qb ) [ω̃s − bωs ]×
79
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
La première étape de l’analyse de l’observabilité est l’identification des états non ob-
servables du système non linéaire en temps continu (2.54) - (2.58) utilisés pour dériver
l’EKF et l’Imp.IEKF.
Si le système non linéaire a un ou plusieurs états non observables, alors ces mêmes états
devraient être non observables pour les filtres dérivés à partir de ce système. Sinon, cela
signifie que les filtres créent de fausses observabilités.
Soit le système non linéaire en temps continu :
ẋ = f (x, u)
(2.95)
z = h(x)
avec f (.) et h(.) les modèles d’évolution et de mesure non linéaires, et u les entrées.
Le système (2.95) est observable lorsque O(x, u) satisfait la condition de rang, c’est-à-
dire lorsque O(x, u) est de rang plein. Dans le cas d’un système inobservable, l’analyse de
l’espace nul de la matrice O(x, u) permet de déterminer les états inobservables.
80
2.4. Application de l’Imp.IEKF à la navigation de projectiles
Le modèle d’évolution non linéaire en temps continu utilisé pour dériver l’EKF et
l’Imp.IEKF est défini par les équations (2.54) - (2.58). Les termes de bruit sont omis car
ils n’influencent pas l’analyse d’observabilité.
Afin d’alléger les calculs, ces équations sont définies dans le repère capteur s et les matrices
de rotation R et Rb sont représentées à partir de leurs vecteurs de rotation ϕ ∈ R3×1 et
ϕb ∈ R3×1 d’après la méthodologie présentée dans [117], [118] :
R = exp(ϕ),
(2.98)
Rb = exp(ϕb )
ϕ̇ = R(ω̃s − bωs ),
(RT˙ v) = [ω̃s − bωs ]× RT v + (ãs − bas ) + RT g,
(2.99)
(RT˙ p) = [ω̃s − bωs ]× RT p + RT v
ḃωs = 03×1 , ḃas = 03×1 , ϕ̇b = 03×1 , ṗb = 03×1
v = RT v, p = RT p,
(2.100)
ω = ω̃s − bωs , a = ãs − bas .
81
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
∂ ∂
δ1,i = ∂bω
[ω]i−1
× ([ω]× v + a) δ2,i = ∂bω
i−1
[ω]× ([ω]× v + a + RT g) (2.104)
La matrice d’observabilité O(x, u) (2.103) n’est pas une matrice de rang complet, ainsi
la condition de rang n’est pas satisfaite et donc le système non linéaire (2.101) - (2.102)
n’est pas complètement observable.
D’après la première colonne de Uc (x, u), la rotation autour de l’axe de gravité (angle
de lacet ψ) n’est pas observable. La seconde colonne de Uc (x, u) indique que la position
p n’est pas observable. Conformément à la troisième colonne de Uc (x, u), la position pb
n’est pas observable avec une seule mesure ω. La position pb devient observable lorsque
plusieurs mesures différentes sont obtenues.
82
2.4. Application de l’Imp.IEKF à la navigation de projectiles
Selon l’analyse d’observabilité, le système non linéaire (2.54) - (2.58) a trois degrés
de liberté non observables ; ψ, p et pb (lorsque ω est constant). Ainsi, lorsque le filtre de
Kalman est utilisé pour l’estimation, les mêmes propriétés d’observabilité doivent être
constatées. Si, lors de l’étape de linéarisation, la matrice d’observabilité du filtre gagne
en rang à cause d’erreurs dans les estimations des états, alors le filtre crée une fausse
observabilité.
Le modèle d’évolution de l’erreur linéarisée d’un filtre de Kalman non linéaire varie
dans le temps donc la matrice d’observabilité locale est utilisée pour effectuer l’analyse
d’observabilité [28].
L’analyse de la matrice d’observabilité locale permet de conclure sur les états observables
par un filtre de Kalman non linéaire. Il est ainsi facile de vérifier que les états observables
par le filtre soient les mêmes que les états observables du système non linéaire.
Définition 2.4.3 (Observabilité locale [119]). Soit le modèle discret d’un filtre de
Kalman non linéaire :
83
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
Le système (2.106) - (2.107) est observable localement sur la période de temps [k, k + n −
1], si et seulement si la matrice d’observabilité locale M est de rang n pour la période
[k, k + n − 1]. Dans le cas contraire, l’étude de l’espace nul de M permet de déterminer
les directions non observables par le filtre.
Il a été démontré que le système physique a trois degrés de liberté non observables
qui sont l’angle de lacet ϕ, la position p et la position pb lorsque ω est constant. Ainsi,
l’Imp.RIEKF doit partager les mêmes propriétés d’observabilité.
D’après la définition 2.4.3, la matrice d’observabilité locale de l’Imp.RIEKF est :
0 RkT 0 −Rbk [pbk ]× 0 [RkT vk ]× δ0.7
δ1.1 δ1.2 0 δ1.4 δ1.5 δ1.6 δ1.7
δ2.1 δ2.2 0 δ2.4 δ2.5 δ2.6 δ2.7
MImp.RIEKF =
δ3.1 δ3.2 0 δ3.4 δ3.5 δ3.6 δ3.7 (2.109)
δ4.1 δ4.2 0 δ4.4 δ4.5 δ4.6 δ4.7
δ5.1 δ5.2 0 δ5.4 δ5.5 δ5.6 δ5.7
δ6.1 δ6.2 0 δ6.4 δ6.5 δ6.6 δ6.7
T T i−1 T
, δi.5 = − j=0
P
avec δi.1 = iRk+i [g] ∆ , δ = Rk+i Rk+j , δi.6 = [Rk+i vk+i ]× ,
P × t i.2
T i−1 i−1 2(i−j)−1
δi.4 = −Rk+i [g]× Rk+j ∆2t , δi.7 = −Rbk+i [ω̃sk+i −bωsk+i ]× .
P
j=0 [vk+j ]× Rk+j ∆t + j=0 2
La matrice d’observabilité locale de l’Imp.RIEKF MImp.RIEKF n’est pas de rang com-
plet, donc plusieurs états ne sont pas observables par le filtre.
T
La première colonne de MImp.RIEKF (2.109) est δi.1 = iRk+i [g]× ∆t , et la troisième colonne
de [g]× est toujours nulle donc l’angle de lacet ψ est non observable. La troisième colonne
de MImp.RIEKF est nulle donc la position p est non observable. D’après la dernière colonne
de MImp.RIEKF , lorsque ω̃s varie dans le temps, la position pb est entièrement observable
et donc la dernière colonne est de rang complet. Lorsque ω̃s est constant pendant au moins
7 pas de temps consécutifs, la position pb devient non observable (cas rare).
Par conséquent, l’Imp.RIEKF est cohérent avec le système non linéaire car il partage les
mêmes propriétés d’observabilité que le système non linéaire donc l’Imp.RIEKF ne crée
pas de fausse observabilité.
84
2.4. Application de l’Imp.IEKF à la navigation de projectiles
La matrice MEKF (2.110) n’est pas de rang complet, donc plusieurs états ne sont pas
observables par le filtre. La troisième colonne de MEKF est nulle donc la position p n’est
pas observable par l’EKF. De plus, d’après la dernière colonne de MEKF , lorsque ω̃s varie
dans le temps, la position pb est observable et lorsque tildeωs est une constante non nulle
pendant au moins 7 pas de temps consécutifs, pb devient non observable (cas rare). En
outre, il est important de souligner que l’angle de lacet ψ est observable par l’EKF alors
que cet angle est non observable par le système en temps continu.
Par conséquent, l’EKF n’est pas cohérent avec le système non linéaire car il ne partage
pas les mêmes états observables. En effet, l’angle de lacet ψ est observable pour l’EKF.
L’incohérence de l’EKF est due à la dépendance de la matrice d’observabilité locale M aux
points de linéarisation pour évaluer les matrices jacobiennes Φk et Hk . En effet, le choix des
points de linéarisation affecte les propriétés d’observabilité de l’EKF. Différents auteurs
[31], [104] ont déjà discuté et proposé des solutions pour résoudre l’incohérence de l’EKF,
principalement appliquées au problème de l’EKF-SLAM (Simultaneous Localization and
Mapping).
Pour conclure l’analyse d’observabilité, l’EKF est incohérent avec le système non li-
néaire car il crée une fausse observabilité contrairement à l’Imp.RIEKF. Ces observations
confirment les propriétés de l’Imp.IEKF énoncées dans la partie (2.3), à savoir qu’une
erreur non linéaire résout le problème d’incohérence dans ce cas.
85
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
86
2.4. Application de l’Imp.IEKF à la navigation de projectiles
Figure 2.7 – Estimation des angles d’Euler du projectile sur l’ensemble du jeu de don-
nées : (RM SEEKF , RM SEIEKF ).
87
Chapitre 2 – Les filtres de Kalman invariants pour la navigation des projectiles
2.5 Conclusion
Ce chapitre présente la méthodologie du Filtre de Kalman Étendu Invariant et de ses
drivées. L’IEKF est un filtre de Kalman non linéaire, définit sur un groupe de Lie matriciel,
qui possède des propriétés remarquables d’observabilité et de convergence, similaires à
celles d’un filtre de Kalman linéaire. Pour cela, la dynamique d’évolution d’un IEKF doit
satisfaire une propriété du groupe.
Dans le cas d’un problème de navigation, cette propriété n’est pas toujours satis-
faite par l’ensemble du système. Il s’agit alors d’un Filtre de Kalman Imparfait Invariant
Étendu. Ce filtre, basé à la fois sur la théorie des IEKF et à la fois sur la théorie des EKF,
présente des propriétés intéressantes qui ont été vérifiées sur un exemple d’application. En
se basant sur les mêmes modèles d’évolution et de mesure, un Imp.IEKF et un EKF ont
été présentés. L’analyse d’observabilité montre que l’EKF crée de fausses observabilités
contrairement à l’Imp.IEKF. De plus, ces deux filtres sont évalués sur des simulations de
trajectoires de mortier de 120 mm et les résultats montrent l’Imp.IEKF est adapté à la
navigation des projectiles contrairement à l’EKF.
Au vu des résultats de ce chapitre, un Imp.IEKF semble être adéquate pour la navi-
gation des projectiles. Afin d’optimiser les estimations, une approche vise à employer des
réseaux de neurones pour ajuster dynamiquement des paramètres de bruit d’un tel filtre.
88
Chapitre 3
Sommaire
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
89
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
3.1 Introduction
Dans le domaine militaire, la connaissance de la position, de la vitesse et de l’orien-
tation d’un projectile à chaque instant est essentielle pour son guidage. Pour cela, les
solutions de navigation proposées dans la littérature exploitent soit l’intégralité, soit une
partie des mesures du récepteur GNSS 1 et de l’IMU 2 embarquée, en les fusionnant par
différents types de filtres de Kalman [9], [32]-[42].
Le filtre de Kalman est une solution populaire d’estimation d’état basée sur les mesures
de différents capteurs [4]. En effet, comme présenté dans la partie (1.3) de ce document,
le Filtre de Kalman Linéaire (Linear Kalman Filter - LKF) est un estimateur optimal
basé sur des modèles d’évolution et de mesure linéaires et où tous les bruits sont blancs
et gaussiens [21], [23], [24].
Cependant, pour les dynamiques non linéaires comme celles d’évolution de la trajectoire
d’un projectile, un filtre de Kalman non linéaire comme le Filtre de Kalman Étendu (Ex-
tended Kalman Filter - EKF) est préférable. Dans ce cas, le modèle d’évolution et/ou le
modèle de mesure est non linéaire. Ces modèles sont alors linéarisés autour de l’estimation
précédente à l’aide d’un développement de premier ordre, impliquant des erreurs d’estima-
tion faibles pour être valides. La théorie standard du filtre de Kalman est ensuite appliquée
aux modèles linéarisés. Bien que l’EKF soit largement utilisé pour résoudre différents pro-
blèmes d’estimation, en particulier des problèmes de navigation, ce filtre présente plusieurs
limitations causées par la linéarisation [4], [21], [25]-[31]. En effet, contrairement au filtre
de Kalman linéaire, la stabilité d’un EKF n’est pas garantie et une fausse initialisation
peut conduire à sa divergence. De plus, un EKF peut être incohérent et créer une fausse
observabilité.
Comme présenté au chapitre 2, une extension de l’EKF exploitant les symétries des mo-
dèles grâce aux groupes de Lie permet de surmonter plusieurs limitations de l’EKF. En
effet, le filtre de Kalman Étendu Invariant (Invariant Extended Kalman Filter - IEKF)
partage des propriétés similaires à celles du filtre de Kalman Linéaire pour des systèmes
non linéaires. Toutefois, l’IEKF est adapté exclusivement aux problèmes de navigation à
partir de capteurs idéaux, ne nécessitant pas d’évaluer les dérives de ces mesures. Dans
90
3.1. Introduction
91
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
92
3.2. Réseau de neurones convolutifs
D’après ces observations, une matrice de covariance du bruit de mesure variable semble
être appropriée à des filtres où les mesures peuvent être plus ou moins fiables suivant les
conditions extérieures. Comme présenté dans la figure 3.1, pour produire une matrice de
covariance du bruit de mesure variable et adaptée aux conditions de mesures extérieures,
une solution vise à utiliser des réseaux de neurones tels que présentés dans [77]-[82], afin
d’ajuster dynamiquement cette matrice aux mesures d’un filtre de Kalman.
Afin de produire une matrice de covariance du bruit de mesure variable qui reflète la
confiance accordée aux mesures en fonction des différents facteurs influents sur l’obtention
de ces mesures, plusieurs réseaux de neurones peuvent être sélectionnés. Dans le cadre des
ces travaux, un réseau de neurones convolutifs (Convolutional Neural Network - CNN)
est préféré car cette architecture présente plusieurs avantages [82]. En effet, pour ce type
d’application, le CNN nécessite un nombre limité de paramètres contrairement à une
autre architecture de réseau telle que les réseaux récurrents. De plus, l’estimation de la
covariance du bruit de mesure est déterminée uniquement à partir des observations et
non pas à partir des estimations précédentes, contrairement aux réseaux récurrents qui
nécessitent une connaissance préalable du contexte d’estimation.
93
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
Comme présenté dans la figure 3.2, un CNN est composé de deux parties :
- la première partie d’un CNN vise à extraire les caractéristiques spatiales dans
les données d’entrée. Pour cela, l’extracteur de caractéristiques est généralement
composé d’une succession de couches de convolution et de fonctions d’activation
non linéaires.
- la seconde partie d’un CNN comprend des couches entièrement connectées (fully
connected), comme un MLP (Multilayer perceptron), afin de combiner les informa-
tions apprises par les opérations de convolution pour réaliser la fonction souhaitée.
Comme mentionné précédemment, pour résoudre un problème de régression non li-
néaire, un CNN est principalement composé de trois types de couches : les couches de
convolution, les couches d’activation non linéaires et les couches fully connected.
94
3.2. Réseau de neurones convolutifs
La couche de convolution
La couche de convolution constitue toujours la première couche des CNN. Cette couche,
basée sur l’opération mathématique de convolution, vise à analyser les données d’entrée
et à détecter la présence de caractéristiques spatiales plus ou moins complexes.
Pour cela, comme illustré dans la figure 3.3, un filtre (également appelé noyau) glisse
sur la donnée d’entrée et effectue l’opération de convolution, notée ∗, entre la matrice
d’entrée et le filtre de convolution. Les différents filtres, de taille définie, sont évalués lors
de l’étape d’entraînement et permettent de détecter des caractéristiques spécifiques.
Les couches de convolution sont généralement suivies par des couches d’activation non
linéaires afin d’ajouter des non linéarités au modèle pour améliorer l’apprentissage. Les
non linéarités sont nécessaires pour inclure de la complexité afin que le réseau de neurones
apprenne à traiter des problèmes complexes, sinon, les couches du réseau pourraient se
résumer par une fonction linéaire. Les fonctions d’activation les plus couramment utilisées
sont :
- la fonction d’activation ReLU (Rectified Linear Unit) définie telle que :
x, x>0
∀x ∈ R, ReLU (x) = ∈ [0; +∞[ (3.1)
0, x ≤ 0
Cette fonction est très employée dans les réseaux de neurones car elle supprime
toutes les valeurs négatives et sa forme permet au réseau d’apprendre rapidement.
95
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
Toutefois, cette fonction n’est pas adaptée lorsque les données recherchées sont à
valeur négative.
- la fonction d’activation Sigmoid définie telle que :
1
∀x ∈ R, Sigmoid(x) = ∈ [0; 1] (3.2)
1 + e−x
Cette fonction est généralement employée pour la classification binaire comme les
sorties sont bornées et donc normalise la sortie des neurones. Cependant, les don-
nées ne sont pas centrées sur zéro et pour des valeurs importantes ou très faibles,
les sorties restent similaires.
- la fonction d’activation TanH (Hyperbolic Tangent) définie telle que :
ex − e−x
∀x ∈ R, T anH(x) = ∈] − 1; 1[ (3.3)
ex + e−x
Cette fonction est majoritairement utilisée pour traiter des données en continu et
est centrée sur zéro donc elle permet également de traiter les données à valeurs
négatives. Toutefois, pour des valeurs très importantes ou très faibles, les sorties
resteront semblables.
Les couches Fully Connected constituent la seconde partie d’un CNN et permettent
de regrouper les informations apprises lors des précédentes couches de convolution pour
effectuer la tâche souhaitée. Pour cela, les neurones d’une couche de Fully Connected
sont complètement connectés à tous les neurones de la couche suivante, comme pour un
MLP (Multilayer perceptron). Les couches de Fully Connected effectuent des combinaisons
linéaires entrecoupées de fonctions d’activation non linéaires.
D’après la littérature [120], [121], un CNN est parfaitement adapté pour détecter des
caractéristiques spatiales dans des images. Une image est une matrice avec plus ou moins
de canaux. Il est alors aisé d’effectuer l’analogie avec le problème d’estimation traité
dans ce chapitre. Les mesures utilisées pour corriger les prédictions d’un filtre de Kalman
sont des matrices, assimilables aux matrices décrivant des images et un CNN permet de
détecter des caractéristiques spatiales dans ces données. Les couches de fully connected
sont ensuite utilisées pour effectuer la tâche souhaitée, à savoir, un problème de régression.
96
3.3. Réglage de la covariance d’un Imp.RIEKF par un CNN
Figure 3.4 – Filtre de Kalman Imparfait Invariant Étendu à droite (Imp.RIEKF) pour
estimer la trajectoire d’un projectile à partir de l’IMU embarquée et du champ magnétique
de référence.
97
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
Comme présenté dans la figure 3.4, l’Imp.RIEKF vise à estimer, à partir des mesures
bruitées et biaisées de l’accéléromètre as , du gyromètre ωs et du magnétomètre hs ainsi
que de la connaissance du champ magnétique de référence hn :
- l’orientation R ∈ SO(3), la vitesse v ∈ R3×1 et la position p ∈ R3×1 du projectile
dans le repère local de navigation n,
- les biais des gyromètres bωs ∈ R3×1 , des accéléromètres bas ∈ R3×1 et des magné-
tomètres bhs ∈ R3×1 dans le repère capteur s.
Modèles et notations
ω̃s = ωs + bωs + Wωs , ãs = as + bas + Was , h̃s = as + bhs + Whs (3.4)
d d d
bω = Wbωs , ba = Wbas , bh = Wbhs , (3.5)
dt s dt s dt s
avec Wbωs ∼ N (03×1 , Σbω ), Wbas ∼ N (03×1 , Σba ) et Wbhs ∼ N (03×1 , Σbh ) des bruits blancs
gaussiens.
La Terre est supposée plate pendant la durée de vol du projectile et la rotation de la
Terre sans influence sur l’estimation de la trajectoire du projectile. Ainsi, la dynamique
d’évolution de la trajectoire du projectile en temps continu est donnée par :
d
dt
R = R[ω̃s − bωs − Wωs ]× , (3.6)
d
dt
v = R(ãs − bas − Was ) + g, (3.7)
d
dt
p = v, (3.8)
avec [.]× l’opérateur du groupe de Lie SO(3) présenté dans l’équation (2.10) et g le vecteur
gravité constant.
98
3.3. Réglage de la covariance d’un Imp.RIEKF par un CNN
À partir d’une condition initiale donnée, des mesures inertielles et du champ magné-
tique de référence, l’Imp.RIEKF vise à estimer les états suivants :
x = R, v, p, bωs , bas , bhs . (3.9)
Les observations considérées pour mettre à jour les prédictions du filtre sont l’estima-
tion du champ magnétique de référence hn ∈ R3×1 dans le repère local de navigation n à
partir des mesures des magnétomètres hs . Le modèle de mesure est alors :
D’après le modèle dynamique (3.5) - (3.8) associé aux états x (3.9), le bruit de modèle
W ∼ N (018×1 , Qk ) est défini tel que :
h iT
W = WωTs Was 0T3×1 WbTωs WbTas WbThs (3.12)
Comme mentionné dans le chapitre 2, une partie des états d’un Imp.IEKF est embar-
quée dans un groupe de Lie matriciel associée à une erreur non linéaire et une seconde
partie des états est embarquée dans un espace euclidien associée à une erreur linéaire.
Les états du projectile (R, v, p) sont embarqués dans le groupe de Lie matriciel SE2 (3) ⊂
R5×5 tel que :
R v p
χt ≜ 01×3 1 0
∈ SE2 (3), R ∈ SO(3), v ∈ R3×1 , p ∈ R3×1 . (3.14)
01×3 0 1
99
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
Les dynamiques des biais des capteurs inertiels bωs , bas et bhs évoluent dans R3×1 et sont
associées à une erreur linéaire entre l’état estimé, noté b., et l’état réel tel que :
ξbω = bbωs − bωs , ξba = bbas − bas , ξbh = bbhs − bωs . (3.15)
L’erreur non linéaire d’estimation de l’Imp.RIEKF relative aux états x (3.9) est com-
posée de l’erreur invariante à droite associée à (R, v, p) et de l’erreur linéaire associée aux
biais telle que :
et = ηχt , ξbω , ξba , ξbh (3.16)
Rb vb pb RT −RT v −RT p RR b T v b T v pb − RR
b − RR b Tp
ηχt = χbt χ−1
t =
01×3 1 0 01×3
1 0 = 01×3
1 0
01×3 0 1 01×3 0 1 01×3 0 1
(3.17)
Une estimation valide de χbt signifie que ηχt est proche de l’élément identité du groupe
de Lie, et donc de l’algèbre g ∈ Rd×d . Ainsi, localement autour de l’identité, l’algèbre est
identifiée à l’espace euclidien Rd×1 par un développement au premier ordre de la fonction
exponentielle expm (.). L’erreur invariante est linéarisée d’après l’équation suivante :
ηχt = exp(ξt ) = expm (Lse2 (3) (ξt )) ≈ I5 + Lse2 (3) (ξt ) (3.18)
Ainsi, l’erreur invariante définie par (3.17) est linéarisée telle que :
b T v
RR b T v pb − RR
b − RR b Tp I + [ξR ]× ξv ξp
3
ηχt = 01×3 1 0 ≈ 01×3 1 0 (3.19)
01×3 0 1 01×3 0 1
L’erreur linéarisée ξt ∼ N (0, Pt ) de l’Imp.RIEKF associée aux états x (3.9) est alors :
ξt = ξR , ξv , ξp , ξbω , ξba , ξbh ∈ R18×1 . (3.20)
100
3.3. Réglage de la covariance d’un Imp.RIEKF par un CNN
La prédiction des états x (3.9) en temps continu est donnée par les modèles dynamiques
(3.5) - (3.8) dans le cas où aucune perturbation W (3.13) n’est présente :
χb
t
f (χb , 0 )
ut t 9×1
R[ω̃s − b ωs − W ωs ] × R(ã s − b as − W as ) + g v
d b 03×1
b
ωs =
fu (χt , W ) = 0 0 0
t 1×3
dt
bb as
03×1
0 1×3 0 0
bbhs 03×1
(3.21)
La discrétisation de la prédiction des états (3.21) à la période d’échantillonnage des
capteurs inertiels définie telle que ∆t = tk − tk−1 est alors :
R k|k−1 = Rk−1|k−1 expSO(3) (ω̃sk − bωsk−1|k−1 )∆t (3.22)
b b b
vbk|k−1 = vbk−1|k−1 + R k−1|k−1 (ãsk − bask−1|k−1 ) + g ∆t (3.23)
b b
avec expSO(3) (.) l’application exponentielle du groupe de Lie SO(3) définie au chapitre 2.
La matrice de covariance de l’erreur linéarisée ξt (3.20), notée Pt , est calculée par
l’équation de Riccati :
d
Pt = At Pt + Pt ATt + Gw Qt GTw (3.26)
dt
avec Qt , la matrice de covariance du bruit de modèle définie par l’équation (3.13), et At
et Gw les matrices identifiées d’après la dynamique d’évolution de l’erreur linéarisée :
d
ξt = At ξt + Gw W + o(||ξt ||) (3.27)
dt
101
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
Dans le cas où les biais sont fixes, la dynamique de l’erreur linéarisée est indépendante de
la trajectoire estimée et est affine de groupe, donc les deux théorèmes fondamentaux de la
théorie IEKF sont satisfaits. Dans cette partie, les biais des capteurs sont évalués, alors la
dynamique d’évolution des erreurs (3.20) dépend de la trajectoire estimée. La dynamique
associée n’est pas affine de groupe.
Remarque 3.3.1. L’identification des matrices At et GW est présentée dans l’annexe
D.1. de ce document.
La prédiction de la matrice de covariance en temps discret est [102] :
avec Φk la matrice de transition d’état [99], [100], [102] évaluée telle que :
d
Φ(t, tk ) = At (t)Φ(t, tk ), Φ(t0 , t0 ) = I (3.30)
dt
Les prédictions obtenues à l’étape précédente (3.22) - (3.25) et (3.29) sont mises à
jour avec les observations qui sont l’estimation du champ magnétique de référence dans le
repère local de navigation n à partir des mesures du magnétomètre. Le modèle de mesure
est alors :
hn = h(x, Whn ) = R(h̃s − bhs − Whs ) ∈ R3×1 (3.33)
avec hn ∈ R3×1 le champ magnétique dans le repère local de navigation n, h̃s le modèle
des mesures du magnétomètre, bhs les biais, et Whs ∈ R3×1 les bruits des mesures.
La linéarisation du modèle d’observation par rapport à ξt (3.20) permet d’identifier la
matrice d’observation H ∈ R18×3 et la matrice de covariance du bruit de mesure N ∈ R3×3
102
3.3. Réglage de la covariance d’un Imp.RIEKF par un CNN
telle que :
h i
H = [Rh̃s ]× 03×3 03×3 03×3 03×3 R (3.34)
N = cov(RWhs ) = Rcov(Whs )RT (3.35)
Remarque 3.3.2. L’identification des matrices H et N est présentée dans l’annexe D.2.
de ce document.
L’état prédit xbk|k−1 et la matrice de covariance d’erreur prédite Pk|k−1 sont mis à jour
conformément à la méthodologie des Imp.IEKF rappelée au chapitre 2 :
h iT
χbk|k = expSE2 (3) ξRT k|k , ξvTk|k , ξpTk|k χbk|k−1
b
b
ωsk|k = bbωsk|k−1 + ξbωk|k , b
b
ask|k = bbask|k−1 + ξbak|k , b
b
hsk|k = bbhsk|k−1 + ξbhk|k (3.38)
Pk|k = (I18 − Kk Hk )Pk|k−1
avec expSE2 (3) (.) l’application exponentielle de SE2 (3) définie dans le chapitre 2.
L’Imp.RIEKF présenté dans la partie (3.3.1) est, comme tout filtre de Kalman, sensible
au réglage de la matrice de covariance du bruit de mesure défini par l’équation (3.35) telle
que :
103
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
Présentation du CNN
Comme illustré dans la figure 3.5, à chaque instant discret k, le réseau de neurones
convolutifs estime trois paramètres αk , βk et γk à partir des mesures hsk ∈ R3×1 du
magnétomètre dans le repère capteur s pour déterminer cov (Whs ) et où les paramètres
σx , σy et σz sont fixés à partir des spécifications du capteur.
104
3.3. Réglage de la covariance d’un Imp.RIEKF par un CNN
Le CNN est entraîné et testé sur des simulations de trajectoires de mortier de 120 mm
générées par BALCO présenté dans la partie (1.5) de ce document. Le jeu de données
d’entraînement se compose de 1000 simulations de trajectoires de mortier, le jeu de don-
nées de validation comprend 100 trajectoires et le jeu de données de test est composé de
100 trajectoires de mortier. La structure des couches du CNN implémenté pour ajuster la
covariance du bruit des mesures des magnétomètres est présentée dans la figure 3.6.
Figure 3.6 – Couches du CNN entraîné pour ajuster la covariance du bruit de mesure
de l’Imp.RIEKF.
Des couches de convolution unidimensionnelles sont utilisées pour extraire les caracté-
ristiques spatiales dans les données d’entrée. Comme pour tous les réseaux, des fonctions
d’activation non linéaires sont appliquées : la fonction ReLU (Rectified Linear Unit), la
fonction TanH (Hyperbolic Tangent) et la fonction LeakyReLU, extension de la fonction
ReLU permettant de prendre en compte des valeurs négatives. Les résultats des couches de
convolution et des fonctions d’activation sont transmises aux couches entièrement connec-
tées pour estimer les trois paramètres α, β et γ permettant de moduler la covariance du
bruit de mesure des magnétomètres.
105
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
L’entraînement vise à ajuster les paramètres du CNN pour minimiser l’erreur entre les
estimations obtenues avec l’Imp.RIEKF où la matrice de covariance du bruit de mesure
est évaluée par le CNN et les données de référence fournies par BALCO. La fonction de
perte employée lors de l’entraînement est l’erreur quadratique moyenne (Mean Squared
Error - MSE), couramment utilisée pour des problèmes de régression et définie telle que :
N
1 X
M SE = (xi − xbi )2 (3.40)
N i=1
h iT
avec N le nombre de données, xi = p v Ψ où Ψ est le vecteur comprenant respecti-
vement les angles de roulis, de tangage et de lacet.
L’algorithme d’optimisation d’Adam [51] est utilisé pour apprendre les paramètres du
CNN afin de minimiser la perte.
106
3.3. Réglage de la covariance d’un Imp.RIEKF par un CNN
Figure 3.7 – Erreurs d’estimation de la position d’un mortier de 120 mm [m] obtenues
par le Dead Reckoning (en vert), l’Imp.RIEKF avec une matrice de covariance constante
(en noir) et l’Imp.RIEKF dont la matrice est ajustée par un CNN (en bleu).
Figure 3.8 – Erreurs d’estimation de la vitesse d’un mortier de 120 mm [m/s] obtenues
par le Dead Reckoning (en vert), l’Imp.RIEKF avec une matrice de covariance constante
(en noir) et l’Imp.RIEKF dont la matrice est ajustée par un CNN (en bleu).
Les figures 3.7 - 3.9 montrent que les estimations basées sur l’Imp.RIEKF (méthodes
2 et 3) présentent des erreurs moins importantes que celles du Dead Reckoning (méthode
1). Ainsi, un filtre de Kalman basé sur une erreur d’estimation en partie non linéaire, un
groupe de Lie matriciel et une mise à jour exponentielle permet d’optimiser les estimations
107
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
Figure 3.9 – Erreurs d’estimation des angles d’Euler d’un mortier de 120 mm [rad]
obtenues par le Dead Reckoning (en vert), l’Imp.RIEKF avec une matrice de covariance
constante (en noir) et l’Imp.RIEKF dont la matrice est ajustée par un CNN (en bleu).
108
3.3. Réglage de la covariance d’un Imp.RIEKF par un CNN
Figure 3.10 – Critère d’erreur CRM SE (3.41) évalué pour l’estimation des positions, des
vitesses et des angles d’Euler de mortier de 120 mm par le Dead Reckoning (méthode 1,
en vert), l’Imp.RIEKF (méthode 2, en noir) et l’Imp.RIEKF réglé par le CNN (méthode
3, en bleu).
La figure 3.10 montre clairement que les méthodes basées sur l’Imp.RIEKF surpasse
le Dead Reckoning pour l’estimation des positions, des vitesses et des angles d’Euler d’un
mortier de 120 mm. En effet, l’Imp.RIEKF (méthode 2) améliore l’estimation des positions
par rapport à l’étape de prédiction du filtre (méthode 1) selon les trois axes. De même
pour l’estimation des vitesses du projectile.
De plus, la figure 3.10 confirme que l’utilisation d’un CNN pour régler la matrice de
covariance du bruit de mesure de l’Imp.RIEKF (méthode 3) permet de réduire signifi-
cativement les erreurs d’estimation de position et de vitesse par rapport à l’Imp.RIEKF
dont la matrice de covariance est constante et réglée classiquement. En effet, les erreurs
d’estimation des positions par l’Imp.RIEKF ajusté par le CNN sont de l’ordre de 20 m
alors que celles de l’Imp.RIEKF avec une matrice de covariance constante sont d’environ
40 m. L’analyse des angles d’Euler est plus ambivalente comme le montre la figure 3.10.
En effet, le CNN (méthode 3) détériore l’estimation des angles d’Euler par rapport au
filtre avec une matrice constante (méthode 2). Plusieurs solutions peuvent être envisagées
109
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
pour améliorer l’estimation des angles d’Euler notamment la normalisation des données
d’entrée du CNN afin que chaque mesure influe sur le réseau de façon équivalente.
Afin de visualiser l’apport d’une matrice de covariance variable dans le temps et ajus-
tée aux différentes phases de vol du projectile, les figures 3.11 et 3.12 présentent l’er-
reur quadratique moyenne (RMSE) des vitesses et des angles estimés par la méthode 3
(Imp.RIEKF et CNN) en fonction de la RMSE obtenue par la méthode 2 (Imp.RIEKF)
pour les Nsim simulations de l’ensemble de données de test.
La figure 3.11 met en évidence la contribution d’un réseau de neurones pour régler
la matrice de covariance d’un filtre de Kalman. En effet, la plupart des marqueurs sont
situés dans la partie supérieure de la figure 3.11, donc les erreurs d’estimation des vitesses
obtenues par la méthode 3 (Imp.RIEKF et CNN) sont nettement inférieures aux erreurs
obtenues par la méthode 2 (Imp.RIEKF). Cela implique que pour la majorité des trajec-
toires du jeu de données de test, le réglage de la matrice de covariance du bruit de mesure
par un CNN améliore les estimations des vitesses du projectile. Des conclusions similaires
sont observées pour l’estimation des positions.
La figure 3.12 confirme les premières observations. En effet, la plupart des marqueurs
sont situés dans la partie inférieure de la figure donc les erreurs d’estimation des angles
d’Euler par la méthode 3 (Imp.RIEKF et CNN) sont plus importantes que celles obtenues
110
3.3. Réglage de la covariance d’un Imp.RIEKF par un CNN
111
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
La normalisation des données d’entrée d’un réseau de neurones est une approche de
prétraitement des données qui vise à redimensionner les données d’entrée sur des plages
de variation similaires tout en préservant la même distribution et les mêmes ratios que
les données d’origine. Toutefois, la normalisation conduit à une perte d’information.
La normalisation des données d’entrée est utilisée pour éviter que certaines valeurs d’en-
trée influent davantage que d’autres lors de la phase d’apprentissage. En effet, des données
d’entrée avec des plages de variation différentes peuvent entraîner une baisse des perfor-
mances d’estimation du réseau. En d’autres termes, les petites valeurs ont une faible
influence donc les poids du réseau sont mis à jour en fonction des valeurs d’entrée plus
élevées. Cela peut conduire à une mise à jour importante des poids et donc à une conver-
gence du réseau plus lente ou à une convergence vers un minimum local.
Deux types de normalisation sont étudiées : la normalisation Min/Max M M (.) et la
normalisation ST D(.).
• La normalisation Min/Max, notée M M (.), est définie comme suit :
x − xmin
xM M = (3.42)
xmax − xmin
x−µ
xST D = (3.43)
σ
avec x la quantité à normaliser, µ sa moyenne et σ son écart type. Ainsi xST D est
une quantité avec une moyenne nulle et un écart type de un.
Cette normalisation est particulièrement utilisée pour les données d’entrée avec des
unités différentes et est moins dépendante aux valeurs aberrantes que la normali-
sation Min/Max.
112
3.3. Réglage de la covariance d’un Imp.RIEKF par un CNN
xγ = Rγ x (3.44)
avec x ∈ R3×1 le vecteur initial dans le repère local de navigation n, xγ ∈ R3×1 ce même
vecteur exprimé dans le repère de navigation tourné nγ et Rγ ∈ SO(3) la matrice de
rotation du repère local de navigation n au repère local de navigation tourné nγ définie
telle que :
cos(γ) −sin(γ) 0 cos(γ) 0 sin(γ) 1 0 0
Rγ = sin(γ) cos(γ) 0 0 1 0 0 cos(γ) −sin(γ) (3.45)
0 0 1 −sin(γ) 0 cos(γ) 0 sin(γ) cos(γ)
113
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
Figure 3.14 – Influence de la rotation du repère local de navigation sur la position d’un
mortier de 120 mm : position exprimée dans le repère local de navigation n (ligne bleue),
position exprimée dans le repère local de navigation tourné nγ (ligne rouge).
Toutes les grandeurs définies initialement dans n sont exprimées dans le repère local
de navigation tourné nγ , c’est-à-dire la position p, la vitesse v et les angles d’Euler Ψ du
projectile. En d’autres termes, lors de la phase d’apprentissage, les trajectoires sont pré-
dites dans le repère local de navigation tourné nγ . Ces estimations sont ensuite comparées
114
3.3. Réglage de la covariance d’un Imp.RIEKF par un CNN
aux données de référence également exprimées dans le repère local de navigation tourné
nγ afin de rétropropager la perte et mettre à jour les paramètres du réseau. Cela permet
ainsi d’évaluer la perte entre les positions, les vitesses et les angles estimés et les données
de référence dans le cas où les plages de variations sont équivalentes suivant les trois axes.
Lors de la phase de test, les trajectoires sont prédites dans le repère local de navigation
tourné nγ , puis ces estimations sont exprimées dans le repère local de navigation initial n
par la rotation inverse. Cette approche a donc les mêmes objectifs que la normalisation.
L’angle de rotation du repère de navigation γ est fixe pour toutes les trajectoires du
jeu de données et est le même pour exprimer la position, la vitesse et les angles d’Euler
dans le repère local de navigation tourné nγ . Cet angle de rotation γ est déterminé en
fonction des données utilisées dans ces travaux, notamment afin d’obtenir des plages de
variation similaires pour les trois positions et par conséquent, pour les trois vitesses.
Table 3.1 – Spécifications des CNN considérés pour estimer la matrice de covariance du
bruit de mesure de l’Imp.RIEKF.
115
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
NX
sim
avec Nsim est le nombre de simulations du jeu de données de test, xbCN N l’estimation
de l’Imp.RIEKF ajusté par le CNN considéré, et xbCST l’estimation de l’Imp.RIEKF
dont la matrice de covariance est constante.
- le taux d’erreur, noté Ce qui représente les erreurs de l’Imp.RIEKF ajusté par le
CNN considéré par rapport aux erreurs de l’Imp.RIEKF sans réseaux de neurones.
Le taux d’erreur Ce est défini tel que :
CRM SECN N
Ce = 100 × (3.47)
CRM SECST + CRM SECN N
avec CRM SECST définit par l’équation (3.41), l’erreur quadratique moyenne globale
de l’Imp.RIEKF avec une matrice de covariance constante, et CRM SECST l’erreur
quadratique moyenne globale de l’Imp.RIEKF réglé par le CNN considéré.
Les figures 3.15 et 3.16 représentent le Cscore (3.46) et le Ce (3.47) évalués pour les
Imp.RIEKF ajustés par le CN N , CN NM M , CN NST D , CN NR , CN NRM M et CN NRST D .
Figure 3.15 – Critère Cscore (3.46) évalué pour les réseaux CN N , CN NM M , CN NST D ,
CN NR , CN NRM M et CN NRST D .
116
3.3. Réglage de la covariance d’un Imp.RIEKF par un CNN
D’après les figures 3.15 - 3.16, l’ensemble des Imp.RIEKF ajustés par des CNN opti-
misent l’estimation des positions et des vitesses du projectile contrairement à l’estimation
des angles d’Euler. De plus, la rotation du repère de navigation améliore significativement
l’estimation des positions et des vitesses du projectile par rapport aux estimations sans
rotation du repère de navigation. En effet, les scores obtenus par l’Imp.RIEKF ajusté par
le CN NR sont supérieurs à ceux obtenus par l’Imp.RIEKF ajusté par le CN N . Cette
observation est validée par l’analyse du taux d’erreur Ce qui est moins importante pour
le CN NR et le CN N . Ainsi, la rotation du repère de navigation permet de réduire prin-
cipalement les erreurs d’estimation des positions et des vitesses du projectile, bien que
cette solution nécessite un temps de calcul plus important. La normalisation des données
d’entrée du CNN affecte les estimations de position, de vitesse et d’orientation par rapport
aux résultats sans normalisation. En effet, les normalisations Min/Max et STD dégradent
l’estimation des positions et des vitesses du projectile par rapport au réseau sans nor-
malisation. Ces observations sont confirmées par les scores Cscore et les taux d’erreur Ce
des Imp.RIEKF ajustés par les CN NM M et CN NST D qui sont plus importants que ceux
obtenus pour l’Imp.RIEKF ajusté par le CN N . Les mêmes observations peuvent être
formulées concernant les réseaux CN NRM M et CN NRST D . Toutefois, la normalisation des
données d’entrée du CNN permet de réduire les erreurs d’estimation des angles d’Euler.
Les résultats rapportés dans cette partie montrent que le réglage de la matrice de
covariance du bruit de mesure d’un Imp.RIEKF par un CNN permet d’optimiser princi-
palement les estimations des positions et des vitesses d’un mortier de 120 mm par rapport
117
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
aux estimations obtenues par l’Imp.RIEKF où la matrice de covariance est constante. Tou-
tefois, cette solution n’est pas optimale pour réduire les erreurs d’estimation des angles
d’Euler de cette munition. Afin de réduire les erreurs d’estimation, deux méthodes de pré-
traitement des données sont étudiées : la normalisation des données d’entrée et la rotation
du repère de navigation. Ces deux méthodes de prétraitement redéfinissent des plages de
variation similaires pour une grandeur suivant les trois axes. Les résultats présentés dans
cette partie montrent que la rotation du repère de navigation est une solution appropriée
pour optimiser les estimations d’un mortier de 120 mm. À l’inverse, la normalisation des
données d’entrée détériore l’estimation des positions et des vitesses mais améliore légère-
ment l’estimation des angles d’Euler par rapport à une solution sans réseau de neurones.
Comme présenté dans la figure 3.17, à partir des mesures des deux magnétomètres
radiaux embarqués notés respectivement Ha et Hb et de la connaissance du champ ma-
118
3.4. Réglage de la covariance du bruit de mesures par un CNN : application à un EKF et à un
IEKF
avec H̃a et H̃b les modèles des deux magnétomètres, et Ha et Hb les mesures des capteurs.
L’EKF vise à estimer les états suivants :
h iT
x = ϕT ωcT bTHa ATHa bTHb ATHb ∈ R6×1 . (3.49)
Les prédictions sont corrigées par des observations qui sont l’estimation des mesures
119
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
avec WHa et WHb les bruits des mesures, et Henv et λ des constantes déterminées à partir
des valeurs du champ magnétique de référence Hn .
avec Wϕ , Wωc , WAHa , WbHa , WAHb et WbHb des bruits blancs supposés gaussiens.
Étape de prédiction de l’EKF : d’après les modèles d’évolution (3.51) - (3.52) associés
aux états (3.49), l’étape de prédiction à temps discret de l’EKF est donnée par :
xbk|k−1 = Ad xbk−1|k−1 ,
(3.53)
Pk|k−1 = Ad Pk−1|k−1 ATd + Qk
0 1 0 0 0 0
avec Ad = (2I6×6 − At ∆t)−1 (2I6×6 − At ∆t), avec At = , avec ∆t
06×6
la période d’échantillonnage des magnétomètres, et avec Qk la matrice de covariance du
bruit de modèle définie telle que Qk = cov Wϕ , Wωc , WbHa , WAHa , WbHb , WAHb .
Étape de mise à jour de l’EKF : d’après le modèle d’observation (3.50) et les mesures
des magnétomètres Ha et Hb , les états prédits xbk|k−1 et la matrice de covariance Pk|k−1
120
3.4. Réglage de la covariance du bruit de mesures par un CNN : application à un EKF et à un
IEKF
avec Rk = cov(WHa , WHb ) la matrice de covariance du bruit des mesures des magnéto-
mètres et avec Hk la matrice d’observation déterminée par la linéarisation du modèle
d’observation de sorte que :
AbH Henv cos(ϕbk + λ) 0 1 Henv sin(ϕbk + λ) 0 0
Hk = b ak (3.57)
−AHbk Henv sin(ϕk + λ) 0 0
b 0 1 Henv cos(ϕbk + λ)
Suivant le même principe que celui présenté dans la partie (3.3.2) de ce document,
un CNN est entraîné pour estimer la matrice de covariance du bruit de mesure de l’EKF.
Ainsi, à partir des mesures des deux magnétomètres radiaux Ha et Hb , le CNN estime la
matrice de covariance du bruit de mesure de la forme :
σH × 10α 0
R= a (3.58)
0 σHb × 10β
avec σHa et σHb les paramètres de la covariance des mesures des magnétomètres déterminés
d’après des tests en vol et avec α et β les paramètres estimés par le CNN.
Les figures 3.18 et 3.19 présentent l’estimation et les erreurs obtenues pour l’estimation
de l’angle de roulis et de la vitesse de roulis d’un projectile de 40 mm par l’EKF présenté
précédemment sans réseau de neurones (en vert), et l’EKF dont la matrice de covariance
du bruit de mesure est déterminée par un CNN (en bleu).
Les figures 3.18 et 3.19 montrent que l’EKF ajusté par un CNN (en bleu) et l’EKF
avec une matrice de covariance constante (en vert) présentent des performances similaires
pour l’estimation de l’angle de roulis et de la vitesse de roulis d’un projectile de 40 mm.
En effet, les erreurs obtenues pour l’estimation de cette trajectoire sont du même ordre
de grandeur avec les deux méthodes considérées. Ainsi, le CNN ne semble pas optimiser
121
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
Figure 3.18 – Estimation de l’angle de roulis d’un projectile de 40 mm par l’EKF (en
vert) et l’EKF ajusté par un CNN (en bleu).
Figure 3.19 – Estimation de la vitesse de roulis d’un projectile de 40 mm par l’EKF (en
vert) et l’EKF ajusté par un CNN (en bleu).
l’estimation des angles et des vitesses de roulis d’un projectile caractérisé par un tir tendu.
122
3.4. Réglage de la covariance du bruit de mesures par un CNN : application à un EKF et à un
IEKF
Figure 3.20 – Représentation des RMSE de l’EKF ajusté par le CNN en fonction des
RMSE de l’EKF avec une matrice de covariance constante pour l’estimation de l’angle et
de la vitesse de roulis d’un projectile de 40 mm.
Afin de confirmer ces observations, le score Cscore (3.46) et le taux d’erreur Ce (3.47) sont
évalués pour l’EKF ajusté par le CNN (en bleu) et pour l’EKF sans réseau de neurones
(en vert) et sont présentés dans la figure 3.21.
La figure 3.21 confirme les observations précédentes. Le CNN ne permet pas de réduire
les erreurs d’estimation de l’angle et de la vitesse de roulis d’un projectile de 40 mm par
rapport à une méthode standard de réglage de la matrice de covariance. En effet, les scores
Cscore et les taux d’erreur Ce sont semblables pour l’EKF ajusté par un CNN et pour l’EKF
avec une matrice de covariance constante. Cela signifie que l’ajustement dynamique de la
covariance du bruit de mesure de l’EKF influe peu sur les estimations obtenues.
123
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
Ces performances d’estimation mitigées peuvent s’expliquer par le fait que l’EKF est déjà
réglé de façon optimale avec les paramètres de covariance σHa et σHb , et donc, l’usage d’un
CNN ne peut réduire les erreurs d’estimation. Une seconde explication est que le CNN
ne parvient pas à optimiser l’estimation de l’angle de roulis du fait de la forte dynamique
associée à cet angle.
Les valeurs au carré et les valeurs absolues sont utilisées afin que le CNN estime des
valeurs strictement positives pour s’assurer que l’EKF ne diverge pas.
La figure 3.22 présente les critères de score Cscore (3.46) et de taux d’erreur Ce (3.47)
pour les EKF ajustés par les réseaux CN N (3.59), CN Nsquare (3.60), CN Nabs (3.61).
La figure 3.22 montre que la forme de la matrice de covariance du bruit de mesure
estimée par le CNN influe sur la précision des estimations. En effet, les CN Nsquare (3.60)
et CN Nabs (3.61) présentent de moins bons résultats que le CN N (3.59) pour l’estimation
de l’angle et de la vitesse de roulis d’un projectile de 40 mm. Toutefois, d’après le taux
d’erreur Ce , les réseaux CN N et CN Nabs présentent des performances semblables pour
l’estimation de la vitesse de roulis. Les résultats présentés dans la figure 3.22 indiquent
que le CNN ne converge pas autour des valeurs constantes de covariance σHa et σHb qui
124
3.4. Réglage de la covariance du bruit de mesures par un CNN : application à un EKF et à un
IEKF
N
1 X
M SE = (xi − xbi )2 (3.62)
N i=1
125
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
N
1 X
M AE = |xi − xbi |2 (3.63)
N i=1
- le CN NHuber qui estime une matrice de covariance décrite par l’équation (3.59)
et où la fonction de perte employée est la perte d’Huber (Huber loss) définie telle
que :
1 (x − x b)2 pour |x − xb| ≤ δ
HuberLoss = 2 1 2
(3.64)
δ|x − xb| − 2 δ pour |x − xb| > δ
La figure 3.23 présente les critères de score Cscore (3.46) et de taux d’erreur Ce (3.47)
pour les EKF ajustés par les réseaux CN N (3.59) (en bleu), CN NM AE (en rouge) et
CN NHuber (en vert) pour l’estimation de l’angle et de la vitesse de roulis d’un projectile
de 40 mm.
La figure 3.23 indique la fonction de perte influe sur la précision des estimations
obtenues. En effet, l’EKF ajusté par le CN NM AE (en rouge) présente les scores les plus
faibles et les taux d’erreurs les plus importants pour l’estimation de l’angle et de la vitesse
de roulis. Ainsi, cette fonction de perte n’est pas adaptée à l’estimation de l’angle de
roulis et de la vitesse de roulis d’un projectile de 40 mm comme cette fonction est préférée
lorsque les données comprennent des valeurs aberrantes. À l’inverse, les EKF ajustés par
les réseaux CN N (en bleu) et CN NHuber (en vert) présentent des résultats semblables,
126
3.4. Réglage de la covariance du bruit de mesures par un CNN : application à un EKF et à un
IEKF
bien que la perte d’Huber semble légèrement dégrader les estimations de l’angle et de la
vitesse de roulis par rapport à l’EKF entraîné avec le CN N .
Les résultats présentés dans cette partie révèlent que le réglage dynamique de la ma-
trice de covariance du bruit de mesure d’un EKF ne permet pas d’optimiser l’estimation
de l’angle et de la vitesse de roulis d’un projectile de 40 mm par rapport à un EKF avec
une matrice de covariance constante. Toutefois, l’EKF ajusté par le CNN ne dégrade pas
les estimations. De plus, malgré différentes formes de la matrice de covariance du bruit et
différentes fonctions de perte, aucune méthodes n’a permis de surpasser l’EKF sans réseau
de neurones pour l’estimation de l’angle et de la vitesse de roulis. Une piste d’explication
est que ce filtre de Kalman est peu optimisable du fait que les valeurs de covariance sont
suffisamment ajustées et qu’il est difficile d’améliorer ces résultats déjà existants.
Comme présenté dans la figure 3.24, le LIEKF (Left-Invariant Extended Kalman Filter)
vise à estimer l’orientation R ∈ SO(3), la vitesse v ∈ R3×1 et la position p ∈ R3×1 d’un
projectile dans le repère de navigation n à partir des mesures des accéléromètres et des
gyromètres effectuées dans le repère capteur s ainsi que de la vitesse du projectile mesurée
par un GPS dans le repère de navigation n.
127
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
Dans le cas d’un IEKF, les biais des capteurs inertiels ne sont pas pris en compte
comme aucun groupe de Lie matriciel ne permet de modéliser ces dynamiques tout en
vérifiant la propriété affine de groupe. Ainsi, les modèles des mesures des capteurs inertiels
sont :
avec ω̃s et ãs ∈ R3×1 le modèle de mesure des gyromètres et des accéléromètres dans le
repère capteur s, ωs et as ∈ R3×1 les mesures des gyromètres et des accéléromètres dans
le repère capteur s, et Wω et Wa ∈ R3×1 des bruits blancs gaussiens.
128
3.4. Réglage de la covariance du bruit de mesures par un CNN : application à un EKF et à un
IEKF
Le système d’évolution associé aux états χbt s’écrit sous forme matricielle telle que :
R[ω̃s ]× Rãs + g v R vb pb [Wω ]× Wa 03×1
b b b b
d b
χ
dt t
= 01×3
0 0 − 0
1 0
0 1 0
1×3 1×3 (3.68)
01×3 0 0 01×3 0 1 01×3 0 1
= fut (χbt ) − χbt Lg (wbt )
L’application fut (.) (3.68) est affine de groupe. Par conséquent, d’après le théorème 2.2.1
(Dynamique d’erreur autonome), la dynamique d’erreur invariante est indépendante des
états du système.
L’erreur invariante à gauche associée aux états χbt (3.67) est évaluée telle que :
−1
R v p R b vb pb
ηχt = χ−1
t χbt = 01×3 1 0 01×3 1 0
01×3 0 1 0 1×3 0 1
(3.69)
T b Tb T Tb T
R R R v − R v R p − R p
= 01×3 1 0
01×3 0 1
L’erreur invariante à gauche ηχt (3.69) est linéarisée sur l’espace euclidien associé tel
h iT
que l’erreur linéarisée ξt = ξRT ξvT ξpT ∈ R9×1 soit définie par :
[ξ ] ξv ξp
R×
η χt = exp( ξt ) = expm (Lg (ξt )) ≈ I5×5 + Lg (ξt ) ≈ I5×5 + 01×3 0 0 (3.70)
01×3 0 0
ηR = R T R
b ≈I
3×3 + [ξR ]× ηv = RT vb − RT v ≈ ξv ηp = RT pb − RT p ≈ ξp (3.71)
129
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
d c
χ
dt t
= fut (χ
ct )
(3.72)
d
P
dt t
= At Pt + Pt At T + Q
b
t
avec fut (.) la dynamique d’évolution définie par l’équation (3.68), et avec At ∈ R9×9 la
matrice d’évolution et Qb ∈ R9×9 la matrice de covariance du bruit de modèle tel que :
t
−[ω̃s ]× 03×3 03×3 W
ω
At = −[ãs ]× −[ω̃s ]× 03×3 , b = cov(w
Q bt ) = cov Wa (3.73)
t
03×3 I3×3 −[ω̃s ]× 03×1
D’après le théorème 2.2.1 (Dynamique d’erreur autonome), la dynamique fut (.) est affine
de groupe(2.19) donc la dynamique d’évolution de l’erreur invariante dtd ηt est indépen-
dante de l’estimation χbt . Cette propriété est vérifiée par la matrice At (3.73) qui est
indépendantes des états χt estimés.
L’étape de prédiction du LIEKF à temps discret avec ∆t la période d’échantillonnage
des capteurs est alors :
Pk|k−1 = Φk Pk−1|k−1 Φk T + Qk
130
3.4. Réglage de la covariance du bruit de mesures par un CNN : application à un EKF et à un
IEKF
c )−1
Kk = Pk|k−1 H T (HPk|k−1 H T + N (3.76)
k
D’après la théorie des IEKF, la mise à jour de l’état estimé par un filtre LIEKF est la
suivante :
Rb
k|k−1
vbk|k−1 pbk|k−1 ξR k|k ξv k|k ξp k|k
−1
χbk|k = χbk|k−1 exp Kk (χbk|k−1 Y − b) = 01×3
1 0
0 1 0 (3.77)
1×3
01×3 0 1 01×3 0 1
Donc, la mise à jour des états estimés à partir des observations à temps discret est :
avec vref les vitesses de référence fournies par BALCO et Σvx , Σvy et Σvz des distributions
aléatoires normales.
Suivant le même principe que celui présenté dans la partie (3.3.2), un CNN est en-
traîné pour estimer trois paramètres α, β et γ à partir des vitesses GPS pour moduler la
covariance du bruit de mesure du LIEKF définie telle que :
σ × 10α
vx
0 0
β
R= 0 σ × 10 0 (3.80)
vy
0 0 σvz × 10γ
131
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
Les figures 3.25 et 3.26 présentent l’estimation des positions et des angles d’Euler d’un
mortier de 120 mm ainsi que les erreurs obtenues par le LIEKF présenté précédemment
sans réseau de neurones (en noir), et le LIEKF dont la matrice de covariance du bruit de
mesure est déterminée par un CNN (en bleu).
Les figures 3.25 et 3.26 indiquent que le LIEKF (en noir) et le LIEKF ajusté par un
CNN (en bleu) présentent des performances semblables pour l’estimation des positions et
des angles d’Euler du mortier de 120 mm. Les mêmes observations peuvent être formulées
pour la vitesse. Toutefois, ces deux méthodes d’estimation présentent plusieurs différences.
Performances globales
132
3.4. Réglage de la covariance du bruit de mesures par un CNN : application à un EKF et à un
IEKF
Figure 3.26 – Estimation des angles d’Euler d’un mortier de 120 mm et erreurs associées
obtenues par le LIEKF (en noir) et le LIEKF dont la matrice de covariance du bruit de
mesure est déterminée par un CNN (en bleu).
Figure 3.27 – Critère Cscore (3.46) du LIEKF ajusté par le CNN (en bleu) et du LIEKF
(en noir) pour l’estimation de 100 trajectoires de mortiers de 120 mm.
Les figures 3.27 et 3.28 montrent que les performances d’estimation du LIEKF et du
LIEKF ajusté par un CNN sont similaires comme les taux d’erreur Ce sont du même ordre
de grandeur pour chacune des grandeurs. Toutefois, il est intéressant de remarquer que le
réglage dynamique de la covariance du bruit de mesure du LIEKF dégrade l’estimation des
positions px , pz , des vitesses vx et vz et des angles de roulis ϕ et de lacet ψ contrairement
aux positions, aux vitesses et aux angles suivant l’axe longitudinal. Ainsi, le réglage de la
covariance du bruit de mesure d’un LIEKF présente les mêmes constatations que précé-
demment. Dans le cas où les observations sont fidèles, le CNN ne permet pas d’optimiser
133
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
Figure 3.28 – Taux d’erreur Ce (3.47) du LIEKF ajusté par le CNN (en bleu) et du
LIEKF (en noir) pour l’estimation de 100 trajectoires de mortiers de 120 mm.
toutes les grandeurs estimées. Toutefois, cette solution permet d’optimiser les estimations
suivant l’axe longitudinal dont les dynamiques associées sont très faibles.
134
3.4. Réglage de la covariance du bruit de mesures par un CNN : application à un EKF et à un
IEKF
Comme illustré sur la figure 3.29, le filtre de Kalman linéaire vise à estimer la position
angulaire p et la vitesse angulaire v d’un mobile en déplacement suivant un axe ainsi que
le biais du gyromètre b à partir des mesures d’un accéléromètre et d’un gyromètre.
La dynamique d’évolution de la position angulaire p et de la vitesse angulaire v ainsi
que du biais du gyromètre b est alors :
d d d
v = Wv , p = v + Wp , b = Wb (3.81)
dt dt dt
= Pk|k−1H(HP
K k|k−1
H T + R)
ωk ωbk (3.84)
xbk|k = xbk|k−1 + K − , Pk|k = (I − KH)Pk|k−1
ak abk
Un jeu de données est généré avec des paramètres connus de bruit de capteur. Les
valeurs de la position et de la vitesse angulaire ainsi que le biais du gyromètre sont
identiques pour l’ensemble des trajectoires du jeu de données, de sorte que :
135
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
avec Wω et Wa les bruits des mesures de chacune des simulations de sorte que :
- le filtre de Kalman ajusté par un CNN entraîné pour déterminer les paramètres α
et β de la matrice de covariance du bruit de mesure du filtre tel que :
Σω × 10α 0
RCN N = (3.90)
0 Σa × 10β
- le filtre de Kalman ajusté par un CNN entraîné pour déterminer les paramètres α
et β de la matrice de covariance du bruit de mesure du filtre tel que :
|α| 0
RCN Nabs = (3.91)
0 |β|
La figure 3.30 présente le taux d’erreur Ce (3.47) du filtre avec les valeurs exactes (en
136
3.5. Conclusion
vert), du filtre avec des valeurs constantes (en noir), du filtre ajusté par le CNN d’après
l’équation (3.90) (en bleu) et du filtre ajusté par le CNN d’après l’équation (3.91) (en
jaune).
Figure 3.30 – Taux d’erreur Ce (3.47) du filtre avec les valeurs exactes (en vert), du
filtre avec des valeurs constantes (en noir), du filtre ajusté par le CNN d’après l’équation
(3.90) (en bleu) et du filtre ajusté par le CNN d’après l’équation (3.91) (en jaune).
La figure 3.30 montre tout d’abord que le filtre avec les valeurs exactes de covariance
(en vert) présente les moins bonnes performances d’estimation. De plus, les filtres ajustés
par les CNN (en bleu et jaune) et le filtre avec des valeurs fixes de covariance (en noir)
présentent des performances similaires pour l’estimation de la position et de la vitesse
angulaire du mobile ainsi que du biais du gyromètre. Toutefois, la forme de la covariance
définie par l’équation (3.90) semble plus appropriée que celle présentée par l’équation
(3.91). Ainsi, dans le cas du filtre de Kalman linéaire présenté ci-dessus, un CNN permet
de déterminer un ordre de grandeur des valeurs de la covariance du bruit de mesure afin
d’obtenir les meilleures estimations. En effet, le CNN détermine les valeurs diagonales de
la matrice de covariance du bruit de mesure du filtre sous la forme de deux paramètres
strictement positifs comme présenté dans l’équation (3.91). Ainsi, dans ce cas d’applica-
tion, le CNN permet d’identifier des valeurs optimales de covariance.
3.5 Conclusion
Ce chapitre a présenté une méthode de navigation basée sur un filtre de Kalman où la
matrice de covariance du bruit de mesure est ajustée par un réseau de neurones convolutifs.
Le CNN permet ainsi de déterminer une matrice de covariance variable dans le temps et
adaptée aux phases de vol du projectile.
137
Chapitre 3 – Réglage du bruit de mesure d’un filtre de Kalman par un réseau de neurones
138
3.5. Conclusion
moins l’un des modèles est non linéaire. Afin de vérifier si la nature des modèles influe sur
la précision de la solution proposée, cette approche a été testée sur un filtre de Kalman
linéaire. Les résultats obtenus montrent que dans le cas d’application de ce filtre, le CNN
converge globalement vers des valeurs optimales de covariance.
La solution proposée dans ce chapitre est basée sur des réseaux de neurones convolutifs.
Ce type de réseau exploite les propriétés spatiales des données en entrée. Il s’agit à présent
d’exploiter les caractéristiques temporelles des données inertielles afin de déterminer les
trajectoires des projectiles.
139
Chapitre 4
E STIMATION DE LA TRAJECTOIRE D ’ UN
PROJECTILE PAR UN LSTM
Sommaire
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
4.2 Les réseaux de neurones récurrents . . . . . . . . . . . . . . . 143
4.2.1 Les RNN pour la prédiction de séries temporelles . . . . . . . . 143
4.2.2 Extension du RNN simple : le Long Short-Term Memory . . . 146
4.3 Caractéristiques d’estimation de la trajectoire d’un projec-
tile par un LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . 149
4.3.1 Formulation du problème . . . . . . . . . . . . . . . . . . . . . 149
4.3.2 Prétraitement des données d’entrée . . . . . . . . . . . . . . . . 152
4.4 Estimation de la trajectoire d’un mortier de 120 mm par un
LSTM : résultats et analyse . . . . . . . . . . . . . . . . . . . . 154
4.4.1 Impact de la normalisation et de la rotation du repère de navi-
gation sur la précision des estimations . . . . . . . . . . . . . . 155
4.4.2 Impact du modèle de capteurs inertiels et de la rotation du re-
père de navigation sur la précision des estimations . . . . . . . 161
4.5 Généralisation à d’autres types de projectiles . . . . . . . . . 174
4.5.1 Estimation de la trajectoire d’un obus 155 mm par un LSTM . 175
4.5.2 Estimation de la trajectoire d’un Basic Finner et d’un projectile
de 40 mm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
4.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
4.1 Introduction
Comme présenté dans le chapitre 1, la navigation des projectiles exploite principale-
ment les mesures de l’IMU (Inertial Measurement Unit) et du récepteur GNSS (Global
141
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Navigation Satellite System) en raison des diverses contraintes imposées au système. Ces
mesures sont ensuite combinées par des filtres de Kalman [32]-[35] pour estimer la trajec-
toire du projectile. Néanmoins, les signaux GNSS sont de plus en plus exclus en raison de
leurs indisponibilités et de leurs vulnérabilités face à des conditions hostiles [13]-[17].
Des réseaux de neurones sont en mesure de pallier aux limitations de ces signaux.
Plusieurs approches peuvent être envisagées notamment la navigation de bout-en-bout
[87]-[94], qui vise à remplacer tous les modèles mathématiques de navigation par des
réseaux de neurones. Par conséquent, ce chapitre étudie une méthode d’estimation de la
trajectoire des projectiles basée exclusivement sur l’IA, dans un environnement sans GNSS
en utilisant uniquement les mesures de l’IMU et des paramètres connus de la munition.
En considérant une trajectoire comme une série temporelle, l’IA fournit des approches
intéressantes pour son estimation. La prédiction de séries temporelles est généralement
basée sur les réseaux de neurones récurrents (Recurrent Neural Networks - RNN) [122]-
[124], qui sont une classe de réseau de neurones capable de mémoriser les données passées
pour prédire les données futures. C’est pourquoi, les RNN sont particulièrement bien
adaptés à la prédiction de séries temporelles, particulièrement le Long Short-Term Memory
(LSTM) [122]-[124], pour ses facultés de mémorisation des informations passées.
Ce chapitre se focalise sur une méthode de navigation basée exclusivement sur l’IA.
Des LSTM sont entraînés pour estimer les trajectoires des projectiles à partir des mesures
IMU et des paramètres connus de la munition. Les objectifs de ce chapitre sont :
→ d’étudier dans quelles mesures des réseaux de neurones peuvent remplacer tous les
modèles mathématiques habituellement employés pour la navigation des projectiles
et de visualiser comment l’IA modélise les différentes dynamiques et contraintes
liées à ces systèmes. Pour cela, les trajectoires des projectiles sont estimées par des
LSTM (Long Short-Term Memory) à partir des mesures de l’IMU embarquée, de
la connaissance du champ magnétique de référence, des paramètres de lancement
de la munition et d’un vecteur temporel.
→ d’appliquer cette solution de navigation à plusieurs projectiles afin de déterminer
les limites de cette approche. Pour cela, les trajectoires balistiques d’un mortier de
120 mm et d’un obus de 155 mm et les tirs tendus d’un projectile de 40 mm et
d’un Basic Finner sont estimés par plusieurs LSTMs.
→ d’évaluer l’influence de plusieurs méthodes de prétraitement des données d’entrée
et l’impact des différents modèles d’erreurs des capteurs inertiels sur la précision
des estimations.
142
4.2. Les réseaux de neurones récurrents
143
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Les données d’entrée d’un réseau de neurones récurrents sont une série temporelle.
Pour cela, une fenêtre glissante se déplace sur les données dans le sens de parcours des
signaux. Cette fenêtre est ensuite transmise en entrée du RNN. Ainsi, à chaque pas de
temps, un réseau de neurones récurrents considère comme donnée d’entrée une séquence
x = [x0 , x1 , ..., xτ ] ∈ Rτ ×F , de longueur τ , et où chaque donnée d’entrée xi comprend F
caractéristiques nécessaires à décrire ces données.
La figure 4.2 représente un RNN afin de mettre en évidence les connexions récurrentes.
Un RNN est composé de plusieurs cellules interconnectées entre elles. Au pas de temps
i ∈ [0, τ ], la i-ème cellule estime une sortie y à partir de l’entrée courante xi et de la sortie
de la cellule RNN précédente hi−1 , appelée l’état caché. Ainsi, à travers les informations
contenues dans l’état caché hi−1 , le RNN mémorise les informations pertinentes passées à
court terme.
144
4.2. Les réseaux de neurones récurrents
Le Vanilla RNN
Le Vanilla RNN, illustré dans la figure 4.2, est la structure la plus simple des réseaux
récurrents. Pour prédire yi au pas de temps i, leVanilla RNN utilise l’entrée courante xi
et l’état caché hi−1 à l’instant précédent, contenant les caractéristiques passées au pas de
temps précédemment. De ce fait, le Vanilla RNN mémorise uniquement les informations
passées à court terme. De plus, lors de la phase d’apprentissage, le Vanilla RNN souffre
de problèmes de disparition et d’explosion de gradient [122], [125], [126] :
- dans le cas de la disparition du gradient, la rétropropagation de la dernière couche
à la première couche conduit à une réduction du gradient. Ainsi, les poids de la
première couche ne sont plus mis à jour pendant l’apprentissage et le Vanilla RNN
n’apprend aucune fonctionnalité.
145
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Comme pour le Vanilla RNN, une séquence x = [x0 , x1 , ..., xτ ] ∈ Rτ ×F est transmise
en entrée du LSTM composé d’une succession de cellules LSTM interconnectées, pour
prédire une séquence de sortie y = [h0 , h1 , ..., hτ ].
Ainsi, une cellule LSTM utilise trois données d’entrée pour prédire une sortie ht : la
146
4.2. Les réseaux de neurones récurrents
donnée d’entrée xt à l’instant courant, l’état caché ht−1 à l’instant précédent et la cellule
mémoire ct−1 à l’instant précédent. L’état caché ht−1 mémorise les informations passées à
court terme et la cellule mémoire ct−1 mémorise les informations passées à long terme.
Comme le montre la figure 4.4, une cellule LSTM est composée de trois portes afin de
gérer efficacement les informations à mémoriser dans l’état caché et la cellule mémoire :
- la porte d’oubli (forget gate) filtre, à travers une fonction sigmoïde σ(.), les données
contenues dans la concaténation de xt et ht−1 . Les données sont oubliées pour les
valeurs proches de 0 et sont mémorisées pour les valeurs proches de 1. Le modèle
de la porte d’oubli est :
La cellule mémoire ct est mise à jour avec la porte d’oubli et la porte d’entrée pour
mémoriser les données pertinentes :
- la porte de sortie (output gate) définit le prochain état caché ht contenant des in-
formations sur les entrées précédentes. L’état caché ht est mis à jour avec la cellule
mémoire ct , l’état caché ht−1 et la donnée d’entrée xt . Le modèle de la porte de
sortie est :
ht = σ(Wh .[ht−1 , xt ] + bh ) × tanh(ct ) (4.4)
147
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
et présenté dans la figure 4.5. La première couche LSTM traite la séquence d’entrée
dans le sens de propagation du signal, alors que la seconde couche LSTM traite la
séquence d’entrée dans le sens inverse du sens de propagation du signal. Les sorties
des deux couches LSTM sont ensuite combinées pour produire la sortie désirée.
Cette architecture présente l’avantage de traiter simultanément des informations
passées et futures et est principalement utilisée pour l’analyse et le traitement du
langage. Toutefois, cette architecture, plus complexe qu’un LSTM, est difficilement
applicable en temps réel.
148
4.3. Caractéristiques d’estimation de la trajectoire d’un projectile par un LSTM
tion de la trajectoire d’un projectile. Il est cependant intéressant de mentionner [94] qui
estime la trajectoire d’un projectile par un LSTM entraîné à partir de mesures radars
incomplètes et bruitées.
149
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Comme le montre la figure 4.7, les prédictions du LSTM au temps k sont obtenues à
partir de données d’entrée tridimensionnelles de taille (Batch size , Seq len , In F eatures ), avec
Batch size le nombre de séquences considérées, Seq len le nombre de pas de temps dans la
séquence et In F eatures le nombre de caractéristiques décrivant chaque pas de temps.
Données d’entrée
150
4.3. Caractéristiques d’estimation de la trajectoire d’un projectile par un LSTM
Données de sortie
La perte entre la prédiction du LSTM et les données de référence est évaluée avec
l’erreur quadratique moyenne (Mean Squared Srror - MSE) définie telle que :
n
1X
M SE = (Xref − XLST M )2 (4.5)
n i=1
avec Xref les positions, les vitesses et/ou les angles d’Euler de référence fournis par
BALCO, et XLST M les grandeurs estimées par le LSTM. L’algorithme d’optimisation
employé est l’algorithme d’optimisation d’Adam [51].
151
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Deux méthodes de prétraitement des données d’entrée du LSTM ont été mises en
place ; la normalisation des données d’entrée et la rotation du repère de navigation. Ces
deux méthodes, présentées au chapitre 3, redimensionnent chaque composante d’un vec-
teur sur des plages de variation similaires.
x − xmin
xM M = (4.6)
xmax − xmin
x−µ
xST D = (4.7)
σ
avec x la quantité à normaliser, µ sa moyenne et σ son écart type. Ainsi xST D est
une quantité avec une moyenne nulle et un écart type de un.
L’impact de la normalisation des données d’entrée du LSTM sur la précision des es-
timations est étudié en normalisant l’ensemble des caractéristiques d’entrée ou en nor-
malisant chacune des caractéristiques d’entrée. Ainsi, les facteurs de normalisation xmax ,
xmin , µx et σx sont calculés sur le jeu de données d’entraînement et sont fixes pour l’en-
152
4.3. Caractéristiques d’estimation de la trajectoire d’un projectile par un LSTM
1 PNsim 1 PNsim
xmax = Nsim i=1 max {χi } , xmin = Nsim i=1 min {χi } (4.8)
1 PNsim 1 PNsim
µx = Nsim i=1 µ (χi ) , σx = Nsim i=1 σ (χi ) (4.9)
avec Nsim le nombre de simulations dans le jeu de données d’apprentissage et avec χi les
h i
quantités considérées de la simulation nº i, qui sont χi = M P T dans le cas de la
normalisation pour l’ensemble des caractéristiques d’entrée, et χi = M ou χi = P ou
χi = T dans le cas de la normalisation pour chacune des caractéristiques d’entrée.
Comme présenté dans la figure 4.8, toutes les grandeurs définies initialement dans le
repère local de navigation n sont exprimées dans le repère local de navigation tourné nγ .
Lors de la phase d’apprentissage, le LSTM prédit les trajectoires dans le repère local de
navigation tourné nγ . Ces estimations sont ensuite comparées aux données de référence
également exprimées dans le repère local de navigation tourné nγ afin de rétropropager
la perte et mettre à jour les paramètres du réseau. Lors de la phase de test, les LSTM
estiment les trajectoires dans le repère local de navigation tourné nγ , puis, par la rotation
inverse, ces estimations exprimées dans le repère local de navigation initial n.
L’angle γ est fixe pour toutes les trajectoires du jeu de données et est le même pour
exprimer les positions, les vitesses et les angles. Il est déterminé afin d’obtenir des plages
de variation similaires pour les trois positions et par conséquent, pour les trois vitesses.
153
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
154
4.4. Estimation de la trajectoire d’un mortier de 120 mm par un LSTM : résultats et analyse
Table 4.1 – Spécifications des versions : Influence de la normalisation des données d’en-
trée du LSTM et de la rotation du repère de navigation.
Les réseaux LST MALL, P OS, V EL, AN G, V1−8 sont entraînés sur un jeu de données d’en-
traînement composé de 100 simulations de trajectoires de mortier de 120 mm, un jeu de
données de validation composé de 10 simulations et un jeu de données de test composé
de 20 simulations, générées par BALCO présenté dans la partie (1.5). Les réseaux sont
entraînés d’après les données d’entrée (M, P, T ) décrites dans la partie (4.3) et avec le
modèle de capteurs inertiels produisant les données IMU. La taille du batch est de 64
et la taille de la séquence d’entrée est de 20 pas de temps pour capturer suffisamment
de dépendances à long terme sans dépendre du bruit des mesures. Les réseaux sont mis
à jour par l’algorithme d’optimisation d’Adam [51] et la perte est évaluée avec l’erreur
quadratique moyenne définie par l’équation (4.5).
Les hyperparamètres d’entraînement des réseaux LST MALL, P OS, V EL, AN G, V1−8 sont ré-
sumés dans le tableau 4.2.
155
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Table 4.2 – Caractéristiques d’entraînement de LST MALL, P OS, V EL, AN G, V1−8 sur des
trajectoires de mortier de 120 mm.
Les figures 4.9 - 4.11 présentent la position, la vitesse et les angles d’Euler estimés
ainsi que les erreurs associées pour une trajectoire de mortier de 120 mm de l’ensemble de
test. Pour des raisons de lisibilité, trois méthodes d’estimation sont d’abord comparées :
- l’algorithme de Dead Reckoning (4.10) - (4.12),
- LST MALL,V1 (sans normalisation et sans rotation du repère local de navigation),
- LST MALL,V6 (sans normalisation et avec la rotation du repère local de navigation).
Comme le montrent les figures 4.9 et 4.10, les positions et les vitesses estimées par les
LSTM sont nettement plus précises que celles du Dead Reckoning. Concernant l’estimation
de l’orientation du projectile (figure 4.11), les LSTM ne sont précis que pour estimer l’angle
de tangage θ et l’angle de lacet ψ. Les erreurs dans l’estimation de l’angle de roulis ϕ par
les LSTM sont dues à la vitesse de rotation du mortier. Les LSTM ne parviennent pas à
capturer pleinement toutes les variations d’angle de roulis. De plus, selon les figures 4.9
et 4.11, la rotation du repère local de navigation améliore l’estimation de la position et
de la vitesse du projectile mais dégrade légèrement l’estimation de l’angle de tangage θ
(figure 4.11).
Afin de valider les observations précédentes, LST MALL, P OS, V EL, AN G, V1−8 sont éva-
lués sur l’ensemble du jeu de données de test selon deux critères basés sur l’erreur qua-
156
4.4. Estimation de la trajectoire d’un mortier de 120 mm par un LSTM : résultats et analyse
Figure 4.9 – Position estimée et erreurs associées [m] obtenues par le Dead Reckoning
(vert), LST MALL, V1 (bleu), LST MALL, V6 (jaune) et la position de référence (rouge).
Figure 4.10 – Vitesse estimée et erreurs associées [m/s] obtenues par le Dead Reckoning
(vert), LST MALL, V1 (bleu), LST MALL, V6 (jaune) et la vitesse de référence (rouge).
157
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Figure 4.11 – Orientation estimée et erreurs associées [rad] obtenues par le Dead Re-
ckoning (vert), LST MALL, V1 (bleu), LST MALL, V6 (jaune) et l’orientation de référence
(rouge).
dratique moyenne (Root Mean Square Error - RMSE) définie comme suit :
v
u N
1 X
(xk,ref − xbk )2
u
RM SEx = t (4.13)
N k=1
NX
sim
100 NXsim
RM SELST M
C2 = (4.15)
Nsim k=1 RM SELST M + RM SEDR
158
4.4. Estimation de la trajectoire d’un mortier de 120 mm par un LSTM : résultats et analyse
Les figures 4.12 - 4.14 présentent le taux de réussite C1 (4.14) et le taux d’erreurs C2
(4.15) pour l’estimation des positions, des vitesses et des angles d’Euler avec les réseaux
LST MALL, P OS, V EL, AN G, V1−8 (voir tableau 4.2).
Figure 4.12 – Analyse de l’estimation des positions : taux de réussite C1 (4.14) et taux
d’erreurs C2 (4.15) de LST MALL, V1 −V8 et LST MP OS, V1 −V8 .
Résultats d’estimation des positions : D’après la figure 4.12, les LSTM surpassent lar-
gement l’algorithme de Dead Reckoning pour l’estimation de la position, en particulier le
long de l’axe y.
De plus, LST MP OS, V1 , V6−8 spécialisé dans l’estimation des positions, surpasse légèrement
LST MALL, V1 , V6−8 d’après C1 et C2 , pour l’estimation des positions suivant les trois axes
lorsqu’il n’y a aucune normalisation des données d’entrée.
Les normalisations affectent différemment les estimations de position. Premièrement,
d’après les taux de réussite et d’erreur, les versions V3 et V4 correspondant aux nor-
malisations M M (T , M, P) et ST D(T ), ST D(M), ST D(P) ne conviennent pas à cette
application. Deuxièmement, la précision des réseaux avec normalisation (Min/Max V2,3,7
et STD V4,5,8 ) est moins bonne que celle des réseaux sans normalisation (V1,6 ) comme
la normalisation implique une perte d’information. Enfin, la normalisation Min/Max par
caractéristique (V2 ) est meilleure qu’une normalisation Min/Max pour toutes les caracté-
ristiques d’entrée (V3 ), contrairement à la normalisation STD où une normalisation pour
l’ensemble des caractéristiques (V5 ) est plus adaptée qu’une normalisation par caractéris-
tique (V4 ).
La rotation du repère de navigation améliore l’estimation des positions. En effet, en com-
parant LST MALL, V1 avec LST MALL, V6 et LST MP OS, V1 avec LST MP OS, V6 , les versions
sans rotation présentent des taux d’erreurs plus importants qu’avec la rotation du repère
de navigation. Donc, cette méthode permet d’améliorer les estimations des positions.
159
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Figure 4.13 – Analyse de l’estimation des vitesses : taux de réussite C1 (4.14) et taux
d’erreurs C2 (4.15) de LST MALL, V1 −V8 et LST MP OS, V1 −V8 .
Résultats d’estimation des vitesses : D’après la figure 4.13, des observations similaires
aux résultats de position peuvent être formulées. Les LSTM surpassent clairement le Dead
Reckoning pour l’estimation des vitesses. Les réseaux spécialisés LST MV EL, V1 , V6−8 sans
normalisation surpassent très légèrement LST MALL, V1 , V6−8 .
De même que pour la position, les versions V3 (M M (T , M, P)) et V4 (ST D(T ), ST D(M),
ST D(P)) présentent les erreurs les plus importantes. Ainsi, ces normalisations ne sont
pas adaptées à l’estimation des vitesses. La normalisation STD pour toutes les carac-
téristiques d’entrée (V5 ) présente les meilleurs résultats parmi les différentes options de
normalisation étudiées, en particulier pour la vitesse le long de l’axe z.
De plus, la rotation du repère de navigation (V6 ) réduit les erreurs d’estimation des vi-
tesses.
Figure 4.14 – Analyse de l’estimation des angles d’Euler : taux de réussite C1 (4.14) et
taux d’erreurs C2 (4.15) de LST MALL, V1 −V8 et LST MP OS, V1 −V8 .
160
4.4. Estimation de la trajectoire d’un mortier de 120 mm par un LSTM : résultats et analyse
Résultats d’estimation des angles d’Euler : L’estimation des angles d’Euler est plus
mitigée d’après la figure 4.14. D’après le taux de réussite C1 , certains LSTM ne par-
viennent pas à estimer les angles de roulis et de tangage par rapport au Dead Reckoning,
mais estiment avec précision l’angle de lacet. De plus, les réseaux spécialisés LST MAN G
sont plus adaptés que les réseaux généralistes LST MALL pour l’estimation des angles de
roulis et de lacet contrairement à l’angle de tangage.
La normalisation détériore considérablement la précision des estimations. Comme précé-
demment, la normalisation ST D(T , M, P) de LST MALL semble présenter les meilleures
performances pour l’estimation du roulis et du tangage parmi les formes de normalisation
étudiées.
De même que pour la position et la vitesse, la rotation du repère de navigation améliore
les estimations.
161
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
- LST MIM U, V1 : LSTM entraîné selon les spécifications données par la table 4.3. Les
données d’entrée (M, P, T ) ne sont pas normalisées et aucune rotation du repère
de navigation n’est effectuée.
- LST MIM U DY N, V1 , entraîné avec les mesures IMU DYN sans normalisation et
sans rotation du repère de navigation.
- LST MIM U, V6 : réseau avec les mêmes spécifications que LST MIM U,V1 (pas de
normalisation, mesures IMU ) mais avec la rotation du repère de navigation.
- LST MIM U DY N, V6 : réseau avec les mêmes spécifications que LST MIM U DY N,V1
(pas de normalisation, mesures IMU DYN ) et la rotation du repère de navigation
est utilisée.
Cette section analyse LST MIM U, V1 (pas de rotation), LST MIM U, V6 (rotation) et le
Dead Reckoning (4.10) - (4.12) pour l’estimation des trajectoires d’un mortier de 120 mm.
Ces réseaux, présentés dans le tableau 4.3, sont entraînés avec les mesures IMU.
Performances d’estimation de LST MIM U, V1 : Les figures 4.15 - 4.17 présentent la
RMSE (4.13) du LST MIM U, V1 en fonction de la RMSE du Dead Reckoning pour l’es-
timation des 400 trajectoires du jeu de données de test.
Selon les figures 4.15 et 4.16, LST MIM U, V1 surpasse considérablement le Dead Recko-
ning pour l’estimation de la position et de la vitesse le long des axes x et y comme la
plupart des marqueurs sont situés dans la partie supérieure. Cependant, les performances
sont légèrement moins importantes pour l’estimation de la position et de la vitesse le long
162
4.4. Estimation de la trajectoire d’un mortier de 120 mm par un LSTM : résultats et analyse
de l’axe z car de nombreux marqueurs sont situés dans la partie inférieure. D’après la
figure 4.17, LST MIM U, V1 ne parvient pas à estimer correctement l’angle de roulis comme
la majorité des marqueurs sont situés dans la partie inférieure, mais estime adéquatement
les angles de tangage et de lacet du projectile.
Ces premières observations confirment que le LSTM généralise avec succès les caractéris-
tiques apprises sur un grand ensemble de données, en particulier pour l’estimation de la
position et de la vitesse.
163
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
N
1 X
ē = (xref − xb) (4.16)
N k=1
L’écart type σ est employé pour évaluer la dispersion des erreurs en fonction du modèle
d’erreur considéré. Il est évalué tel que :
v
u N
1 X
([xref − xb] − ē)2
u
σ= t (4.17)
N k=1
Figure 4.18 – Distribution des erreurs moyennes de position de LST MIM U, V1 (bleu),
LST MIM U, V6 (vert) et du Dead Reckoning (rouge).
164
4.4. Estimation de la trajectoire d’un mortier de 120 mm par un LSTM : résultats et analyse
Figure 4.19 – Distribution des erreurs moyennes de vitesse de LST MIM U, V1 (bleu),
LST MIM U, V6 (vert) et du Dead Reckoning (rouge).
165
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
estimations de LST MIM U, V1 (pas de rotation) sont légèrement biaisées et peuvent être
corrigées par la rotation du repère de navigation. La figure 4.19 confirme l’apport des
LSTM pour l’estimation des vitesses par rapport à un Dead Reckoning, ainsi que l’intérêt
de la rotation du repère de navigation pour améliorer l’estimation de vx et vz .
Figure 4.20 – Distribution des erreurs moyennes d’orientation de LST MIM U, V1 (bleu),
LST MIM U, V6 (vert) et du Dead Reckoning (rouge).
166
4.4. Estimation de la trajectoire d’un mortier de 120 mm par un LSTM : résultats et analyse
Pour conclure cette première analyse, les figures 4.18 - 4.20 indiquent que le LSTM
entraîné à partir des mesures IMU est parfaitement adapté pour estimer les positions et les
vitesses d’un mortier de 120 mm, et de plus, surpasse significativement un algorithme de
Dead Reckoning. Néanmoins, l’estimation de l’orientation du projectile par un LSTM est
mitigée et nécessite une attention particulière. Enfin, la rotation du repère de navigation
permet d’optimiser les positions et les vitesses estimées, notamment le long de l’axe z.
Le jeu de données comprend des mesures IMU DYN pour lesquelles la dynamique
des capteurs est prise en compte. L’influence de ce modèle d’erreur est examinée avec
les réseaux entraînés avec les mesures IMU DYN, à savoir, LST MIM U DY N, V1 (pas de
rotation), LST MIM U DY N, V6 (rotation) et l’algorithme Dead Reckoning (4.10) - (4.12).
Les caractéristiques d’entraînement sont résumées dans le tableau 4.3.
Les figures 4.21 - 4.23 présentent les distributions des erreurs moyennes (4.16) d’esti-
mation des positions, des vitesses et des angles d’Euler obtenues par LST MIM U DY N, V1 ,
LST MIM U DY N, V6 , et l’algorithme de Dead Reckoning (4.10) - (4.12).
167
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Figure 4.22 – Distribution des erreurs moyennes de vitesse de LST MIM U DY N, V1 (bleu),
LST MIM U DY N, V6 (vert) et du Dead Reckoning (rouge).
168
4.4. Estimation de la trajectoire d’un mortier de 120 mm par un LSTM : résultats et analyse
169
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Métrique d’évaluation
N
1 X
M AE = |xref − xb| (4.18)
N k=1
NX
sim
La MAE est évaluée sur l’ensemble du jeu de données de test tel que :
1 NX sim
CM AE = M AEsimk (4.20)
Nsim k=1
170
4.4. Estimation de la trajectoire d’un mortier de 120 mm par un LSTM : résultats et analyse
entraînés avec les mesures IMU, et l’estimation de py , vx et vy pour les LSTM entraînés
avec les mesures IMU DYN. La figure 4.24 confirme qu’un LSTM n’est pas adapté à l’es-
timation de l’angle de roulis contrairement à l’angle de tangage ou l’angle de lacet. De
plus, la rotation du repère de navigation améliore légèrement l’estimation de l’angle de
tangage avec les mesures IMU DYN.
Analyse du critère Cscore : La figure 4.25 présente le score Cscore (4.19), évalué sur l’en-
semble du jeu de données de test pour LST MIM U, V1 , LST MIM U DY N, V1 , LST MIM U DY N, V6
et le Dead Reckoning.
Figure 4.25 – Critère d’erreur Cscore (4.19) de LST MIM U, V1 , LST MIM U, V6 ,
LST MIM U DY N, V1 , LST MIM U DY N, V6 et du Dead Reckoning.
D’après la figure 4.25, LST MIM U, V1,6 et LST MIM U DY N, V1,6 surpassent de manière
significative le Dead Reckoning pour l’estimation des positions et des vitesses. De plus, la
rotation du repère de navigation améliore pz , vx et vz en cas de mesures IMU et améliore
py , vx et vy en cas de mesures IMU DYN. Selon les scores pour l’estimation des angles
d’Euler, les LSTM sont efficaces pour estimer les angles de tangage et de lacet, pour les
deux types de données inertielles. Cependant, la rotation du repère de navigation détériore
l’estimation de l’orientation du projectile, particulièrement l’estimation de l’angle de lacet.
171
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Figure 4.26 – Erreurs au point d’impact obtenues par LST MIM U, V1 (croix bleues),
LST MIM U, V6 (croix vertes) et le Dead Reckoning (points rouge).
D’après les figures 4.26 et 4.27, la majorité des erreurs au point d’impact du Dead
Reckoning sont supérieures à 100 m contrairement aux LSTM où les erreurs sont stric-
tement inférieures à 100 m. La plupart des erreurs au point d’impact de LST MIM U, V6
(rotation) sont inférieures à 5 m, contrairement à LST MIM U, V1 où la majorité des erreurs
172
4.4. Estimation de la trajectoire d’un mortier de 120 mm par un LSTM : résultats et analyse
Figure 4.28 – Erreurs au point d’impact obtenues par LST MIM U DY N, V1 (croix bleues),
LST MIM U DY N, V6 (croix vertes) et le Dead Reckoning (points rouge).
173
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Les figures 4.28 et 4.29 confirment les analyses précédentes. Les mesures IMU DYN
provoquent la divergence du Dead Reckoning. De plus, la rotation du repère de navigation
détériore la précision des estimations. En effet, dans le cas du LST MIM U DY N, V1 , 66.5%
des simulations ont des erreurs au point d’impact inférieures à 5 m alors que 45% des
simulations ont des erreurs au point d’impact inférieures à 5 m avec le LST MIM U DY N, V6 .
Les figures 4.15 - 4.29 montrent qu’un LSTM entraîné à partir de mesures inertielles,
des paramètres de vol et d’un vecteur de temps, est une approche précise d’estimation des
positions et des vitesses avec des erreurs inférieures à dix mètres dans un environnement
sans GNSS. Néanmoins, les figures 4.15 - 4.29 confirment qu’un LSTM n’est pas appro-
prié pour estimer l’orientation d’un projectile. Une méthode classique de navigation sera
privilégiée. De plus, selon l’analyse de la rotation du repère de navigation, cette méthode
est intéressante dans le cas des mesures IMU et permet d’optimiser fortement l’estimation
des positions et des vitesses du mortier de 120 mm.
174
4.5. Généralisation à d’autres types de projectiles
Table 4.4 – Caractéristiques d’entraînement de LST Mobus155 sur des trajectoires d’obus
de 155 mm.
position, la vitesse et les angles d’Euler d’un obus de 155 mm à partir des données d’entrée
In F eatures = (M, P, T ) ∈ R16 . Les paramètres de vol de cette munition sont l’angle de
roulis initial, la vitesse initiale et l’angle d’élévation du canon. Les caractéristiques de
l’entraînement de LST Mobus155 sont présentées dans le tableau 4.4.
Les figures 4.30 - 4.31 présentent la position et les angles d’Euler estimés ainsi que les
erreurs obtenues par le LST Mobus155 et le Dead Reckoning pour une trajectoire d’obus de
155 mm.
Les figures 4.30 - 4.31 montrent qu’un LSTM parvient à capturer globalement les dy-
namiques des positions de cette munition, bien que les résultats soient moins performants
que ceux obtenus précédemment. Des observations similaires peuvent être formulées pour
175
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Figure 4.30 – Position estimée et erreurs associées [m] obtenues par l’algorithme de
Dead Reckoning (vert), le LST Mobus155 (bleu) et la position de référence (rouge).
Figure 4.31 – Orientation estimée et erreurs associées [rad] obtenues par l’algorithme
de Dead Reckoning (vert), le LST Mobus155 (bleu) et l’orientation de référence (rouge).
la vitesse. Toutefois, comme pour le mortier de 120 mm, le LSTM ne parvient pas à
estimer l’orientation d’un obus de 155 mm. En effet, le LSTM capture globalement les
dynamiques des angles de tangage et de lacet contrairement à l’angle de roulis, où le
LSTM n’estime aucune dynamique.
176
4.5. Généralisation à d’autres types de projectiles
Afin de valider ces premières observations, les performances de LST Mobus155 sont éva-
luées sur l’ensemble du jeu de données de test avec les critères CM AE (4.20) et Cscore
(4.19). Les figures 4.32 et 4.33 présentent ces deux critères de performance obtenus par
le LST Mobus155 et le Dead Reckoning pour l’estimation des positions, des vitesses et des
angles d’Euler d’un obus de 155 mm.
Figure 4.33 – Critère d’erreur Cscore (4.19) de LST Mobus155 et du Dead Reckoning.
Les figures 4.32 et 4.33 montrent que LST Mobus155 surpasse le Dead Reckoning pour
l’estimation des positions et des vitesses d’un obus de 155 mm. Toutefois, les erreurs
moyennes de position et de vitesse CM AE du LST Mobus155 sont relativement importantes
malgré les fortes dynamiques de cette munition. En effet, les erreurs moyennes de positions
de LST Mobus155 sont d’environ 300 m suivant les axes x et z. Concernant l’estimation des
angles d’Euler, le LST Mobus155 ne parvient pas à capturer la dynamique de l’angle de
roulis contrairement aux angles de tangage et de lacet.
D’après les résultats présentés dans les figures 4.30 - 4.33, un LSTM est partiellement
adapté à l’estimation des positions et des vitesses d’un obus de 155 mm comparé aux
177
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
résultats obtenus pour le mortier de 120 mm. Ces observations s’expliquent par les im-
portantes vitesses de rotation de l’obus de 155 mm qui ne disposent pas d’ailettes. Cela
implique de fortes dynamiques angulaires qui influent sur la précision des estimations du
LSTM. Ainsi, dans le cas d’un projectile à forte vitesse de rotation, des réseaux spécialisés
dans l’estimation des positions et des vitesses exclusivement sont préférables.
De plus, les figures 4.30 - 4.33 confirment les constatations formulées précédemment sur
le mortier de 120 mm ; un LSTM qui estime la trajectoire complète d’un projectile ne
parvient pas à estimer convenablement l’angle de roulis de la munition. Ces observations
sont d’autant plus vraies lorsque la vitesse de rotation du projectile est importante. Dans
le cas de l’obus de 155 mm, le LSTM ne capture aucune dynamique de l’angle de roulis.
Toutefois, cette solution est adaptée aux angles de tangage et de lacet de la munition.
Pour conclure sur l’estimation de la trajectoire balistique d’un projectile, un LSTM
est parfaitement adapté à l’estimation des positions des vitesses. En effet, au vu des résul-
tats obtenus pour le mortier de 120 mm ainsi que ceux obtenus pour une autre munition
non présentée dans ce document, un LSTM est parfaitement adapté à l’estimation des
positions et des vitesses d’une munition caractérisée par une trajectoire balistique avec un
faible taux de roulis. Toutefois, d’après les résultats obtenus pour l’obus de 155 mm, les
performances d’estimation d’un LSTM sont dégradées dans le cas d’un projectile carac-
térisé par une trajectoire balistique avec une forte vitesse de rotation. Néanmoins, pour
l’ensemble des projectiles étudiés jusqu’à présent, un LSTM ne parvient pas à capturer
les dynamiques angulaires, même dans le cas de projectiles à faibles vitesses de rotation.
178
4.5. Généralisation à d’autres types de projectiles
Figure 4.34 – Présentation de LST Mϕ , LST Mϕunroll , LST Mθ,ψ , LST Mϕ,θ,ψ ,
LST Mϕunroll ,θ,ψ , LST MROTϕunroll ,θ,ψ .
timer indépendamment les grandeurs de l’orientation dans le but de discriminer les dif-
férentes dynamiques. Ainsi, sur le principe des réseaux spécialisés, 6 LSTM, présentés
dans la figure 4.34, ont été entraînés spécifiquement dans les mêmes conditions d’après les
données d’entrée In F eatures = (M, P, T ) ∈ R16 présentée à la partie (4.3) de sorte que :
- LST Mϕ estime l’angle de roulis ϕ de la munition.
- LST Mϕunroll estime l’angle de roulis déplié ϕunroll , puis cet angle est exprimé entre
±π comme la munition tourne sur elle-même.
- LST Mθ,ψ estime l’angle de tangage θ et de lacet ψ de la munition.
- LST Mϕ,θ,ψ estime les angles de roulis ϕ, tangage θ et lacet ψ de la munition.
- LST Mϕunroll ,θ,ψ estime l’angle de roulis déplié ϕunroll , l’angle de tangage θ et de
lacet ψ de la munition, puis l’angle de roulis est exprimé entre ±π.
- LST MROTϕunroll ,θ,ψ estime l’angle de roulis déplié ϕunroll , l’angle de tangage θ et
de lacet ψ de la munition dans le repère de navigation tourné nγ , puis l’angle de
roulis est exprimé entre ±π et la rotation inverse est appliquée afin d’exprimer les
trois angles dans le repère de navigation local n.
Les figures 4.35 - 4.37 présentent les résultats d’estimation de LST Mϕ , LST Mϕunroll ,
LST Mθ,ψ , LST Mϕ,θ,ψ , LST Mϕunroll ,θ,ψ , LST MROTϕunroll ,θ,ψ pour l’estimation des trois angles
d’Euler d’un mortier de 120 mm.
179
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Figure 4.35 – Estimation de l’angle de roulis par LST Mϕ , LST Mϕunroll , LST Mϕ,θ,ψ ,
LST Mϕunroll ,θ,ψ et LST MROTϕunroll ,θ,ψ .
La figure 4.35 montre l’estimation de l’angle de roulis d’un mortier de 120 mm par
LST Mϕ , LST Mϕunroll , LST Mϕ,θ,ψ , LST Mϕunroll ,θ,ψ et par LST MROTϕunroll ,θ,ψ . L’angle de
roulis est estimé correctement par LST Mϕ et par LST Mϕ,θ,ψ . Ces réseaux parviennent
à estimer la dynamique de roulis moyennant un nombre important de couches. À l’in-
verse, et contrairement aux résultats attendus, le dépliage de l’angle de roulis et la rota-
tion du repère de navigation détériorent l’estimation de cet angle. En effet, LST Mϕunroll ,
LST Mϕunroll ,θ,ψ et LST MROTϕunroll ,θ,ψ présentent un retard.
Figure 4.36 – Estimation de l’angle de tangage par LST Mθ,ψ , LST Mϕ,θ,ψ ,
LST Mϕunroll ,θ,ψ et LST MROTϕunroll ,θ,ψ .
180
4.5. Généralisation à d’autres types de projectiles
Figure 4.37 – Estimation de l’angle de lacet par LST Mθ,ψ , LST Mϕ,θ,ψ , LST Mϕunroll ,θ,ψ
et LST MROTϕunroll ,θ,ψ .
est l’estimation de LST Mθ,ψ , sans dépliage de l’angle de roulis et sans rotation du repère
de navigation. De plus, LST Mϕ,θ,ψ présente de moins bonnes performances que LST Mθ,ψ
donc un réseau spécialisé dans l’estimation de tangage et de lacet semble préférable.
Afin d’analyser les performances globales des réseaux, la figure 4.38 présente le critère
d’erreur Cscore (4.19) évalué pour 50 trajectoires de mortier de 120 mm.
Figure 4.38 – Critère d’erreur Cscore (4.19) de LST Mϕ , de LST Mϕunroll , de LST Mθ,ψ ,
de LST Mϕ,θ,ψ , de LST Mϕunroll ,θ,ψ et de LST MROTϕunroll ,θ,ψ .
La figure 4.38 confirme les observations préliminaires. Des réseaux spécialisés sont
nécessaires pour estimer convenablement les angles d’Euler d’un mortier de 120 mm.
En effet, LST Mϕ,θ,ψ présente les meilleurs résultats d’estimation de l’angle de roulis, et
LST Mθ,ψ présente les meilleures performances d’estimation des angles de tangage et de
lacet. Ainsi, un réseau spécialisé parvient à capturer les trois dynamiques angulaires.
D’après les analyses formulées précédemment, la solution la plus appropriée à l’esti-
mation de l’angle de roulis du mortier de 120 mm est le réseau LST Mϕ,θ,ψ . Pour cela, ce
même réseau est entraîné pour estimer les trois angles d’Euler d’un obus de 155 mm. Les
résultats d’estimation pour une trajectoire sont présentés dans la figure 4.39.
181
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Figure 4.39 – Estimation des angles d’Euler d’un obus de 155 mm par le Dead Reckoning
(en vert), le LST Mϕ,θ,ψ (en bleu) et les angles de référence (en rouge).
Les figures 4.30 - 4.33 montrent que le LSTM parvient à capturer globalement la
dynamique d’évolution de l’obus de 155 mm. Un paramètre influant ces résultats est la
taille de la séquence d’entrée du LSTM. Pour cela, afin de visualiser l’influence de la taille
de la séquence d’entrée, plusieurs LSTM dont les caractéristiques sont présentées dans la
table 4.4 ont été entraînés. Ainsi, LST M5 est entraîné avec une séquence d’entrée de 5
pas de temps, LST M10 avec 10 pas de temps, et LST M50 est entraîné avec 50 pas de
temps afin d’estimer les positions, les vitesses et les angles d’Euler d’un obus de 155 mm.
Les figures 4.40 - 4.42 présentent les positions, les vitesses et les angles d’Euler d’un
obus de 155 mm estimés par le LST M5 , le LST M10 et le LST M50 .
182
4.5. Généralisation à d’autres types de projectiles
Figure 4.42 – Estimation des angles d’Euler d’un obus de 155 mm par LST M5 (noir),
LST M10 (bleu) et LST M50 (vert).
Les figures 4.40 - 4.42 montrent que les réseaux LST M5 , LST M10 et LST M50 par-
viennent à capturer globalement les dynamiques des positions et des vitesses. Comme
observé précédemment, les réseaux ne capturent pas la dynamique de l’angle de roulis
mais parviennent à estimer de façon cohérente les angles de tangage et de lacet.
La figure 4.43 présente la somme des erreurs quadratiques moyennes, notée CRM SE ,
évaluée pour LST M5 (noir), LST M10 (bleu) et LST M50 (vert) sur l’ensemble de test.
183
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Figure 4.43 – Erreur quadratique moyenne CRM SE évaluée pour LST M5 (noir), LST M10
(bleu) et LST M50 (vert).
La figure 4.43 montre que la longueur de la séquence d’entrée influe sur la précision des
estimations. En effet, les séquences les plus courtes présentent en moyenne les plus faibles
erreurs d’estimation. Ainsi, pour l’estimation des positions d’un obus de 155 mm, une
séquence de 10 pas de temps est préférable contrairement aux vitesses où une séquence
de 5 pas de temps semble plus appropriée. La longueur de la séquence est un paramètre
à définir lors de l’entraînement d’un LSTM et est réglée de façon empirique suivant la
nature et la forme des données d’entrée. Concernant l’obus de 155 mm, malgré plusieurs
tests préliminaires, la taille de la séquence, comme le nombre de couches, n’ont pas permis
d’estimer précisément les positions et les vitesses de cette munition, du fait de la forte
vitesse de rotation de l’obus.
Le LST MBF estime la position, la vitesse et les angles d’Euler d’un Basic Finner,
caractérisé par un tir tendu et une vitesse de rotation faible, similaire à celui du mortier
de 120 mm. Les données d’entrée de LST MBF sont In F eatures = (M, P, T ) ∈ R16 avec
M ∈ R12 les données inertielles comprenant les mesures IMU et le champ magnétique de
référence, avec P ∈ R3 les paramètres de vol qui sont l’angle de braquage des ailettes, la
vitesse initiale et l’angle d’élévation du canon et avec T ∈ R1 le vecteur temps. Aucune
184
4.5. Généralisation à d’autres types de projectiles
Table 4.5 – Caractéristiques d’entraînement de LST MBF sur des trajectoires de Basic
Finner.
Les figures 4.44 - 4.46 présentent les résultats d’estimation de la position, de la vitesse
et des angles d’Euler d’une trajectoire d’un Basic Finner ainsi que les erreurs associées.
Figure 4.44 – Basic Finner : Position estimée et erreurs associées [m] obtenues par
l’algorithme de Dead Reckoning (vert), LST MBF (bleu) et la position de référence (rouge).
Les figures 4.44 - 4.46 montrent que, malgré les faibles dynamiques, le LST MBF est
largement moins performant qu’un Dead Reckoning pour l’estimation des positions, des
vitesses et des angles d’Euler d’un Basic Finner, à l’exception de la position suivant l’axe
y. Toutefois, le LST MBF parvient à capturer les dynamiques des positions, des vitesses
et des angles de tangage et de lacet.
185
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Figure 4.45 – Basic Finner : Vitesse estimée et erreurs associées [m/s] obtenues par
l’algorithme de Dead Reckoning (vert), LST MBF (bleu) et la vitesse de référence (rouge).
Figure 4.46 – Basic Finner : Orientation estimée et erreurs associées [rad] obtenues
par l’algorithme de Dead Reckoning (vert), LST MBF (bleu) et orientation de référence
(rouge).
Les performances du LST MBF et du Dead Reckoning sont évaluées sur l’ensemble du
jeu de données de test avec les critères Cscore (4.19) et CRM SE définis tels que :
1 PNsim
CRM SE = Nsim k=1 RM SE(simk ) (4.21)
186
4.5. Généralisation à d’autres types de projectiles
Les figures 4.47 - 4.48 présentent les critères CRM SE (4.21) et Cscore (4.19) du LST MBF
et du Dead Reckoning pour l’estimation de la trajectoire d’un Basic Finner.
Figure 4.47 – Basic Finner : CRM SE (4.21) du LST MBF et du Dead Reckoning.
Figure 4.48 – Basic Finner : Cscore (4.19) du LST MBF et du Dead Reckoning.
Les figures 4.47 - 4.48 montrent que le LST MBF n’est pas du tout performant pour
estimer la trajectoire d’un Basic Finner. En effet, les performances d’estimation du LSTM
sont moins bonnes que celles d’un Dead Reckoning. Malgré plusieurs tests préliminaires
tels que la modification de plusieurs hyperparamètres ou la modification des couches,
aucun réseau n’a surpassé le Dead Reckoning pour l’estimation de la trajectoire d’un
Basic Finner.
Le LST M40 mm estime la position, la vitesse et les angles d’Euler d’un projectile de 40
mm, caractérisé par un tir tendu et une vitesse de rotation élevée, similaire à celle de l’obus
de 155 mm. Les données d’entrée du LST M40 mm sont In F eatures = (M, P, T ) ∈ R16 avec
M ∈ R12 les données inertielles, P ∈ R3 les paramètres de vol qui sont l’angle de roulis
initial, la vitesse initiale et l’angle d’élévation du canon et avec T ∈ R1 le vecteur temps.
Les caractéristiques de LST M40 mm sont présentées dans le tableau 4.6.
187
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Table 4.6 – Caractéristiques d’entraînement de LST M40 mm sur des trajectoires projec-
tiles de 40 mm.
Les figures 4.49 - 4.50 présentent les critères CRM SE (4.21) et Cscore (4.19) du LST M40 mm
Comme pour le Basic Finner, les figures 4.49 - 4.50 montrent que le LST M40 mm ne
surpasse pas l’algorithme de Dead Reckoning pour l’estimation de la trajectoire d’un pro-
jectile de 40 mm. Comme précédemment, malgré différents entraînements, le LST M40 mm
ne surpasse pas les estimations d’un Dead Reckoning.
188
4.5. Généralisation à d’autres types de projectiles
Les figures 4.44 - 4.49 montrent qu’un LSTM ne parvient pas à estimer convenable-
ment les trajectoires d’un Basic Finner et d’un projectile de 40 mm caractérisés par des
tirs tendus. L’hypothèse formulée est qu’un LSTM ne parvient pas à estimer la trajec-
toire d’un projectile caractérisé par un tir tendu, du fait de la faible durée de vol et des
faibles amplitudes de variation associées. Afin de vérifier cette hypothèse, LST M120 mm
est entraîné pour estimer la trajectoire tronquée d’un mortier de 120 mm sachant que ce
réseau performe pour l’estimation de la trajectoire complète de ce projectile. LST M120 mm
est entraîné d’après les spécifications de LST MALL présenté dans la partie (4.3.1) afin
d’estimer la trajectoire tronquée d’un mortier de 120 mm, correspondant à un tir tendu.
Les figures 4.51 - 4.53 présentent l’estimation de la position, de la vitesse et des angles
d’Euler d’une trajectoire d’un mortier de 120 mm en tir tendu ainsi que les erreurs asso-
ciées.
Figure 4.51 – Projectile de 120 mm en tir tendu : Position estimée et erreurs associées
[m] obtenues par l’algorithme de Dead Reckoning (vert), LST M120 mm (bleu) et la position
de référence (rouge).
Comme le montre les figures 4.51 - 4.53, le LST M120 mm ne parvient pas à estimer
la trajectoire d’un mortier de 120 mm en tir tendu, alors que ce même réseau estimait
avec précision la trajectoire complète du mortier de 120 mm. Cette constatation est par-
ticulièrement vérifiée pour l’estimation des vitesses et des angles de tangage et de lacet
du projectile. En particulier, une erreur systématique, observée également pour le Basic
Finner et le projectile de 40 mm, est présente pour l’estimation des vitesses.
189
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
Figure 4.52 – Projectile de 120 mm en tir tendu : Vitesse estimée et erreurs associées
[m/s] obtenues par l’algorithme de Dead Reckoning (vert), LST M120 mm (bleu) et la vi-
tesse de référence (rouge).
Figure 4.53 – Projectile de 120 mm en tir tendu : Orientation estimée et erreurs as-
sociées [rad] obtenues par l’algorithme de Dead Reckoning (vert), LST M120 mm (bleu) et
l’orientation de référence (rouge).
Afin de valider l’hypothèse qu’un LSTM n’est pas adapté à l’estimation de la trajectoire
d’un projectile caractérisé par un tir tendu, les figures 4.54 - 4.55 présentent respective-
ment les critères d’évaluation CRM SE (4.21) et Cscore (4.19) obtenus par le LST M120 mm et
le Dead Reckoning pour l’estimation des positions, des vitesses et des angles d’Euler d’un
mortier de 120 mm dont la trajectoire est tronquée pour correspondre à un tir tendu.
Les figures 4.54 et 4.55 montrent que le Dead Reckoning est largement plus précis que
LST M120 mm pour estimer les positions, les vitesses et les angles d’Euler d’un mortier de
190
4.6. Conclusion
Figure 4.54 – Mortier de 120 mm en tir tendu : erreur quadratique moyenne globale
CRM SE (4.21).
120 mm dont la trajectoire est tronquée pour correspondre à un tir tendu. Ces résultats
sont en contradiction avec ceux obtenus pour l’estimation de la trajectoire complète d’un
mortier de 120 mm où le LSTM présentait de très faibles erreurs d’estimation comparées
aux erreurs d’un Dead Reckoning. Ainsi, ces observations confirment l’hypothèse formulée.
Le LST M120 mm ne parvient pas à estimer la trajectoire d’un mortier de 120 mm en tir
tendu, alors que ce même réseau est performant pour estimer la trajectoire complète
du mortier de 120 mm. Ces observations expliquent donc les mauvaises performances
d’estimation obtenues sur les projectiles de 40 mm et le Basic Finner. Ainsi, un LSTM
n’est pas adapté à l’estimation de la trajectoire d’un projectile caractérisé par un tir tendu.
4.6 Conclusion
Ce chapitre présente une méthode de navigation des projectiles basée exclusivement
sur l’IA. Des LSTM (Long Short-Term Memory) estiment les trajectoires de plusieurs
projectiles à partir des mesures IMU embarquées, des paramètres de lancement de la mu-
nition, et d’un vecteur temporel. Des réseaux spécialisés dans l’estimation d’une grandeur,
191
Chapitre 4 – Estimation de la trajectoire d’un projectile par un LSTM
des méthodes de prétraitement des données d’entrée et l’influence du modèle d’erreur des
capteurs inertiels sont analysés.
Cette solution est parfaitement adaptée à l’estimation des positions et des vitesses
d’un mortier de 120 mm mais n’est pas optimale pour estimer l’orientation de cette mu-
nition. Pour cela, un réseau spécialisé dans l’estimation des angles d’Euler est préférable.
D’une part, la normalisation des données d’entrée du LSTM ne permet pas d’optimiser
les estimations contrairement à la rotation du repère de navigation. D’autre part, les
résultats montrent qu’un LSTM estime précisément la trajectoire d’un mortier de 120
mm sans être impacté par le modèle d’erreur des capteurs inertiels. Ainsi, un LSTM est
parfaitement adapté à l’estimation de la trajectoire d’un mortier de 120 mm à partir des
mesures inertielles embarquées, des paramètres de lancement et d’un vecteur temporel.
L’estimation de la trajectoire d’un obus de 155 mm par un LSTM présente de moins
bonnes performances que celles obtenues pour le mortier de 120 mm. Toutefois, cette so-
lution reste adaptée à l’estimation des positions et des vitesses de cette munition. De plus,
comme pour le mortier, les angles d’Euler de l’obus de 155 mm nécessitent d’être estimés
indépendamment des autres grandeurs. Les résultats obtenus pour le mortier de 120 mm,
l’obus de 155 mm et une autre munition qui ne tourne pas avec une trajectoire similaire à
celle du mortier, permettent de conclure qu’un LSTM est parfaitement adapté à l’estima-
tion des positions et des vitesses des projectiles caractérisés par une trajectoire balistique.
De plus, cette solution est optimale lorsque la munition ne tourne que faiblement.
Les LSTM entraînés pour estimer les trajectoires d’un Basic Finner et d’un projectile
de 40 mm prouvent que cette solution n’est pas applicable pour des projectiles caractérisés
par des tirs tendus. Cette conclusion est validée en entraînant un LSTM sur des trajectoires
tronquées d’un mortier de 120 mm. Ce même réseau est parfaitement adapté pour estimer
la trajectoire complète de ce projectile alors qu’il ne permet pas d’estimer la trajectoire
du mortier en tir tendu.
Au vu des résultats obtenus dans ce chapitre, les LSTM sont parfaitement adaptés
à l’estimation des positions et des vitesses de projectiles caractérisés par des trajectoires
balistiques et avec de faibles vitesses de rotation comme le mortier de 120 mm. Cette
méthode peut ainsi être optimisée en l’intégrant dans des filtres de Kalman pour produire
des solutions de navigation hybrides à faible coût, sans nécessiter de mesures GNSS tout
en étant précises à long terme.
192
Chapitre 5
Sommaire
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
5.2 Correction d’un filtre de Kalman par des pseudo-mesures
générées par un LSTM . . . . . . . . . . . . . . . . . . . . . . . 195
5.2.1 Imp.LIEKF pour l’estimation de la trajectoire d’un projectile . 196
5.2.2 Équations de l’Imp.LIEKF . . . . . . . . . . . . . . . . . . . . 198
5.2.3 Deep Imp.LIEKF . . . . . . . . . . . . . . . . . . . . . . . . . . 200
5.2.4 Résultats d’estimation du Deep Imp.LIEKF . . . . . . . . . . . 201
5.3 Estimation du modèle d’erreur d’un algorithme de naviga-
tion à l’estime . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
5.3.1 Estimation d’un modèle à partir des prédictions précédentes . . 206
5.3.2 L’apprentissage par transfert . . . . . . . . . . . . . . . . . . . 207
5.4 Estimation du modèle d’évolution d’un filtre de Kalman . . . 209
5.4.1 Présentation du problème d’estimation . . . . . . . . . . . . . . 209
5.4.2 ES-KF pour estimer la trajectoire d’un projectile . . . . . . . . 214
5.4.3 Deep ES-KF . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
5.4.4 Résultats d’estimation du Deep ES-KF . . . . . . . . . . . . . 220
5.5 Adaptation d’un filtre de Kalman . . . . . . . . . . . . . . . . 226
5.5.1 Filtre de Kalman testé en vol pour l’estimation du roulis . . . . 227
5.5.2 Deep EKF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
5.5.3 Estimation du modèle de mesure . . . . . . . . . . . . . . . . . 231
5.5.4 Estimation du modèle d’observation . . . . . . . . . . . . . . . 237
5.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
193
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
5.1 Introduction
L’intelligence artificielle (IA) est de plus en plus intégrée dans les programmes mili-
taires [52]-[55], [63], comme présenté dans la partie (1.4.4) de ce document. Toutefois,
l’IA présente plusieurs limitations restreignant son intégration dans les programmes de
navigation militaire [59], telle que la transparence et l’interprétabilité des modèles, qui
limitent l’utilisation des réseaux de neurones pour des applications critiques, la vulnéra-
bilité des modèles d’IA face à de nouvelles données inconnues, notamment dans le cas de
la reconnaissance de formes où la modification d’un pixel peut conduire à une réponse
contradictoire, ou encore la conception d’un jeu de données représentatif du problème à
traiter, qui nécessite l’acquisition et le traitement de données fidèles et réalistes.
Dans le cadre de cette thèse, le jeu de données généré par BALCO [96] est considéré
suffisamment représentatif des différentes trajectoires possibles des projectiles étudiés. De
plus, malgré les précisions obtenues, la solution d’estimation présentée au chapitre précé-
dent se base exclusivement sur l’intelligence artificielle et dépend complètement du modèle
d’IA entraîné. Afin de limiter la dépendance des solutions proposées aux modèles d’IA, il
est possible d’intégrer partiellement des réseaux de neurones dans des filtres de Kalman.
Il s’agit alors d’un Deep Kalman Filter, bénéficiant ainsi des avantages des réseaux de
neurones en termes de modélisation, tout en améliorant l’interprétabilité de la solution
proposée.
Un Deep Kalman Filter est un filtre de Kalman classique dont l’un des modèles est
déterminé par un réseau de neurones. Comme relaté dans [130], l’intégration d’IA dans
un filtre de Kalman permet notamment de régler des paramètres du filtre comme dans
[77]-[82], d’évaluer un modèle comme dans [83]-[86], ou de générer des pseudo-mesures
comme dans [71]-[76]. Ainsi, ce chapitre se focalise sur plusieurs Deep Kalman Filter pour
la navigation des projectiles. En d’autres termes, les objectifs de ce chapitre sont :
→ de valider la notion de Deep Kalman Filter pour la navigation des projectiles à
travers un filtre de Kalman Imparfait Invariant Étendu (Imp.LIEKF) corrigé par
des observations générées par un réseau de neurones.
→ d’étudier les performances d’estimation d’un Deep Error State Kalman Filter dans
le cas où le modèle d’évolution est déterminé par un réseau de neurones.
→ d’évaluer comment l’IA permet d’adapter un modèle mathématique. Pour cela, un
filtre de Kalman, valide dans le cas d’un tir tendu, est adapté à une trajectoire
balistique en employant l’IA pour déterminer les modèles inconnus.
194
5.2. Correction d’un filtre de Kalman par des pseudo-mesures générées par un LSTM
La première partie (5.2) présente un filtre de Kalman Imparfait Invariant Étendu corrigé
par des observations générées par un réseau de neurones. La seconde partie (5.3) introduit
la notion d’apprentissage par transfert nécessaire à l’entraînement d’un Deep Kalman
Filter. La troisième partie (5.4) se concentre sur un Deep Error State Kalman Filter où le
modèle d’évolution du filtre est déterminé par un réseau de neurones. Enfin, la quatrième
partie (5.5) détaille un filtre de Kalman testé en vol, valide dans le cas d’un tir tendu et
adapté à l’estimation d’une trajectoire balistique grâce aux réseaux de neurones.
Cette partie présente un Deep Kalman Filter pour estimer la trajectoire d’un mor-
tier de 120 mm où les observations du filtre sont générées par un LSTM. Ainsi, comme
dans [71]-[76], un réseau de neurones est utilisé afin de générer des observations pour
corriger les prédictions d’un filtre de Kalman. Cette approche permet ainsi de traiter
et d’extraire les mesures des capteurs extérieurs afin de produire des observations fidèles
lorsque ces dernières sont difficilement exploitables ; quand les mesures sont bruitées, biai-
sées, indisponibles ou nécessitant des prétraitements complexes tels que l’extraction de
caractéristiques spatiales dans des images.
Dans l’exemple d’application présenté dans cette partie, un Filtre de Kalman Impar-
fait Invariant Étendu (Imperfect Left Invariant Extended Kalman Filter - Imp.LIEKF)
prédit la trajectoire du projectile à partir des mesures des accéléromètres et des gyro-
mètres embarqués, puis, la position et la vitesse estimée par un LSTM ainsi que le champ
magnétique estimé à partir des magnétomètres corrigent ces prédications. En effet, d’après
les résultats obtenus au chapitre précédent, un LSTM est parfaitement adapté à l’esti-
mation des positions et des vitesses d’un mortier de 120 mm. De plus, comme aucune
mesure GNSS n’est considérée dans ces travaux, cette méthode est adéquate pour géné-
rer des observations de positionnement absolu afin de corriger les prédictions du filtre de
Kalman.
195
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
196
5.2. Correction d’un filtre de Kalman par des pseudo-mesures générées par un LSTM
Comme présenté dans la figure 5.1, à partir d’une configuration initiale donnée, des
mesures des gyromètres ωs , des accéléromètres as , des magnétomètres hs et du champ
magnétique de référence, le Deep Imp.LIEKF vise à estimer les états suivants :
x ≜ R, v, p, bωs , bas , bhs (5.1)
Modèles et dynamiques
Les modèles de mesure des gyromètres, des accéléromètres et des magnétomètres sont :
ω̃s = ωs + bωs + Wωs , ãs = as + bas + Was , h̃s = hs + bhs + Whs , (5.3)
avec ω̃s , ãs et h̃s ∈ R3×1 les modèles de mesure des gyromètres, des accéléromètres et des
magnétomètres dans le repère capteur s, avec ωs , as et hs ∈ R3×1 les mesures vraies dans
le repère capteur, bωs , bas et bhs ∈ R3×1 les biais, et Wωs , Was et Whs ∈ R3×1 les bruits
des mesures supposés blancs et gaussiens.
Le modèle d’évolution des biais des capteurs inertiels est un mouvement brownien modélisé
par les équations suivantes,
avec Wbωs , Wbas et Wbhs ∈ R3×1 des bruits gaussiens de moyenne nulle.
La dynamique d’évolution de l’orientation R, de la vitesse v et de la position p du
projectile dans le repère local de navigation n est alors :
197
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
avec [.]× l’opérateur linéaire du groupe de Lie SO(3) et g le vecteur gravité supposé
constant pour la durée de vol du projectile.
D’après les dynamiques d’évolution (5.4) - (5.5), le bruit de modèle wt associé aux
états (5.1) est alors :
h iT
wt = WωTs WaTs 0T3×1 WbTωs WbTas WbThs ∈ R18×1 . (5.6)
Les biais bωs , bas et bhs des capteurs inertiels sont des éléments de R3×1 .
L’erreur non linéaire d’estimation de l’Imp.LIEKF est alors e = (ηχt , ξbωs , ξbas , ξbhs )
avec ξbωs = bbωs − bωs , ξbas = bbas − bas , et ξbhs = bbhs − bhs , les erreurs linéaires des biais
des gyromètres, des accéléromètres et des magnétomètres, et avec ηχt ∈ SE2 (3) l’erreur
invariante à gauche associée à χt (5.7) définie telle que :
−1
R v p
Rb vb pb RT R b RT v
b − RT v RT pb − RT p
−1
η χt = χt χbt = 01×3 1 0
01×3
1 0
=
01×3 1 0 (5.8)
01×3 0 1 01×3 0 1 01×3 0 1
avec ηR = RT R b ≈ I
3×3 + [ξR ]× l’erreur invariante d’orientation, ηv = R v
Tb
− RT v ≈ ξv
l’erreur invariante de vitesse et ηp = RT pb − RT p ≈ ξp l’erreur invariante de position.
198
5.2. Correction d’un filtre de Kalman par des pseudo-mesures générées par un LSTM
La prédiction de l’état x (5.1) est donnée par le système d’évolution (5.4) - (5.5) dans
le cas où aucune perturbation n’est présente :
χb
t
f (χ
c)
ut t
R[ω̃
b
s − b
b
ω s ]× R(ã
b
s − b
b
as ) + g v
b
d b 0
b
ωs = 3×1 , avec fu (χ
) = 0 0 0 (5.10)
t
c t 1×3
dt
bas
b
03×1
01×3 0 0
bbhs 03×1
d
Pt = At Pt + Pt ATt + Adχ Qt ATdχ (5.11)
dt
Les prédictions sont corrigées par des mesures yk (5.2) qui sont la position pLST M
et la vitesse vLST M du projectile déterminées par un LSTM et le champ magnétique de
référence hn ∈ R3×1 dans le repère local de navigation n. Le modèle de mesures est alors :
pb
pb
ybk = vb = vb ∈ R9×1 . (5.13)
h
b
n Rh
b
s
199
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
avec WpLST M , WvLST M et Whs ∈ R3×1 des bruits blancs supposés gaussiens de l’estimation
des positions et des vitesses par le LSTM et des magnétomètres.
D’après la méthodologie des Imp.LIEKF présentée dans le chapitre 2 de ce document,
les prédictions sont mises à jour telles que :
h iT
ξR Tk ξv Tk ξp Tk ξbωs Tk ξbas Tk ξbhs Tk = Kk (yk − ybk ) (5.17)
R k|k = Rk|k−1 ξR k|k , v
bk|k = R k|k−1 ξv k|k + v
bk|k−1 , pbk|k = R k|k−1 ξp k|k + p
bk|k−1 , (5.18)
b b b b
b
b
ωs k|k = bbωs k|k−1 + ξbωs k , b
b
as k|k = bbas k|k + ξbas k , b
b
hs k|k = bbhs k|k + ξbhs k , (5.19)
Pk|k = (I18×18 − Kk Hk )Pk|k−1 (5.20)
L’Imp.LIEKF présenté dans la partie (5.2.2) est corrigé en partie par la position et la
vitesse du projectile estimées par un LSTM. Cette solution est choisie d’après les résultats
obtenus au chapitre précédent, qui montrent qu’un LSTM est parfaitement adapté pour
estimer les positions et les vitesses d’un mortier de 120 mm. De plus, cette méthode permet
de disposer des mesures absolues de position et de vitesse du projectile sans impliquer de
mesures GNSS, en s’affranchissant des limitations de ces signaux et en utilisant que des
capteurs inertiels à faible coût et facilement embarquables.
Pour cela, le LST MALL , sans normalisation et sans rotation du repère de navigation,
présenté dans la partie (4.4) est réemployé. Pour rappel, les caractéristiques des données
d’entrée du LSTM sont In F eatures = (M, P, T ) ∈ R16 avec :
- M ∈ R12 les données inertielles les mesures IMU dans le repère capteur s et le
champ magnétique de référence dans le repère local de navigation n.
- P ∈ R3 les paramètres de vol : l’angle de braquage des ailettes, la vitesse
initiale en sortie de canon et l’angle d’élévation du canon.
200
5.2. Correction d’un filtre de Kalman par des pseudo-mesures générées par un LSTM
- T ∈ R1 le vecteur temps évalué tel que T = k∆t avec k le pas de temps considéré
et ∆t = 1e−3 la période d’échantillonnage des capteurs.
Conformément aux caractéristiques d’entraînement présentées dans le tableau (4.2),
le LST M est initialement entraîné pour estimer la position, la vitesse et l’orientation
du projectile. Lorsque la convergence du LST M est établie, les résultats d’estimation de
ce réseau sont introduites dans le Deep Imp.LIEKF. Afin de valider la notion de Deep
Kalman Filter, le LST M est entraîné puis intégré au filtre de Kalman sans effectuer
d’entraînement spécifique pour produire les pseudo-observations pour le filtre.
Le fonctionnement du Deep Imp.LIEKF est résumé dans l’algorithme 1.
Gain de Kalman (5.14) - (5.16) : Kk = Pk|k−1 HkT (Hk Pk|k−1 HkT + Rk )−1
Mise à jour des prédictions et de la covariance : (5.17) - (5.20)
201
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
Figure 5.2 – Positions estimées et erreurs associées [m] obtenues par le Deep Imp.LIEKF
(en vert), le LST M (en bleu) et la position de référence (en rouge).
Figure 5.3 – Vitesses estimées et erreurs associées [m/s] obtenues par le Deep Imp.LIEKF
(en vert), le LST M (en bleu) et la vitesse de référence (en rouge).
202
5.2. Correction d’un filtre de Kalman par des pseudo-mesures générées par un LSTM
Figure 5.4 – Orientations estimées et erreurs associées [rad] obtenues par le Deep
Imp.LIEKF (en vert), le LST M (en bleu) et l’orientation de référence (en rouge).
1 PNsim
CRM SE = Nsim k=1 RM SE(simk ), (5.21)
PNsim
Cscore = k=1 RM SE(Deep Imp.LIEKF )simk < RM SE(LST M )simk (5.22)
203
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
La figure 5.5 présente les critères CRM SE (5.21) et le score Cscore (5.22) évalués sur
l’ensemble du jeu de données de test en comparant le Deep Imp.LIEKF (en vert) et
LST M (en bleu) pour l’estimation de trajectoires de mortier de 120 mm.
Figure 5.5 – Erreur quadratique moyenne globale CRM SE (5.21) et score Cscore (5.22) du
Deep Imp.LIEKF (en vert) et du LST M (en bleu).
La figure 5.5 montre que les performances des deux algorithmes sont équivalentes pour
l’estimation des positions et des vitesses d’un mortier de 120 mm, malgré que le Cscore du
LST M soit supérieur à celui du Deep Imp.LIEKF. De plus, les erreurs d’estimation sont
inférieures à 5 m pour les positions et de l’ordre d’un mètre par seconde pour les vitesses.
Toutefois, l’intérêt du Deep Imp.LIEKF est clairement illustré pour l’estimation de l’angle
de roulis. En effet, les prédictions des angles d’Euler par le Deep Imp.LIEKF sont corrigées
par l’estimation du champ magnétique de référence à partir des magnétomètres. Donc,
les angles d’Euler, et tout particulièrement l’angle de roulis, sont estimés par un modèle
mathématique basé sur des prédictions précises obtenus aux instants précédents. Cette
méthode permet donc de surpasser les limitations du LST M pour l’estimation de cet
angle. Toutefois, la formulation du Deep Imp.LIEKF détériore l’estimation des angles de
tangage et de lacet du fait des biais estimés des magnétomètres.
D’après les figures 5.2 - 5.5, le Deep Imp.LIEKF est une méthode précise d’estimation
des positions, des vitesses et des angles d’Euler d’un mortier de 120 mm. Cette méthode
204
5.3. Estimation du modèle d’erreur d’un algorithme de navigation à l’estime
présente donc plusieurs avantages. Le premier est que la solution proposée est basée à la
fois sur un modèle d’IA et à la fois sur un modèle mathématique. Ainsi, cette méthode
gagne en interprétabilité par rapport à une solution basée exclusivement sur l’IA. Le
second avantage est que le Deep Imp.LIEKF permet de ne considérer aucune mesure
GNSS tout en disposant des mesures absolues de position et de vitesse du projectile. En
effet, les signaux GNSS ne sont pas toujours disponibles et sont facilement brouillables
et leurrables. L’utilisation d’un LSTM permet d’obtenir des mesures similaires à celles
d’un GNSS sans partager ces limitations dans le cas où le réseau est entraîné à partir des
mesures des capteurs inertiels, de la connaissance du champ magnétique de référence et
des paramètres de prévol de la munition. Le dernier avantage du Deep Imp.LIEKF est
que cette méthode permet de résoudre les mauvaises estimations de l’angle de roulis d’un
LSTM, tout en bénéficiant des bonnes estimations de position et de vitesse.
Ainsi, d’après les résultats présentés dans cette partie, la combinaison d’un modèle
d’IA et d’un filtre de Kalman est une solution appropriée à l’estimation de la trajectoire
d’un mortier de 120 mm. Un LSTM est parfaitement adapté pour produire les pseudo-
observations afin de corriger les prédictions d’un filtre de Kalman.
205
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
Figure 5.6 – Estimation du modèle d’erreur d’un Dead Reckoning par un réseau LSTM.
Comme présenté dans la figure 5.6, l’estimation du modèle d’erreur d’un algorithme
de Dead Reckoning se déroule en plusieurs étapes :
— Étape n°1 : un algorithme de Dead Reckoning estime la position pbk|k−1 , la vitesse
vbk|k−1 et les angles d’Euler Ψ b
k|k−1 d’un projectile à partir des mesures de l’accéléro-
mètre ask et du gyromètre ωsk effectuées dans le repère capteur et des prédictions
aux instants précédents.
— Étape n°2 : Un LSTM est entraîné pour estimer les erreurs de position δ pbk , de
vitesse δ vbk et d’orientation δ Ψ b de l’algorithme de Dead Reckoning, à partir de la
k
206
5.3. Estimation du modèle d’erreur d’un algorithme de navigation à l’estime
Cette solution a été testée par différents entraînements de LSTM en modifiant les
hyperparamètres ainsi que les couches, mais, aucun résultat cohérent n’a été obtenu. En
effet, les erreurs δ pbk , δ vbk et δ Ψ
b , estimées par le LSTM étaient très importantes et donc
k
les prédictions du Dead Reckoning corrigé devenaient erronées. Comme ces prédictions
erronées sont utilisées pour la prédiction suivante, cette solution n’a jamais présenté de
résultats cohérents.
Ainsi, cette méthode a permis de conclure que sans un pré-entraînement du LSTM,
les Deep Kalman Filter où l’un des modèles est estimé par un réseau de neurones ne
pouvaient présenter de bons résultats. Le pré-entraînement du LSTM est également connu
comme une méthode d’apprentissage par transfert. De plus, d’après la littérature [83]-[86],
l’apprentissage par transfert est couramment employé pour les Deep Kalman Filter.
L’apprentissage par transfert permet donc d’utiliser les connaissances déjà apprises
sur un premier jeu de données et de les transférer à un second afin d’apprendre des ca-
ractéristiques plus spécifiques. Ainsi, le réseau pré-entraîné est adapté afin de résoudre
une autre tâche. Cette méthode est utilisée principalement pour optimiser la phase d’ap-
prentissage d’un réseau de neurones, dans le but de réduire le coût d’apprentissage et
207
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
208
5.4. Estimation du modèle d’évolution d’un filtre de Kalman
Cette partie présente un Deep Kalman Filter pour estimer avec précision la trajectoire
d’un projectile dans un environnement sans GNSS en utilisant uniquement l’IMU intégrée
et le champ magnétique de référence. Pour cela, un Deep Error State Kalman Filter est
proposé où le modèle d’évolution du filtre est remplacé par un LSTM, permettant ainsi
de modéliser les erreurs des capteurs inertiels afin de produire une solution de navigation
précise à long terme. De plus, d’après les observations formulées dans la partie (5.3), une
méthode d’apprentissage par transfert est employée pour minimiser les erreurs.
209
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
Figure 5.8 – ES-KF traditionnel pour estimer une trajectoire de projectile (position,
vitesse, angles d’Euler) à partir de l’IMU et du champ magnétique de référence.
Dans le cas d’un Error State Kalman Filter traditionnel comme présenté dans la figure
5.8, la trajectoire nominale est tout d’abord prédite à partir d’un modèle mathématique
d’évolution et des mesures des accéléromètres et des gyromètres embarqués. Dans un
second temps, l’étape de prédiction de l’ES-KF détermine les erreurs de trajectoire et
la matrice de covariance de l’erreur à partir des mesures des accéléromètres et des gy-
romètres et de la linéarisation du modèle mathématique d’évolution. Dans un troisième
temps, l’étape de mise à jour de l’ES-KF corrige ces erreurs de trajectoire à partir d’ob-
servations qui sont l’estimation du champ magnétique de référence à partir des mesures
des magnétomètres. Enfin, la trajectoire nominale initialement estimée par un modèle
mathématique est corrigée par les erreurs de trajectoire évaluées lors de l’étape de mise à
jour de l’ES-KF.
A partir de ce filtre, un Deep Error State Kalman Filter est développé. L’étape de
prédiction de l’état nominal de l’ES-KF présenté sur la figure 5.8 est remplacée par un
Long Short-Term Memory (LSTM) pour prédire la trajectoire nominale comme illustré
sur la figure 5.9. Ensuite, l’ES-KF détermine classiquement les erreurs de trajectoire, afin
de corriger la trajectoire nominale prédite par le LSTM.
Les données d’entrée du LSTM sont les mesures de l’IMU embarquée (accéléromètre,
gyromètre et magnétomètre), le champ magnétique de référence, des paramètres de prévol
spécifiques à la munition considérée et un vecteur temps. Le LSTM permet ainsi de modé-
210
5.4. Estimation du modèle d’évolution d’un filtre de Kalman
Figure 5.9 – Deep ES-KF pour estimer la trajectoire d’un projectile. Une partie de l’état
nominal est prédit par un LSTM dont les données d’entrée sont un vecteur temporel, des
paramètres de vol de la munition, l’IMU embarquée et le champ magnétique de référence.
L’état nominal prédit est ensuite corrigé par les erreurs estimées par l’ES-KF lors de
l’étape de prédiction et de mise à jour.
liser les erreurs des capteurs inertiels afin de produire une solution de navigation précise
à long terme. De plus, afin d’optimiser la solution proposée et d’après les observations
formulées dans la partie (5.3), une méthode d’apprentissage par transfert est proposée
pour minimiser les erreurs d’estimation Deep ES-KF.
La méthodologie d’un Error State Kalman Filter est détaillée dans [117], [135], [136]
et est brièvement rappelée dans cette partie.
Soit un système non linéaire à temps discret défini comme suit :
xk = f (xk−1 , uk , wk ) (5.23)
yk = h(xk , vk ) (5.24)
avec xk ∈ Rn×1 les états, uk ∈ Rl×1 l’entrée de commande, yk ∈ Rm×1 les mesures, f (.)
et h(.) les modèles d’évolution et d’observation non linéaires, et wk ∼ N (0, Qk ) et vk ∼
N (0, Rk ) les bruits de modèle et de mesure supposés blancs gaussiens et indépendants.
Un Error State Kalman Filter (ES-KF) estime les états xk du système non linéaire
211
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
(5.23) comme une combinaison de l’état nominal, noté xnk , et de l’état d’erreur noté δxk :
avec ⊕ la somme de deux variables définies dans R sauf pour les quaternions où cet
opérateur désigne le produit de quaternions :
Tout d’abord, l’ES-KF évalue l’état nominal xbnk avec le modèle d’évolution f (.). Deuxiè-
mement, l’état d’erreur δxb
k|k−1 et la covariance d’état d’erreur Pk|k−1 sont prédits par
standards. Enfin, l’état nominal est corrigé par l’état d’erreur tel que xbk|k = xbnk ⊕ δx
b
k|k .
L’état d’erreur δxk , erreur entre l’état vrai xk et l’état nominal xnk , est un signal de
petite amplitude et associé à une faible dynamique. Ainsi, sous l’hypothèse de faibles
bruits, la linéarisation au premier ordre de cette dynamique reste valable, contrairement
à un EKF traditionnel qui suppose de petites erreurs d’estimation pas toujours satisfaites.
Cela explique pourquoi un ES-KF présente de meilleures performances qu’un EKF sur
des problèmes similaires. De plus, l’état d’erreur δxk est petit et proche de l’origine donc
l’ES-KF évite d’éventuels problèmes de singularité [117].
Modèles et notations
ω̃s = ωs + bωs + Wωs , ãs = as + bas + Was , h̃s = hs + bhs + Whs , (5.27)
avec ωs , as et hs les mesures des capteurs inertiels, Wωs , Was et Whs des bruits blancs
gaussiens, et bωs , bas , bas les biais des trois capteurs dont la dynamique est modélisée par :
212
5.4. Estimation du modèle d’évolution d’un filtre de Kalman
partir de l’IMU et du champ magnétique de référence. Les 20 états à estimer par l’ES-KF
sont alors :
h iT
x ≜ q T v T pT bTωs bTas bThs (5.29)
ẋ = f (x, u, w)
1
q̇ 2
q ⊗ q{ωs }
v̇ R{q}as + g
ṗ v (5.30)
=
ḃωs W
bωs
ḃas W
bas
ḃhs Wbhs
y = h(x, Wh )
(5.32)
hn = R{q}hs = R{q} h̃s − bhs − Whs
213
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
avec δθ ∈ R3×1 l’erreur d’angle du quaternion de sorte que le quaternion orientation soit
évalué par l’équation suivante :
1
q = qn ⊗ δq = qn ⊗ 1 . (5.35)
2
δθ
Ainsi, selon la dynamique du projectile (5.30), l’état nominal prédit xbnk en temps
discret est donné par les équations suivantes :
k
1
2
Ω(ω˜sk −bωs
b )∆t
P∞ k−1|k−1
qbnk = k=0 k! qbk−1|k−1 ,
(5.37)
vbnk = vbk−1|k−1 + R k−1|k−1 (ãsk − bask−1|k−1 ) + g ∆t, (5.38)
b b
1 2
pbnk = pbk−1|k−1 + vbk−1|k−1 ∆t + R k−1|k−1 (ãsk − bask−1|k−1 ) + g ∆t , (5.39)
b b
2
b
b
ω sn
k
= bbωsk−1|k−1 , bbasnk = bbask−1|k−1 , bbhsnk = bbhsk−1|k−1 , (5.40)
214
5.4. Estimation du modèle d’évolution d’un filtre de Kalman
L’état d’erreur δx
b
k|k−1 et la prédiction de la matrice de covariance d’état d’erreur
δx
b
k|k−1 = Fk δxk−1|k−1 + Fw wk ,
b Pk|k−1 = Fk Pk−1|k−1 FkT + Fw Qk FwT , (5.41)
avec Fk la matrice jacobienne en temps discret du modèle d’évolution f (.) avec le respect
de l’état d’erreur δxk et Fw la matrice jacobienne en temps discret du modèle d’évolution
f (.) avec le respect du bruit du modèle wk tel que :
P∞ (A∆t)k ∂f ∂f
Fk = k=0 k!
≈ I + A∆t avec A = ∂δx , et Fw = ∂w . (5.42)
(x,u) (xk ,δxk ,uk ,w)
Fk = I18×18 +
−I∆t 0
−[ω̃s k − bω s n ] ×
b 0 0 −I 0 0
k 0 −Rnk ∆t 09×9
b
−Rnk [ãsk − b
basnk ]× 0 0 0 −Rnk 0 Fw = (5.46)
.
b b
∆t, 0 0
0 I 0 0 0 0
09×6 I9×9
09×18
215
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
L’état d’erreur δx
b
k|k et la covariance Pk|k sont mises à jour avec les observations yk , le
avec Hk la matrice jacobienne en temps discret du modèle d’observation h(.) par rapport
à l’état d’erreur δxk tel que :
∂h ∂h ∂x
Hk = = = Hx XδX . (5.50)
∂δx xk ∂x xk ∂δx xk
D’après le modèle de mesure (5.32), les matrices jacobiennes en temps discret Hx ∈ R3×20
et XδX ∈ R20×18 sont :
∂(q⊗δq)
h
∂R{q}hb
i
∂δθ
03×15
Hx = ∂q
0 0 0 0 R{q} , XδX = (5.51)
015×3 I15×15
L’état nominal xnk (5.37) - (5.40) est mis à jour avec l’état d’erreur δ xbk|k tel que :
1
qbk|k = qbnk ⊗ q{δq
b bnk ⊗
k|k } = q 1b
, (5.52)
2
δθk|k
vbk|k = vbnk + δv
b
k|k , (5.53)
pbk|k = pbnk + δp
b
k|k , (5.54)
b
b
ωsk|k = bbωsnk + δb
b
ωsk|k , b
b
ask|k = bbasnk + δb
b
ask|k , b
b
hsk|k = bbhsnk + δb
b
hsk|k . (5.55)
qbk|k
qbk|k = . (5.56)
∥qbk|k ∥
216
5.4. Estimation du modèle d’évolution d’un filtre de Kalman
Les caractéristiques des données d’entrée sont In F eatures = (M, P, T ) ∈ R16 avec :
- M ∈ R12 les données inertielles comprenant les mesures de l’IMU et le champ
magnétique de référence,
- P ∈ R3 les paramètres de prévol, c’est-à-dire l’angle de braquage des ailettes, la
vitesse initiale et l’angle d’élévation du canon dans le cas d’un mortier de 120 mm.
- T ∈ R1 le vecteur temps évalué tel que T = k∆t avec k le pas de temps considéré
et ∆t la période d’échantillonnage des capteurs inertiels.
217
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
Une méthode d’apprentissage par transfert est utilisée pour entraîner le LSTM. Dans
le cas Deep ES-KF, comme le montre la figure 5.10, le LSTM est initialement entraîné
pour estimer la trajectoire du projectile Out F eatures (5.57) à partir des données d’entrée
In F eatures .
Une fois la convergence LSTM établie, ce réseau est à nouveau entraîné avec la méthode
h i
de fine tuning pour prédire les états Ψnk vnk pnk tandis que les biais bωsnk , basnk et
bhsnk sont donnés par l’équation (5.40). Avec l’état nominal complet xnk , déterminé à la
fois par le LSTM et par un modèle mathématique d’évolution des biais, l’état d’erreur de
l’ES-KF δx b
k|k est prédit puis mis à jour pour corriger l’état nominal xnk conformément
aux équations (5.52) - (5.56). Les deux parties du processus d’apprentissage du LSTM
sont illustrées dans la figure 5.10.
Figure 5.10 – 1) LSTM entraîné pour estimer la trajectoire du projectile (Ψ, v, p). 2)
Apprentissage par transfert : ajustement des paramètres LSTM pour prédire les états
nominaux ES-KF Ψnk , vnk et pnk .
218
5.4. Estimation du modèle d’évolution d’un filtre de Kalman
Les données d’entrée du LSTM In F eatures n’incluent pas les trajectoires prédites aux
instants précédents xbk−1|k−1 . Cette option permet ainsi au Deep ES-KF d’être indépendant
entre chaque estimation du LSTM et évite ainsi tout problème de dérive de l’ES-KF.
N
1 X
M SE = (xbk − xrefk )2 (5.58)
N k=1
Le Deep ES-KF mis en œuvre pour estimer la trajectoire d’un projectile est résumé
dans l’algorithme 3 ci-dessous.
219
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
Les figures 5.11 - 5.13 présentent les erreurs de position, de vitesse et d’orientation
obtenues par les quatre méthodes mentionnées ci-dessus, pour une trajectoire de mortier
de 120 mm d’une portée de 4k m et d’une apogée de 1.5 km.
Figure 5.11 – Erreurs d’estimation de position pour une trajectoire de mortier : Deep
ES-KF (bleu), LSTM pré-entraîné (vert), ES-KF (noir), Dead Reckoning (jaune).
220
5.4. Estimation du modèle d’évolution d’un filtre de Kalman
Figure 5.12 – Erreurs d’estimation de vitesse pour une trajectoire de mortier : Deep
ES-KF (bleu), LSTM pré-entraîné (vert), ES-KF (noir), Dead Reckoning (jaune).
Figure 5.13 – Erreurs d’estimation d’orientation pour une trajectoire de mortier : Deep
ES-KF (bleu), LSTM pré-entraîné (vert), ES-KF (noir), Dead Reckoning (jaune).
221
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
Les figures 5.11 et 5.12 indiquent que le Deep ES-KF (en bleu) et le LSTM pré-
entraîné (en vert) sont des solutions précises d’estimation des positions et des vitesses
du projectile. L’ES-KF (en noir), moins précis que les solutions basées sur l’IA, présente
également de faibles erreurs, contrairement au Dead Rekoning (en jaune) qui diverge. Ces
erreurs illustrent la précision de l’IMU modélisée par BALCO.
La figure 5.13 révèle que les solutions basées sur l’IA ne parviennent pas à estimer l’angle
de roulis du projectile contrairement à l’ES-KF (en noir). Ces mauvaises prédictions, déjà
constatées au chapitre précédent, ne peuvent être corrigées adéquatement lors de l’étape
de mise à jour afin d’estimer avec précision les angles d’Euler de la munition. De plus,
le Deep ES-KF (en bleu) dégrade l’estimation de l’angle de roulis par rapport au LSTM
pré-entraîné (en vert). Néanmoins, le Deep ES-KF et le LSTM pré-entraîné semblent
appropriés pour estimer les angles de tangage et de lacet du projectile. Enfin, malgré
des résultats cohérents pour l’angle de roulis, le Dead Reckoning (en jaune) dévie pour
l’estimation des angles de tangage et de lacet.
Afin de valider les premières observations formulées dans la partie précédente, le Deep
ES-KF, le LSTM pré-entraîné, l’ES-KF et le Dead Reckoning sont évalués sur les 200
trajectoires de mortier du jeu de données de test selon trois critères d’erreur :
- l’erreur quadratique moyenne (Root Mean Square Error - RMSE) évaluée telle que :
q
(xk,ref − xbk )2 ,
1 PN
RM SE = N k=1 (5.59)
- l’erreur moyenne absolue (Mean Absolute Error - MAE) évaluée telle que :
1 PN
M AE = N k=1 |xk,ref − xbk |, (5.60)
NX
sim
222
5.4. Estimation du modèle d’évolution d’un filtre de Kalman
1 NX sim
1 NX sim
Les figures 5.14 - 5.16 présentent CRM SE , CM AE et SR évalués sur 200 trajectoires pour
les quatre méthodes d’estimation considérées.
Figure 5.14 – Analyse de la précision des estimations des positions : évaluation des
critères CRM SE , CM AE (5.62), SR (5.61) obtenus par le Deep ES-KF (en bleu), le LSTM
pré-entraîné (en vert), l’ES-KF (en noir) et le Dead Reckoning (en jaune).
La figure 5.14 illustre l’apport de l’intelligence artificielle pour estimer les positions
d’un projectile. En effet, les critères CRM SE , CM AE et SR montrent que le Deep ES-KF
(en bleu) et le LSTM pré-entraîné (en vert) surpassent l’ES-KF (noir) et le Dead Recko-
ning (en jaune). Plus précisément, les erreurs moyennes de position CM AE sont inférieures
au mètre pour le Deep ES-KF (en bleu), autour de quelques mètres pour le LSTM pré-
entraîné (en vert) et supérieures à plusieurs dizaines de mètres pour le ES-KF (en noir) et
le Dead Rekoning (en jaune). Enfin, parmi les deux approches basées sur l’IA et selon les
trois critères d’erreur, le Deep ES-KF surpasse le LSTM pré-entraîné pour l’estimation
des positions.
L’analyse des trois critères d’erreur CRM SE , CM AE (5.62) et SR (5.61) confirme les observa-
223
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
tions précédentes rapportées dans la figure 5.11, le Deep ES-KF est une approche précise
pour estimer les positions d’un mortier de 120 mm. De plus, cette méthode hybride est
préférable à une solution basée exclusivement sur l’IA pour l’estimation des positions.
Figure 5.15 – Analyse de la précision des estimations des vitesses : évaluation des
critères CRM SE , CM AE (5.62), SR (5.61) obtenus par le Deep ES-KF (en bleu), le LSTM
pré-entraîné (en vert), l’ES-KF (en noir) et le Dead Reckoning (en jaune).
D’après la figure 5.15, des observations similaires aux résultats de position peuvent
être formulées pour l’estimation de la vitesse du projectile. En effet, le Deep ES-KF (en
bleu) et le LSTM pré-entraîné (en vert) surpassent l’ES-KF (en noir) et le Dead Reckoning
(en jaune) suivant les trois axes. De plus, le Deep ES-KF présente les erreurs d’estimation
de vitesse les plus faibles comparées au trois autres méthodes.
La figure 5.16 révèle que les approches basées sur l’intelligence artificielle sont inadé-
quates pour estimer l’angle de roulis du projectile comme l’ES-KF (en noir) et le Dead
Reckoning (en jaune) présentent de plus faibles erreurs. Selon les trois critères d’erreur
CRM SE , CM AE et SR , l’ES-KF (en noir) reste la solution optimale pour estimer l’angle
de roulis du projectile. Le Dead Reckoning (en jaune) diverge pour estimer les angles de
tangage et de lacet du projectile contrairement au Deep ES-KF (en bleu), au LSTM pré-
entraîné (en vert) et à l’ES-KF (en noir). Cependant, d’après le taux de réussite SR , le
LSTM pré-entraîné est la solution la plus appropriée pour estimer les angles de tangage et
224
5.4. Estimation du modèle d’évolution d’un filtre de Kalman
Figure 5.16 – Analyse de la précision des estimations des angles d’Euler : évaluation des
critères CRM SE , CM AE (5.62), SR (5.61) obtenus par le Deep ES-KF (en bleu), le LSTM
pré-entraîné (en vert), l’ES-KF (en noir) et le Dead Reckoning (en jaune).
En résumé, selon les figures 5.11 - 5.16, le Deep ES-KF est une solution précise pour
estimer les positions et les vitesses d’un mortier de 120 mm, mais ne convient pas à
l’estimation de l’orientation. De plus, par rapport aux algorithmes de navigation conven-
tionnels tels que le Dead Reckoning ou l’ES-KF, les orientations incorrectes estimées par
les méthodes basées sur l’IA n’ont aucune influence sur la précision de l’estimation de la
position et de la vitesse.
Ces résultats confirment donc qu’un Deep Kalman Filter où l’un des modèles du filtre
est remplacé par un réseau de neurones est une solution adéquate pour l’estimation des
positions et des vitesses d’un projectile. Cette méthode présente plusieurs avantages. Le
premier est que le Deep Kalman Filter présenté dans cette partie permet d’estimer la
trajectoire d’un projectile dans un environnement sans GNSS en utilisant uniquement le
champ magnétique de référence ainsi que l’unité de mesure inertielle (IMU) embarquée et
225
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
des connaissances sur les conditions de lancement de la munition. Cette méthode néces-
site donc des capteurs à faible coût, adéquate pour la navigation de projectiles. Le second
avantage de la solution proposée est que le réseau de neurones permet de modéliser préci-
sément les erreurs de l’IMU et les corrélations entre les capteurs, sans devoir formuler des
hypothèses complexes et restreignantes. Le troisième avantage de cette solution est que le
LSTM est entraîné à partir de l’IMU, du champ magnétique de référence, des paramètres
prévol propres à la munition et d’un vecteur temps. Les données d’entrée du réseau ne
dépendent pas des prédictions précédentes. Ainsi, une mauvaise estimation à un instant
n’influe pas sur les estimations aux instants suivants. Toutefois, le Deep Kalman Filter
présenté dans cette partie ne permet pas d’estimer convenablement l’orientation du pro-
jectile. Ces observations confirment donc qu’un modèle mathématique est préférable pour
l’estimation de l’orientation d’un projectile, comme proposé dans la partie (5.2).
Un Deep Kalman Filter où l’un des modèles du filtre est remplacé par un réseau de neu-
rones est une approche valide pour estimer avec précision les positions et les vitesses des
projectiles.
Les analyses des Deep Kalman Filter précédents montrent que cette méthode est adap-
tée à l’estimation des positions et des vitesses d’un projectile, mais n’est pas optimale pour
évaluer les angles d’Euler. De plus, il s’est avéré qu’une méthode d’apprentissage par trans-
fert est nécessaire afin d’obtenir des résultats optimaux. Afin de répondre au problème
d’estimation de l’orientation d’un projectile, et plus précisément à l’estimation de l’angle
de roulis, cette partie se concentre sur un Deep Kalman Filter pour estimer cet angle.
Pour cela, un filtre de Kalman testé en vol est considéré dans le but d’estimer l’angle de
roulis d’un projectile de 30 mm caractérisé par un tir tendu. Ce même filtre est ensuite
adapté, à l’aide de réseaux de neurones, à un projectile caractérisé par une trajectoire
balistique. Le filtre de Kalman considéré est celui employé dans la partie (3.4.1) de ce
manuscrit à des fins d’optimisation des paramètres de bruit. A l’inverse, cette partie se
concentre sur les facultés de l’intelligence artificielle à adapter un modèle mathématique
à une dynamique différente.
226
5.5. Adaptation d’un filtre de Kalman
227
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
avec H̃a et H̃b les modèles des mesures, Ha et Hb les mesures des capteurs, AHa et AHb
les amplitudes modélisées des deux mesures, bHa et bHb les biais respectifs, et WHa et WHb
les bruits des mesures supposés gaussiens.
avec WAHa , WbHa , WAHb et WbHb des bruit blancs supposés gaussiens.
228
5.5. Adaptation d’un filtre de Kalman
Les observations considérées pour mettre à jour le filtre sont l’estimation des mesures
des magnétomètres à partir du champ magnétique de référence et de l’angle de roulis
estimé tel que le modèle de mesure soit :
H
c A H sin(ϕ + λ) + bHa + WHa
a = Ha env (5.67)
H
c
b AHb Henv cos(ϕ + λ) + bHb + WHb
avec WHa et WHb les bruits des mesures, et Henv et λ des variables fonctions du champ
h iT
magnétique de référence Hn = Hi Hj Hk et des angles d’Euler de la munition. Pour
rappel, le projectile de 30 mm pour lequel ce filtre est développé est caractérisé par un tir
tendu, donc θ ≈ ψ ≈ 0. Ainsi, les variables Henv et λ sont définies telles que :
q H
1 = −sin(θ)Hi + cos(θ)Hj + ψsin(θ)Hk ≈ Hj
Henv = H12 + H22 avec (5.68)
H2 = ψHi + Hk ≈ Hk
H2
cos(λ) = Henv
λ tel que H1
(5.69)
sin(λ) =
Henv
Étape de prédiction
L’état xbk|k−1 et la covariance Pk|k−1 prédite sont mis à jour par l’estimation des mesures
des magnétomètres Ha et Hb et à partir de la connaissance du champ magnétique de
229
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
référence (5.67). Ainsi, l’étape de mise à jour est donnée par les équations suivantes :
Hk =
AbHak|k−1 Henv cos(ϕbk|k−1 + λ) 0 1 Henv sin(ϕbk|k−1 + λ) 0 0
−AbHbk|k−1 Henv sin(ϕbk|k−1 + λ) 0 0 0 1 Henv cos(ϕbk|k−1 + λ)
(5.75)
Hk est déterminée par un second LSTM pour estimer l’angle et la vitesse de roulis d’un
mortier de 120 mm. Comme dans le cas de l’EKF traditionnel, seules les mesures des deux
h iT
magnétomètres radiaux Ha et Hb ainsi que le champ magnétique Hn = Hi Hj Hk
dans le repère local de navigation sont considérés.
Afin d’estimer les deux modèles par des réseaux de neurones, les deux LSTM, notés
respectivement LST MY pour l’estimation du modèle de mesure et LST MH pour l’estima-
tion de la matrice d’observation, sont tous deux entraînés séparément par des méthodes
d’apprentissage par transfert.
230
5.5. Adaptation d’un filtre de Kalman
des biais bbHak|k−1 et bbHbk|k−1 , et de l’angle de roulis ϕbk|k−1 prédit, ainsi qu’à partir des
deux paramètres λ et Henv . Ce modèle de mesure est déterminé en supposant de faibles
variations des angles de tangage et de lacet. Or, dans le cas d’une trajectoire balistique,
cette hypothèse n’est plus valide. Pour cela, un Deep EKF est proposé afin de déterminer
les mesures estimées H c et H
a
c par un LSTM.
b
Pré-entraînement de LST MY
Comme illustré dans la figure 5.19, le LST MY est pré-entraîné pour estimer les mo-
dèles des mesures, notés respectivement H
c
aLST M et HbLST M , à partir de 10 caractéristiques
c
231
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
(5.5.1). Chaque état prédit xbk|k−1 est obtenu notamment à partir de l’état estimé à
l’instant précédent xbk−1|k−1 et mis à jour traditionnellement d’après les équations
(5.72) - (5.74).
h iT
- Hn = Hi Hj Hk ∈ R3 le champ magnétique de référence dans le repère local
de navigation n, constant pendant la durée de vol du projectile.
- T = k∆t ∈ R1 le vecteur temps avec k le pas de temps considéré et ∆t la période
d’échantillonnage des magnétomètres.
Le pré-entraînement du LSTM est nécessaire comme les données d’entrée dépendent des
prédictions précédentes. L’objectif est donc d’exploiter dans un premier temps les pré-
dictions de l’EKF afin que le LSTM égale les estimations H c et H
a
c obtenues avec des
b
modèles mathématiques. Dans un second temps, il s’agit d’affiner les paramètres appris
pour estimer précisément l’angle et la vitesse de roulis du mortier de 120 mm.
Le LST MY est entraîné sur 100 trajectoires de mortier de 120 mm, validé sur 50
trajectoires et testé sur 30 trajectoires. La perte entre les estimations H
c
aLST M et HbLST M
c
et les mesures vraies des magnétomètres Ha et Hb est évaluée avec l’erreur quadratique
moyenne (Mean Squared Error - MSE) :
N
1 X
M SE = (xrefk − xbk )2 . (5.76)
N k=1
232
5.5. Adaptation d’un filtre de Kalman
Les figures 5.20 et 5.21 présentent les estimations H aLST M et HbLST M du Deep EKF
c c
ajusté par le LST MY pré-entraîné (en bleu), ainsi que les estimations H
c et H
a
c du filtre
b
de Kalman traditionnel (en vert) présenté dans la partie (5.5.1) pour une trajectoire de
mortier de 120 mm.
D’après les figures 5.20 et 5.21, le LST MY ne parvient pas à égaler les estimations
c et H
H c de l’EKF, bien que ce filtre ne soit pas adapté à une trajectoire balistique. Une
a b
explication de ces mauvais résultats est que les mesures des magnétomètres radiaux sont
des signaux périodiques. Or, d’après la littérature [128], [129], les réseaux de neurones
récurrents ne sont pas adaptés à l’estimation de fonction périodique comme pour une
même séquence en entrée du LST M , le réseau envisage plusieurs solutions.
Afin de résoudre ce problème tout en bénéficiant des propriétés de prédiction d’un LSTM,
une première solution est de supposer les fonctions cos(.) et sin(.) connues. Ces fonctions
interviennent dans le modèle de mesure définit par l’équation (5.67). Toutefois, les résul-
tats préliminaires obtenus ont indiqué que la connaissance des fonctions cos(.) et sin(.)
n’est pas suffisante pour que le LST MY produise des résultats convaincants et correspon-
dants à la périodicité des mesures des magnétomètres. Ainsi, l’estimation des mesures H c
a
233
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
et H
c est modifiée de sorte que d’après les données d’entrée I
b bk|k−1 , Hn , T ) ∈
n F eatures = (x
10
R présentées précédemment, le LST MY estime le vecteur suivant :
h i
Out F eatures = X1 X 2 X 3 X4 X5 X6 (5.77)
Les mesures des magnétomètres sont ensuite déterminées par les équations suivantes :
H
c (X + AbHa ) × Henv × sin(λ + ϕb + X2 ) + (X3 + bbHa )
aLST M = 1 (5.78)
H
c
bLST M (X4 + AbHb ) × Henv × cos(λ + ϕb + X5 ) + (X6 + bbHb )
Les figures 5.22 et 5.23 présentent les estimations HaLST M et HbLST M du Deep EKF
c c
ajusté par le LST MY pré-entraîné conformément à l’équation (5.78) (en bleu) ainsi que
les estimations H
c et H
a
c du filtre de Kalman traditionnel (en vert) présenté dans la partie
b
Les figures 5.22 et 5.23 indiquent que le LSTM parvient à estimer de façon cohérente
les mesures Ha et Hb des deux magnétomètres radiaux à partir des prédictions de l’EKF.
234
5.5. Adaptation d’un filtre de Kalman
Ainsi, la connaissance de l’état prédit, des paramètres Henv et λ et des fonctions cos(.) et
sin(.) est nécessaire pour évaluer le modèle de mesure.
D’après les résultats présentés dans les figures 5.22 et 5.23, le LST MY pré-entraîné
à estimer Out F eatures (5.77) permet de déterminer les mesures des deux magnétomètres
conformément à l’équation (5.78). Il s’agit à présent d’exploiter les connaissances ap-
prises lors du pré-entraînement de LST MY afin d’évaluer H c
aLST M et HbLST M à partir des
c
Figure 5.24 – Deep EKF : estimation du modèle de mesure de l’EKF par le LST MY .
Comme présenté dans la figure 5.24, le LST MY est intégré au filtre de Kalman afin de
déterminer les mesures Ha et Hb des deux magnétomètres. Pour cela, le filtre de Kalman
est d’abord initialisé traditionnellement. Puis, l’état xbk|k−1 et la matrice de covariance
de l’erreur Pk|k−1 sont prédits conformément aux équations (5.70) et (5.71). Ensuite, ces
prédictions sont employées comme données d’entrée du LST MY , de sorte que les carac-
téristiques d’entrée soient In F eatures = (xbk|k−1 , Hn , T ) ∈ R10 . A partir de ces prédictions,
le LST MY estime le vecteur Out F eatures (5.77) afin de déterminer les mesures des ma-
gnétomètres H c
aLST M et HbLST M conformément à l’équation (5.78). La connaissance des
c
235
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
mesures estimées par le LSTM et les mesures vraies Ha et Hb permet de mettre à jour
l’état xbk|k et la matrice de covariance de l’erreur Pk|k conformément aux équations de
l’EKF traditionnel (5.74). Le Deep EKF présenté dans la figure 5.24 est entraîné suivant
les mêmes caractéristiques que le LST MY pré-entraîné présenté dans la partie (5.5.3) de
ce document.
Les figures 5.25 et 5.26 présentent les résultats d’estimation des mesures des deux
magnétomètres par le Deep EKF illustré dans la figure 5.24 (en bleu) et par l’EKF tra-
ditionnel (en vert) pour une trajectoire de mortier de 120 mm.
Les figures 5.25 et 5.26 montrent que contrairement aux résultats du pré-entraînement,
le LST MY ne parvient pas à capturer la dynamique des magnétomètres. Ainsi, les mau-
vaises prédictions de Hc
aLST M et HbLST M par le LST MY impactent de manière significative
c
les estimations obtenues à l’étape de mise à jour de l’EKF. Ces mauvaises estimations
influent ensuite sur les prédictions successives comme ces données alimentent le LST MY .
Ces observations concordent avec celles formulées dans la partie (5.3) de ce document.
L’utilisation des prédictions antérieures du LSTM comme données d’entrée ne permet
pas de résoudre le problème d’estimation, bien que le LST MY ait été préalablement pré-
entraîné.
236
5.5. Adaptation d’un filtre de Kalman
Figure 5.27 – Deep EKF : estimation du modèle d’observation de l’EKF par le LST MH .
237
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
h i
- yk = Hak Hbk ∈ R2 les mesures vraies des deux magnétomètres embarqués.
h i
2
- ybk = H ak Hbk ∈ R les mesures des deux magnétomètres, estimées à partir des
c c
238
5.5. Adaptation d’un filtre de Kalman
Les figures 5.28 et 5.29 montrent que le Deep EKF où la matrice d’observation est
évaluée par le LST MH et l’EKF traditionnel présenté dans la partie (5.5) ont des per-
formances semblables pour l’estimation de l’angle de roulis et de la vitesse de roulis d’un
mortier de 120 mm. Afin de valider ces observations et de vérifier l’apport de cette mé-
thode hybride pour estimer l’angle et la vitesse de roulis d’un mortier de 120 mm, deux
critères d’erreur sont évalués sur l’ensemble du jeu de données de test :
- l’erreur quadratique moyenne globale, notée CRM SE et définie telle que :
1 NX sim
NX
sim
avec Nsim le nombre de simulations du jeu de données de test et RM SE(.) définie comme
la racine carrée de l’erreur quadratique moyenne (5.58).
La figure 5.30 présente les critères CRM SE (5.79) et Cscore (5.80) évalués sur l’ensemble
du jeu de données de test pour l’estimation des angles et des vitesses de roulis d’un mortier
de 120 mm en comparant le Deep EKF avec la matrice d’observation déterminée par le
LST MH (en bleu) et l’EKF traditionnel présenté dans la partie (5.5.1) de ce document
(en vert).
La figure 5.30 indique que les erreurs quadratiques moyennes globales CRM SE du Deep
EKF et de l’EKF traditionnel sont similaires pour l’estimation de l’angle de roulis. Des
observations semblables peuvent être formulées pour l’estimation des vitesses de roulis.
Toutefois, les scores Cscore indiquent que l’EKF traditionnel surpasse légèrement le Deep
EKF. Ainsi, malgré un pré-entraînement, le Deep EKF où le modèle d’observation est
estimé par LST MH ne surpasse pas une méthode classique d’estimation basée sur des
modèles mathématiques traditionnels. Ces constatations concordent avec celles observées
pour le Deep EKF où le modèle de mesure est estimé par LST MY . La forme périodique
des signaux à estimer influe sur les performances des deux LSTM.
D’après les figures 5.20 - 5.30, la solution de Deep Kalman Filter proposée dans cette
partie n’est pas optimale. En effet, l’ajustement du modèle de mesure et du modèle d’ob-
servation d’un EKF par des LSTM ne réduit pas les erreurs d’estimation comparé à un
239
Chapitre 5 – Optimisation d’un filtre de Kalman par des réseaux de neurones
Figure 5.30 – Critères CRM SE (5.79) et Cscore (5.80) obtenus par le Deep EKF avec la
matrice d’observation déterminée par le LST MH (en bleu) et l’EKF traditionnel (en vert)
pour l’estimation de l’angle et de la vitesse de roulis d’un mortier de 120 mm.
5.6 Conclusion
Ce chapitre étudie plusieurs Deep Kalman Filter afin d’évaluer leurs apports et leurs
intérêts pour estimer la trajectoire d’un projectile. Les réseaux de neurones permettent
ainsi de pallier les limites d’un modèle mathématique ou de compléter des mesures erronées
d’un filtre de Kalman.
Trois formes de Deep Kalman Filter sont évaluées dans ce chapitre.
La première solution implémentée vise à remplacer les observations, nécessaires lors de
l’étape de mise à jour d’un filtre, par un réseau de neurones. Pour cela, et en se basant
sur le principe de fusion des données IMU et GNSS, un filtre de Kalman est corrigé par
les positions et les vitesses déterminées par un LSTM. Les résultats obtenus permettent
240
5.6. Conclusion
de valider la notion de Deep Kalman Filter. De plus, la combinaison d’un modèle d’IA
et d’un filtre de Kalman est une solution appropriée à l’estimation de la trajectoire d’un
projectile.
La seconde méthode se focalise sur l’estimation de l’un des modèles mathématiques d’un
filtre de Kalman par un réseau de neurones. Pour cela, un Deep Error State Kalman Filter
est proposé dans le cas où le modèle d’évolution du filtre est remplacé par un LSTM, afin
de modéliser les erreurs des capteurs inertiels et de produire une solution de navigation
précise à long terme. Les résultats rapportés confirment que cette configuration hybride
est adéquate pour estimer les positions et les vitesses d’un projectile.
La dernière approche hybride mise en place vise à évaluer comment l’IA permet d’adapter
un modèle mathématique. Pour cela, un filtre de Kalman, valide dans le cas d’un tir
tendu, est adapté à une trajectoire balistique en employant l’IA pour déterminer les
modèles inconnus. Deux réseaux de neurones récurrents sont employés afin d’évaluer les
deux modèles mathématiques inconnus. Malgré divers tests, les résultats d’estimation sont
mitigés. En effet, cette approche se concentre exclusivement sur l’estimation de l’angle de
roulis de la munition alors qu’un LSTM n’est pas optimal pour estimer de tels signaux.
Au vu des résultats obtenus dans ce chapitre, les Deep Kalman Filter sont des solutions
prometteuses pour l’estimation des positions et des vitesses d’un projectile caractérisé
par une trajectoire balistique. Plusieurs formes de Deep Kalman Filter nécessitent d’être
formulées comme l’estimation du gain de Kalman ou l’évaluation de plusieurs modèles
d’un même filtre par des réseaux de neurones. De plus, l’influence de différents types de
réseaux de neurones pour de telles prédictions nécessite d’être étudiée.
241
C ONCLUSION
Conclusion générale
Les travaux présentés dans ce document évaluent l’apport et l’intérêt des algorithmes
d’intelligence artificielle (IA) pour estimer les trajectoires de différents projectiles. Pour
cela, plusieurs approches combinant des méthodes classiques de navigation et des réseaux
de neurones sont étudiées.
Les trajectoires des projectiles sont habituellement estimées par des filtres de Kalman
fusionnant les mesures inertielles et GNSS (Global Navigation Satellite Systems) embar-
quées. Cependant, comme ces mesures présentent plusieurs limitations, l’IA vise à être
intégrée dans les solutions de navigation afin de corriger les erreurs induites par ces me-
sures. Ces travaux évaluent ainsi l’apport de l’IA pour la navigation des projectiles.
Trois approches d’estimation de la trajectoire d’un projectile sont analysées :
→ La première approche vise à utiliser des réseaux de neurones convolutifs pour ajus-
ter dynamiquement la matrice de covariance du bruit de mesure d’un filtre de
Kalman. Cette solution est notamment appliquée à un filtre de Kalman Imparfait
Invariant Étendu, un filtre de Kalman Étendu et un filtre de Kalman linéaire. Les
résultats obtenus montrent que cette solution n’est pas adaptée à tous les filtres. En
effet, l’apport de cette approche est principalement bénéfique dans le cas du filtre
de Kalman Imparfait Invariant Étendu qui estime la trajectoire d’un mortier de
120 mm à partir des mesures de l’accéléromètre, du gyromètre et du magnétomètre
embarqué ainsi que de la connaissance du champ magnétique de référence.
→ La deuxième méthode implémentée vise à remplacer tous les modèles mathéma-
tiques décrivant l’évolution de la trajectoire d’un projectile par un Long Short-Term
Memory. D’après les résultats obtenus, cette approche est parfaitement adaptée à
l’estimation des positions et des vitesses des projectiles caractérisés par des trajec-
toires balistiques. Toutefois, cette méthode n’est pas optimale pour estimer l’orien-
tation des projectiles avec de faibles vitesses de rotation. De plus, cette solution de
navigation n’est pas appropriée aux projectiles caractérisés par des tirs tendus du
fait des courtes durées de vols et des faibles variations des grandeurs.
243
→ La troisième méthode mise en œuvre se concentre sur les Deep Kalman Filter qui
vise à remplacer l’un des modèles mathématiques d’un filtre de Kalman par un
réseau de neurones. Plusieurs approches sont étudiées notamment la génération
d’observations par un réseau de neurones pour corriger un filtre de Kalman, l’esti-
mation d’un modèle de prédiction d’un filtre de Kalman, et l’adaptation de modèles
à une dynamique différente. Les résultats proposés indiquent que l’apprentissage
par transfert est nécessaire dans le cas d’un Deep Kalman Filter. De plus, cette
solution reste prometteuse comme elle se base à la fois sur des méthodes clas-
siques de navigation et sur l’intelligence artificielle. Toutefois, l’entraînement d’un
Deep Kalman Filter n’est pas aisé et nécessite de choisir soigneusement les données
d’entrée.
Les résultats proposés dans ce document montrent que l’IA présente un intérêt pour la
navigation des projectiles, notamment lorsque les capteurs classiquement utilisés comme
le récepteur GNSS ne sont pas disponibles. Toutefois, les résultats obtenus indiquent que
l’IA n’est pas la solution privilégiée pour estimer l’orientation d’un projectile.
Ces travaux visent à être approfondis afin de résoudre les problèmes d’estimation des
angles d’Euler ainsi que les estimations inexactes des trajectoires des projectiles caracté-
risés par des tirs tendus.
Perspectives
L’IA présente des performances intéressantes pour le traitement d’image. C’est pour-
quoi, en collaboration avec Guillaume COURTIER, doctorant à l’ISL sur le développement
d’un système de navigation basé sur la polarisation de la lumière solaire [19], une méthode
de navigation exploitant l’IA et des images a été évaluée.
Comme présenté dans la figure suivante, cette approche vise estimer le cap d’un véhi-
cule terrestre à partir d’images polarisées du ciel et d’un réseau de neurones convolutifs
(Convolutional Neural Network - CNN). En effet, l’information de polarisation contenue
dans les images du ciel capturées par une caméra spécialisée permet de déterminer le cap
d’un véhicule à partir de deux paramètres :
- l’angle de polarisation linéaire (Angle of Linear Polarization - AoLP) qui corres-
pond à l’angle de polarisation de la lumière du ciel par rapport à l’axe du capteur
de la caméra.
- le degré de polarisation linéaire (Degree of Linear Polarization - DoLP) qui re-
244
présente la proportion de la lumière polarisée dans la lumière totale reçue par la
caméra.
Figure 5.31 – Estimation du cap d’un véhicule terrestre à partir d’images polarisées du
ciel et d’un réseau de neurones convolutifs (Convolutional Neural Network - CNN).
Afin d’estimer le cap d’un véhicule terrestre par un CNN et à partir d’images polarisées
du ciel, un simulateur est employé. Le simulateur génère les AoLP, les DoLP et les caps
associés à partir de la connaissance de la position du soleil dans le ciel. Un CNN est alors
entraîné pour estimer le cap du véhicule à partir de l’AoLP et du DoLP.
Les caps estimés par des traitements d’images et des modèles mathématiques déve-
loppés par Guillaume COURTIER présentent des erreurs moyennes de l’ordre du degré.
Les caps estimés par le CNN alimenté par l’AoLP et le DoLP conduisent à des erreurs
similaires, à l’exception de certaines positions spécifiques du soleil. Ainsi, l’apport de l’IA
pour estimer le cap d’un véhicule à partir des informations de polarisation contenues dans
la lumière du ciel est validé.
L’intérêt de cette approche est de pallier certaines limitations du traitement d’image clas-
sique, comme l’estimation des trois angles d’orientation du robot qui génère de grandes
erreurs. De ce fait, l’IA permet de remédier à cette problématique.
245
A NNEXES
d
ξt = At ξt + Adχ wt (A.1)
dt
D’après les propriétés de l’opérateur [.]× rappelées par l’équation (2.10), la dynamique
de l’erreur d’orientation ηR est :
d
η = d b T
(RR ) = R b −1 RT + R(R
b −1 )T
dt R dt
T T
= R[ω̃ s − bωs ]× R + R(R[ω̃s − bωs − Wωs ]× )
b b b
bT b T
(A.2)
= R[W ωs − ξbωs ]× R RR = [R(Wωs − ξbωs )]× ηR
b b
d
≈ [R(W
b
ωs − ξbωs )]× [ξR ]× + o(∥ξR ∥) ≈ dt [ξR ]×
d
ξR = R(Wωs − ξbωs )ξR (A.3)
b
dt
d
η
dt v
= d b
dt
(v − RRb T v) = (v b)−1 − (RR
b T )−1 v − RR
b T v −1
−1
= R(W as − ξbas ) + g − (ηR ) v − ηR g
b
(A.4)
≈ R(W
b
as − ξbas ) − [R(Wωs − ξbωs )]× v − [ξR ]× g
b
d
≈ R(W
b
as − ξbas ) + [v]× R(Wωs − ξbωs ) + [g]× ξR ≈ dt ξv
b
247
Donc, la dynamique d’évolution de l’erreur linéarisée de vitesse est :
d
ξv = R(Was − ξbas ) + [v]× R(Wωs − ξbωs ) + [g]× ξR (A.5)
b b
dt
d
η
dt p
= d b
dt
(p −RR b −1 − (RR
b T p) = (p) b T )−1 p − RR
b T p−1
d
ξp = ξv + [p]× R(Wωs − ξbωs ) (A.7)
b
dt
Pour conclure, sachant (A.3), (A.5) et (A.7) et d’après la dynamique d’évolution des
erreurs de biais et de l’erreur invariante ηRb ,
d
ξ
dt bωs
= Wbωs ,
d
ξ
dt bas
= Wbas ,
d
(A.8)
ξ
dt Rb
= WRb ,
d
ξ
dt pb
= Wpb ,
248
Annexe B. Quaternions
Cette annexe vise à rappeler brièvement le formalisme des quaternions et des opéra-
tions associées [117], [136].
Soit p et q deux quaternions définis comme suit :
p
0
q
0
p0 px q0 qx
p= = q= = (B.1)
pv py qv qy
pz qz
Soit a ∈ R3×1 , les opérateurs Ω(.) et E(.) sont définis tels que :
0 −aT −qvT
Ω(a) = , E(q) = (B.4)
a −[a]× q0 I3 + [qv ]×
Les dérivations relatives aux quaternions sont données par les équations suivantes :
∂(q⊗a⊗q ∗ ) Ra
∂a
= ∂a
=R
∂(q⊗a⊗q ∗ ) Ra
h i (B.5)
∂q
= ∂q
= 2 q0 a + [qv ]× a qvT aI3 + qv aT − aqvT − q0 [a]× ∈ R3×4
249
Annexe C. EKF pour la navigation des projectiles
1 1
qbk+1 = qbk + Ω(WRb )qbk ∆t = qbk + E(qbk )WRb ∆t (C.1.4)
2 2
∂f
ϕk ≈ I23 + |x ,u ∆t (C.2.1)
∂x k k
250
Les dérivées partielles de la dynamique d’évolution f (.) (2.86) par rapport aux états
permet d’identifier la matrice jacobienne ϕk de sorte que :
∂q
∂q
= 12 Ω(ω̃s − bωs )
∂q ∂ 1
∂bωs
= ∂bωs 2
E(q)(ω̃ s − b ω s ) = − 21 E(q)
∗
∂v
∂q
= ∂q⊗(ãs −b
∂q
as )⊗q
(C.2.2)
∂v
∂bas
= −R
∂p
∂v
= I3
et avec la matrice ∂
∂q
(q ⊗ a ⊗ q ∗ ) définie dans l’annexe B.
d
ξt = At ξt + Gw W (D.1.1)
dt
251
D’après les propriétés de l’opérateur [.]× , la dynamique d’évolution de l’erreur invariante
d’orientation s’écrit :
d
η = d b T
(RR ) = R b −1 RT + R(R
b −1 )T
dt R dt
T T
= R[ω̃s − bωs ]× R − R[ω̃s − bωs − Wωs ]× R
b b b
T T
(D.1.2)
= R[W ωs − (bωs − bωs )]× R = R[Wωs − ξbω ]× R
b b b
bT b T
= R[W ωs − ξbω )]× R RR = [R(Wωs − ξbω )]× ηR
b b
L’erreur invariante d’orientation est linéarisée sur l’espace euclidien associé tel que ηR ≈
I3×3 + [ξR ]× . La dynamique de l’erreur linéarisée d’orientation est alors :
d
ξR = R(W ωs − ξbω ) (D.1.3)
b
dt
d
ξv = R(W as − ξba ) + [v]× R(Wωs − ξbω ) + [g]× ξR (D.1.5)
b b
dt
d
η
dt p
= b −1 − (RR
(p) b T p−1
b T )−1 p − RR
= b T )−1 p − RR
vb − (RR b Tv
b T v) − (RR
= (vb − RR b T )−1 p = η − (η )−1 p (D.1.6)
v R
≈ ξv − [R(W
b
ωs − ξbω )]× p
d
ξp = ξv + [p]× R(W ω − ξbω ) (D.1.7)
b
dt
252
Pour conclure, sachant (D.1.3) - (D.1.7) et d’après la dynamique d’évolution des erreurs
de biais,
d d d
ξbω = Wbωs , ξba = Wbas , ξb = Wbhs , (D.1.8)
dt dt dt h
alors la représentation sous forme matricielle de la dynamique d’évolution de l’erreur
linéarisée permet d’identifier les matrices At et GW de sorte que :
0
3×3
03×3 03×3 −R 03×3 03×3
R 03×3 03×3 03×3
[g]× 03×3 03×3 −[v]× R −R 03×3 [v]× R R 03×3 03×3
At = , Gw =
03×3 I3×3 03×3 −[p]× R 03×3 03×3 [p]× R 03×3 R 03×3
09×18 09×9 I9×9
(D.1.9)
= −[ξR ]× R
b h̃ + R(
s
b bbhs − bhs ) + RW
b
hs + o(ξt ) + o(Whs ) (D.2.3)
= [R
b h̃ ] ξ + Rξ
s × R
b
bh + RWhs
b
253
B IBLIOGRAPHIE
255
[9] S. Changey, E. Pecheur, L. Bernard, E. Sommer, P. Wey et C. Berner,
« Real time estimation of projectile roll angle using magnetometers : In-flight ex-
perimental validation », p. 371-376, 2012. doi : 10.1109/PLANS.2012.6236904.
[10] J. Zhao, « A review of wearable IMU (Inertial-Measurement-Unit)-based pose
estimation and drift reduction technologies », in Journal of Physics : Conference
Series, IOP Publishing, t. 1087, 2018, p. 042 003.
[11] M. Narasimhappa, A. D. Mahindrakar, V. C. Guizilini, M. H. Terra et
S. L. Sabat, « An improved Sage Husa adaptive robust Kalman Filter for de-
noising the MEMS IMU drift signal », in 2018 Indian Control Conference (ICC),
IEEE, 2018, p. 229-234.
[12] C. J. Hegarty, « GNSS signals—An overview », in 2012 IEEE International
Frequency Control Symposium Proceedings, IEEE, 2012, p. 1-7.
[13] G. Lachapelle, « High sensitivity GNSS limitations in RF perturbed environ-
ments », NATO STO lecture series SET-197, navigation sensors and systems in
GNSS degraded and denied environments, 2013.
[14] G. T. Schmidt, « Navigation sensors and systems in GNSS degraded and denied
environments », Chinese journal of aeronautics, t. 28, 1, p. 1-10, 2015.
[15] G. X. Gao, M. Sgammini, M. Lu et N. Kubo, « Protecting GNSS receivers from
jamming and interference », Proceedings of the IEEE, t. 104, 6, p. 1327-1338, 2016.
[16] A. Ruegamer, D. Kowalewski et al., « Jamming and spoofing of GNSS signals–
an underestimated risk », Proc. Wisdom Ages Challenges Modern World, t. 3,
p. 17-21, 2015.
[17] M. L. Psiaki et T. E. Humphreys, « GNSS spoofing and detection », Proceedings
of the IEEE, t. 104, 6, p. 1258-1270, 2016.
[18] H. Sheng et T. Zhang, « MEMS-based low-cost strap-down AHRS research »,
Measurement, t. 59, p. 63-72, 2015.
[19] G. Courtier, R. Adam, P.-J. Lapray, E. Pecheur, S. Changey et J.-P.
Lauffenburger, « Image-based navigation system using skylight polarization for
an unmanned ground vehicle », in Unmanned Systems Technology XXIV, SPIE,
t. 12124, 2022, p. 173-182.
[20] D. Simon, « Kalman filtering », Embedded systems programming, t. 14, 6, p. 72-79,
2001.
256
[21] T. Karvonen et al., « Stability of linear and non-linear Kalman filters », 2014.
[22] G. Welch, G. Bishop et al., « An introduction to the Kalman filter », 1995.
[23] M. I. Ribeiro, « Kalman and extended kalman filters : Concept, derivation and
properties », Institute for Systems and Robotics, t. 43, p. 46, 2004.
[24] A. Barrau et S. Bonnabel, « Extended Kalman filtering with nonlinear equality
constraints : A geometric approach », IEEE Transactions on Automatic Control,
t. 65, 6, p. 2325-2338, 2019.
[25] K. Reif, S. Gunther, E. Yaz et R. Unbehauen, « Stochastic stability of the
discrete-time extended Kalman filter », IEEE Transactions on Automatic control,
t. 44, 4, p. 714-728, 1999.
[26] B. Ni et Q. Zhang, « Stability of the Kalman filter for continuous time output
error systems », Systems & Control Letters, t. 94, p. 172-180, 2016.
[27] Y. Yang et G. Huang, « Observability analysis of aided INS with heterogeneous
features of points, lines, and planes », IEEE Transactions on Robotics, t. 35, 6,
p. 1399-1418, 2019.
[28] G. Huang et S. Mourikis Anastasiosand Roumeliotis, « Observability-based
Rules for Designing Consistent EKF-SLAM Estimators », The International Jour-
nal of Robotics Research, t. 29, 5, p. 502-528, 2010. doi : 10.1177/0278364909353640.
eprint : https://doi.org/10.1177/0278364909353640. adresse : https://doi.
org/10.1177/0278364909353640.
[29] K. W. Lee, W. S. Wijesoma et J. I. Guzman, « On the observability and ob-
servability analysis of SLAM », in 2006 IEEE/RSJ International Conference on
Intelligent Robots and Systems, IEEE, 2006, p. 3569-3574.
[30] J. Hesch, D. Kottas, S. Bowman et S. Roumeliotis, « Observability-constrained
vision-aided inertial navigation », University of Minnesota, Dept. of Comp. Sci. &
Eng., MARS Lab, Tech. Rep, t. 1, p. 6, 2012.
[31] G. Huang, A. Mourikis et S. Roumeliotis, « Genearalized analysis and im-
provement of the consistency for EKF-based SLAM », University of Minnesota,
p. 2008-0001, 2008.
[32] L. L. Wells, « The projectile GRAM SAASM for ERGM and Excalibur », in
IEEE 2000. Position Location and Navigation Symposium (Cat. No. 00CH37062),
IEEE, 2000, p. 106-111.
257
[33] L. D. Fairfax et F. E. Fresconi, « Position estimation for projectiles using low-
cost sensors and flight dynamics », Journal of Aerospace Engineering, t. 27, 3,
p. 611-620, 2014.
[34] H. Zhao et Z. Li, « Ultra-tight GPS/IMU integration based long-range rocket
projectile navigation », Defence Science Journal, t. 66, 1, p. 64-70, 2016.
[35] J. Vandersteen, S. Bennani et C. Roux, « Robust Rocket Navigation with
Sensor Uncertainties : Vega Launcher Application », Journal of Spacecraft and
Rockets, t. 55, 1, p. 153-166, 2018.
[36] A. Radi, S. Zahran et N. El-Sheimy, « GNSS Only Reduced Navigation System
Performance Evaluation for High-Speed Smart Projectile Attitudes Estimation »,
in 2021 International Telecommunications Conference (ITC-Egypt), IEEE, 2021,
p. 1-4.
[37] M. B. Aykenar, I. C. Boz, G. Soysal et M. Efe, « A Multiple Model Approach
for Estimating Roll Rate of a Very Fast Spinning Artillery Rocket », in 2020 IEEE
23rd International Conference on Information Fusion (FUSION), IEEE, 2020, p. 1-
7.
[38] D. Long, J. Lin, X. Zhang et J. Li, « Orientation estimation algorithm applied to
high-spin projectiles », Measurement Science and Technology, t. 25, 6, p. 065 001,
2014.
[39] H. Zhao et Z. Su, « Real-time estimation of roll angle for trajectory correction
projectile using radial magnetometers », IET radar, sonar & navigation, t. 14, 10,
p. 1559-1570, 2020.
[40] L. An, L. Wang, N. Liu, J. Fu et Y. Zhong, « A novel method for estimating
pitch and yaw of rotating projectiles based on dynamic constraints », Sensors,
t. 19, 23, p. 5096, 2019.
[41] S. Changey, D. Beauvois et V. Fleck, « A mixed extended-unscented filter
for attitude estimation with magnetometer sensor », in 2006 American Control
Conference, IEEE, 2006, 6-pp.
[42] J. M. Maley, « Efficient attitude estimation for a spin-stabilized projectile »,
Journal of Guidance, Control, and Dynamics, t. 39, 2, p. 339-350, 2016.
258
[43] C. Combettes, S. Changey, R. Adam et E. Pecheur, « Attitude and velocity
estimation of a projectile using low cost magnetometers and accelerometers », in
2018 IEEE/ION Position, Location and Navigation Symposium (PLANS), IEEE,
2018, p. 650-657.
[44] A. Fiot, S. Changey et N. C. Petit, « Estimation of air velocity for a high velo-
city spinning projectile using transerse accelerometers », in 2018 AIAA Guidance,
Navigation, and Control Conference, 2018, p. 1349.
[45] S. Changey, V. Fleck et D. Beauvois, « Projectile attitude and position deter-
mination using magnetometer sensor only », Proc. SPIE, t. 5803, mars 2005. doi :
10.1117/12.602099.
[46] Z. Zhao, G. Wen, X. Zhang et D. Li, « Model-based estimation for pose, velocity
of projectile from stereo linear array image », Measurement Science Review, t. 12,
3, p. 104, 2012.
[47] L. Hsiang-Yueh et K. Hao-Yuan, « Projectile Flight Trajectory and Position
Estimation System Based on Stereo Vision », Sensors and Materials, t. 31, 11,
p. 3483-34, 2019. doi : https://doi.org/10.18494/SAM.2019.
[48] T. G. Dietterich, « Machine learning », Annual review of computer science, t. 4,
1, p. 255-306, 1990.
[49] E. Charniak, Introduction au deep learning. Dunod, 2021.
[50] S. Sharma, S. Sharma et A. Athaiya, « Activation functions in neural net-
works », towards data science, t. 6, 12, p. 310-316, 2017.
[51] D. P. Kingma et J. Ba, « Adam : A method for stochastic optimization », arXiv
preprint arXiv :1412.6980, 2014.
[52] P. Svenmarck, L. Luotsinen, M. Nilsson et J. Schubert, « Possibilities and
challenges for artificial intelligence in military applications », in Proceedings of the
NATO Big Data and Artificial Intelligence for Military Decision Making Specia-
lists’ Meeting, 2018, p. 1-16.
[53] Y. Zhang, Z. Dai, L. Zhang, Z. Wang, L. Chen et Y. Zhou, « Application of
Artificial Intelligence in Military : From Projects View », in 2020 6th International
Conference on Big Data and Information Analytics (BigDIA), IEEE, 2020, p. 113-
116.
259
[54] A. Carlo, « Artificial Intelligence in the Defence Sector », in International Confe-
rence on Modelling and Simulation for Autonomous Systems, Springer, 2020, p. 269-
278.
[55] M. Hoijtink et A. Planqué-van Hardeveld, « Machine learning and the plat-
formization of the military : A study of google’s machine learning platform Ten-
sorFlow », International Political Sociology, t. 16, 2, olab036, 2022.
[56] D. C. Tarraf, W. Shelton, E. Parker et al., « The Department of Defense pos-
ture for artificial intelligence : Assessment and recommendations », Rand National
Defense Research Inst Santa Monica CA United States, rapp. tech., 2019.
[57] S. Zeldam, « Automated failure diagnosis in aviation maintenance using explai-
nable artificial intelligence (XAI) », mém. de mast., University of Twente, 2018.
[58] V. Ustun, R. Kumar, A. Reilly, S. Sajjadi et A. Miller, « Adaptive synthetic
characters for military training », arXiv preprint arXiv :2101.02185, 2021.
[59] P. Svenmarck, L. Luotsinen, M. Nilsson et J. Schubert, « Possibilities and
challenges for artificial intelligence in military applications », in Proceedings of the
NATO Big Data and Artificial Intelligence for Military Decision Making Specia-
lists’ Meeting, 2018, p. 1-16.
[60] D. Ventre, Artificial Intelligence, Cybersecurity and Cyber Defence. John Wiley
& Sons, 2020.
[61] T. Farrell, T. Terry et O. Frans, A transformation gap ? : American innova-
tions and European military change. Stanford University Press, 2010.
[62] N. J. Wheeler, « Guardian angel or global gangster : A review of the ethical
claims of international society », Political Studies, t. 44, 1, p. 123-135, 1996.
[63] M. des Armées (France), « L’intelligence Artificielle au Service de la Défense »,
Report, 2019.
[64] J. Liu et G. Guo, « Vehicle localization during GPS outages with extended Kal-
man filter and deep learning », IEEE Transactions on Instrumentation and Mea-
surement, t. 70, p. 1-10, 2021.
[65] Y. Yao, X. Xu, C. Zhu et C.-Y. Chan, « A hybrid fusion algorithm for GPS/INS
integration during GPS outages », Measurement, t. 103, p. 42-51, 2017.
260
[66] J. Li, N. Song, G. Yang, M. Li et Q. Cai, « Improving positioning accuracy
of vehicular navigation system during GPS outages utilizing ensemble learning
algorithm », Information Fusion, t. 35, p. 1-10, 2017.
[67] C. Shen, Y. Zhang, J. Tang, H. Cao et J. Liu, « Dual-optimization for a MEMS-
INS/GPS system during GPS outages based on the cubature Kalman filter and
neural networks », Mechanical Systems and Signal Processing, t. 133, p. 106 222,
2019.
[68] W. Fang, J. Jiang, S. Lu et al., « A LSTM algorithm estimating pseudo mea-
surements for aiding INS during GNSS signal outages », Remote sensing, t. 12, 2,
p. 256, 2020.
[69] J. J. Wang, J. Wang, D. Sinclair et L. Watts, « A neural network and Kalman
filter hybrid approach for GPS/INS integration », in Proceedings of the Korean Ins-
titute of Navigation and Port Research Conference, Korean Institute of Navigation
et Port Research, t. 1, 2006, p. 277-282.
[70] A. AbdulMajuid, O. Mohamady, M. Draz et G. El-bayoumi, « GPS-Denied
Navigation Using Low-Cost Inertial Sensors and Recurrent Neural Networks »,
arXiv preprint arXiv :2109.04861, 2021.
[71] Z. Shi, F. Zhao, X. Wang et Z. Jin, « Deep Kalman-based Trajectory Estimation
of Moving Target from Satellite Images », in 2022 IEEE 10th Joint Internatio-
nal Information Technology and Artificial Intelligence Conference (ITAIC), IEEE,
t. 10, 2022, p. 71-75.
[72] D. Kim, K. Min, H. Kim et K. Huh, « Vehicle sideslip angle estimation using deep
ensemble-based adaptive Kalman filter », Mechanical Systems and Signal Proces-
sing, t. 144, p. 106 862, 2020.
[73] L. Vargas-Meléndez, B. L. Boada, M. J. L. Boada, A. Gauchía et V. Díaz,
« A sensor fusion method based on an integrated neural network and Kalman filter
for vehicle roll angle estimation », Sensors, t. 16, 9, p. 1400, 2016.
[74] J. Liu, W. Wang, X. Gong, X. Que et H. Yang, « A hybrid model based
on Kalman filter and neutral network for traffic prediction », in 2012 IEEE 2nd
International Conference on Cloud Computing and Intelligence Systems, IEEE,
t. 2, 2012, p. 533-536.
261
[75] T. Bao, Y. Zhao, S. A. R. Zaidi, S. Xie, P. Yang et Z. Zhang, « A deep Kalman
filter network for hand kinematics estimation using sEMG », Pattern Recognition
Letters, t. 143, p. 88-94, 2021.
[76] S. Bi, L. Ma, T. Shen, Y. Xu et F. Li, « Neural network assisted Kalman filter for
INS/UWB integrated seamless quadrotor localization », PeerJ Computer Science,
t. 7, e630, 2021.
[77] X. Dai, V. Nateghi, H. Fourati et C. Prieur, « Q-learning-based noise co-
variance adaptation in Kalman filter for MARG sensors attitude estimation »,
in 2022 IEEE International Symposium on Inertial Sensors and Systems (INER-
TIAL), IEEE, 2022, p. 1-6.
[78] X. Dai, H. Fourati et C. Prieur, « A Dynamic Grid-based Q-learning for Noise
Covariance Adaptation in EKF and its Application in Navigation », in 2022 IEEE
61st Conference on Decision and Control (CDC), IEEE, 2022, p. 4984-4989.
[79] D.-J. Jwo et H.-C. Huang, « Neural network aided adaptive extended Kalman
filtering approach for DGPS positioning », The journal of navigation, t. 57, 3,
p. 449-463, 2004.
[80] L. Abdrazakov et D. Yudin, « Neural Network Adaptation of the Kalman Filter
for Odometry Fusion », in Proceedings of the Fifth International Scientific Confe-
rence “Intelligent Information Technologies for Industry”(IITI’21), Springer, 2022,
p. 44-54.
[81] S. Jouaber, S. Bonnabel, S. Velasco-Forero et M. Pilte, « NNAKF : A
Neural Network Adapted Kalman Filter for Target Tracking », in ICASSP 2021-
2021 IEEE International Conference on Acoustics, Speech and Signal Processing
(ICASSP), IEEE, 2021, p. 4075-4079.
[82] M. Brossard, A. Barrau et S. Bonnabel, « AI-IMU dead-reckoning », IEEE
Transactions on Intelligent Vehicles, t. 5, 4, p. 585-595, 2020.
[83] S. Hosseinyalamdary, « Deep Kalman filter : Simultaneous multi-sensor inte-
gration and modelling ; A GNSS/IMU case study », Sensors, t. 18, 5, p. 1316,
2018.
[84] G. Revach, N. Shlezinger, X. Ni, A. L. Escoriza, R. J. Van Sloun et Y. C.
Eldar, « KalmanNet : Neural network aided Kalman filtering for partially known
dynamics », IEEE Transactions on Signal Processing, t. 70, p. 1532-1547, 2022.
262
[85] Y.-t. Bai, X.-y. Wang, X.-b. Jin, Z.-y. Zhao et B.-h. Zhang, « A neuron-based
Kalman filter with nonlinear autoregressive model », Sensors, t. 20, 1, p. 299, 2020.
[86] C. Chen, C. X. Lu, B. Wang, N. Trigoni et A. Markham, « DynaNet : Neural
Kalman dynamical model for motion estimation and prediction », IEEE Transac-
tions on Neural Networks and Learning Systems, t. 32, 12, p. 5479-5491, 2021.
[87] Z. Shi, M. Xu, Q. Pan, B. Yan et H. Zhang, « LSTM-based flight trajectory
prediction », in 2018 International joint conference on neural networks (IJCNN),
IEEE, 2018, p. 1-8.
[88] L. Rossi, M. Paolanti, R. Pierdicca et E. Frontoni, « Human trajectory
prediction and generation using LSTM models and GANs », Pattern Recognition,
t. 120, p. 108 136, 2021.
[89] K. A. Sørensen, P. Heiselberg et H. Heiselberg, « Probabilistic maritime
trajectory prediction in complex scenarios using deep learning », Sensors, t. 22, 5,
p. 2058, 2022.
[90] E. Barsoum, J. Kender et Z. Liu, « HP-GAN : Probabilistic 3D human motion
prediction via GAN », in Proceedings of the IEEE conference on computer vision
and pattern recognition workshops, 2018, p. 1418-1427.
[91] A. Al-Molegi, M. Jabreel et B. Ghaleb, « STF-RNN : Space time features-
based recurrent neural network for predicting people next location », in 2016 IEEE
Symposium Series on Computational Intelligence (SSCI), IEEE, 2016, p. 1-7.
[92] S. H. Park, B. Kim, C. M. Kang, C. C. Chung et J. W. Choi, « Sequence-to-
sequence prediction of vehicle trajectory via LSTM encoder-decoder architecture »,
in 2018 IEEE intelligent vehicles symposium (IV), IEEE, 2018, p. 1672-1678.
[93] N. E. Gaiduchenko, P. A. Gritsyk et Y. I. Malashko, « Multi-Step Ballistic
Vehicle Trajectory Forecasting Using Deep Learning Models », in 2020 Internatio-
nal Conference Engineering and Telecommunication (En&T), IEEE, 2020, p. 1-6.
[94] L.-h. Hou et H.-j. Liu, « An end-to-end LSTM-MDN network for projectile trajec-
tory prediction », in Intelligence Science and Big Data Engineering. Big Data and
Machine Learning : 9th International Conference, IScIDE 2019, Nanjing, China,
October 17–20, 2019, Proceedings, Part II 9, Springer, 2019, p. 114-125.
263
[95] N. Nikhil et B. Tran Morris, « Convolutional Neural Network for trajec-
tory prediction », in Proceedings of the European Conference on Computer Vision
(ECCV) Workshops, 2018.
[96] P. Wey, D. Corriveau, T. A. Saitz, W. de Ruijter et P. Strömbäck, « BALCO
6/7-DoF trajectory model », in 29th International Symposium on Ballistics, t. 1,
2016, p. 151-162.
[97] D. Corriveau, « Validation of the NATO Armaments Ballistic Kernel for use in
small-arms fire control systems », Defence technology, t. 13, 3, p. 188-199, 2017.
[98] M. Zeidler, « Application des techniques de contrôle des écoulements au pilotage
des projectiles : Contrôle fluidique d’un projectile gyrostabilisé de 155 mm par effet
Coanda », thèse de doct., Université de Lille, 2015.
[99] A. Barrau, « Non-linear state error based extended Kalman filters with applica-
tions to navigation », thèse de doct., Mines Paristech, 2015.
[100] P. Chauchat, « Smoothing algorithms for navigation, localisation and mapping
based on high-grade inertial sensors », thèse de doct., Université Paris sciences et
lettres, 2020.
[101] A. Barrau et S. Bonnabel, « The invariant extended Kalman filter as a stable
observer », IEEE Transactions on Automatic Control, t. 62, 4, p. 1797-1812, 2016.
[102] R. Hartley, M. Ghaffari, R. M. Eustice et J. W. Grizzle, « Contact-aided
invariant extended Kalman filtering for robot state estimation », The International
Journal of Robotics Research, t. 39, 4, p. 402-430, 2020.
[103] A. Barrau et S. Bonnabel, « Invariant kalman filtering », Annual Review of
Control, Robotics, and Autonomous Systems, t. 1, p. 237-257, 2018.
[104] S. Teng, M. W. Mueller et K. Sreenath, « Legged robot state estimation
in slippery environments using invariant extended Kalman filter with velocity
update », in 2021 IEEE International Conference on Robotics and Automation
(ICRA), IEEE, 2021, p. 3104-3110.
[105] S. Bonnabel, « Observateurs asymptotiques invariants : théorie et exemples »,
thèse de doct., École Nationale Supérieure des Mines de Paris, 2007.
[106] A. Barrau et S. Bonnabel, « Invariant particle filtering with application to
localization », 53rd IEEE Conference on Decision and Control, p. 5599-5605, 2014.
264
[107] S. Bonnabel, « Une approche géométrique pour certains problèmes de filtrage
non-linéaires. », thèse de doct., Université Pierre et Marie Curie, 2014.
[108] M. Brossard, « Deep learning, inertial measurements units, and odometry : some
modern prototyping techniques for navigation based on multi-sensor fusion », thèse
de doct., Université Paris sciences et lettres, 2020.
[109] F. Paulin, « Introduction aux groupes de Lie pour la physique », 2018. adresse :
https://www.math.u-psud.fr/~paulin/notescours/cours_centrale.pdf.
[110] B. S. Marc Briant Lucas Chesnel, « Des Groupes de Lie et de leurs applications
en Physique Fondamentale », 2008.
[111] E. Eade, « Lie groups for computer vision », Cambridge Univ., Cam-bridge, UK,
Tech. Rep, t. 2, 2014.
[112] K. S. Phogat et D. E. Chang, « Invariant extended Kalman filter on matrix Lie
groups », Automatica, t. 114, p. 108 812, 2020.
[113] S. Bonnable, P. Martin et E. Salaün, « Invariant extended Kalman filter :
theory and application to a velocity-aided attitude estimation problem », in Pro-
ceedings of the 48h IEEE Conference on Decision and Control (CDC) held jointly
with 2009 28th Chinese Control Conference, IEEE, 2009, p. 1297-1304.
[114] A. Fiot, « Attitude estimation of an artillery shell in free-flight from accelero-
meters and magnetometers », thèse de doct., Université Paris sciences et lettres,
2020.
[115] J. D. Hol, T. B. Schon et F. Gustafsson, « A new algorithm for calibrating a
combined camera and IMU sensor unit », in 2008 10th International Conference
on Control, Automation, Robotics and Vision, IEEE, 2008, p. 1857-1862.
[116] M. Bloesch, C. Gehring, P. Fankhauser, M. Hutter, M. A. Hoepflinger
et R. Siegwart, « State estimation for legged robots on unstable and slippery
terrain », in 2013 IEEE/RSJ International Conference on Intelligent Robots and
Systems, IEEE, 2013, p. 6058-6064.
[117] J. Sola, « Quaternion kinematics for the error-state Kalman filter », arXiv pre-
print arXiv :1711.02508, 2017.
[118] X. Zhu et J. Angeles, « A Reparametrization of the Rotation Matrix in Rigid-
Body Dynamics », Journal of Applied Mechanics, t. 82, 5, p. 051 003, 2015.
265
[119] Z. Chen, K. Jiang et J. C. Hung, « Local observability matrix and its applica-
tion to observability analyses », in IECON’90 : 16th Annual Conference of IEEE
Industrial Electronics Society, IEEE, 1990, p. 100-103.
[120] R. Chauhan, K. K. Ghanshala et R. Joshi, « Convolutional Neural Network
(CNN) for image detection and recognition », in 2018 first international conference
on secure cyber computing and communication (ICSCCC), IEEE, 2018, p. 278-282.
[121] Z. Liang, A. Powell, I. Ersoy et al., « CNN-based image analysis for malaria
diagnosis », in 2016 IEEE international conference on bioinformatics and biome-
dicine (BIBM), IEEE, 2016, p. 493-496.
[122] A. Sherstinsky, « Fundamentals of Recurrent Neural Network (RNN) and Long
Short-Term Memory (LSTM) network », Physica D : Nonlinear Phenomena, t. 404,
p. 132 306, 2020.
[123] Y. Yu, X. Si, C. Hu et J. Zhang, « A review of recurrent neural networks : LSTM
cells and network architectures », Neural computation, t. 31, 7, p. 1235-1270, 2019.
[124] R. C. Staudemeyer et E. R. Morris, « Understanding LSTM–a tutorial into
Long Short-Term Memory recurrent neural networks », arXiv preprint arXiv :1909.09586,
2019.
[125] S. Hochreiter et J. Schmidhuber, « Long Short-Term Memory », Neural com-
putation, t. 9, 8, p. 1735-1780, 1997.
[126] S. Hochreiter, Y. Bengio, P. Frasconi, J. Schmidhuber et al., « Gradient
flow in recurrent nets : the difficulty of learning long-term dependencies », 2001.
[127] A. Graves, S. Fernández et J. Schmidhuber, « Bidirectional LSTM networks
for improved phoneme classification and recognition », in Artificial Neural Net-
works : Formal Models and Their Applications–ICANN 2005 : 15th Internatio-
nal Conference, Warsaw, Poland, September 11-15, 2005. Proceedings, Part II 15,
Springer, 2005, p. 799-804.
[128] L. Ziyin, T. Hartwig et M. Ueda, « Neural networks fail to learn periodic func-
tions and how to fix it », Advances in Neural Information Processing Systems,
t. 33, p. 1583-1594, 2020.
[129] T. Deng, A. Cheng, W. Han et H.-X. Lin, « Visibility Forecast for Airport
Operations by LSTM Neural Network. », in ICAART (2), 2019, p. 466-473.
266
[130] S. Kim, I. Petrunin et H.-S. Shin, « A Review of Kalman Filter with Artifi-
cial Intelligence Techniques », in 2022 Integrated Communication, Navigation and
Surveillance Conference (ICNS), IEEE, 2022, p. 1-12.
[131] K. Weiss, T. M. Khoshgoftaar et D. Wang, « A survey of transfer learning »,
Journal of Big data, t. 3, 1, p. 1-40, 2016.
[132] F. Zhuang, Z. Qi, K. Duan et al., « A comprehensive survey on transfer lear-
ning », Proceedings of the IEEE, t. 109, 1, p. 43-76, 2020.
[133] C. Tan, F. Sun, T. Kong, W. Zhang, C. Yang et C. Liu, « A survey on deep
transfer learning », in Artificial Neural Networks and Machine Learning–ICANN
2018 : 27th International Conference on Artificial Neural Networks, Rhodes, Greece,
October 4-7, 2018, Proceedings, Part III 27, Springer, 2018, p. 270-279.
[134] N. Agarwal, A. Sondhi, K. Chopra et G. Singh, « Transfer learning : Sur-
vey and classification », Smart Innovations in Communication and Computational
Sciences : Proceedings of ICSICCS 2020, p. 145-155, 2021.
[135] L. Marković, M. Kovač, R. Milijas, M. Car et S. Bogdan, « Error state
extended Kalman filter multi-sensor fusion for unmanned aerial vehicle localization
in GPS and magnetometer denied indoor environments », in 2022 International
Conference on Unmanned Aircraft Systems (ICUAS), IEEE, 2022, p. 184-190.
[136] W. Youn et S. A. Gadsden, « Combined quaternion-based error state Kalman
filtering and smooth variable structure filtering for robust attitude estimation »,
IEEE Access, t. 7, p. 148 989-149 004, 2019.
267
Titre : Étude des méthodes d’intelligence artificielle pour la navigation des projectiles
Résumé : La navigation des projectiles se réseau de neurones afin de tenir compte des
base sur les mesures d’une Unité de Mesure erreurs et des corrélations des mesures. La
Inertielle (IMU - Inertial Measurement Unit) deuxième méthode vise à remplacer tous les
et d’un récepteur GNSS (Global Navigation modèles mathématiques d’évolution de la tra-
Satellite Systems), fusionnées par des filtres jectoire d’un projectile par un réseau de neu-
de Kalman. Toutefois, ces capteurs présentent rones récurrents. La troisième solution mise
plusieurs limitations notamment en termes de en œuvre évalue les performances d’estima-
précision et de disponibilité. L’objectif de cette tion d’un filtre de Kalman où au moins l’un
thèse est d’évaluer l’apport de l’intelligence ar- des modèles est estimé par un réseau de neu-
tificielle (IA) pour optimiser les méthodes clas- rones.
siques de navigation afin d’estimer avec préci- Les résultats obtenus montrent l’intérêt de
sion la trajectoire d’un projectile. l’IA pour la navigation des projectiles, notam-
Trois méthodes d’estimation de la trajec- ment lorsque les capteurs classiquement uti-
toire d’un projectile ont été mises en œuvre. lisés comme le récepteur GNSS ne sont pas
La première approche consiste à ajuster un disponibles. Toutefois, l’IA n’est pas optimale
paramètre de bruit d’un filtre de Kalman par un pour estimer l’orientation d’un projectile.
Abstract: Projectile navigation is based on filter by a neural network to take into account
the Inertial Measurement Unit and the GNSS the measurement errors and correlations. The
(Global Navigation Satellite Systems) receiver second approach aims to replace all projec-
readings fused by Kalman filters. However, tile trajectory mathematical models by a recur-
these sensors present several limitations in rent neural network. The third solution imple-
terms of accuracy and availability. The goal of mented evaluates the accuracy of a Kalman
this thesis is to evaluate Artificial Intelligence filter when at least one model is estimated by
(AI) contribution to optimize classical naviga- a neural network.
tion methods to accurately estimate a projec- The reported results highlight the interest
tile trajectory. of AI for projectile navigation, especially when
Three methods are implemented to esti- conventional sensors such as GNSS receivers
mate a projectile trajectory. The first approach are not available. However, AI is not optimal to
aims to adjust a noise parameter of a Kalman estimate projectile orientation.
270