Mathématiques Minute
Mathématiques Minute
Mathématiques Minute
Maths in minutes
Tous les efforts sont été faits pour contacter les détenteurs des copyrights. Toute omission accidentelle sera corrigée lors d’une
prochaine édition.
ISBN : 978-2-81321-586-4
www.editions-tredaniel.com
Crédits des images : Toutes les images appartiennent au domaine public, à l’exception de : 135 : © Oxford Science Archive /
Heritage Images / Imagestate ; 179 : Deutsche Fotothek/Wikimedia ; 229 : D.328/Wikimedia ; 279 : Jgmoxness/Wikimedia ;
293 : Time3000/Wikimedia ; 299 : Adam Majewski/Wikimedia ; 367 : fromoldbooks.org ; 389 : Grontesca/Wikimedia ; 399 :
Sam Daoud/Wikimedia.
1 + 2 + 4 + 8 + 16 + 31 + 62 + 124 + 248.
Les nombres parfaits sont rares et difficiles à trouver. Les mathématiciens n’ont pas encore
découvert des réponses probantes à certaines questions importantes du genre y a-t-il un
nombre infini de nombres parfaits, ou tous les nombres parfaits sont-ils pairs.
Algorithme d’Euclide
n algorithme est une méthode de résolution d’un problème en suivant un ensemble de
U règles. L’algorithme d’Euclide a été formulé vers 300 av. J.-C. en vue de trouver le plus
grand commun diviseur (PGCD) de deux nombres. Les algorithmes sont essentiels pour
l’informatique, et la plupart des appareils électroniques s’en servent.
La plus simple variante de l’algorithme d’Euclide utilise le fait que le PGCD de deux
nombres est le même que le PGCD du plus petit des deux et la différence entre eux. Cela
permet d’écarter maintes fois le plus grand des deux nombres impliqués, les réduisant jusqu’à
ce que l’un d’entre eux devienne nul. Le dernier nombre différent de zéro est alors le PGCD
des deux nombres initiaux.
Pour arriver à la réponse, cette méthode impose de nombreuses répétitions. Une méthode
plus efficace, l’algorithme standard, remplace le nombre le plus grand par le reste obtenu en
divisant le nombre le plus petit jusqu’à ce qu’il n’y ait plus de reste.
(à cette étape, la réponse est évidente, mais soustraire 13 neuf autres fois conduit à…)
13 — 13 = 0, donc le PGCD est 13.
Variante standard de l’algorithme d’Euclide : 3 étapes
= 1 (reste 143)
= 3 (reste 13)
= 11 (aucun reste)
donc le processus s’arrête, et 13 est le PGCD.
Nombres irrationnels
es nombres irrationnels sont des nombres qui ne peuvent pas être exprimés en divisant un
L nombre naturel par un autre, en tant que ratio entre deux nombres entiers ou sous une
forme décimale qui soit arrive à une fin, soit passe à un modèle régulier de chiffres répétés.
Les développements décimaux des nombres irrationnels se poursuivent à perpétuité sans
répétition périodique.
Comme les nombres naturels et rationnels, les nombres irrationnels vont à l’infini. Mais
alors que les nombres rationnels et entiers sont des ensembles finis (cardinalité) (voir
page 56), les nombres irrationnels sont bien plus nombreux. En fait, leur nature les rend non
seulement infinis, mais indénombrables (voir page 64).
Certains des nombres les plus importants sont irrationnels : π, le rapport constant de la
circonférence d’un cercle et de son diamètre, la constante d’Euler e, le nombre d’or et √2, la
racine carrée de 2.
Le nombre d’or est le rapport entre le plus grand des deux nombres et le plus petit, égal au rapport entre la somme
des deux et le plus grand. C’est un nombre irrationnel et une constante émergeant naturellement dans beaucoup
de situations. Il régit les proportions en peinture et en architecture.
Nombres algébriques et transcendants
n nombre algébrique est un nombre complexe qui est la racine d’un polynôme (équation
U impliquant des puissances de la variable x) (voir page 184) à coefficients rationnels. Un
nombre transcendant n’est pas algébrique. Les coefficients de telles équations sont les
nombres qui multiplient chacune des variables. Par exemple, √2 est irrationnel, car il ne peut
pas être écrit en tant que rapport de deux nombres entiers. Mais il est aussi algébrique, car il
est la solution de l’équation x 2 – 2 = 0, qui a des coefficients rationnels (1 et 2). Tous les
nombres rationnels sont algébriques, car tout rapport donné peut être une solution de
qx – p = 0.
On s’attendrait à ce que les nombr_es transcendants soient rares, alors que c’est le contraire.
√2 est exceptionnel ; presque tous les nombres irrationnels sont aussi transcendants. Très
difficile à prouver, un nombre choisi au hasard entre 0 et 1 sera presque assurément
transcendant. Cela soulève la question : pourquoi les mathématiciens ont-ils passé autant de
temps à résoudre les équations algébriques, ignorant la vaste majorité des nombres ?
Ce diagramme gigogne montre les principaux types de nombres réels, dont quelques exemples importants.
π
, nombre transcendant, est l’une des constantes mathématiques fondamentales. Représenté
π
par la lettre grecque π, il apparaît dans une diversité de situations inattendues. Il est si
important que des mathématiciens et des informaticiens ont consacré énormément de temps et
d’efforts à le calculer avec toujours plus de précision. En 2010, le nombre de décimales,
calculé bien entendu par ordinateur, dépassait les 5 trillions !
En pratique, une telle précision est inutile, et π peut être représenté par les nombres
rationnels et , ou en notation décimale, par 3,14159265358979323846264338. Il a été
découvert grâce à la géométrie, probablement quelque deux millénaires avant notre ère en
Égypte et en Mésopotamie. Il est d’habitude désigné comme étant le rapport de la
circonférence d’un cercle et de son diamètre. Archimède utilisait la géométrie pour trouver des
limites supérieures et inférieures pour cette valeur (voir page 92). Depuis lors, il a servi dans
des domaines aussi différents que la probabilité et la relativité.
3,14159265358979323846264338327950288419716
9399375105820974944592307816406286208998628
034825342117067982148086513282306647093844
6095505822317253594081284811174502841027019
385211055596446229489549303819644288109756
6593344612847564823378678316527120190914564
856692346034861045432664821339360726024914
1273724587006606315588174881520920962829254
091715364367892590360011330530548820466521
3841469519415116094330572703657595919530921
8611738193261179310511854807446237996274956
7351885752724891227938183011949129833673362
4406566430860213949463952247371907021798609
4370277053921717629317675238467481846766940
5132000568127145263560827785771342757789609
1736371787214684409012249534301465495853710
5079227968925892354201995611212902196086403
4418159813629774771309960518707211349999998
37297804995105973173281609631859502445955...
e
est un nombre transcendant et l’une des constantes fondamentales des mathématiques.
eNommé constante d’Euler, sa valeur est d’environ 2,71828182845904523536028747.
On le trouve dans l’analyse mathématique, et bien que les ingénieurs et les physiciens
utilisent les puissances de dix et les logarithmes (voir page 44) de base dix, les mathématiciens
travaillent presque toujours avec les puissances de e et les logarithmes de base e, les
logarithmes naturels.
Comme π, e a plusieurs définitions. C’est l’unique nombre réel pour lequel la dérivée (voir
page 208) de la fonction ex, la fonction exponentielle, est lui-même. En probabilités, c’est une
proportion naturelle ; en termes de sommes infinies, il a de nombreuses représentations.
e est étroitement lié au π, puisque les fonctions trigonométriques (voir page 200), souvent
exprimées en faisant appel à π, peuvent aussi être définies en passant par la fonction
exponentielle.
Lorsque les valeurs de x sont tracées en fonction de ax pour diverses valeurs de a, e est l’unique nombre pour lequel
la pente du graphe en x = 0 est 1.
Logarithmes
es logarithmes permettent de connaître l’ordre de grandeur d’un nombre. Le logarithme
L d’un nombre est la puissance à laquelle un nombre fixe, la base, doit être élevé pour
produire ce nombre. Si un nombre donné b peut être exprimé sous la forme 10a, on dit que a
est le logarithme décimal (de base 10) de b, noté log(b). Comme le produit d’un nombre élevé
à différentes puissances peut être obtenu en additionnant ces puissances, on peut aussi utiliser
les logarithmes pour réaliser toute multiplication impliquant des puissances.
Ainsi, en posant an = x et am = y, le principe anam = an + m peut être écrit sous forme
logarithmique :
log(xy) = log(x) + log(y),
alors que (an)w = anw est log(xw) = wlog(x).
Avant l’invention des calculateurs électroniques, ces principes étaient utilisés pour
simplifier les calculs complexes grâce à des tables de logarithmes ou des règles à calcul – deux
règles avec des échelles logarithmiques coulissant l’une sur l’autre, où l’addition des échelles
entraîne une multiplication.
Règle à calcul proportionnelle et règle à calcul logarithmique. Sur une règle à calcul proportionnelle, l’alignement
des nombres à additionner, dans ce cas 4 et 7, montre leur somme. La règle logarithmique sert à la multiplication :
l’alignement des chiffres montre le produit.
i
est un « nombre » utilisé pour représenter la racine carrée de –1. Ce concept, par ailleurs
iimpossible à représenter, n’est pas un nombre dans le sens arithmétique ; c’est un nombre
imaginaire.
Le concept de i est utile pour résoudre une équation telle que x2 + 1 = 0, qui peut être
réécrite sous la forme x2 = –1. Comme le carré de tout nombre positif ou négatif réel est
toujours positif, cette équation n’a pas des solutions nombres réels. Cependant, montrant un
exemple classique de la beauté et de l’utilité des mathématiques, si on définit une solution et
on lui donne un nom (i), on arrive à un développement des nombres réels parfaitement
cohérent. Tout comme les nombres positifs ont une racine carrée tant positive que négative, -i
est aussi une racine carrée de –1, donc l’équation x2 + 1 = 0 a deux solutions.
Grâce à ce nouveau nombre imaginaire, on aborde un monde inédit de nombres complexes,
avec des parties tant réelle qu’imaginaire (voir pages 288 à 311).
Préambule aux ensembles
n ensemble est une collection d’objets. Les objets d’un ensemble sont ses éléments.
U L’idée d’ensemble est très puissante, et les ensembles sont, de bien des façons, les
composantes tout à fait fondamentales des mathématiques – encore plus que les nombres.
Un ensemble peut comporter un nombre fini ou infini d’éléments, et est d’habitude noté en
plaçant les éléments entre accolades { }. L’ordre dans lequel sont écrits les éléments n’a pas
d’importance dans la spécification de l’ensemble, tout comme la répétition d’un élément. Les
ensembles peuvent par ailleurs être formés d’autres ensembles, qui doivent cependant être
décrits avec grand soin.
Entre autres, les ensembles permettent de conserver la généralité, plaçant aussi peu de
structure que possible sur les objets étudiés. Les éléments d’un ensemble peuvent être
n’importe quoi, depuis des nombres aux planètes, en passant par des hommes, ou un mélange
des trois, bien que dans les applications ils soient d’habitude liés.
Combiner des ensembles
tant donné deux ensembles, diverses opérations peuvent être utilisées pour créer de
É nouveaux ensembles, dont beaucoup ont leur propre abrégé.
L’intersection de deux ensembles X et Y, notée sous la forme X ∩ Y, est l’ensemble de tous
les éléments qui appartiennent tant à X qu’à Y, alors que l’union de X et de Y, notée sous la
forme X ∪ Y, est l’ensemble de tous les éléments présents dans au moins l’un des ensembles
X et Y.
L’ensemble vide, représenté comme { } ou ∅, est l’ensemble ne contenant aucun élément.
Un sous-ensemble d’un ensemble X est un ensemble dont les éléments sont tous présents en X.
Il peut inclure certains des éléments de X, ou tous. L’ensemble vide est aussi un possible sous-
ensemble de tout autre ensemble.
Le complémentaire de Y, écrit Y, est l’ensemble des éléments qui n’appartiennent pas à Y. Si
Y est un sous-ensemble de X, alors le complémentaire relatif de Y, noté X \ Y, est l’ensemble
des éléments de X qui n’appartiennent pas à Y.
Représentations simples de Venn (voir page 52) pour plusieurs opérations de base des ensembles.
Représentations de Venn
es représentations de Venn sont des diagrammes simples largement utilisés pour décrire
L les relations entre ensembles. Au plus simple, un disque représente chaque ensemble, les
intersections des disques indiquant les intersections des ensembles.
L’utilisation de telles représentations pour mettre en évidence les relations entre différentes
propositions philosophiques ou différents ensembles remonte à des siècles. Elle a été
formalisée par le philosophe britannique John Venn en 1880. Venn les appelait cercles
euleriens, en référence à un genre similaire de diagramme développé par le mathématicien
suisse Leonhard Euler au XVIIIe siècle.
Une manière classique de décrire toutes les relations possibles (voir page 49) pour trois
ensembles existe. Cependant, pour plus de trois ensembles, l’arrangement des intersections
devient rapidement bien plus complexe. Le diagramme ci-contre montre une approche de la
manière de lier six ensembles distincts.
Une solution possible pour montrer six ensembles sur une représentation de Venn.
Le paradoxe du barbier
n paradoxe est une affirmation apparemment vraie qui se contredit ou conduit à une
E situation défiant la logique. En 1901, le mathématicien britannique Bertrand Russell s’est
servi du paradoxe du barbier pour mettre en lumière les failles de la théorie élémentaire des
ensembles :
Tous les hommes d’un village soit se rasent eux-mêmes, soit sont rasés par un barbier
(lui-même homme du village). Le barbier affirme raser uniquement les hommes du village
qui ne se rasent pas eux-mêmes. Qui rase alors le barbier ?
Reformulé en termes d’ensembles, le paradoxe demande de considérer un ensemble
contenant tous les sous-ensembles qui ne sont pas leur propre élément. Cet ensemble est-il un
élément de lui-même ? La solution immédiate de tels paradoxes est de limiter la théorie des
ensembles par une série de règles ou axiomes, créant une hiérarchie d’ensembles qui ne
peuvent être des éléments que des ensembles placés au-dessus d’eux dans la hiérarchie. Bien
qu’elle ne soit pas la plus élégante des solutions, la théorie axiomatique des ensembles a été
largement acceptée.
Si le barbier se rase lui-même, son affirmation qu’il rase uniquement ceux qui ne le font pas eux-mêmes est fausse.
Si le barbier ne se rase pas lui-même, alors il affirme qu’il se rase lui-même ! De quelle manière qu’on formule la
chose, il y aura une contradiction.
Cardinalité et dénombrabilité
a cardinalité d’un ensemble fini A, écrit |A|, est le nombre d’éléments distincts qu’il
L comprend. On dit que deux ensembles, finis ou infinis, ont la même cardinalité si leurs
éléments peuvent être placés dans une correspondance bijective. Cela signifie que les éléments
de chaque ensemble peuvent être disposés deux par deux, chaque élément étant associé à un
élément, et à un seul, de l’autre ensemble.
Les ensembles dénombrables sont ceux dont les éléments peuvent être décrits par les
nombres naturels. Intuitivement, cela signifie que les éléments de l’ensemble peuvent être
listés, bien que la liste puisse être infinie. Mathématiquement, cela signifie que l’ensemble
peut être placé dans une correspondance bijective avec un sous-ensemble de nombres naturels.
Les conséquences sont étonnantes. Par exemple, un sous-ensemble strict d’un ensemble
dénombrable peut avoir la même cardinalité que l’ensemble même. Ainsi, l’ensemble de tous
les nombres pairs a la même cardinalité que l’ensemble des nombres au carré, qui à son tour a
la même cardinalité que l’ensemble des nombres naturels. On dit que tous sont
dénombrablement infinis.
L’hôtel de Hilbert
’hôtel de Hilbert est une analogie inventée par le mathématicien David Hilbert afin de
L visualiser l’idée d’infinis dénombrables. Cet hôtel imaginaire a un ensemble
dénombrablement infini de chambres, numérotées 1, 2, 3,…, et est entièrement occupé
lorsqu’un retardataire arrive et demande une chambre.
Après réflexion, le concierge demande par haut-parleur à chaque client de s’installer dans la
chambre suivante en ordre numérique. Donc, l’occupant de la chambre 1 s’installe dans la
chambre 2, celui de la 2 va dans la 3 et ainsi de suite. Pour n’importe lequel des clients
dénombrablement infinis de la chambre N, il y a toujours une chambre N + 1 où il s’installera,
de sorte qu’au moment où tous se sont déplacés, la chambre 1 se libère pour accueillir le
nouveau venu.
L’hôtel de Hilbert montre que le résultat de l’addition d’un élément à un ensemble
dénombrablement infini est toujours un ensemble dénombrablement infini, de sorte qu’il doit
y avoir des infinis dénombrables différents.
Dénombrer les nombres rationnels
ien que tous les ensembles infinis ne soient pas dénombrables, quelques ensembles très
B grands le sont. Parmi eux, les nombres rationnels – nombres formés par le rapport de
deux nombres entiers . On le prouve en examinant juste les nombres rationnels entre 0 et 1.
Si les nombres rationnels entre 0 et 1 sont dénombrables, ils doivent pouvoir être placés
dans un ordre créant une liste complète, même si elle est infinie. Ici, l’ordre ascendant naturel
de grandeur n’est pas utile, car entre deux nombres rationnels on peut toujours en trouver un
autre, de sorte qu’on ne peut même pas noter le premier et le second éléments d’une telle liste.
Y a-t-il une autre façon de lister les nombres ?
Une solution est d’ordonner les nombres d’abord selon leur dénominateur, b, puis d’après le
numérateur a, comme montré ci-contre. Cette approche est quelque peu répétitive, mais
chaque nombre rationnel entre 0 et 1 y apparaîtra au moins une fois.
Ensembles denses
a densité est une propriété décrivant les relations entre les ensembles et leurs sous-
L ensembles lorsqu’il y a une notion de distance entre les éléments des ensembles. Cela
permet d’évaluer la « grandeur » relative des différents ensembles infinis, qui est différente du
dénombrement des éléments. Par exemple, une façon de saisir la signification mathématique
de la notion que les nombres rationnels sont un ensemble « très grand » est de dire qu’ils sont
denses dans un sous-ensemble spécifique, dans ce cas celui des nombres réels, eux-mêmes
« très grands ».
Un ensemble X est dit être dense dans un autre ensemble Y si X est un sous-ensemble de Y
et si tout point de X est soit un élément de Y, soit arbitrairement proche d’un tel élément : pour
tout point de Y, on peut choisir toute distance d plus grande que 0 et trouver un point de X
situé à la distance d de ce point-là.
Par exemple, pour prouver que les nombres rationnels sont denses dans l’ensemble des
nombres réels, on choisit une distance d et un nombre réel y, puis on démontre qu’il y a
toujours un nombre rationnel x à distance d de y, ce qu’on accomplit en tronquant le
développement décimal de y.
Ensembles indénombrables
es ensembles indénombrables sont des ensembles infinis dont les éléments ne peuvent pas
L être disposés dans un ordre dénombrable. L’existence de tels ensembles signifie qu’il y a
au moins deux types d’ensemble infini, dénombrable et indénombrable ; il s’avère qu’il y a
infiniment de types différents d’ensemble indénombrable.
Comment peut-on prouver qu’un ensemble est dénombrable ? En 1891, le mathématicien
allemand Georg Cantor a démontré par la contradiction que l’ensemble des nombres réels
entre 0 et 1 est indénombrable. S’il est dénombrable, raisonnait-il, alors il y a une liste infinie
mais dénombrable de ses éléments, dont chacun peut être écrit sous la forme :
0.a1a2a3a4…
Dans ce cas, on peut créer un nombre qui n’est pas sur la liste en regardant le premier
nombre de la liste, k = 1, et en choisissant comme premier chiffre du développement décimal
de notre nouveau nombre le 7 si a11 = 6 ou, dans le cas contraire, le 6. Pour choisir le second
chiffre, on applique la même règle, mais en utilisant le second chiffre du second nombre de la
liste. Le troisième chiffre est trouvé à partir du troisième nombre, et ainsi de suite :
0,a11a12a13a14…
0,a21a22a23a24…
0,a31a32a33a34…
À la fin de ce processus infini on aura un nombre dont le développement décimal implique
uniquement les chiffres 6 et 7 et qui diffère de toute nème entrée de la liste par la nème décimale
– donc, la liste originale n’est pas complète et l’ensemble est indénombrable. C’est là
l’argument de la diagonale de Cantor.
Ensemble de Cantor
’ensemble de Cantor est le premier exemple de fractale. L’argument de la diagonale
L développé par Georg Cantor (voir page 64) montre que certains intervalles de la droite des
nombres réels sont des ensembles non dénombrables. Mais tous les ensembles non
dénombrables contiennent-ils de tels intervalles ? Cantor a montré qu’il était possible de
constituer un ensemble non dénombrable ne contenant aucun intervalle. L’ensemble de Cantor
est infiniment complexe ; il a une structure à des échelles de plus en plus infinitésimales.
Un exemple est l’ensemble triadique de Cantor obtenu en partant d’un intervalle unité et en
enlevant à chaque étape le tiers central de tous les intervalles restant. À la nème étape de la
construction, il a 2n intervalles, chacun de longueur et une longueur totale de .
Comme n tend vers l’infini, le nombre de points qu’il contient fait pareil, alors que la longueur
de l’ensemble tend vers zéro. C’est plus compliqué de montrer que quelque chose subsiste à la
limite infinie de cette subdivision et de prouver que l’ensemble est non dénombrable, mais
c’est possible.
N’importe quelle théorie axiomatique comporte des énoncés logiques qui ne peuvent être ni
prouvés vrais ni réfutés dans cette théorie.
Cela signifie que les axiomes d’une théorie, qui doivent la décrire complètement,
n’arriveront jamais à le faire, et qu’il est toujours possible d’augmenter le nombre d’axiomes.
Un second théorème implique la cohérence interne des ensembles d’axiomes :
Il est uniquement possible de prouver qu’un ensemble d’axiomes est incohérent, pas que les
axiomes sont cohérents.
Autrement dit, on ne peut jamais être sûr qu’un ensemble d’axiomes ne renferme pas de
contradiction cachée.
Les théorèmes de Gödel ont eu des implications profondes pour la philosophie des
mathématiques – mais les mathématiciens tendent en général à continuer comme si de rien
n’était.
L’axiome du choix
’axiome du choix est une règle fondamentale souvent ajoutée à la liste des axiomes
L utilisés pour définir la pensée mathématique. Il est utilisé implicitement dans l’argument
de la diagonale de Cantor (voir page 64) et de nombreuses autres démonstrations
mathématiques impliquant la supposition que les listes infinies ont une existence abstraite et
qu’un ensemble infini de choix peut être fait.
Plus précisément, ces démonstrations affirment qu’étant donné un nombre infini
d’ensembles non vides contenant plus d’un élément, il est possible de choisir une suite infinie
d’éléments avec exactement un élément de chaque ensemble. Cela peut sembler absurde, mais
l’axiome du choix permet une telle procédure.
D’autres axiomes peuvent être choisis, qui permettent à l’axiome du choix de devenir
théorème ; quelle que soit la variante employée, cet ajout à l’ensemble basique de règles
logiques est nécessaire pour rendre de tels arguments acceptables.
Théorie des probabilités
ette branche des mathématiques mesure et prédit la probabilité que certains résultats
C surviennent. C’est tant une application de la théorie des ensembles qu’une théorie
entièrement nouvelle.
Une manière d’aborder les probabilités est de traiter une série de résultats possibles comme
des éléments d’un ensemble. Prenons le cas d’une pièce de monnaie ordinaire lancée trois fois
en l’air. L’ensemble de tous les résultats possibles est représenté par des éléments formés de
trois lettres, une par lancée, avec F pour face et P pour pile. Cet ensemble a huit éléments :
Comme un de ces résultats surviendra sans faute, la somme de toutes les probabilités doit
être 1 ; si la pièce est une pièce ordinaire et si chaque résultat est également probable, dans
chaque cas la probabilité est .
On peut répondre à des questions plus compliquées sur les probabilités en tenant des
résultats spécifiques pour des ensembles qui sont à leur tour des sous-ensembles de l’ensemble
précédent de tous les résultats possibles.
Par exemple, on peut voir immédiatement que l’ensemble des résultats avec exactement
deux faces contient trois éléments, et présente donc une probabilité de .
Qu’en est-il de la probabilité qu’une pièce lancée tombe exactement face, étant donné qu’au
moins une pièce lancée est tombée pile ? Si on sait qu’au moins une pièce lancée tombe pile,
on peut limiter l’ensemble de résultats à :
Deux des sept éléments de cet ensemble sont face – la probabilité est donc .
Des arguments similaires mais plus généralisés ont permis aux mathématiciens de
développer un ensemble d’axiomes pour la probabilité, énoncés en termes de probabilité des
ensembles et d’opérations définies dans les ensembles.
Parties d’un ensemble
es parties d’un ensemble donné S sont l’ensemble de tous les sous-ensembles de S,
L incluant S lui-même et l’ensemble vide. Donc, si S = {0, 1}, alors les parties de son
ensemble, P(S), sont {∅, {0}, {1}, {0, 1}}.
Le mathématicien allemand Georg Cantor a utilisé les parties d’un ensemble pour montrer
qu’il y a infiniment de classes différentes d’infini, de plus en plus grandes, en utilisant un
argument quelque peu similaire au paradoxe du barbier, bien que plus ancien que celui-ci (voir
page 54).
L’argument de la diagonale de Cantor (voir page 64) a déjà montré l’existence d’au moins
deux types d’ensemble infini – dénombrable et indénombrable, tels que l’ensemble des
nombres réels. Cantor a montré que si S est un ensemble infini, alors ses parties seront
toujours plus grandes que S, dans le sens qu’il est impossible de faire correspondre les
éléments de S aux éléments de P(S) de sorte que chaque élément d’un ensemble soit associé à
un, et à un seul, élément de l’autre ensemble. Autrement dit, la cardinalité de P(S) est toujours
plus grande que celle de S.
Ce diagramme montre la hiérarchie des sous-ensembles dans les parties d’un ensemble {x, y, z}. Les flèches
indiquent où les sous-ensembles de P{x, y, z} sont également des sous-ensembles d’autres sous-ensembles.
Préambule aux suites
es suites mathématiques sont des listes ordonnées de nombres. Comme les ensembles
L (voir page 48), les suites peuvent être infinies. À la différence des ensembles, les éléments
ou les termes d’une suite respectent un ordre spécifique et les mêmes termes peuvent revenir
en différents points de la liste.
Les suites les plus connues sont des listes de nombres naturels, comme 1, 2, 3, … Les
termes de cette suite sont séparés par des intervalles réguliers et continuent à l’infini. Une
variante est la suite de Fibonacci, où l’espace entre les termes s’agrandit. Les deux sont des
suites divergentes. D’autres suites sont convergentes, arrivant au voisinage d’une valeur
spécifique à mesure qu’elles approchent de la limite des termes infinis.
Les termes d’une suite représentant la désintégration radioactive, où la quantité subsistante
d’un isotope radioactif diminue de moitié à intervalle régulier, sa « demi-vie » ou sa période,
se rapprochent de zéro à mesure de la progression de la suite. Cette suite convergente est
illustrée par la courbe exponentielle de la désintégration (ci-contre).
Dans beaucoup de cas, cette somme tend vers l’infini ou peut ne pas s’approcher d’une
valeur particulière. Toutefois, il y a des séries où la somme tend vers un nombre unique, la
limite. Pour voir si une série a une limite significative, on définit la somme partielle finie Sn
comme étant la somme des n + 1 premiers termes, a0 + a1 + … + an. La série convergera vers
une limite L si la suite associée de sommes partielles pour chaque n tend vers L.
Limites
a limite d’une suite ou d’une série infinie, si elle existe, est la valeur unique approchée à
L mesure que le nombre de termes de cette liste ou somme tend vers l’infini. Établir des
limites permet de comprendre le processus infini en procédant à une série d’approximations,
puis en déterminant si la suite de réponses s’approche au plus près d’une réponse unique.
Établir des limites est un important moyen de gérer les processus sans fin, chose absolument
fondamentale pour les mathématiques. Bien qu’elle ait été utilisée par les Grecs pour calculer,
entre autres, des approximations de π, ainsi que par Isaac Newton, la notion de limite n’a été
entièrement formalisée qu’au XIXe siècle.
Devenues la base de nombreux domaines des mathématiques, les limites sont utilisées
surtout par le calcul infinitésimal (voir page 208) lors de l’étude des fonctions mathématiques,
des relations entre variables ou du développement du calcul différentiel et intégral.
Paradoxe de Zénon
e
oici un des paradoxes proposés par le mathématicien grec Zénon d’Élée au siècle av.
V J.-C. :
V
La tortue et le lièvre font la course sur 3 km. Le lièvre court à une allure régulière. La
tortue, étant philosophe, s’assoit, sachant pertinemment que le lièvre n’atteindra jamais la
ligne d’arrivée.
Selon la tortue, le lièvre doit parcourir d’abord 1 km, puis la moitié du dernier kilomètre,
puis la moitié du dernier demikilomètre, et ainsi de suite. Il est sûrement impossible pour le
lièvre de parcourir ce nombre infini de distances ?
Le paradoxe de Zénon soulève des questions mathématiques et philosophiques. D’un point
de vue mathématique, le point clé est que, dans certains cas, les suites infinies de nombres
produisent une série de sommes convergeant vers une valeur finie ; si cela est vrai pour la
distance parcourue et le temps mis pour parcourir une distance finie, le lièvre devrait y arriver
sans problème.
Suite de Fibonacci
a suite de Fibonacci est un modèle créé en additionnant deux nombres afin d’en obtenir
L un troisième. Nommée d’après le mathématicien italien qui l’a introduite en Occident en
1201, elle apparaît dans plusieurs domaines des mathématiques, en plus d’être visible dans le
monde physique et naturel.
En termes mathématiques, la suite est définie comme :
Fn + 1 = Fn + Fn – 1 (avec F0 = 0 et F1 = 1)
La règle aboutit à une série de nombres débutant par : 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89…
En biologie, ces nombres sont visibles dans la relation entre les volutes de la tige d’une plante
et le nombre de feuilles disposées dessus, dans la disposition en spirale des grains d’une fleur
de tournesol et dans bien d’autres motifs naturels. La suite de Fibonacci est aussi utile dans
plusieurs contextes mathématiques, dont la solution de l’algorithme d’Euclide et le nombre
d’or (voir page 37).
Suites convergentes
es termes d’une liste ordonnée de nombres sont convergents s’ils se rapprochent
L progressivement d’une valeur ou limite spécifique. Alors qu’on peut observer qu’une
suite semble converger vers une limite, comment peut-on déterminer cette limite ? Par
exemple, les méthodes d’estimation du π reposent souvent sur une approche successive. À
mesure que la suite s’approche de plus en plus d’un nombre, on aimerait dire que c’est la vraie
valeur de π.
Si un nombre L est connu, alors une suite tend vers L si, étant donné tout taux d’erreur s, il
existe une quelconque étape après laquelle tous les termes restants sont dans un intervalle
d’erreur s de L. Karl Weierstrass et d’autres chercheurs ont découvert qu’il n’est pas
nécessaire de connaître L pour déterminer si une suite converge.
Une suite de Cauchy est une suite où, étant donné tout degré d’erreur s, il y a une
quelconque étape après laquelle deux points restants dans la suite sont dans un intervalle
d’erreur s l’un de l’autre. Pour les nombres réels, ceci équivaut à la présence d’une limite.
Tracé des suites d’une série convergente (au-dessus) et d’une série non-convergente d’oscillations (au-
dessous).
Série convergente
a somme d’une liste ordonnée de nombres est convergente si elle tend vers une valeur ou
L limite spécifique.
Intuitivement, on peut imaginer qu’une série s’approche d’une limite si la différence entre
des sommes partielles successives (la série réduite à un nombre spécifique de termes) devient
de plus en plus petite. Par exemple, si la suite de sommes partielles est (1, S1, S2, S3,… ), où
alors la différence entre S et Sn + 1 est . À mesure que n devient très grand, devient
très petit. Mais cela suffit-il vraiment pour dire que cette série, la série harmonique (voir
page 102), s’approche d’une limite ?
Il s’avère que dans ce cas Sn ne s’en approche pas, et la série est divergente. Donc, bien que
les différences successives diminuent, comme pour une suite de Cauchy convergente, cela ne
suffit pas pour garantir qu’une série converge.
Tracé de la série harmonique – même si les sommes se rapprochent peu à peu, elles ne convergent jamais vers une
limite.
Estimer π
lusieurs méthodes d’estimation de la constante irrationnelle π reposent sur une approche
P successive. Au IIIe siècle av. J.-C., le mathématicien grec Archimède de Syracuse a utilisé
une méthode séquentielle pour calculer π jusqu’à la seconde décimale.
Prenons un cercle de rayon 1, donc de circonférence 2π. Plaçons dedans plusieurs
polygones réguliers à n côtés, en commençant par un carré. Chaque n-gone peut être tenu pour
un groupe de triangles avec un angle de sommet . En divisant chacun de ces polygones
en deux, on obtient des triangles rectangles dont l’hypoténuse a la longueur 1, donc la
longueur du rayon, et un angle de . En utilisant les fonctions trigonométriques (voir
page 132), on peut calculer les autres côtés du triangle, donc le périmètre du polygone.
Bien entendu, Archimède, ne connaissant pas les valeurs des fonctions trigonométriques,
devait choisir soigneusement n. Les approches modernes utilisent une série d’approximations.
Isaac Newton a passé beaucoup de temps à calculer π jusqu’à la quinzième décimale.
Étapes de la méthode séquentielle d’Archimède pour estimer π. Les valeurs progressivement accrues de n donnent
des estimations de plus en plus justes de π.
Estimer e
a constante d’Euler, le nombre irrationnel e, a ses origines dans l’étude des suites et peut
L e
être déterminée en les utilisant. Cette constante a fait sa première apparition à la fin du
XVII siècle, lorsque Jacques Bernoulli avait résolu un problème d’intérêt composé. Dans ce cas,
tant la somme investie que l’intérêt accumulé après une durée donnée sont utilisés pour
déterminer l’intérêt payé à l’étape suivante. Si le taux d’intérêt est de 100 % par an, avec des
payements semestriels, alors pour un investissement de 1 €, l’intérêt de 50 centimes sera payé
après six mois, aboutissant à un nouveau total de 1,50 €. Après six autres mois, 75 autres
centimes seront payées, aboutissant à un total de 2,25 €. Plus généralement, pour une année
divisée en n périodes égales de temps, le gain global est donné par la formule :
Bernoulli a noté qu’à mesure que n augmente, cette expression converge vers la valeur que
nous appelons constante d’Euler : approximativement 2,71828182846.
Itération
’itération est un processus mathématique où une règle, une action ou une instruction est
L répétée. Cette répétition peut générer une suite. Les méthodes itératives sont souvent
utilisées dans l’analyse numérique, l’étude des méthodes traduisant les problèmes
mathématiques en langage informatique.
Les domaines des systèmes dynamiques et de l’étude du chaos décrivent la manière dont les
états d’un système évoluant quand des règles simples sont appliquées de manière itérative.
Dans toutes ces applications, il est important de comprendre le degré auquel différentes
valeurs initiales peuvent affecter le résultat final, chose pas toujours facile.
Prenons un nombre entier positif x. S’il est impair, on le multiplie par 3 et on ajoute 1. S’il
est pair, on le divise par 2. On applique de nouveau la règle, arrêtant le processus seulement si
la suite arrive à 1. Chaque valeur initiale de x qui a été testée s’arrête après une durée de temps
finie. En 1937, le mathématicien allemand Lothar Collatz a conjecturé que cela est vrai pour
chaque valeur possible de x, ce qui reste encore à prouver.
Diagramme des orbites de Collatz où les nombres jusqu’à 30 approchent la fin de la suite à 1. Le nombre 27 est
omis pour des raisons pratiques – il lui faut 95 étapes supplémentaires pour rejoindre ce diagramme, auquel il se
connecte au nombre 46.
Progressions arithmétiques
ne progression arithmétique est une liste ordonnée de nombres où la différence entre
U termes successifs est une constante. Un exemple est 0, 13, 26, 39, 52…, où la différence
commune constante est 13. Si cette différence commune est positive, une suite tendra à
l’infini. Si le terme commun est négatif, la suite tend vers un infini négatif. La théorie de
Green-Tao (voir page 316) récemment prouvée décrit la prévalence de longues progressions
arithmétiques de nombres premiers.
Les sommes partielles d’une progression arithmétique sont relativement simples à calculer
en utilisant une petite astuce. Par exemple, quelle est la somme des nombres de 1 à 100 ? La
manière facile de la calculer est de lister deux fois les nombres, une fois de gauche à droite,
une fois de droite à gauche, dans des colonnes dont la somme sera 101. Puisqu’il y a 100
colonnes, la somme totale sera 100 multiplié par 101, divisé par 2. En général, cela montre que
la somme de toute progression arithmétique est donnée par la formule :
a + 2a + 3a + … + na = a(n + 1).
Progressions géométriques
ne progression géométrique est une liste ordonnée de nombres où chaque terme successif
U est le produit du terme précédent et d’un nombre constant. Un exemple est 1, 4, 16, 64,
256, … où le facteur multipliant constant, le ratio commun (ou raison de la suite) r, est 4.
La somme partielle d’une progression géométrique est Sn = a + ar + ar 2 … + ar n. Si le
module de r est plus grand que 1, la série géométrique diverge vers plus ou moins l’infini ; si
le module de r est plus petit que 1, la série géométrique tend vers la limite S = .
Les progressions géométriques apparaissent dans de nombreux problèmes mathématiques et
sont essentielles pour l’étude de l’intérêt composé et de la valeur comptable. Beaucoup de
mathématiciens diront qu’ils peuvent résoudre aussi le paradoxe de Zénon (voir page 84), car
les sommes de la distance parcourue et du temps mis par le lièvre pour ce faire sont des
progressions géométriques dont la somme est la distance du trajet.
Dans le diagramme ci-dessus, la superficie des rectangles représente la progression géométrique avec un ratio
commun de 1/2, montrant clairement que la série infinie converge vers une valeur de 2.
Série harmonique
a série harmonique est la somme d’une suite infinie de fractions diminuant régulièrement.
L Importante pour la théorie de la musique, elle est définie comme :
La série harmonique est importante dans la musique, car elle donne les divers modes de vibration pour une corde
fixée aux deux extrémités, qui est pincée ou frappée.
Séries et approximations
lusieurs des nombres fondamentaux des mathématiques apparaissent en tant que sommes
P infinies, si bien que ces séries peuvent être utilisées pour trouver des approximations des
nombres comme π, e et certains logarithmes naturels.
La série harmonique, , est un bon point de départ. En remplaçant par un
signe moins un signe plus sur deux, la somme converge vers la valeur du logarithme naturel de
2. Et en remplaçant le dénominateur de chaque fraction par son carré, la somme converge vers
le nombre . En fait, chaque somme des puissances paires converge vers une constante
connue multipliée par une puissance de π2. Les sommes des puissances impaires convergent
aussi, mais vers des nombres dépourvus d’expression « fermée » connue.
Enfin, si on remplace chaque dénominateur par sa factorielle, la somme converge vers e.
Une factorielle, représentée par le symbole !, est le produit d’un nombre multiplié par tous les
nombres positifs plus petits que lui. Donc : 3! = 3 × 2 × 1 = 6 et 5! = 5 × 4 × 3 × 2 × 1 = 120.
Série entière
ne série entière est la somme des termes d’une liste ordonnée, où ces termes impliquent
U des puissances positives croissantes d’une variable x. La progression géométrique
1 + x + x2 + x3 + x4 + …
est un cas particulier, où les coefficients de chaque terme sont égaux à 1. La série entière est
bien plus générale qu’elle le semble, et beaucoup de fonctions peuvent être écrites sous cette
forme. Si tous les coefficients au-delà d’un terme donné sont égaux à zéro, alors la série
entière est finie et forme un polynôme (voir page 184).
La série entière peut-elle converger ? En utilisant la théorie des progressions géométriques
(voir page 100), on peut dire que si x est compris entre –1 et 1, la somme partielle pour la série
ci-dessus converge vers . Bien entendu, toutes les séries entières n’obéissent pas à de
telles règles, mais les comparaisons avec des progressions géométriques simples peuvent
souvent servir à déterminer si c’est ou non le cas.
Préambule à la géométrie
a géométrie est l’étude de la forme, de la taille, de la position et de l’espace. Dans sa
L forme classique due au mathématicien grec Euclide vers 300 av. J.-C., elle repose sur des
listes d’objets et des suppositions, les axiomes, dont découlent tous les résultats.
Son livre Éléments énumère cinq axiomes ou postulats :
1. Une droite peut être conduite entre deux points.
2. Une droite finie peut être prolongée par continuité en une droite.
3. On peut décrire un cercle d’un point quelconque et avec un intervalle quelconque.
4. Deux angles droits sont égaux entre eux.
5. Par un point du plan on ne peut mener qu’une parallèle à une droite.
Notons que les axiomes d’Euclide utilisent nombre de termes, comme ligne, angle droit et
rayon, sans les expliquer ou les définir. De nouveaux axiomes ont été introduits à la fin des
années 1800 pour développer la géométrie dans un cadre rigoureusement logique.
Droites et angles
es droites et les angles sont deux des notions les plus fondamentales de la géométrie. Le
L cinquième axiome d’Euclide dit que par un point du plan on ne peut mener qu’une
parallèle à une droite. Autrement dit, les lignes typiques se coupent, les lignes parallèles ne se
coupant pas sont inhabituelles.
Le concept d’angle a émergé comme outil décrivant la manière dont les lignes se coupent.
Supposons que deux lignes se coupent en un point P, comme montré ci-contre. Dans ce cas,
les lignes divisent en quatre segments un cercle centré sur P. Si ces segments ont une aire
égale, les lignes sont dites perpendiculaires et les angles sont des angles droits. Cela se
rapporte au quatrième axiome d’Euclide.
Dans les cas plus généraux, les angles sont mesurés en degrés. À travers les fonctions
trigonométriques (voir page 132), les angles jouent par ailleurs un rôle fondamental dans des
domaines apparemment sans rapport avec la géométrie.
Mesurer les angles
’un point de vue historique, mesurer les angles entre deux lignes implique de tracer un
D cercle autour de leur point d’intersection et de diviser celui-ci en plusieurs segments
égaux. Les astronomes mésopotamiens ont introduit l’emploi de 360 telles divisions, les
degrés actuels. Ils ont aussi subdivisé les unités des degrés en 60 minutes égales, chacune
comportant 60 secondes identiques. Pour éviter la confusion avec les unités de temps, ces
subdivisions sont souvent appelées minutes d’arc et secondes d’arc. Ainsi, on mesure un angle
en déterminant combien de degrés, minutes et secondes le forment.
Les nombres 60 et 360 sont très faciles à utiliser dans ce contexte, puisque 60 peut être
divisé par 1, 2, 3, 4, 5 ou 6 et aboutir toujours à un nombre entier. Toutefois, des unités
spécifiques ne sont pas essentielles pour mesurer les angles. L’idée fondamentale est qu’un
angle peut être tenu pour la proportion du cercle encadrée par les deux lignes qui le forment.
Cercles
n cercle est défini comme l’ensemble de points se trouvant à une distance égale, le rayon
U r, d’un point central P. Il est l’une des figures élémentaires sous-entendues dans les
axiomes d’Euclide. La courbe fermée passant par tous les points externes est la circonférence
du cercle. La longueur de la circonférence C est liée au rayon r par l’équation C = 2πr, alors
que l’aire A du cercle est définie par l’équation A = πr 2. De cette manière, le cercle conduit
inévitablement à π, l’une des deux grandes constantes des mathématiques (voir page 40).
Le cercle définit aussi d’autres courbes, lignes et aires. Un arc est une partie limitée de la
circonférence, alors qu’un secteur est une région du cercle délimitée par deux rayons et un arc.
Une corde est une ligne droite traversant le cercle entre deux points de sa circonférence, un
segment, une aire du cercle délimitée par la circonférence et une corde. Une sécante est une
corde élargie – une ligne droite coupant le cercle en deux points – une tangente, une ligne
droite qui touche le cercle en un seul point.
Aspects des cercles. Le rayon du cercle, sa circonférence et son aire sont étroitement liés à la définition de la
constante π. Diverses lignes géométriques et aires sont également dérivées des cercles.
Radians
n tant qu’alternative aux degrés, minutes et secondes d’arc traditionnels, les
E mathématiciens expriment souvent les angles en unités de mesure appelées radians.
Reposant sur la géométrie d’un cercle, les radians présentent de nombreux avantages, facilitant
en particulier le maniement des fonctions trigonométriques (voir page 132).
La signification intuitive des radians est mieux comprise en considérant un cercle de rayon
1. Exprimé en radians, l’angle entre deux lignes est égal à la longueur de l’arc formé entre
elles par le cercle de rayon 1, centré sur leur intersection.
Comme la circonférence d’un cercle est donnée par C = 2πr, si r = 1 alors C = 2π. Donc, un
segment x du cercle a θ radians d’angle, où θ = 2πx.
Par exemple, diviser le cercle en quatre segments égaux donne un angle droit, qui est égal à
2π multiplié par ou radians.
Conséquence claire : si un secteur d’un cercle de rayon r, disons une part de gâteau, a un angle de θ radians, alors
la longueur de l’arc circulaire du gâteau est rθ. Les angles mesurés en radians offrent une manière simple de
mesurer les longueurs de l’arc.
Triangles
n triangle peut être défini par trois points qui ne se trouvent pas sur la même ligne droite.
U Le triangle est simplement la région entourée par les trois segments de ligne connectant
ces points.
L’aire d’un triangle peut être calculée en traçant autour de lui des rectangles. Si on choisit
un côté comme base du triangle et si on définit la hauteur comme la distance perpendiculaire
depuis le troisième sommet du triangle à sa base, alors son aire est égale à la moitié du produit
de la hauteur et de la longueur de la base.
Les triangles et leurs généralisations dans les dimensions multiples sont souvent des moyens
simples de décrire les corps plus complexes. Par exemple, beaucoup d’objets peuvent être
modelés en accolant des triangles. Cette idée est familière aux ingénieurs, qui décomposent
des formes compliquées telles que les murs curvilignes dans des triangles rectangles afin de
leur conférer une plus grande force.
Types de triangle
l existe plusieurs types de triangles, chacun portant un nom spécifique. Dans chaque
I triangle, la somme des angles internes est π radians (ou 180°), et une relation précise existe
entre la taille des angles et les longueurs relatives des côtés.
Un triangle équilatéral a trois côtés égaux, ce qui signifie aussi que ses trois angles sont
égaux. Comme la somme des angles est π radians, chaque angle doit être égal à ou 60°. Un
triangle isocèle a deux côtés égaux, donc deux angles égaux.
Un des angles d’un triangle rectangle est droit, ou 90° ; un triangle scalène a trois côtés
de différentes longueurs et trois angles de tailles différentes.
Centre d’un triangle
l y a plusieurs manières différentes de définir le centre d’un triangle. Par exemple, ce peut
I être un point équidistant des trois sommets, le centre du plus grand cercle inscrit dans un
triangle ou le centre d’un cercle circonscrit à un triangle (passant par tous les sommets de
celui-ci). Ce sont toutes des définitions naturelles, même si elles peuvent ne pas coïncider
dans les mêmes positions.
L’un des plus utiles centres du triangle est le centre de gravité. Si on trace une ligne à partir
de chaque sommet d’un triangle jusqu’au point bissecteur du côté opposé, alors le centre de
gravité est le point où les trois médianes se rencontrent. Le fait que ces trois lignes se
rencontrent dans un point unique n’est pas complètement évident. Le centre de gravité marque
un point qui serait le centre de masse si le triangle était découpé dans un matériau à la densité
uniforme. Si on suspend un tel triangle depuis tout autre point, il trouvera une position
d’équilibre, où le centre de gravité sera en dessous du point d’où il est suspendu, sur une ligne
verticale passant par celui-ci.
Deux triangles congruents peuvent être identifiés par divers critères, comme avoir au moins deux côtés identiques
et un angle identique, comme montré ici. Malgré cela, ces deux triangles congruents ne peuvent pas être
superposés.
Théorème de Pythagore
ien qu’elle soit nommée d’après le mathématicien grec Pythagore de la fin du VIe siècle
B av. J.-C., cette célèbre relation entre les longueurs des côtés d’un triangle rectangle était
presque assurément connue des siècles plus tôt chez les Babyloniens.
Le théorème prône que le carré du côté le plus long, l’hypoténuse, est égal à la somme des
carrés des longueurs des deux autres côtés. Une démonstration simple reposant sur les rapports
des côtés de triangles semblables est montrée ci-contre, mais le théorème peut aussi être
démontré en considérant les aires des carrés géométriques construits sur chaque côté du
triangle.
Le théorème de Pythagore est un outil important de la géométrie. Plusieurs définitions de la
distance en coordonnées cartésiennes (voir page 160) sont basées sur cette relation, qui peut
être reformulée en termes de relation entre les fonctions trigonométriques sinus et cosinus
(voir page 136).
La similitude des triangles ABC et CHB d’une part, et ABC et CAH de l’autre, implique : et .
D’où : a2 = ec et b2 = dc, ou : a2 + b2 = (e + d )c = c 2
Sinus, cosinus et tangente
es triangles rectangles permettent d’associer des fonctions aux angles, via les rapports des
L longueurs des côtés. Ces fonctions trigonométriques sont le sinus, le cosinus et la
tangente.
Pour définir ces fonctions, on choisit l’un des angles, θ, différent de 90°. Il est formé par
l’intersection de l’hypoténuse de longueur H et du côté adjacent de longueur A. Le côté restant
à l’opposé de l’angle a la longueur O. Le sinus, le cosinus et la tangente sont définis par les
rapports :
Puisque deux triangles rectangles avec un même angle θ sont des variantes l’un de l’autre
remises à échelle, les fonctions ont la même valeur, indépendamment de la taille du triangle.
Qui plus est, puisque , on peut voir que
Alors que l’hypoténuse d’un triangle rectangle est toujours le côté le plus long, les côtés opposé et adjacent sont
définis par rapport à l’angle considéré.
Triangulation
a triangulation est une méthode permettant de calculer les propriétés complètes d’un
L triangle à partir de la mesure d’un seul côté et d’un angle. Elle repose sur les fonctions
trigonométriques, sinus, cosinus et tangente.
Imaginons un prince tentant d’entrer chez la princesse Rapunzel au sommet de sa tour
dépourvue de porte. Comment peut-il déterminer la hauteur d de sa fenêtre, et quelle longueur
doit avoir la chevelure de Rapunzel pour arriver jusqu’au sol ? Il se tient à une distance l de la
tour et mesure l’angle θ entre la base de la tour et la fenêtre.
En supposant que la tour est verticale, sa fenêtre et sa base, ainsi que la position du prince,
forment les sommets d’un triangle rectangle. Le prince connaît l’angle θ et le côté adjacent l,
et veut déterminer d, le côté opposé à l’angle θ. Introduisant ces valeurs dans la formule de la
tangente, on obtient :
Identités trigonométriques
es identités trigonométriques sont des expressions impliquant les fonctions sinus, cosinus
L et tangente valables pour tous les angles. Étant donné tout triangle rectangle avec un angle
θ, une longueur opposée O, une longueur adjacente A et une hypoténuse H, le théorème de
Pythagore prône que O2 + A2 = H2. Diviser les deux côtés de cette équation par H 2 donne :
sin2θ + cos2θ = 1
pour tout angle θ. Notons que la forme sin2θ montre qu’on parle du carré du sinus de θ, et non
du sinus de θ2. Cette identité est vraie pour toutes les valeurs de θ, en plus de dire quelque
chose d’utile à propos des fonctions mêmes. Notons qu’il s’agit en fait d’une reformulation du
théorème de Pythagore.
Pour un triangle rectangle dont on connaît la longueur de l’hypoténuse H et l’angle a, l’application du sinus et du
cosinus permet de trouver facilement les longueurs des autres côtés.
Règles du sinus/cosinus
es règles du sinus et du cosinus sont des formules reliant les angles et les côtés des
L triangles en général. La notion de congruence (voir page 128) montre que deux côtés et
l’angle entre eux décrivent un triangle, de sorte qu’on peut trouver les autres angles et l’autre
côté à partir de cette information.
Pour un triangle aux côtés et aux angles tels que ceux montrés ci-contre, les règles sont :
(règle du sinus)
c2 = a2 + b2 – 2ab cos C (règle du cosinus)
Si C est un angle droit, alors cos C = 0 et la règle du cosinus est juste le théorème de
Pythagore. On peut donc considérer que la règle du cosinus corrige le théorème de Pythagore
pour les cas où C n’est pas un angle droit.
Formules de l’angle double
es formules de l’angle double permettent de calculer les sinus et les cosinus des additions
L des angles. Elles permettent aussi d’élargir l’utilité des sinus et des cosinus au-delà de la
gamme des angles (0-90°) d’un triangle.
Les formules sont déterminées à partir des triangles formés de deux triangles accolés,
comme montré ci-contre :
Les formules de l’angle double permettent de calculer les sinus et les cosinus des angles combinés, comme A et B dans
ces deux triangles.
Introduction à la symétrie
n objet (une image) est symétrique si sa forme reste essentiellement la même lorsqu’il est
U déplacé ou transformé.
En géométrie, les transformations utilisées pour définir la symétrie sont celles conservant la
longueur : réflexions, symétries inversées pareilles à une ligne (géométrie bidimensionnelle)
ou à un plan (géométrie tridimensionnelle), rotations, où l’objet est déplacé autour d’un plan
ou tourné autour d’un axe, et translations, où l’objet est déplacé dans une direction donnée.
Ces actions peuvent aussi être combinées. Si l’application d’une transformation donnée à un
objet ne semble pas changer celui-ci, l’objet est invariant.
La symétrie est aussi utile dans d’autres domaines des mathématiques, où toute opération
sur un objet mathématique peut être considérée comme étant symétrique si elle préserve une
propriété donnée de cet objet-là. C’est un important concept utilisé pour de la définition des
groupes d’opérations (voir page 268).
Translation, rotation, réflexion
a géométrie connaît trois types basiques de symétrie, transformations d’un objet en
L préservant sa forme essentielle.
Les translations déplacent la forme dans une direction donnée, sans changer les longueurs
ou les angles la caractérisant, tout comme les rotations, qui font tourner la forme autour d’un
point du plan.
En deux dimensions, les réflexions reflètent la forme à travers une ligne donnée, l’axe de
symétrie. Alors que d’autres translations peuvent être achevées en faisant glisser une forme
autour de son plan, la réflexion ne peut être achevée qu’en sortant une forme du plan et en la
retournant. Une fois de plus, les longueurs ou les angles ne changent pas. Dans certaines
circonstances, l’inclusion des réflexions dans la définition d’une symétrie est inappropriée. Par
exemple, les deux côtés d’une pièce de puzzle ne sont pas équivalents, car un côté montre
l’image, un côté est vierge.
Bien entendu, avec une telle liberté de placer des faces, il y a davantage de types de
polyèdres que de types de polygones.
Pavages
es formes bidimensionnelles pavent une zone si elles peuvent être parfaitement placées
L côte à côte sans laisser d’espaces entre elles ou se chevaucher. Parmi les polygones
réguliers, seuls le carré à quatre faces et l’hexagone à six faces peuvent paver à eux seuls
l’ensemble d’une zone.
Des pavages plus compliqués peuvent être construits en utilisant des combinaisons de
formes. Le plus simple, appelé pavage périodique, montre une symétrie translationnelle,
autrement dit le modèle peut être déplacé dans une direction donnée, de sorte qu’il s’adapte
précisément à lui-même.
Parmi les polyèdres réguliers, seul le cube peut paver un espace tridimensionnel. En
recourant à des polyèdres plus compliqués, il est possible d’obtenir infiniment plus de
pavages, les nids d’abeille. Ceux-ci sont importants dans la cristallochimie, où les sommets
des polyèdres marquent les positions des atomes dans le cristal. L’analyse des nids d’abeille
révèle 230 pavages distincts, gamme des structures cristallines possibles.
Pavages de Penrose
es pavages de Penrose sont un type particulier de pavages utilisant deux formes de base
L différentes. Découverts au milieu des années 1970 par le physicien britannique Roger
Penrose, ces pavages apériodiques ne se répètent pas selon un modèle périodique.
Remarquablement, on a prouvé que ces objets abstraits ont une application naturelle. Au
début des années 1980, les spécialistes des matériaux ont découvert les structures
apériodiques, les quasi-cristaux, dont la description mathématique est similaire. Ces quasi-
cristaux peuvent être utilisés comme revêtements durs pour d’autres matériaux et présentent
une friction très faible.
Les plus simples pavages de Penrose sont construits en utilisant comme formes basiques un
rhombe « gros » et un rhombe « mince » (voir ci-contre). Un rhombe est une forme à quatre
côtés égaux, où chaque paire de côtés opposés est parallèle. On ne sait pas s’il est possible de
trouver une forme unique susceptible d’être assemblée en présentant les mêmes propriétés.
Sphères
Une sphère est l’équivalent tridimensionnel d’un cercle, un objet géométrique parfaitement
rond. Si la sphère a un cadre fixe de référence, par exemple l’axe polaire de la Terre, alors tout
point de sa surface peut être décrit par deux angles. Dans le cas de la Terre, il s’agit de la
longitude et de la latitude. La latitude est l’angle entre une ligne joignant le point concerné au
centre de la sphère, appelé rayon, et l’axe principal. La longitude est l’angle entre le rayon de
latitude et une ligne partant d’un point de référence défini, comme le méridien d’origine de la
Terre.
Les rayons partant de la limite de toute aire partielle de la sphère forment un cône au centre.
La superficie de celui-ci, son angle solide, est une mesure de la surface sur laquelle ce cône se
projette radialement sur une sphère de rayon unité. Puisque l’aire globale d’une sphère est
donnée par la formule 4πr2, l’aire de cette sphère-là est simplement 4π.
Représenter la surface d’un objet sphérique sur un feuille de papier exige de faire des choix : l’image doit-elle être
telle que le rapport des deux aires est le même, les lignes de latitude doivent-elles être droites, ou une quelconque
autre mesure doit-elle être préservée ? Cela conduit à des représentations bidimensionnelles différentes de la même
surface courbe.
Géométries non euclidienne et non classique
a géométrie non euclidienne est basée sur une surface ou un espace différent des plans
L familiers de la géométrie euclidienne (voir page 108). Dans ces circonstances, le
cinquième axiome d’Euclide – par un point du plan on ne peut mener qu’une parallèle à une
droite – ne s’applique pas. Par exemple, considérons la géométrie d’une surface sphérique. Ici,
une ligne devient un arc d’un grand cercle autour de la circonférence de la sphère. Si on
choisit un point qui n’est pas situé sur cette ligne, tout autre grand cercle passant par le
nouveau point coupera le cercle d’origine. Il n’y a donc pas de lignes parallèles sur la surface
d’une sphère !
La géométrie non euclidienne comprend la géométrie elliptique à courbure positive, comme
la surface d’une sphère, et la géométrie hyperbolique à courbure négative, comme la selle
montrée ci-contre. Dans les géométries non classiques, plusieurs lignes passant par un point
donné sont parallèles à une ligne donnée.
Disposition des sphères
e problème de la disposition des sphères concerne leur arrangement le plus efficace dans
L une boîte – les sphères doivent-elles être disposées de sorte à minimiser l’espace libre
subsistant ?
Malgré son importance relative pour un négociant expédiant des oranges par bateau, ce
problème a une riche histoire, avec les oranges remplacées par des boulets de canon. Au XVIIe
siècle, l’astronome allemand Johannes Kepler a conjecturé que la meilleure configuration
simple était obtenue en partant d’une rangée horizontale de sphères disposées en carré, au-
dessus de laquelle on plaçait une autre rangée dans les intervalles créés par la première, et
ainsi de suite. Kepler a calculé que cela occupait un peu plus de 74 % de l’espace disponible –
le même que l’arrangement hexagonal apparenté.
Il a été très difficile de prouver que ces deux arrangements sont effectivement les meilleurs.
Une démonstration minutieuse par ordinateur, analysant les innombrables cas spéciaux
distincts, a été achevée en 2003.
Sections coniques
es sections coniques, comme les lignes et les plans, ont été à la base de la géométrie
L grecque. Elles émergent du découpage de tranches dans un cône tridimensionnel, créant
un ensemble de courbes géométriquement belles.
Si l’axe du cône est vertical, avec un sommet en O, alors :
• Un cercle est form par l’intersection du c™ne avec tout plan horizontal ne passant pas
par O.
• Une parabole est cre par l’intersection du c™ne avec un plan parallle au c™ne, qui ne
passe pas par O.
• Une ellipse est cre par l’intersection du c™ne avec un plan non horizontal ne passant pas
par O, si l’angle de ce plan est plus grand que l’angle du c™ne.
• Deux hyperboles sont formes comme dans le cas précédent, si l’angle du plan est plus
petit que l’angle du c™ne.
Le cas spécial des plans passant par O donne un seul point ou une ou deux lignes droites.
Coordonnées cartésiennes
es coordonnées cartésiennes représentent la position d’un point dans un plan grâce à deux
L nombres qui décrivent la manière d’atteindre ce point à partir d’une origine arbitraire.
Introduites au XVIIe siècle par le philosophe et mathématicien français René Descartes, elles
agissent d’une manière assez semblable aux systèmes de coordonnées utilisés pour les cartes
et permettent de décrire plus facilement les objets géométriques.
Dans un plan bidimensionnel, un point a les coordonnées (x, y), autrement dit on doit se
déplacer de x unités horizontalement, puis de y unités verticalement. Les points négatifs
comme (–1, –2) impliquent un déplacement dans les directions opposées.
Pareillement, en trois dimensions, trois coordonnées (x, y, z) précisent la position des points.
Il est facile de voir comment les mathématiciens peuvent ainsi décrire les espaces n-
dimensionnels indiqués par n coordonnées, même si de tels espaces multidimensionnels sont
difficiles à visualiser.
Illustrations du système de coordonnées cartésiennes en deux dimensions (au-dessus) et en trois dimensions (à
droite).
Algèbre
’algèbre élémentaire est l’art de manipuler les expressions mathématiques où les quantités
L sont représentées par des symboles ; l’algèbre abstraite concerne la théorie des structures
mathématiques telles que les groupes (voir page 268). L’utilisation des symboles à la place des
nombres permet la généralisation, x étant l’option la plus traditionnelle quand on en vient à la
représentation d’un nombre inconnu ou arbitraire. En faisant appel à cette approche, on peut
manipuler les expressions et réécrire les relations entre quantités de manière plus concise.
Par exemple, on cherche le nombre qui, ajouté à 3, aboutit à un total de 26. Bien entendu,
on peut le trouver instinctivement ; mathématiquement cependant, on utilise une lettre pour
représenter cette inconnue et on formule le problème dans l’équation x + 3 = 26. Cet exemple
banal montre que déduire 3 des deux côtés de l’équation aboutira à la réponse sous la forme
x = 26 – 3. C’est cela l’algèbre, même si le processus est d’habitude un peu plus complexe.
Équations
ne équation est une expression mathématique énonçant qu’une chose est égale à une
U autre. Donc, 2 + 2 = 4 est une équation, tout comme E = mc 2 ou x + 3 = 26. Chacun de
ces exemples est subtilement différent. Le premier est une identité – qui est toujours vraie. Le
second est une relation, définissant E en termes de m et c, alors que le troisième est une
équation vraie seulement pour certaines valeurs de x. Dans la plupart des contextes
algébriques, au moins un côté de l’équation implique des éléments inconnus, d’habitude notés
x, y ou z. Beaucoup de techniques algébriques visent à résoudre des équations pour trouver ces
éléments inconnus.
Les disciplines plus quantitatives, comme les sciences, l’économie, divers domaines de la
psychologie et de la sociologie, décrivent des situations réelles en termes d’équations. Pour la
physique, les lois du mouvement de Newton décrivant l’interaction des masses et des forces,
sont écrites sous forme d’équations impliquant des dérivées (voir page 208) ainsi que des
nombres. Dans des modèles économiques, les équations lient le prix des biens à l’offre et à la
demande.
L’équation d = ut + at 2 est bien connue en physique, où elle se rapporte à la distance d parcourue par un corps
ayant la vitesse initiale u, soumis à une accélération constante a. Dans cet exemple graphique, la distance est
déterminée par rapport au temps et l’accélération est négative, résultant, par exemple, dans la courbe parabolique
typique d’un projectile tiré vers le haut.
Manipulation des équations
es équations peuvent être simplifiées et, dans certains cas, résolues, grâce à une
L quelconque manipulation. La façon de représenter les équations respecte certaines
conventions. L’une des plus habituelles est d’exclure les signes de multiplication en raison de
l’omniprésence du x en tant que symbole universel pour les variables inconnues. Donc, au lieu
d’écrire x × y, on écrit xy ; E = mc 2 signifie E = m × c × c. Les parenthèses sont utilisées pour
clarifier les expressions susceptibles de dérouter.
Par exemple, l’expression 2 × 3 + 5 × 4 est ambiguë : la réponse dépend de l’ordre de
traitement des opérations. Les parenthèses indiquent l’ordre à suivre : on commence par les
expressions simples comprises dans le plus grand nombre de parenthèses, puis on travaille
vers l’extérieur.
Ainsi, (2 × 3) + (5 × 4) donne un résultat différent de 2 × (3 + 5) × 4 et 2 × (3 + (5 × 4)). Les
parenthèses ne sont pas toujours nécessaires, par exemple dans les opérations associatives
comme la multiplication, où a × b × c donne le même résultat que a × (b × c) et (a × b) × c.
Système d’équations
es systèmes d’équations sont des ensembles d’équations comportant plusieurs inconnues.
L Un exemple est celui de deux équations comportant deux inconnues, comme 2x + y = 3,
x – y = 1. En résolvant ces deux équations de concert, on trouve chacune des inconnues.
Si on réarrange la seconde équation selon les règles de la manipulation algébrique, on peut
exprimer x en tant que 1 + y. En utilisant cette valeur pour x dans la première équation, on voit
que 2(1 + y ) + y = 3, donc 2 + 2y + y = 3 ou 2 + 3y = 3. En réarrangeant cette expression, on
voit que 3y = 3 – 2 ou y = . Si on insère cette valeur pour y dans la seconde équation, on
détermine maintenant que x a une valeur de .
En général, une équation est nécessaire pour chaque inconnue, bien que cela ne garantisse ni
une solution, ni l’unicité d’une solution. D’un point de vue géométrique, les deux équations ci-
dessus sont linéaires : elles décrivent des lignes droites. Donc, résoudre deux équations
linéaires est la même chose que trouver le point d’intersection de deux lignes.
Équations et graphes
eprésenter graphiquement une équation montre la façon dont la valeur d’une variable
R change à mesure de la modification de l’autre. Cela repose sur l’idée que toute équation
liant deux variables réelles peut être vue comme une relation entre des coordonnées
cartésiennes bidimensionnelles, x et y. Une équation peut donc être interprétée comme une
courbe représentant les valeurs correspondantes de x et de y déterminées par cette équation-là.
L’équation y = x2 génère une courbe parabolique de points (ci-contre). Les équations plus
compliquées créent des courbes plus complexes, même si pour chaque x plusieurs valeurs
correspondantes de y (ou aucune) peuvent exister.
Lorsque deux systèmes d’équations sont tracés sur les mêmes axes, les intersections
marquent les points où x et y vérifient les deux équations. Ainsi, la solution du système
d’équations est essentiellement une question de déterminer les points d’intersection des
courbes : l’algèbre et la géométrie se rencontrent.
Trouver les solutions où les variables sont définies par deux équations est essentiellement le même problème que
trouver graphiquement leurs intersections.
L’équation d’une droite
oute ligne droite dans le plan peut être écrite soit x = a, où a est constante (c’est le cas
T particulier d’une ligne verticale), soit dans la forme plus standard y = mx + c, où m et c
sont constantes. La constante m représente la pente de la ligne droite et c est la valeur de y au
point où la ligne rencontre l’axe y.
La pente de la ligne, calculée en considérant deux points situés sur elle, est égale au
changement de hauteur entre ces points, divisé par le changement de la position horizontale
entre eux. Mathématiquement, étant donné deux points distincts (x1, y1) et (x2, y2), alors
. La pente du graphe ci-contre est .
Les deux équations x = a et y = mx + c peuvent être écrites sous la forme plus générale
rx + sy = t pour les constantes r, s et t. C’est sous cette forme que l’équation d’une ligne droite
se présente souvent dans les systèmes d’équations linéaires (voir page 170).
L’équation d’un plan
n plan est une surface bidimensionnelle dans un espace tridimensionnel. L’équation d’un
U plan est la généralisation tridimensionnelle de l’équation d’une ligne : ax + by + cz = d,
où a, b, c et d sont constantes et où au moins une, a, b ou c, est différente de zéro. Comme on
travaille maintenant en trois dimensions, une variable supplémentaire, z, est nécessaire pour
décrire la troisième direction.
Dans le cas particulier où a = b = 0, l’équation se réduit à cz = d, ou . Puisque c et d
sont constantes, z est aussi constante, si bien que ce plan est une surface horizontale de hauteur
constante z, sur laquelle x et y peuvent prendre n’importe quelle valeur.
La solution des trois systèmes d’équations linéaires à trois variables représente
l’intersection des trois plans, d’habitude un point ; certains cas n’ont aucune solution (deux
plans parallèles et non identiques) ou infiniment de solutions : soit une ligne de solutions, soit
un plan de solutions.
Un plan est un objet bidimensionnel orienté dans l’espace tridimensionnel. Ici, l’axe x représente le plan horizontal,
l’axe z, le plan vertical, tandis que l’axe y est perpendiculaire au plan de la page.
L’équation d’un cercle
n cercle est défini comme l’ensemble de points situés à une distance fixe par rapport à un
U point donné. En termes algébriques, il peut être décrit sous la forme d’une équation.
Si le centre d’un cercle est défini comme l’origine d’un système de coordonnées
cartésiennes (0, 0), on peut se servir du théorème de Pythagore pour trouver les coordonnées
d’un point arbitraire situé sur le périmètre du cercle (x, y). Tout rayon r liant le centre au point
(x, y) peut être traité comme l’hypoténuse d’un triangle dont les autres côtés ont la longueur x
et y.
Ainsi, pour un rayon fixe r, on peut écrire x2 + y2 = r2 et définir le cercle comme étant
l’ensemble de points dont les coordonnées répondent à cette condition – l’équation d’un
cercle. Cette équation fournit le point de départ pour les équations des diverses sections
coniques (voir page 158).
Paraboles
ne parabole est une section conique obtenue en coupant un cône avec un plan parallèle à
L sa surface. Elle a une seule valeur, maximale ou minimale ; en algèbre, elle est définie par
une équation où une variable est égale à une fonction du second degré de l’autre,
y = ax2 + bx + c.
L’exemple le plus simple est y = x2. Puisque x2 est plus grand que zéro tant pour les valeurs
positives que négatives, quand x = 0 la plus petite valeur que peut prendre y est également
zéro. Qui plus est, à mesure que la grandeur de x augmente, x2 fait pareil.
Les paraboles sont utiles pour décrire le mouvement d’objets soumis à une accélération
constante, puisque la distance parcourue par un objet accélérant est proportionnelle au carré de
l’intervalle de temps concerné. Par exemple, la trajectoire idéale d’un projectile tel qu’un
boulet de canon a une vitesse horizontale constante dans la direction x, mais est influencée par
la gravité exerçant une action descendante dans la direction y (voir page 165).
Équations des sections coniques
a courbe d’une section conique est définie géométriquement par l’intersection de plans
L avec un double cône (voir page 158). La formule algébrique pour un tel cône présentant
une symétrie autour de l’axe z est |z| = x2 + y2, où |z| est le module de z, donc |z| est égal à z si z
est positif, et à -z si z est négatif. Le module n’est jamais négatif et représente la taille de z.
La coordonnée z d’un plan horizontal est une constante, par exemple c, et son intersection
avec un cône vertical est définie par x2 + y2 = |c|. Cette équation est équivalente à l’équation
d’un cercle de rayon √|c|. Pour l’intersection avec un plan vertical, la coordonnée y est
constante, donnant x2 + c2 = |z|, qui est l’équation pour deux paraboles, une pour z < 0, une
pour z > 0. L’ellipse et l’hyperbole sont produites par les intersections avec les plans inclinés.
Si le plan coupe le cône selon une seule courbe fermée, le résultat est une ellipse de forme
. S’il coupe deux fois le cône, on aboutit à deux hyperboles pour lesquelles
.
Ellipses
ne ellipse est définie comme une section conique par l’intersection d’un plan incliné avec
U un double cône défini par l’équation |z| = x2 + y2. Si le plan incliné coupe le cône le long
d’une seule courbe, le résultat est une ellipse de forme . Les constantes a et b sont
liées aux longueurs des axes long et court.
Si a > b > 0, les foyers sont les deux points situés sur l’axe majeur de l’ellipse, l’axe x dans
ce cas, à une distance √(a2 – b2) du centre. Une ellipse peut aussi être définie comme
l’ensemble de points tels que le périmètre des triangles qu’ils forment avec l’ellipse et les deux
foyers est constant.
En 1609, l’astronome allemand Johannes Kepler a noté que les orbites planétaires peuvent
être décrites par des ellipses qui ont le Soleil dans un de leurs foyers. En général, les ellipses
peuvent donc décrire le mouvement des objets dans les champs gravitationnels, tels que les
satellites artificiels sur leurs orbites.
Polynômes
n polynôme est une expression mathématique de forme a0 + a1x + a2x2 +… + anxn, où a0,
U a1, a2,… sont constants. Autrement dit, c’est une série finie (voir page 80) de puissances
entières de x. Le plus grand exposant d’un polynôme est appelé le degré de ce polynôme. Un
polynôme du degré 2, quadratique, a des termes en x 2. Un polynôme du degré 3, cubique, a
des termes en x 3. Les polynômes du degré 1 sont linéaires, car leurs graphes sont des lignes
droites. Les zéros d’un polynôme (les racines du polynôme) sont les solutions de l’équation
dont un polynôme occupe le côté gauche et dont le côté droit est égal à zéro.
Les polynômes sont de bonnes approximations locales de nombreuses fonctions, et servent
à la construction des modèles d’une large diversité d’applications, de la physique et la chimie
à l’économie et aux sciences sociales. En mathématique, ils sont importants en tant que tels ;
de plus, ils sont utilisés pour décrire les propriétés des matrices (voir page 258) et créer des
invariants de nœud (voir page 368). Les polynômes jouent également un rôle important dans
l’algèbre abstraite.
Graphique de l’équation d’un polynôme du cinquième degré (quintique)
Équations quadratiques
ne équation quadratique (équation du second degré) implique des termes allant jusqu’aux
U carrés d’une variable, donc est une équation polynomiale du degré 2. Géométriquement,
cela correspond à l’intersection d’une parabole avec l’axe x (y = 0) ; la forme générale d’une
équation quadratique est ax2 + bx + c = 0, où a est différent de zéro.
Si b = 0, il est facile de résoudre l’équation. En réarrangeant ax2 + c = 0, on trouve que
ax2 = –c, ou . La solution est donc . Le symbole ± indique la présence
de solutions positives et négatives, les deux pouvant être élevées au carré pour donner un
résultat de . Bien entendu, si est lui-même négatif, il n’y a pas de solution dans
l’ensemble des nombres réels.
Un argument légèrement plus général rend possible de dériver la formule montrée ci-contre.
La valeur b2 – 4ac est le discriminant de l’équation ; son signe détermine le nombre de ses
solutions réelles.
Équations cubiques, quartiques et quintiques
es équations cubiques sont des polynômes du troisième degré. Les équations quartiques et
L quintiques sont des polynômes du quatrième et du cinquième degré, impliquant
respectivement une variable à la puissance 4 et 5. Juste comme les équations quadratiques
forment des courbes paraboliques avec un seul pic, les polynômes du degré élevé définissent
généralement une courbe dont les pics sont inférieurs d’une unité à leur degré. Les courbes
cubiques ont deux pics, les quartiques, trois, et ainsi de suite.
Il est bien plus difficile que pour les équations quadratiques de trouver une solution générale
à ces équations en termes de fonctions élémentaires. La solution des équations cubiques a été
découverte en Italie au XVIe siècle : une, deux ou trois solutions dans l’ensemble des nombres
réels. Un raisonnement extrêmement astucieux a permis de résoudre les équations quartiques.
Les équations quintiques n’ont été résolues que dans les années 1820, quand il a été prouvé
qu’il n’existe pas de solution générale pour les polynômes d’un degré supérieur à 4.
Le théorème fondamental de l’algèbre
es théorèmes fondamentaux sont censés occuper une place centrale quant à un domaine
L des mathématiques. Le nombre de solutions réelles d’une équation d’un polynôme du
degré n est limité par n. Le théorème arrive à cela en élargissant la compréhension des
polynômes au-delà de ceux aux coefficients réels, à ceux aux coefficients complexes (voir
page 288).
Ce théorème donne une factorisation des polynômes similaire à la décomposition en
facteurs premiers (voir page 30). Il prône que :
an(x – z1) … (x – zn )
où z1, …, zn sont des nombres complexes. Comme la partie imaginaire de certains de ces
nombres est égale à zéro, ceux-ci sont donc des nombres réels. Si les coefficients ai du
polynôme sont tous des nombres réels, alors les nombres complexes de la partie imaginaire
différente de zéro apparaissent dans des paires complexes conjuguées (voir page 290).
Si le polynôme est égal à zéro, alors au moins un des termes entre parenthèses doit être
zéro, et vice versa. Cette formule dit par conséquent qu’un polynôme du degré n a n solutions
ou racines, même si certaines peuvent être répétées et certaines ne pas être des nombres réels.
Une racine répétée est une racine qui apparaît plus d’une fois. Par exemple, (x – a)2 = 0 a une
solution, a, qui est répétée deux fois, une fois pour chaque parenthèse.
Ce résultat est crédité au grand mathématicien allemand Karl Gauss, qui l’a énoncé en 1799.
Toutefois, sa démonstration était incomplète ; elle n’a été achevée qu’en 1920.
Préambule aux fonctions
es fonctions représentent des relations entre des variables mathématiques. Elles prennent
L un paramètre, le manipulent d’une quelconque façon et produisent une valeur. Par
exemple, la fonction f(x) = x + 2 prend un nombre x comme paramètre et produit une valeur
f(x) plus grande de 2 unités que x. Des exemples plus sophistiqués incluent des fonctions
trigonométriques, des polynômes et des séries entières, mais il est difficile d’aborder les
mathématiques sans assumer l’existence d’une quelconque relation fonctionnelle entre
variables.
Une fonction n’a pas à être définie pour toutes les valeurs de x. Elle peut être spécifiée
seulement pour certains sous-ensembles de valeurs, appelés le domaine de f. L’étendue des
valeurs possibles d’une fonction est sa plage (l’ensemble des valeurs atteintes par cette
fonction). La collection des valeurs réelles générées par la fonction agissant sur un sous-
ensemble du domaine est son image.
Très peu de fonctions élémentaires sont facilement définies et utilisées. La plupart des
autres sont représentées ou approximées en utilisant ces expressions élémentaires.
Une fonction décrit tout paramètre x dans un espace valide appelé domaine de la fonction pour une valeur f(x)
dans un autre espace appelé la plage de cette fonction.
Fonction exponentielle
a fonction exponentielle est probablement la plus importante fonction des mathématiques,
L de concert avec la fonction identité x. Écrite exp(x), elle est toujours positive et tend vers
zéro à mesure que x tend vers – infini, et + infini à mesure que x tend vers + infini. La
représentation graphique de y = exp(x) se rapproche davantage de la verticale à mesure que x
augmente ; la pente du graphe est égale à la valeur de la fonction, qui est la hauteur sur l’axe y.
Des phénomènes aussi divers que la désintégration radioactive, les épidémies et l’intérêt
composé sont décrits par la fonction exponentielle. Elle est une composante de bien d’autres
fonctions. Exp(x) est parfois écrit ex – la constante d’Euler élevée à la puissance x (voir
page 42). Elle peut aussi être définie comme une série entière :
La représentation graphique de la fonction exponentielle débute par une pente réduite, qui devient plus abrupte à
mesure que la valeur de x augmente.
Fonctions réciproques
es fonctions réciproques (ou inverses) inversent l’action d’une autre fonction. Par
L exemple si f(x) = x + 2, alors la fonction réciproque, connue comme f-1(x), est f-1(x) = x –
2. Graphiquement, les fonctions réciproques sont trouvées en retournant le graphe de la
fonction originale à travers la ligne diagonale y = x.
L’inverse de la fonction identité x est x même, et la fonction réciproque de la fonction
exponentielle est le logarithme naturel (voir page 44). Le logarithme naturel d’un nombre
donné x, d’habitude écrit ln(x), est par conséquent la puissance à laquelle e doit être élevé afin
d’égaler la variable x. Le logarithme naturel apparaît aussi comme une aire, et d’où en
intégration (voir page 216) ; ln(n) est l’aire sous la courbe de 1 à n.
Parmi ses nombreuses caractéristiques intéressantes, la fonction ln(x) peut être utilisée pour
décrire le nombre approximatif de nombres premiers plus petits que x (voir page 392).
Représentation graphique d’une fonction échantillon et sa réciproque : notez que le graphe de la fonction
réciproque est identique à celui de la fonction originale retourné à travers la diagonale y = x.
Fonctions continues
a continuité exprime l’idée que le graphe d’une fonction peut être tracé sans lever le
L crayon du papier. Au contraire, pour tracer le graphe d’une fonction discontinue, on doit
lever le crayon du papier. La propriété de continuité permet un grand contrôle sur la fonction,
donc de définir les fonctions continues dans leur ensemble.
Si une fonction est continue, on peut se demander à quelle vitesse elle varie. Les variations
infinitésimales de la variable x correspondent à des variations infinitésimales de la fonction
f(x). En choisissant une variable suffisamment proche de x, on s’assure que la variation de la
fonction due à une variation de x est aussi infime qu’on le veut.
Cette notion est similaire à celles utilisées pour trouver les limites de suites et des séries
(voir page 82), ce qui n’est pas un hasard. Une définition formelle de la continuité en x est
que, pour toute suite donnée de points qui converge vers x, la suite obtenue en estimant la
fonction en ces points converge vers f (x).
Exemples de fonctions continues. La première est y = |x|, qui est y = x pour x > 0 et y = -x pour x < 0. La seconde
montre les fonctions de Bessel, qui sont utilisées pour construire le modèle des oscillations en train de s’estomper.
Fonctions trigonométriques
es fonctions trigonométriques élémentaires sont les fonctions sinus, cosinus et tangente,
L écrites comme f (x) = sin x, f (x) = cos x et f (x) = tan x. En géométrie, les valeurs de f (x)
sont obtenues par une formule impliquant les angles et les côtés d’un triangle rectangle.
Toutefois, ces fonctions peuvent être développées en utilisant des raisonnements géométriques
afin de les définir pour toutes les valeurs réelles de l’« angle ». Cela permet d’envisager leurs
applications au-delà de la géométrie.
Représentées en tant que graphes, les fonctions sinus et cosinus exhibent un motif régulier,
leur forme se répétant tous les 2π (360°). Les fonctions présentant ce motif répété sont des
fonctions périodiques ; elles facilitent l’étude des phénomènes d’oscillation acoustique ou
lumineuse.
Le sinus est une fonction impaire, où sin (–x) = –sin x.
Le cosinus, quant à lui, est pair : cos (–x) = cos x. Les résultats des deux fonctions se situent
toujours entre +1 et –1.
Ce graphe montre la manière dont les fonctions sin x (ligne pleine) et cos x (ligne en pointillé) s’étendent au-delà
des limites des angles d’un triangle.
Théorème des valeurs intermédiaires
e théorème décrit l’idée qu’une fonction continue peut être tracée sans lever le crayon du
C papier. Il prône que pour toute fonction continue, étant donné tout nombre entre deux
résultats, il existe une variable qui a ce nombre-là comme résultat, autrement dit il n’y a pas de
sauts excluant certains des résultats possibles. Par exemple, si les variables 10 et 20 donnent
des résultats de 20 et 40, le théorème des valeurs intermédiaires implique que pour tout
résultat de notre fonction compris entre 20 et 40 il doit exister une variable comprise entre 10
et 20 qui a ce nombre-là comme résultat. Notons que si le théorème s’applique à toutes les
fonctions continues, plusieurs fonctions discontinues le satisfont aussi.
Ce théorème est utilisé lors de nombreuses démonstrations, y compris celle de l’existence
de solutions à certaines équations. Il est aussi un ingrédient important du théorème du
sandwich au jambon, qui prône l’existence d’un plan séparant chacun des solides en deux
parties de mesures égales, autrement dit, la tranche de jambon entre deux tranches de pain peut
être coupée en deux d’un seul coup de couteau.
Pour toute valeur u comprise entre f(a) et f(b) il existe au moins une valeur de x comprise entre a et b telle que
f(x) = u. Pour le choix de u dans ce diagramme, il y a en fait trois valeurs de x présentant cette propriété.
Préambule au calcul infinitésimal
e calcul infinitésimal est la branche des mathématiques étudiant le changement. Ses
L composantes fondamentales sont la différentiation (variations des fonctions) et
l’intégration (mesure d’ensemble des variations), les deux impliquant de travailler avec des
variations infiniment petites des fonctions et donc des limites. Le calcul infinitésimal est un
outil sous-jacent de modélisation mathématique où le taux de variation des variables telles que
la vitesse, l’accélération ou la diffusion, peut être exprimé sous forme mathématique.
La toile de fond du calcul infinitésimal est l’idée que pour de nombreuses fonctions il existe
une relation entre les variations infinies des résultats et les petits changements des variables. Il
repose sur ces relations. Les mathématiques appliquées les plus classiques se basent sur le
calcul infinitésimal et les fonctions : des phénomènes tels que les ondes dans les fluides, les
oscillations dans la mécanique, le mouvement des planètes, la formation des motifs des
coquillages et des bancs de poissons, les transformations chimiques et les feux de forêt sont
tous décrits en utilisant le calcul infinitésimal.
Les modèles mathématiques basés sur le calcul infinitésimal peuvent décrire le développement des motifs sur les
coquillages tels que ce beau conus marmoreus.
Taux de variation
n peut mesurer le taux de variation d’une fonction en utilisant des graphes. Si le graphe
O d’une fonction montre une forte pente, alors son résultat change rapidement. S’il est peu
prononcé, son résultat change plus lentement. Cela présente une analogie physique avec les
collines et vallées réelles, où des pentes accentuées signifient que l’altitude change fortement
en tant que fonction de la distance horizontale.
Pour une ligne droite, le gradient est constant, chose indiquée par la quantité m dans
l’équation y = mx + c (voir page 172). Pour un graphe plus général, on peut visualiser au
gradient en un de ses points comme étant le gradient d’une ligne tangentielle qui effleure le
graphe en ce point-là.
Cela peut être approximé en traçant les lignes connectant le point même et des points
voisins sur le graphe, et en voyant s’ils tendent vers une limite. Lorsqu’un tel gradient existe,
il est appelé la dérivée de la fonction en ce point-là, et varie à mesure que le point où il est
évalué change.
Sur ce graphe d’une fonction typique, la tangente révèle le gradient en un seul point, tandis que la sécante révèle le
gradient mesuré en se connectant à un autre point proche.
Différentiation
a différentiation est un concept clé du calcul différentiel, manière d’utiliser les équations
L pour calculer le gradient d’une fonction, donc son taux de variation, à un certain point.
La relation la plus simple entre deux variables est une relation linéaire, f (x) = mx + c, où m
représente le gradient. Si on fixe une valeur x0 sur l’axe x, alors le gradient de la fonction en
tout point x est lié au taux de variation de x et de y ou des directions f (x). Ces quantités sont
représentées respectivement comme x – x0 et f (x) – f (x0). Pour trouver le gradient à x0, il faut
trouver la valeur de m pour laquelle f (x) – f (x0) est approximativement égale à m(x – x0), à
mesure que x tend vers la valeur de x0.
Si à mesure que x tend vers x0 la limite du gradient m existe, on dit que f est différentiable à
x0, et que cette limite est la dérivée de f à x0. Si f est différentiable, alors la valeur de m variera
avec la valeur de x0. Autrement dit, on a créé une nouvelle fonction de x, appelée dérivée de f
et écrite ou f ’(x).
La dérivée de f est le gradient restrictif de la sécante montrée par la ligne grise continue à mesure que x – x0
devient plus petit.
Analyse de sensibilité
’analyse de sensibilité permet entre autres aux mathématiciens et à d’autres de mesurer,
L en plus du degré de variation, sa signification. Par exemple, l’évaluation des fonds de
pension implique un équilibre entre les actifs actuels et les passifs futurs. Même si actifs et
passifs s’équilibrent à un taux d’intérêt particulier, une petite variation future de ce taux peut
changer radicalement la situation. D’autres exemples incluent les chiffres du chômage, les
modèles climatiques, les réactions chimiques.
Plus la dérivée d’une fonction est grande, plus sa variation est rapide, mais un grand
changement d’une très grande quantité peut être moins important qu’un petit changement
d’une très petite quantité. Une évaluation juste exige de considérer tant la dérivée de la
fonction que sa valeur. Une façon de le faire utilise la durée d’une fonction, qui est le
changement relatif dans sa valeur due à un petit changement à partir d’une valeur actuelle.
Cela est lié à l’élasticité de la fonction, terme qui décrit la manière dont le gradient varie en
comparaison du gradient d’une fonction linéaire.
Trois projections du réchauffement global pour le prochain siècle, montrant des résultats très différents causés par
la sensibilité due au comportement dans chaque modèle.
Calculer les dérivées
a dérivée d’une fonction f (x) = xn est donnée par l’expression :
L
f’(x) = nxn–1
En continuant ainsi, on peut calculer des dérivées d’ordre de plus en plus élevé. La nème
dérivée d’une fonction f(x) est notée f(n)(x).
Combiner des fonctions
l y a deux façons principales de combiner des fonctions pour en créer de nouvelles. Le
I produit de deux fonctions f(x) et g(x) est obtenu en multipliant les valeurs des fonctions,
aboutissant à la fonction f(x)g(x). Par exemple, la fonction x 2sin x est le produit de la fonction
f (x) = x2 et de la fonction g(x) = sin(x).
La composition de deux fonctions est obtenue en les appliquant consécutivement pour
arriver à f (g(x)). On l’appelle parfois la fonction d’une fonction. Pour l’exemple ci-dessus,
f(g(x)) serait f (sin x) ou (sin x)2. C’est différent de la combinaison des fonctions dans l’ordre
opposé, puisque g( f(x)) serait égal à sin (x 2).
Les dérivées des produits et des compositions sont trouvées en utilisant les règles du produit
et de la chaîne (montrées ci-contre). Les deux sont valables seulement si les dérivées des
fonctions sous-jacentes existent. La règle du quotient, qui donne la dérivée d’une fonction
divisée par une autre, est une conséquence directe des règles du produit et de la chaîne.
Intégration
e processus d’intégration correspond dans les grandes lignes à la découverte de l’aire
L sous-tendue par un graphe, où les aires sous l’axe contribuent à une aire négative.
Considérons une courbe entre deux points a et b : si on divise l’aire qu’elle sous-tend en petits
segments, l’aire de chaque segment est approximativement égale à la valeur de la fonction en
ce point, multipliée par la largeur du segment.
La somme de ces aires aboutit à une approximation de l’aire totale sous-tendue par la courbe.
Plus le nombre de segments de plus en plus étroits utilisés lors de ce processus est
considérable, plus le résultat sera précis. Si la limite existe à mesure que la longueur des
segments tend vers zéro, elle est appelée l’intégrale de la fonction entre les limites a et b avec
a < b, noté :
L’intégration permet de calculer l’aire sous-tendue par le graphe, décrite par f(x). Elle peut être vue comme la
somme des aires d’une série de colonnes de largeur ∆x lorsque ∆x tend vers zéro.
Le théorème fondamental de l’analyse
e théorème fondamental de l’analyse prône que l’intégration est l’opposé de la dérivation.
L Il part de la notion que l’intégrale d’une fonction f peut être tenue pour une nouvelle
fonction, disons F(x), de la limite supérieure de l’intégrale, sans préciser la limite inférieure.
Donc .
Par convention, cela est souvent écrit F(x) = ∫f(x)dx.F(x) est appelée une intégrale indéfinie.
Comme la limite inférieure n’est pas spécifiée, elle est définie seulement jusqu’à une
constante, la constante d’intégration.
Les variations de F(x) reflètent les variations de l’aire sous la courbe dues aux petits
changements instantanés de la limite supérieure. Puisque la dérivée d’une constante est zéro, la
dérivée de la fonction F(x) ne dépend pas de la constante d’intégration et il s’avère qu’elle est
égale à la fonction originale f(x). Donc F’(x) = f(x). Voilà le théorème fondamental de
l’analyse. Un résultat lié est que ∫f’(x)dx = f(x) + c, où c est une constante d’intégration. C’est
une manière utile d’évaluer de nombreuses intégrales.
Une démonstration géométrique du théorème fondamental. L’aire de la bande étroite hachurée peut être estimée
comme h x f(x) ou, si la fonction est A(x), peut être calculée comme A(x + h) – A(x). Placer ceux-ci dans une
équation et diviser les deux côtés par h révèle que, à mesure que h approche de zéro, f(x) = A’(x).
Intégration et trigonométrie
l s’avère que les intégrales de certaines fonctions élémentaires de x sont liées aux fonctions
I trigonométriques. Cela démontre à quel point les fonctions trigonométriques sont
importantes pour les mathématiques : si elles n’avaient pas été introduites en géométrie via les
rapports de côtés des triangles (voir page 132), elles auraient dû être définies dans le calcul
infinitésimal en tant qu’intégrales d’une quelconque fonction simple. Par exemple :
Un autre exemple est présenté ci-contre. Ci-dessus, tan–1 est la fonction réciproque de la
fonction tangente, l’arc tangente. Similairement, sin–1 est la fonction réciproque de la fonction
sinus, l’arc sinus. Notez que la fonction réciproque est différente de l’inverse, .
La manière standard de dériver ces expressions est d’utiliser la relation ∫f ’(x)dx = f (x) + c
et l’affirmation que la dérivée de la fonction arctan, tan–1 x, est .
Théorème de Taylor
e théorème de Taylor prône que si une fonction f(x) peut être dérivable un nombre infini
L de fois, alors elle peut être approximée par une série de Taylor. La série de Taylor (série
entière construite à partir de la fonction f au voisinage d’un point x0) est une somme de termes
de la variable (x – x0) élevée à des puissances successives de nombres naturels.
où f(n) est la nème dérivée de la fonction et ! est la factorielle (voir page 104). Si x = 0, la série
de Taylor est appelée aussi série de Mac Laurin.
Si la série converge (voir page 90) pour toutes les valeurs de x au voisinage de x0, la
fonction est dite analytique. Les fonctions analytiques sont importantes pour l’analyse
complexe (voir page 302).
Ce graphe montre les approximations successives d’une fonction f(x) d’une série de Taylor tronquée au voisinage
de x = 0. La courbe quadratique (une parabole) utilise les trois premiers termes, jusqu’à et incluant le terme x2.
Interpolation
’interpolation est l’art d’estimer la valeur d’une fonction en un point spécifique, en se
L basant sur la valeur de cette fonction en d’autres points connus. Elle est importante dans
les applications où les données sont utilisées pour construire une relation fonctionnelle entre
quantités.
Imaginons connaître la valeur d’une fonction f(x) en n + 1 points x0, x1, …, xn, avec le xi
ordonné depuis le plus petit au plus grand. Quelle valeur doit-on assigner à la fonction en un
point général x entre x0 et xn ? Ce problème est soulevé tous les jours pour la prédiction du
climat en partant des données d’un ensemble de sites nationaux. La tentative de faire
correspondre un polynôme (voir page 184) aux points des données est une forme
d’interpolation. Comme il y a n + 1 points, un polynôme de nème ordre a n + 1 coefficients à
assigner, si bien qu’on dispose précisément du nombre correspondant aux valeurs connues.
Au XVIIIe siècle, le mathématicien français Joseph-Louis Lagrange a trouvé une formule
explicite pour cette forme d’interpolation, avec une erreur associée similaire à celle d’une série
de Taylor tronquée.
Maximums et minimums
e processus trouvant les valeurs maximales ou minimales d’une fonction est appelé
L optimisation. Le maximum d’une fonction f(x) se trouve au point c si f(c) est plus grande
que f(x) ou égale à celle-ci pour toutes les autres valeurs de x. Similairement, un minimum se
trouve au point d si f(d) est plus petite que f(x) ou égale à celle-ci pour toute autre valeur de x.
Un maximum ou un minimum local est celui où f(x) est comparée seulement aux valeurs
proches de x.
En ces points, la tangente de la courbe est horizontale, donc la dérivée est zéro. Cela permet
de déterminer facilement les maximums ou les minimums locaux. En un point c où la dérivée
est zéro, le terme linéaire de la série de Taylor (voir page 222) disparaît et f(x) ≈ f(c) + f"(c)
(x – c)2 + termes d’ordre supérieur
Si f"(c) ≠ 0, alors la fonction est localement pareille à une parabole, avec un maximum si la
seconde dérivée est négative et un minimum si elle est positive. Si f"(c) = 0, on est en présence
d’un point d’inflexion, où la fonction s’aplatit avant de continuer dans la même direction.
Équations différentielles
es équations différentielles expriment les relations entre fonctions et leurs dérivées. Elles
L sont utilisées pour construire des modèles mathématiques de divers phénomènes
économiques, biologiques, physiques et chimiques, où elles lient le taux de variation d’une
quantité à la quantité même.
Par exemple, le taux de désintégration radioactive d’un échantillon chimique est
proportionnel au nombre d’atomes de l’échantillon, comme le montre l’équation : =–aN,
où N est le nombre d’atomes, a est une constante se rapportant à la période de l’élément et t est
le temps. Cela a pour solution N(t) = N(0)e–at. L’expression incorpore un terme de forme ex,
montrant que la désintégration est exponentielle.
Les équations différentielles ordinaires impliquent une seule variable indépendante, comme
le temps dans l’exemple ci-dessus. D’habitude, il n’est pas possible de les résoudre
explicitement ; on doit recourir soit à des méthodes d’approximation, soit à des simulations
numériques.
La courbe de cette image représente une solution des équations de Lorenz, équations différentielles construisant le
modèle mathématique du climat. La courbe ne se répète pas et a une structure fractale, indiquant la présence du
chaos.
Série de Fourier
a série de Fourier est une série trigonométrique, exprimée en tant que somme infinie de
L sinus et de cosinus. Comme les fonctions sinus et cosinus consistent en motifs répétitifs,
la série de Fourier est elle aussi une fonction périodique.
Pour des valeurs de x entre 0 et 2π, on peut approximer la fonction f (x) comme étant :
où
Si la fonction originale n’est pas elle-même périodique, alors la série de Fourier offre une
représentation de la fonction dans l’intervalle spécifié de valeurs, mais pas en dehors de celui-
ci. Elle répète la fonction, comme on le voit ci-contre.
L’intégrale de sa surface s’exprime en termes d’intégrales doubles, car l’aire est un produit
des petits changements de x et y. Les intégrales à plusieurs variables donnant une intégration
généralisée pour les fonctions de plusieurs variables, peuvent aussi être définies.
La double intégrale de la fonction de l’aire rectangulaire donne le volume de l’aire hachurée.
Théorème de Green
e théorème de Green lie une intégrale double sur une surface A à une intégrale de chemin
L autour du bord γ de la surface. Il prône que :
Toute trajectoire suivie par une série de vecteurs peut être ramenée à un vecteur global à direction et grandeur
uniques, représenté par ∑ la lettre grecque sigma.
Produit scalaire
e produit scalaire est une opération qui combine deux vecteurs afin de créer un scalaire,
L un nombre sans direction donnée. Écrit sous la forme a · b, c’est le produit de leurs
longueurs multipliées par le cosinus de l’angle qu’ils forment. Si les vecteurs sont représentés
sous la forme de leurs composantes, alors le produit scalaire est la somme des produits de
chaque paire de composantes. Le produit scalaire de (1, 2) et de (1, 3) est donc
(1 × 1) + (2 × 3) = 7.
Si deux vecteurs sont perpendiculaires, alors le cosinus de l’angle qu’ils forment est zéro.
D’où, le produit scalaire de deux vecteurs perpendiculaires est aussi zéro. Si chaque vecteur
est un vecteur unitaire, de grandeur ou module 1, alors le produit scalaire est la composante de
l’autre vecteur dans la direction du vecteur unitaire : le produit scalaire de (2, 3) et de (0, 1) est
3.
Ce concept est important pour la physique où des propriétés telles que le flux magnétique
sont mises en évidence par le produit scalaire des vecteurs représentant le champ magnétique
et l’aire considérée.
|a| cos θ est la projection d’a sur la direction de b, si bien que le produit scalaire, |a||b|cos θ, est le produit du module
du vecteur b et de la projection d’a sur b (ou vice versa).
Produit vectoriel
e produit vectoriel, écrit a × b, est une méthode de multiplication de deux vecteurs dans
L un espace tridimensionnel, produisant un vecteur qui est perpendiculaire par rapport aux
deux vecteurs initiaux. En physique, il est utilisé pour calculer la force de torsion. Le module
du produit vectoriel de deux vecteurs est le produit de leurs longueurs multipliées par le sinus
de l’angle entre eux. Cela est aussi égal à l’aire d’un parallélogramme dont les côtés adjacents
sont donnés par les deux vecteurs.
La direction du vecteur résultant est donnée par une convention appelée règle de la main
droite (ci-contre). Si l’index de la main droite représente le vecteur a et le médius représente le
vecteur b, la direction du produit vectoriel est indiquée par le pouce. En utilisant cette règle
pour identifier la direction de a × b et de b × a, on constate que le pouce indique des directions
différentes. Donc, l’ordre dans lequel sont écrits les vecteurs est important : à la différence de
la multiplication des nombres, le produit vectoriel est non-commutatif.
Géométrie vectorielle
a géométrie vectorielle décrit l’utilisation des vecteurs pour résoudre des problèmes
L géométriques. Beaucoup de concepts géométriques sont grandement simplifiés en étant
représentés sous forme vectorielle, spécialement quand on travaille en trois dimensions ou
plus. Par exemple, si la position d’un point en trois dimensions est représentée par un vecteur
r = (x, y, z), appelé vecteur de position, alors un plan bidimensionnel à travers un point au
vecteur de position r0 est donné par les solutions de a · (r – r0) = 0, où a est un vecteur
perpendiculaire au plan.
Si on note les équations des coordonnées des trois plans en utilisant cette formule, la
condition de leur intersection est donnée par trois systèmes d’équations (voir page 168). Si on
regarde ainsi le problème, la géométrie rend évident que trois systèmes d’équations linéaires
ont soit une solution unique, le cas typique (infiniment de solutions, où tous les plans sont le
même plan), soit aucune solution, où au moins deux plans sont parallèles et non égaux.
Fonctions vectorielles
es vecteurs dont les composantes sont des fonctions décrivant une relation entre deux ou
L plusieurs variables sont des fonctions vectorielles. Pour étudier ces relations, les
composantes peuvent être dérivées ou intégrées à la manière des fonctions réelles.
La différentiation peut être exprimée par un opérateur vectoriel. Par exemple, si f(x, y) est
une fonction réelle dans un plan, le gradient de f est donné par une fonction vectorielle
Si Mr décrit l’effet d’une transformation linéaire d’un vecteur r, alors les vecteurs qui
s’appliquent à un vecteur donné b suite à la transformation sont donnés par les solutions à
l’équation matricielle Mr = b. Pour résoudre cette équation, on utilise la matrice inverse de M,
si elle existe.
La matrice inverse M–1 est la matrice qui, multipliée par M, donne la matrice identité I. En
appliquant M–1 à l’équation Mr = b, on peut dire que M –1Mr = M –1b. Puisque M –1M = I, alors
Ir = M –1b. Et comme la matrice identité laisse un vecteur inchangé, r est donc égal à M -1b.
Bien entendu, cela n’aide pas, sauf si on connaît M–1, mais au moins dans le cas 2 × 2 la
matrice inverse est facile à calculer. Pour la matrice générale , la matrice inverse est
à condition que ad – bc ne soit pas égal à zéro.
Si on pense à la représentation en coordonnées de l’équation matricielle Mr = b, c’est
précisément un ensemble de systèmes d’équations linéaires. Ainsi, on revient au point
d’origine : le problème de trouver l’intersection de trois plans (voir page 174) équivaut à
résoudre trois systèmes d’équations linéaires (voir page 168) via la représentation vectorielle
des plans (voir page 250), et aussi à résoudre les équations matricielles.
La matrice inverse permet de voir qu’en deux dimensions, où les plans sont la même chose
que les lignes, il y a une solution unique, à condition que ad – bc ne soit pas égal à zéro. S’il
l’est, soit il n’y a pas de solution, soit il y a infiniment de solutions. La quantité ad – bc est
appelé le déterminant de la matrice. Dans des dimensions multiples, l’expression est plus
compliquée, mais des manières standard de la calculer existent.
Espaces nuls
ppelé aussi noyau d’une matrice, l’espace nul est l’ensemble de tous les vecteurs qui
A s’appliquent au vecteur zéro par l’action de la transformation linéaire. Pour une matrice
M, où Mr décrit l’effet d’une transformation linéaire d’un vecteur r, l’espace nul N est
l’ensemble de points pour lesquels Mr = 0. La dimension de cet espace nul est appelée sa
nullité.
Pour explorer la taille ou la dimension des vecteurs transformés, on considère l’image Im(M
): c’est l’ensemble de points b pour lesquels Mr = b pour une certaine valeur de r. Alors, le
rang de M est la dimension de son image. Qui plus est, si Mr = b a une solution pour un b
donné, alors il existe un espace de solutions égal à la dimension de N. Cela est dû au fait que
l’ajout de tout vecteur en N à la solution connue est aussi une solution. Donc, si b est dans
l’image de M, une solution existe, la multiplicité des solutions étant décrite par la dimension
de N.
Puisque l’effet d’une transformation linéaire peut être déduit de son action sur un ensemble
d’éléments de base (voir page 256), ce n’est pas surprenant que la taille ou la dimension de
l’ensemble de points de l’image de la transformation, Im(M), est égal au nombre de vecteurs
linéairement indépendants des éléments de la base transformée.
Cela peut ne pas sembler très important, mais c’est le genre de théorème de décomposition
qu’aiment les mathématiciens, et dont les conséquences sont notables. Comme de nombreux
problèmes, tels que les équations différentielles linéaires, peuvent être exprimés dans ce
langage, la description très précise des espaces de solution à partir de ce résultat est utilisée
dans plusieurs domaines des mathématiques.
Éléments propres et vecteurs propres
es éléments propres et les vecteurs propres sont des ensembles particuliers de scalaires et
L de vecteurs associés à une matrice donnée. Pour une matrice carrée M, avec un élément
propre λ et un vecteur propre correspondant r, Mr est égal à Àr. En termes physiques, cela
signifie que les vecteurs propres sont les directions qui restent inchangées par l’action de la
matrice M ; λ décrit la manière dont les distances varient dans cette direction, les éléments
propres négatifs indiquant une inversion de direction.
Si on tente de résoudre l’équation Mr = Àr, ce sont les éléments propres (λ) qui sont les plus
faciles à trouver. En réécrivant la définition comme (M – λI)r = 0, on peut voir que les
solutions existent seulement si (M – λI) a un espace nul non trivial. Cela signifie que le
déterminant de (M – λI) doit être zéro. Le déterminant d’une telle matrice n × n s’avère être un
polynôme (voir page 184) du degré n dans λ. Les problèmes d’éléments propres fournissent
beaucoup d’informations sur les transformations linéaires.
Un vecteur r est un vecteur propre de la matrice M si r et Mr vont dans la même direction (ou en directions
exactement opposées).
Préambule à l’algèbre abstraite
’algèbre abstraite est l’étude de la structure impliquant des règles distinctes de
L combinaison des éléments d’un ensemble. Ces règles imitent différents aspects des
opérations ordinaires d’addition et de multiplication. Les structures créées incluent les
groupes, les corps, les anneaux et les espaces vectoriels.
Par exemple, un espace vectoriel est une structure abstraite qui inclut un ensemble de
vecteurs avec leurs règles associées. Ces règles décrivent la manière dont se comportent les
combinaisons d’objets dans cette structure, et peuvent être codifiées en tant que brève liste de
propriétés. Dans les espaces vectoriels, les règles décrivent l’addition des vecteurs (voir
page 244) et la multiplication scalaire (voir page 246). Cet éloignement des applications
explicites dans un espace réel vers un ensemble plus abstrait de propriétés est typique de la
manière dont les mathématiciens développent des concepts. Malgré leur abstraction et leur
restriction, ces structures étonnantes ont des implications d’une grande portée dans des
domaines allant de la structure moléculaire à la topologie.
La théorie des groupes joue un rôle important pour la compréhension des structures cristallines, puisque les
groupes de symétries peuvent être utilisés pour établir un modèle du comportement et des arrangements possibles
des atomes dans un réseau cristallin.
Groupes
n groupe est un ensemble d’éléments et d’une opération binaire (ou loi de composition)
U qui peut être une multiplication ou une addition, mais qui n’est pas nommée dans la
définition générale.
Pour un ensemble G, une opération · et trois éléments a, b et c, quatre propriétés basiques
(ou axiomes) doivent être vérifiées :
1. Composition interne : si a et b sont en G, a · b le sont aussi.
2. Associativité : a · (b · c) = (a · b) · c.
3. Élément neutre : il existe un élément e de G tel que e · a = a pour tout a de G.
4. Inverse : pour tout élément a de G il existe un a–1 de G, tel que a · a–1 = e, où a–1 est
l’élément inverse de a.
Par exemple, l’ensemble des nombres entiers et l’opération d’addition forment un groupe
avec e = 0, puisque celui-ci est le seul nombre qui peut être ajouté à un élément sans le
changer. Les groupes peuvent aussi être utilisés pour représenter les propriétés physiques,
telles que les symétries des polygones réguliers, des structures cristallines ou des flocons de
neige.
Groupes de symétries
n groupe de symétries décrit les différentes transformations géométriques qui laissent
U l’objet invariant. Il concerne aussi l’opération de composition, appliquant une
transformation au résultat d’une autre, comme le font toutes les manipulations du groupe.
Considérons un triangle équilatéral. Si on le fait tourner de 120° dans le sens des aiguilles
d’une montre ou s’il est réfléchi selon une ligne passant par un sommet et le centre, le résultat
ne changera pas. Si on appelle la rotation a et la réflexion b, on peut utiliser la multiplication
pour indiquer les compositions des deux.
Donc, a2b signifie qu’on fait tourner deux fois le triangle de 120°, avant de le réfléchir sur la
ligne. En fait, six combinaisons différentes de a et b produisent des transformations
indépendantes du triangle : e, a, a2, b, ab et a2b, où e est l’identité, qui laisse le triangle
inchangé. Toute autre combinaison est équivalente à l’une de celles-ci : a3 ou b2 sont
identiques à l’absence de changement, e.
Les six éléments du groupe de symétries pour un triangle équilatéral.
Sous-groupes et groupes quotient
n sous-groupe est un sous-ensemble d’un groupe qui satisfait les axiomes du groupe (voir
U page 268). Puisque l’élément neutre {e} est lui-même un groupe, il y a toujours au moins
un sous-groupe.
Le groupe de symétries du triangle équilatéral (voir page 270) est {e, a, a2, b, ab, a2b} où a
est une rotation de 120° autour du centre et b est une réflexion selon une ligne de symétrie
traversant le centre. Ce groupe a deux sous-groupes non triviaux évidents, les rotations {e, a,
a2}, et les réflexions {e, b}. Les deux sont des exemples de groupes cycliques, où tous les
éléments sont des compositions d’un élément unique.
Un groupe quotient est un groupe construit à partir des éléments d’un groupe et de l’un de
ses sous-groupes normaux.
Dans le cas des groupes, le rôle des nombres premiers est joué par les groupes simples, ceux
qui n’ont pas des sous-groupes non triviaux normaux autres qu’eux-mêmes.
Groupes simples
es groupes simples sont des groupes ne comportant pas des groupes quotient non triviaux.
L Leurs seuls sous-groupes normaux sont soit l’élément neutre, soit le groupe original
même. C’est presque exactement analogue aux nombres premiers, qui n’ont que le 1 et eux-
mêmes comme facteurs.
Juste comme les nombres premiers, il y a infiniment de groupes simples. À la différence des
nombres premiers, toutefois, les groupes simples peuvent être clairement classifiés. En 2004,
l’achèvement de la classification de tous les groupes simples finis a été l’une des plus grandes
réalisations mathématiques de ces cinquante dernières années.
Les groupes simples incluent les groupes cycliques d’ordre premier et la famille des
groupes alternés, qui apparaissent dans l’étude des ensembles finis. Il y a 16 autres familles de
groupes simples (les groupes de Lie) et 26 exceptions (les groupes sporadiques), cas spéciaux
particuliers. De ceux-ci, 20 familles sont liées à la plus grande des exceptions, le Monstre. Les
six restantes sont appelées les parias.
Les tentatives du botaniste suédois Carl von Linné de classer les plantes selon la forme de leurs organes
reproducteurs est comparable à la classification des groupes mathématiques.
Le Monstre
e Monstre est le plus grand groupe sporadique simple, important pour la classification des
L groupes finis. Ses seuls sous-groupes normaux sont le groupe trivial et le Monstre lui-
même.
Conjecturé à l’origine dans les années 1970, le Monstre a été construit par Robert Griess en
1981, et décrit dans un article de 1982 intitulé The Friendly Monster. Il comporte
808017424794512875886459904961710757005754368000000000 (environ 8 × 1053)
éléments. Écrit sous forme matricielle, il exige 196 883 × 196 883 composantes.
Étant donné la taille et la complexité des groupes de ce genre, il a fallu du temps pour
s’assurer d’avoir pris en compte tous les groupes sporadiques possibles. Bien que les premiers
groupes sporadiques aient été découverts au début du XIXe siècle, la description complète de
tous n’a été achevée qu’au début du XXIe siècle.
Groupes de Lie
n groupe de Lie est un groupe doté d’une structure de variété différentielle et décrit la
U symétrie continue en mathématiques. Un exemple simple est le groupe de symétries du
cercle : une rotation autour du centre d’un cercle selon n’importe quel angle aboutit au cercle
lui-même. Le groupe de symétries du cercle a une paramétrisation continue.
Les groupes de Lie sont d’habitude classés en quatre types : réels, complexes,
quartenioniques et exceptionnels (ces derniers notés respectivement E6, E7, E8, F4 et G2)
Peu surprenant, la théorie des groupes continus est plus compliquée que celles des groupes
discrets, bien que les groupes de Lie soient les mieux compris de tous. Ils peuvent être décrits
seulement grâce à la nature de leurs paramètres, mais ils héritent davantage que juste la
structure continue de ceux-ci. On peut aussi définir un groupe de Lie comme une variété, type
spécifique d’espace topologique (voir page 336).
a × (b + c) = (a × b) + (a × c)
et (a + b) × c = (a × c) + (b × c).
Les nombres entiers, les nombres rationnels et les nombres réels sont tous des anneaux.
Néanmoins, un anneau général a des propriétés différentes de ces exemples. Par exemple, si
a ≠ 0, où 0 est l’élément neutre pour l’addition (l’élément qui, lorsqu’il est combiné avec tout
autre élément en utilisant l’addition, laisse ce dernier élément inchangé) et si a × b = 0, alors
on ne peut pas forcément conclure que b = 0, même si cela est évident pour les nombres
rationnels, les nombres entiers ou les nombres réels. Pour des raisons similaires, si
a × b = a × c, alors b et c ne sont pas non plus forcément égaux.
Malgré ces restrictions, les anneaux apparaissent dans nombre de domaines des
mathématiques, particulièrement ceux associés à la théorie des groupes. Pour permettre des
propriétés telles que la réduction multiplicative, d’autres restrictions doivent être placées sur la
structure algébrique, aboutissant aux corps (voir page 282).
Corps
n corps est une structure algébrique incluant un ensemble et deux opérations binaires.
U Comme dans le cas d’un anneau, ces opérations sont l’addition et la multiplication.
Pareillement, l’ensemble, de concert avec l’opération additive, forme un groupe commutatif.
Toutefois, la multiplication est elle aussi commutative dans un corps : pour les éléments a et b,
a × b = b × a et l’ensemble, à l’exception de l’élément neutre pour l’addition, forment un
groupe commutatif avec l’opération multiplicative. Les lois distributives d’un anneau sont
également valables (voir page 281).
Cela signifie que dans un corps la division est possible pour tous les éléments, à l’exception
de l’élément neutre pour l’addition, et que, à la différence des anneaux, si a × b = a × c et
a ≠ 0, alors b = c. Ainsi, un corps présente davantage des caractéristiques des nombres
standard en cas d’addition et de multiplication qu’un anneau. Les nombres entiers, les
nombres rationnels et les nombres réels sont tous des corps, en plus d’être des anneau_x. Un
autre exemple est l’ensemble de nombres de forme a + b √2, où a et b sont des nombres
rationnels.
Ces deux tableaux représentent les opérations d’addition et de ultiplication dans un corps simple de quatre
éléments, ci, I est l’élément neutre pour la multiplication du corps et on élément neutre pour l’addition.
L
Théorie de Galois
ette théorie a été développée par le mathématicien français Évariste Galois, mort à 20 ans
C des suites d’un duel. Elle connecte la théorie des groupes aux solutions des équations
polynomiales (voir page 184).
Les solutions générales des équations des second, troisième et quatrième degrés étaient
connues à la fin du XVIe siècle, mais aucune solution n’avait été trouvée pour les polynômes de
plus haut ordre. Galois a montré que la théorie des groupes peut révéler si un polynôme a une
solution de forme fermée, impliquant des opérations algébriques simples.
En étudiant la manière dont les équations aux solutions données peuvent être transformées
les unes dans les autres, Galois a constaté que l’existence des solutions de forme fermée se
rapporte à la commutativité d’un groupe associé. Seuls les quatre premiers groupes résolubles
qu’il a construits sont commutatifs, indiquant que seuls les polynômes jusqu’au quatrième
degré y compris peuvent être résolus en termes de fonctions algébriques simples.
La théorie de Galois prouve qu’il est impossible de trouver une solution généralisée aux équations du sixième degré
(polynômes du sixième degré), telles que celles représentées ici.
Monstrous moonshine
a conjecture monstrous moonshine décrit la connexion entre deux domaines distincts des
L mathématiques. Elle a été proposée par les mathématiciens britanniques John Conway et
Simon Norton après que John Kay eut mentionné une coïncidence bizarre au cours d’un
séminaire de 1978. Kay a noté qu’un coefficient de développement d’une fonction, défini dans
la théorie des nombres par Felix Klein, était 196 884, différent de juste une unité de 196 883,
la taille du Monstre sous forme matricielle.
Ces deux domaines – représentations du Monstre d’une part et de la théorie algébrique des
nombres d’autre part – sont étroitement liés, car on se sert de notions venant d’un autre
domaine des mathématiques, la théorie de l’algèbre vertex. Dans un travail qui lui a valu la
médaille Fields, la plus haute récompense des mathématiques, Richard Borcherds a montré
que la théorie des champs conformes de la physique fournit une explication pour cette
connexion étroite. Toutefois, de nombreux détails de cette relation entre théories quantiques,
algèbre, topologie et théorie des nombres ne sont pas encore compris.
Nombres complexes
es nombres complexes sont un développement des nombres réels permettant de
L comprendre les racines carrées des nombres négatifs. Tout nombre complexe z peut être
écrit comme a + ib, où a et b sont réels et i est la racine carrée de –1, donc i2 = –1 ; a est la
partie réelle de z, b, sa partie imaginaire.
Si on pense à (a, b) comme à des coordonnées cartésiennes, on peut explorer la géométrie
des nombres complexes comme sur le diagramme d’Argand (ci-contre). En tant que point dans
le plan, tout nombre complexe z comporte par conséquent une distance depuis le point
d’origine, appelé le module de z et noté |z|. Selon le théorème de Pythagore, |z| peut être
calculé à partir de ses deux composants, en utilisant |z|2 = a2 + b2.
Tout nombre complexe a aussi un angle par rapport à l’axe x, appelé l’argument de z. Un
nombre complexe peut donc être décrit en termes de son module |z| et de son angle θ, car
z = |z| (cos θ + i sin θ).
Diagramme d’Argan
Géométrie des nombres complexes
’interprétation géométrique des nombres complexes en utilisant le diagramme d’Argand
L offre une interprétation simple de deux autres de leurs caractéristiques : le nombre
complexe conjugué et l’inégalité triangulaire.
Le nombre complexe conjugué de z = a + ib, noté z* ou z, est a – ib, l’image de z reflétée
sur l’axe réel (x). Un calcul simple montre que |z|2 = zz*, et aussi que les parties réelle et
imaginaire de z peuvent être écrites en termes de la somme et de la différence du nombre et de
son nombre complexe conjugué : et .
L’inégalité triangulaire est la formulation mathématique de l’affirmation que le côté long
d’un triangle doit être plus court que la somme de ses deux autres côtés. La somme de deux
nombres complexes est géométriquement la même que la somme de deux vecteurs (voir
page 244), où les composantes d’un nombre complexe sont ses parties réelle et imaginaire.
Ainsi, pour les nombres complexes z, w et z + w, l’inégalité triangulaire est |z + w| ≤ |z| + |w|.
Puisque z = |z|eiΦ, la multiplication par un nombre complexe ei est, en utilisant les règles des exposants, zeiΦ =
|z|ei(θ + Φ), rotation par un angle 9, autre conséquence de la vision géométrique des nombres complexes.
Transformations de Möbius
es transformations de Möbius sont des fonctions du plan complexe qui appliquent des
L cercles et des lignes droites sur des cercles et des lignes droites. Elles prennent la forme
où ad – bc ≠ 0, a, b, c et d sont des nombres complexes et z est une variable
complexe.
Les compositions de ces transformations forment un groupe (voir page 268), dont
l’opération est équivalente à la multiplication matricielle sur la matrice 2 × 2, avec des entrées
a, b, c et d. Qui plus est, elles préservent aussi les angles.
Les transformations de Möbius sont utilisées dans la physique, par exemple, pour simplifier
les modèles bidimensionnels des fluides, afin de résoudre plus facilement les problèmes, puis
les faire revenir à l’état initial.
En utilisant les transformations de Möbius, on peut visualiser par ailleurs certaines
caractéristiques du groupe de matrices complexes 2 × 2, créant de beaux graphes comme celui
présenté ci-contre.
Le cercle d’Apollonius est l’un des nombreux motifs remarquables qui peuvent être générés en utilisant les
transformations de Möbius.
Série entière complexe
ne série entière complexe (série de Taylor complexe) est une série infinie de forme
U a0 + a1z + a2z2 + a3z 3 + …, où les coefficients ak sont tous des nombres complexes. Plus
généralement, les puissances de z peuvent être remplacées par des puissances de (z – z0) pour
un nombre complexe invariable z0.
Comme pour la série entière réelle (voir page 106), le problème de convergence est central
pour la théorie de la série entière complexe. Pour établir la convergence, on peut comparer la
somme des modules de chaque terme |a0| + |a1z| + |a2z2| + |a3z3| + … à la progression
géométrique 1 + r + r 2 + r 3… (voir page 100).
Si la série entière converge pour toutes les valeurs de z, alors la fonction créée par la série
est entière. Les fonctions entières incluent les polynômes complexes et les fonctions
complexes de type exponentiel. Si la série entière converge pour les valeurs de z proches de z0,
alors le rayon de convergence de la série est le plus grand r, faisant que la série converge pour
tout z dans un cercle de rayon r centré sur z0.
Module d’une série entière complexe, montrant la divergence en un certain point et le rayon de convergence
concernant un point donné z0.
Fonctions exponentielles complexes
es fonctions exponentielles complexes sont obtenues en appliquant la définition d’une
L fonction exponentielle (voir page 194) à un nombre complexe, z = x + iy. Puisque la
fonction exponentielle de z, e x + iy, peut être exprimée comme exeiy, où ex est la fonction
exponentielle réelle standard, tout ce qui est nouveau dans cette valeur vient de la partie
imaginaire, eiy, appelée fonction exponentielle complexe.
En fait, en représentant eiy comme une série entière (voir page 106) et en séparant les termes
réel et imaginaire, on arrive à la conclusion
ei y = cos y + i sin y.
Donc, les fonctions trigonométriques ne sont pas réellement géométriques, mais des
fonctions exponentielles complexes ! Cette remarquable découverte a des usages pratiques
importants : les ingénieurs utilisent les nombres complexes lors de la modélisation du courant
alternatif, les physiciens se servent des fonctions d’onde complexes pour décrire la probabilité
des événements en mécanique quantique.
D’un point de vue mathématique, il est plus naturel de commencer par la fonction
exponentielle et les nombres complexes et d’en déduire l’interprétation géométrique. Notez
que, en utilisant la formule correspondante pour e-iy, les fonctions cosinus et sinus peuvent être
écrites sous forme de sommes ou de différences des fonctions exponentielles.
La relation entre fonctions exponentielles complexes et les fonctions sinus et cosinus fait
apparaître ce qui, pour beaucoup, est la plus belle équation des mathématiques. C’est l’identité
d’Euler, qui lie les cinq nombres les plus importants de l’analyse mathématique : 0, 1, e, π et i.
Elle est dérivée en posant y = π dans l’équation précédente. Puisque cos π = –1 et sin π = 0,
l’équation devient eiπ = –1. Si on déplace le 1 de l’autre côté de l’équation, on obtient :
eiπ + 1 = 0.
Puisqu’on peut écrire z = x + iy en termes d’un module |z| = r, et un argument θ en tant que
z = r(cos θ + i sin θ), la description module – argument d’un nombre complexe est donnée par
z = reiθ, autre conséquence de cette relation.
Fonctions complexes
ne fonction complexe f (z) est simplement une fonction d’un nombre complexe,
U z = x + iy. Puisque f(z) est complexe, elle a tant une partie réelle qu’une partie
imaginaire, souvent écrite comme u + iv. La théorie des fonctions complexes est franchement
bizarre, générant toutes sortes de résultats spécifiques au monde de l’analyse complexe. Une
fonction de z est très restrictive ; la fonction doit être écrite sans utiliser le nombre complexe
conjugué z*. Par conséquent, la partie réelle de z n’est pas une fonction complexe.
Cette nature spéciale devient très évidente quand les fonctions complexes sont itératives
(voir page 96). Durant l’itération, un nouveau nombre est défini comme étant la fonction du
nombre précédent, puis l’ensemble du processus est répété. La séquence obtenue en utilisant
cette approche fait le sujet du domaine des systèmes dynamiques. Un exemple de structures
créées à partir d’une fonction complexe pure comme c + z2 est présenté ci-contre. Il montre un
ensemble de points appelé ensemble de Julia, dont l’itération ne tend pas vers l’infini.
Dérivation complexe
a dérivée d’une fonction complexe est définie de la même façon que celle d’une fonction
L réelle (voir page 208) : elle mesure la manière dont une fonction change à mesure que sa
valeur change. Par conséquent, la dérivée de f à z, si elle existe, est f’(z) où f(w) – f(z) tend vers
f’(z)(w – z) à mesure que la variable complexe w tend vers z. Cela signifie que si f(z) = z2, alors
la dérivée f ’(z) est 2z.
En raison de la nature bidimensionnelle de la limite et de la forme particulière de la fonction
complexe, satisfaire cette définition impose à la fonction bien plus de restrictions. Par
exemple, si z = x + iy et f(z) = u + iv, alors f est une dérivée complexe si, et seulement si, les
règles appelées conditions de Cauchy – Riemann sont valables pour les dérivées partielles
et . À son tour, cela implique que u et v sont des fonctions harmoniques qui
satisfont . C’est là l’équation de Laplace, l’une des plus omniprésentes équations
de la physique mathématique.
Fonction harmonique
Fonctions analytiques
es fonctions analytiques sont les fonctions complexes dérivables. Puisqu’une fonction
L complexe doit satisfaire l’équation de Laplace (voir page 300) pour être dérivable, de
telles fonctions doivent être dérivables non seulement une fois, mais deux. On s’attendrait à ce
que les fonctions deux fois dérivables soient plus rares que les dérivables, mais en fait c’est le
contraire : il est si difficile pour une fonction complexe d’être dérivable que si une fonction
peut être dérivée une fois, cela implique qu’elle est indéfiniment dérivable. C’est aussi loin de
la dérivation des fonctions réelles (voir page 208) qu’il est possible de l’être !
Donc, dans les cas complexes, si une dérivée existe, alors toutes existent. Supposons que f
et g sont deux fonctions analytiques, chacune ayant une série de Taylor convergente dans une
certaine région du plan complexe. Si les régions se chevauchent et f(z) = g(z) dans la zone de
chevauchement, alors f(z) = g(z) partout. Cette technique de prolongement analytique est
utilisée pour l’analyse de la fonction zêta de Riemann (voir page 394).
Prolongement analytique : l’image montre les régions se chevauchant dans le plan complexe. Si la série de Taylor
d’une fonction converge en une région et la série de Taylor d’une autre fonction converge dans une seconde région,
mais que les deux fonctions sont égales dans le chevauchement, alors ce sont des fonctions de Taylor de la même
fonction analytique.
Singularités
ne singularité est tout point où une fonction complexe n’est pas bien définie. Les
U singularités complexes sont apparentes si elles sont supprimées par le prolongement
analytique, pôles si elles se comportent comme , avec n > 0, essentielles si la série de
Laurent définie ci-dessous a indéfiniment de termes aux puissances négatives, ou points de
branchement si la fonction est multiforme.
Si f(z) est définie près d’un pôle par une série entière qui inclut des puissances négatives de
z, alors :
Ce développement en série de Laurent est utilisé pour exprimer les fonctions complexes qui
ne sont pas analytiques et ne peuvent pas être représentées par le développement traditionnel
en série de Taylor. Une représentation apparentée est le développement de Newton – Puiseux,
série entière généralisée qui peut inclure des puissances fractionnaires de z. Elle est utilisée
pour créer un nouvel objet, une surface de Riemann, à travers laquelle une fonction a une seule
valeur.
À un pôle, la fonction n’est pas définie et son module tend à l’infini.
Surfaces de Riemann
ne surface de Riemann est celle où une fonction multiforme du plan complexe devient
U uniforme sur la surface. Le logarithme naturel, ln(z), du nombre complexe z = |z|eiθ est
ln(|z|) + iθ. Mais puisque e2iπ = 1, utilisant l’Identité d’Euler (voir pag 296), z = |z|ei(θ + 2π), donc
ln(z) est aussi ln(|z|) + i(θ + 2π). En fait, e2kiπ = 1 pour toute valeur nombre entier de k, donc
ln(z) = ln(|z|) + i(θ + 2kπ) pour tout nombre entier k. C’est une fonction complexe multiforme
– la racine carrée de z est un exemple légèrement différent.
La surface de Riemann ci-contre élimine la nature multiforme du logarithme naturel en
séparant les différentes branches des logarithmes. Si on se déplace autour de la colonne
centrale par une rotation (2π radians), on ne revient pas à la même place, comme ce serait le
cas dans un plan. Cela permet au logarithme d’être uniforme sur la surface. La théorie générale
des surfaces de Riemann montre comment créer ces modèles plus compliqués du plan
complexe pour rendre différentes fonctions uniformes.
Courbe d’intégration typique dans le plan complexe pour l’évaluation de l’intégrale d’une fonction réelle en
utilisant des méthodes complexes.
Ensemble de Mandelbrot
’ensemble de Mandelbrot est une fractale définie comme l’ensemble des points c du plan
L complexe pour lesquels la suite définie par récurrence par z0 = 0 ne tend pas vers l’infini
dans zn + 1 = C + zn. Puisque z1 = C si z0 = 0, une autre manière d’énoncer cela est de dire que
les itérations du point complexe C restent bornées. Bien qu’il soit défini par le comportement
de 0 ou de C, un point complexe de l’ensemble de Mandelbrot donne aussi des informations
concernant l’ensemble de Julia (voir page 298).
Les images de l’ensemble de Mandelbrot sont créées numériquement en choisissant
plusieurs valeurs de C et en vérifiant si elles deviennent assez grandes par itération pour
indiquer qu’elles finiront par tendre vers l’infini, avec des astuces telles que l’itération
rétrograde contribuant aux détails. Celles qui ne sont pas colorées en noir produisent l’image
étonnamment belle ci-contre. La frontière de l’ensemble de Mandelbrot est fractale – elle
comporte des détails infiniment complexes, auto-similaires (voir pages 338).
Préambule à l’analyse combinatoire
’analyse combinatoire est la branche des mathématiques qui étudie les combinaisons
L d’ensembles finis et les dénombrements. Comme un joueur de poker évaluant
mentalement la possibilité que les autres joueurs ont certaines mains, cette analyse est
concernée par la découverte du nombre d’objets ou de possibilités d’un certain événement,
sans avoir à énumérer tous les résultats distincts.
L’analyse combinatoire se trouve au cœur de nombreux problèmes de probabilité,
d’optimisation et de théorie des nombres. Parmi les grands représentants de ce quasi art on
trouve Leonhard Euler, Carl Gauss et, plus récemment, le mathématicien hongrois Paul Erdös
célèbre pour son excentricité.
Tenu par le passé pour un domaine dépourvu de théorie, reflétant un manque de techniques
et de méthodes unificatrices, de récentes avancées et réussites suggèrent qu’il se développe en
tant que sujet d’étude tout à fait distinct.
Principe du trou de pigeon
e principe du trou de pigeon (appelé aussi principe des boîtes ou des tiroirs) est une idée
L simple qui a de nombreuses applications. Imaginons qu’on a 101 pigeons. Si on n’a que
100 nids pour eux, il est évident qu’au moins un des 100 nids devra accueillir deux ou
plusieurs pigeons. En termes plus généraux, on peut dire que si on a n trous et m objets avec
m > n, alors au moins un trou contiendra plus d’un objet.
Le principe peut être appliqué à une large gamme de situations. Par exemple, il peut être
utilisé pour démontrer que dans toute ville de plus d’un million d’habitants qui ne sont pas
chauves au moins deux résidants ont exactement le même nombre de cheveux sur la tête. La
démonstration repose sur le fait qu’une personne a environ 150 000 cheveux, donc juste par
précaution on assume que le nombre maximal est 900 000. On a donc un million d’habitants
qui ne sont pas chauves, les m objets, et 900 000 cheveux possibles, le n boîtes. Puisque m > n,
le principe des boîtes dit qu’il doit y avoir au moins deux résidants avec le même nombre de
cheveux.
Théorème de Green-Tao
e théorème de Green-Tao utilise des méthodes de l’analyse combinatoire pour étudier les
L modèles d’apparition des nombres premiers. Le théorème dit que la suite des nombres
premiers contient des suites arithmétiques arbitrairement longues (voir page 98).
Par exemple, les trois premiers nombres premiers, 3, 5 et 7, forment une suite de raison 2
(on ajoute 2 à chaque nombre). Les nombres premiers 199, 409, 619, 829, 1039, 1249, 1459,
1669, 1 879 et 2 089 sont une suite de raison 210. Toutefois, 2 089 + 210 = 2299, qui n’est pas
un nombre premier. Cette progression ne fonctionne plus après dix termes.
De telles suites courtes dans la liste des nombres premiers sont connues depuis des années,
mais le théorème a résisté à toutes les tentatives de le prouver en utilisant les systèmes
dynamiques et la théorie des nombres. En 2004, Ben Green et Terence Tao ont prouvé la
conjecture en utilisant des techniques combinatoires montrant que l’on peut trouver de telles
suites de longueur aussi grande qu’on le souhaite.
Liste des nombres premiers jusqu’à 2100, mettant en évidence la suite formée par l’ajout de 210.
Les ponts de Königsberg
a résolution du célèbre problème mathématique des sept ponts de Königsberg a conduit au
L développement d’une nouvelle discipline, la théorie des graphes. Au XVIIIe siècle, la ville
prussienne de Königsberg (actuel Kaliningrad, Russie), comportait sept ponts connectant
quatre quartiers traversés par le fleuve Pregolia. Était-il possible de faire le tour de la ville en
traversant chaque pont seulement une fois ? Des tâtonnements disaient que c’était très
difficile, mais en 1735 Leonhard Euler a démontré mathématiquement que c’était impossible.
En imaginant chaque quartier comme un point ou un sommet abstrait connecté par des
lignes ou des côtés représentant les ponts, on change la géométrie de la carte en un graphe.
Lors d’une promenade à travers la ville, on s’approche et on s’éloigne de chaque sommet le
long d’un côté. Pour traverser chaque pont seulement une fois, chaque sommet doit se
connecter à un nombre pair de côtés. Puisqu’en fait les sommets sont tous liés à un nombre
impair de côtés, il n’y a pas de trajectoire correspondant à l’exigence du problème initial.
Carte simplifiée représentant le problème du pont de Königsberg (ci-dessus) et représentation graphique (ci-
dessous) montrant le problème en termes de sommets et de côtés.
Préambule à la théorie des graphes
a théorie des graphes est l’étude des connexions. À la différence des graphes des
L fonctions, dans ce contexte les graphes consistent en sommets (points ou nœuds) abstraits
liés par des arêtes (ou arcs). Une suite de sommets reliés par des arêtes est une voie.
Les graphes permettent d’analyser les problèmes combinatoires complexes. Souvent, les
solutions impliquent le dénombrement des voies d’une longueur donnée dans un graphe ou la
compréhension des sous-graphes contenus dans un graphe. De nombreuses applications de la
théorie des graphes ont été développées à partir de l’étude des circuits électriques, les flots sur
les arêtes correspondant à la circulation du courant. Les graphes pondérés de circulation dans
les conduits ou les chaînes d’approvisionnement sont aussi utilisés pour établir le flot maximal
à travers des réseaux, aidant à la modélisation mathématique des processus physiques ou
logistiques. Plus récemment, l’Internet a été vu comme un graphe. Nombre de modèles
modernes d’interaction entre substances chimiques et gènes dans les cellules reposent aussi sur
la théorie des graphes.
Théorème des quatre couleurs
e théorème des quatre couleurs est un cas classique d’étude mathématique. Il prône que le
L nombre minimal de couleurs qui peuvent être utilisées pour colorier une carte de sorte que
deux zones ne partagent aucune frontière commune, est quatre.
En reformulant cela en termes de théorie des graphes, on peut représenter chaque région par
un sommet et connecter deux sommets partageant une frontière à un côté. Le problème est
alors d’associer chaque sommet à une couleur, de sorte qu’aucun des deux sommets adjacents
ne soient identiques.
Problème exigeant l’analyse de plusieurs configurations distinctes, le théorème a été
démontré à la fin des années 1980 par Kenneth Appel et Wolfgang Haken, qui ont utilisé un
logiciel informatique pour vérifier chacun des quelque 2000 cas particuliers. Depuis lors, des
méthodes plus traditionnelles ont été appliquées avec succès et une démonstration analytique
formelle a été achevée en 2005.
Carte des États-Unis. Quatre teintes différentes suffisent pour assurer qu’aucun État ne partage une teinte avec un
État adjacent.
Graphes aléatoires
n graphe aléatoire est un graphe où les arêtes entre sommets sont choisies par un
U processus aléatoire. Pour générer un graphe aléatoire, considérons N sommets, et pour
chaque paire de sommets choisissons de créer une arête, avec la probabilité p, ou aucune arête,
avec la probabilité 1 – p. Il s’avère qu’à mesure que N tend à l’infini, les propriétés de tels
graphes deviennent indépendantes de p et donc le graphe borné est le graphe aléatoire.
En particulier, dans le graphe aléatoire il y aura toujours une voie connectant deux sommets
– le graphe est connexe. Aussi, étant donné deux ensembles finis de sommets, il existe un
sommet qui est connecté à tous les sommets dans l’un des ensembles et à aucun des sommets
dans l’autre. La manière dont un graphe aléatoire évolue typiquement à mesure que N
augmente est intéressante. Tant que N est petit, le graphe contient plusieurs petites
composantes et pas de cycles (voies non triviales à partir d’un sommet vers lui-même). Il y a
un raccourci pour la connexité : si p est un peu plus petit que , alors il y a encore des
sommets isolés.
Préambule aux espaces métriques
es espaces métriques utilisent une abstraction du concept de distance entre objets. Ce sont
L des ensembles (voir page 48) définissant une distance (la métrique) entre éléments.
L’exemple le plus familier est la métrique euclidienne de l’espace tridimensionnel, où la
distance entre deux points x et y est donnée par la longueur de la ligne droite les connectant.
Plus généralement, une métrique d et un ensemble X sont censés former un espace métrique
si d est une fonction réelle des couples de points de l’ensemble d(x, y) satisfaisant trois
conditions :
1. La distance entre deux points est positive et zéro si, et seulement si, les points sont les
mêmes.
2. La distance entre x et y est la même que la distance entre y et x.
3. Pour tout point z, la distance de x à y est moindre que, ou égale à, la distance entre x et z
plus la distance entre z et y.
Géodésiques
ne géodésique est la distance la plus courte entre deux points sur une surface courbe. Sur
U une surface plane, on sait intuitivement que c’est une ligne droite. Sur une surface courbe
toutefois, la distance la plus courte est représentée par une courbe plus générale, qui minimise
une distance définie sur la surface par une métrique (voir page 326). Les géodésiques non-
euclidiennes les plus connues sont les grands cercles, tels que l’équateur et les trajectoires de
vol des long-courriers.
Dans beaucoup de cas, la géodésique peut être déterminée en utilisant l’intégration, en tant
que minimum d’une fonction différentielle décrivant les trajectoires entre deux objets. C’est
ainsi que les géodésiques sont décrites par la théorie de la relativité générale d’Einstein, où
elles représentent les trajectoires des corps à travers l’espace-temps courbe. Le fait que les plus
courtes distances à travers l’espace sont en fait des courbes géodésiques explique les
irrégularités des orbites des planètes autour du Soleil, ainsi que la déviation de la lumière et
des objets massifs à proximité des trous noirs.
Théorèmes du point fixe
es théorèmes du point fixe donnent les conditions sous lesquelles une fonction f(x) admet
L au moins un point fixe – un point tel que f(x) = x. Le théorème du point fixe de Brouwer
montre que, pour toute déformation d’un objet géométrique, la position d’au moins un point
reste inchangée. En prenant deux feuilles de papier, froissez-en une et placez-la sous l’autre,
de sorte qu’aucune de ses parties ne dépasse celle-ci. Le théorème dit qu’au moins un point de
la feuille froissée se trouve directement sous sa position d’origine.
Cela s’applique uniquement si on ne déchire pas la feuille en deux, ce qui, en termes
mathématiques, signifie que la fonction f doit être continue. Similairement, la feuille froissée
doit rester à l’intérieur des limites de la feuille intacte, signifiant que f agit sur un ensemble
fermé de valeurs, auxquelles elle aboutit. En termes généraux, si f est continue et décrit un
ensemble fermé sur lui-même, alors elle doit avoir un point fixe. Des théorèmes similaires sont
très utilisés dans la microéconomie et servent aussi à prouver l’existence et l’unicité des
solutions des équations différentielles.
La continuité des fonctions (voir page 198) précédemment définie en termes de limites a
également une définition équivalente en termes d’ensembles ouverts : une fonction f est
continue si l’image réciproque de chaque ensemble ouvert est aussi ouverte. L’image
réciproque d’un ensemble U est l’ensemble des points x dont l’image, f(x), appartient à U.
Autre notion importante dans les espaces métriques est la compacité, développement de la
notion d’ensemble fermé. Un recouvrement d’un espace est une collection d’ensembles
ouverts dont la réunion englobe l’espace entier. L’espace est compact si chaque recouvrement
a un sous-recouvrement fini. Autrement dit, il y a un ensemble fini d’ensembles ouverts dans
le recouvrement, qui recouvre aussi l’ensemble original.
Cela aide à définir la convergence. Dans un espace compact, chaque suite bornée
d’éléments de l’espace a une sous-suite convergente, et chaque espace compact métrique est
complet : chaque suite de Cauchy (voir page 88) converge vers un point de cet espace.
Fractales
es fractales sont des ensembles qui ont une structure à des échelles arbitrairement infimes.
L Les exemples incluent l’ensemble triadique de Cantor (voir page 66) et la frontière de
l’ensemble de Mandelbrot (voir page 310). Les formes et surfaces complexes des fractales ne
sont pas forcément présentes dans la géométrie euclidienne. L’ensemble triadique de Cantor
possède une dimension non entière et est non dénombrable, si bien qu’il a la cardinalité d’un
intervalle ligne.
Les fractales sont étudiées du point de vue de la théorie de la mesure. Cette théorie est
utilisée en particulier pour définir une « dimension » alternative où la dimension de l’ensemble
triadique de Cantor est comprise entre 0 et 1.
La complexité infinie des fractales est révélée si on tente de recouvrir l’ensemble de boules
ouvertes de diamètre r, puis laisser r tendre vers zéro. Si le nombre de boules nécessaires est
N(r), alors à mesure que r diminue le nombre de boules augmente ; pour une fractale,
l’augmentation est bien plus considérable, car les boules doivent recouvrir ses détails
infinitésimaux.
Une série de boules de rayon r recouvrant le contour de la Grande-Bretagne. À mesure que r diminue, le nombre
requis de boules s’accroît considérablement avec l’apparition de davantage de détails – les fractales imposent cette
croissance exponentielle.
Cadrans solaires fractals
e cadran solaire fractal est une remarquable expérience de pensée proposée par le
L mathématicien Kenneth Falconer en 1990. Falconer a prouvé qu’il est théoriquement
possible de construire une sculpture fractale tridimensionnelle qui jetterait des ombres
variables en forme de chiffres, annonçant le temps comme une horloge numérique.
Le point de départ de Falconer est une suite donnée de lettres ou nombres grossis tracés
dans un plan et une suite correspondante d’angles. Il a montré que pour chaque suite de ce
genre il existe un ensemble fractal pour lequel, au moment où l’angle du Soleil correspond à
un angle de la suite donnée, l’ombre jetée par la fractale sur le plan est proche des lettres ou
des nombres projetés correspondant à cet angle-là.
La démonstration de Falconer n’est pas constructive : elle prouve qu’un tel cadran solaire
est possible, sans proposer de moyen de déterminer la forme de la fractale, donc de construire
un cadran solaire utilisable.
Paradoxe de Banach-Tarski
e paradoxe de Banach – Tarski affirme qu’une boule de l’espace tridimensionnel peut être
L coupée en un nombre fini de morceaux, ré-assemblés ensuite pour former deux boules
identiques à celle d’origine, à un déplacement près. Ou une petite boule solide peut être
coupée puis ré-assemblée en une boule dont le rayon est le double de celui initial. Dans les
deux cas, les morceaux découpés ne sont ni étirés ni déformés de quelque manière que ce soit.
Cela semble illogique : couper et déplacer les morceaux ne peut pas changer leur volume,
donc le volume du début doit être égal au volume de la fin. Toutefois, cela est vrai seulement
si la notion de volume est logique pour les morceaux utilisés dans la construction. Pour une
boule physique, c’est le cas, mais pour une boule mathématique il y a d’autres options.
Le résultat repose sur l’existence d’ensembles non mesurables, collections de points qui
n’ont pas de volume traditionnel, et exige des choix indénombrables afin de préciser la
manière dont la boule est divisée.
Selon le paradoxe de Banach-Tarski, il est possible de diviser certains modèles mathématiques de boules en
segments qui peuvent être ré-assemblés pour former deux boules identiques à l’original. Avec des boules réelles, ce
n’est pas si facile !
Préambule à la topologie
a topologie est la branche des mathématiques qui décrit les formes et identifie leurs
L équivalences. Ce domaine implique de considérer les propriétés importantes des formes et
la manière dont elles peuvent être reconnues. En topologie, un beignet et une tasse à café
peuvent être classifiés comme « identiques », car chacun contient une seule surface et un seul
trou.
Quelques exemples simples d’objets topologiques sont les formes qu’on peut construire
avec une feuille de papier en collant ses bords. En collant deux bords opposés, on obtient un
tube ou un cylindre, en collant les deux autres bords, on crée un tore. Deux autres objets,
l’anneau de Möbius (voir page 346) et la bouteille de Klein (voir page 348) peuvent être créés
– en théorie – en imprimant certaines torsions.
Les idées topologiques sont utilisées dans les programmes de reconnaissance optique et
l’infographie. Elles peuvent aussi être appliquées aux problèmes tels que le placement des
antennes de télécommunication.
Anneau de Möbius
’anneau de Möbius est une surface avec un seul côté et un seul bord. Il est formé en
L prenant une bande de papier et en lui imprimant une torsion de sorte qu’un côté est
retourné, puis en joignant les deux extrémités de la boucle.
Cet anneau est un exemple de surface non-orientable. L’orientation permet de savoir si une
surface a un « dessus » et un « dessous ». Prenons un vecteur normal en un point
perpendiculaire à la surface et transportons-le continuellement partout autour de la surface, le
long d’une trajectoire. Sur une surface non-orientable telle que l’anneau de Möbius, il y a des
trajectoires telles que, lorsque le vecteur revient à son point d’origine, il est orienté dans la
direction opposée à la direction vers laquelle il est parti. L’intérieur et l’extérieur finissent par
se confondre !
En collant deux anneaux de Möbius le long de leurs bords, on obtient un objet apparenté, la
bouteille de Klein. Dans l’espace euclidien tridimensionnel, cette action n’est pas possible
sans déchirer le papier.
Bouteille de Klein
a bouteille de Klein est une surface non-orientable qui n’a qu’un côté et pas de bords. Elle
L est formée – mathématiquement parlant – en prenant une feuille de papier et en faisant
adhérer les bords opposés pour obtenir un cylindre, puis en faisant adhérer les deux autres
bords dans la direction opposée à celle qui crée un tore.
Dans un espace tridimensionnel, la surface de la bouteille de Klein devra se traverser elle-
même afin d’aligner les bords, alors que dans un espace quadridimensionnel elle peut exister
sans auto-intersection.
À la différence de l’anneau de Möbius, la bouteille de Klein est une surface fermée, pour
laquelle il n’est pas possible de définir un « intérieur » et un « extérieur » – elle est compacte
(voir page 337). Les mathématiciens classifient les surfaces fermées en comptant le nombre de
trous de la surface et en déterminant si celle-ci est orientable ou non.
Caractéristique d’Euler
a caractéristique d’Euler est un nombre qui peut être associé à une surface et qui reste
L inchangé lorsque la forme est pliée ou déformée. Elle offre une manière de déterminer des
propriétés telles que le nombre de trous d’une surface.
Un polyèdre est une surface fermée particulièrement simple, consistant en un nombre de
faces plates liées par des bords droits, qui se rencontrent aux sommets. Leonhard Euler a noté
que pour tout polyèdre avec un nombre de faces F, un nombre de bords E et un nombre de
sommets V, il y a l’équation V – E + F = 2. Les surfaces plus générales peuvent être divisées
en faces et bords courbes, se rencontrant aux sommets de manière similaire. Dans le tore ci-
contre, V = 1, E = 2 et F = 1, donnant V – E + F = 0.
Le nombre V – E + F est appelé la caractéristique d’Euler d’une surface. Pour une surface
fermée orientable, le nombre de trous g, appelé le genre de la surface, se rapporte à la
caractéristique d’Euler par l’équation V – E + F = 2 – 2g.
Ces informations, ou leurs équivalents multidimensionnels, sont les trois premiers nombres
de Betti de l’objet.
Un tore comme celui-ci a une composante connexe, deux trous « circulaires » (un à travers le centre et un à
l’intérieur de la surface) et un vide tridimensionnel (celui à l’intérieur de la surface). Cela donne ses trois premiers
nombres de Betti comme 1, 2, 1.
Conjecture de géométrisation de Thurston
a conjecture de géométrisation de Thurston permet la classification des surfaces fermées
L de dimension 3. En 1982, Bill Thurston a énuméré huit variétés orientables de dimension
3, chacune liée à une définition différente de la distance sur la surface. Thurston a conjecturé
que chaque surface tridimensionnelle peut être obtenue en « suturant » des exemples de ces
huit structures géométriques.
Chacune des huit variétés de Thurston est liée à un groupe de Lie (voir page 278). La plus
simple est liée à la géométrie euclidienne et comporte dix variantes fermées finies, alors que
les autres sont liées à la géométrie sphérique et à la géométrie hyperbolique, qui n’ont pas
encore été complètement classifiées. La manière dont elles s’accordent est reflétée dans la
structure du groupe fondamental des variétés orientables de dimension 3.
En 2003, Grigori Perelman a démontré la conjecture en utilisant une technique avancée, le
flot de Ricci, pour déterminer l’équivalence des diverses géométries.
Dans la conjecture de géométrisation de Thurston, les surfaces tridimensionnelles telles que les sphères et les tores
sont suturées à partir des variétés.
Conjecture de Poincaré
a conjecture de Poincaré est l’un des problèmes du millénaire du Clay Institute (voir
L page 405), le premier à être résolu – par Grigori Perelman en 2003. En termes simples,
elle suggère que toutes les variétés tridimensionnelles fermées sans trous sont
topologiquement équivalentes à une sphère tridimensionnelle.
Un espace n’a pas de trous (est connecté simplement) si chaque boucle peut être contractée
à un point, de sorte que le groupe fondamental est trivial. En deux dimensions, la seule surface
avec cette propriété est la surface d’une sphère topologique. En 1904, Henri Poincaré a
conjecturé que cela est aussi vrai en trois dimensions. Le problème était de démontrer
l’existence d’une quelconque variété tridimensionnelle extravagante simplement connectée,
mais pas une sphère.
Perelman a prouvé que la conjecture de géométrisation de Thurston (voir page 358) écarte
cette possibilité, bien qu’à ce jour il ait refusé le million de dollars récompensant cet exploit.
L’analogue de la conjecture de Poincaré pour des multiples dimensions a été en fait résolu
plus tôt. Le problème en cinq dimensions a été attaqué dans les années 1960 par Stephen
Smale, une amélioration ultérieure étant due à Max Newman. Le problème à quatre
dimensions a été abordé par Michael Freedman en 1982.
Sur toute surface qui est homéomorphe à une sphère normale, les boucles peuvent être contractées à un point.
Homologie
’homologie est une manière de mesurer les trous des espaces topologiques. Elle implique
L de regarder les ensembles de l’espace qui n’ont pas de limite, sans être pour autant la
limite de quelque chose d’autre, identifiant par conséquent les trous.
Les groupes d’homologie d’un espace peuvent être calculés par ordinateur en triangulant
l’ensemble : le convertissant en sommets, arêtes, faces triangulaires, volumes tétraédriques et
ainsi de suite jusqu’à des dimensions plus nombreuses. Celles-ci peuvent être organisées pour
former une structure de groupe utilisant des opérateurs bornés qui décomposent les faces en
arêtes, etc., et une direction définie. Une autre approche, la cohomologie, construit les parties
multidimensionnelles à partir de celles de moindres dimensions. En fonction du problème,
l’une ou l’autre des approches peut s’avérer plus facile ou offrir des résultats plus clairs.
Les groupes d’homologie sont bien plus faciles à traiter que les groupes d’homotopie.
Toutefois, puisqu’il y a quelques trous subtils que l’homologie ne prend pas en compte,
l’homotopie peut encore être requise.
Fibrés vectoriels
es fibrés vectoriels offrent une manière de considérer les structures topologiques définies
L sur une surface, plutôt qu’en elle. Définir le fibré vectoriel sur une surface implique
d’associer un espace vectoriel (voir page 266) à chaque point de cette surface. En choisissant
un élément particulier dans l’espace vectoriel, appelé une fibre, et en l’associant à un point de
la surface, on crée un champ de vecteurs, qui peut être représenté par une flèche en chaque
point.
Les fibrés offrent de nombreuses manières de décrire les variétés. La caractéristique d’Euler
(voir page 350) apparaît naturellement dans ce contexte en tant que nombre d’intersection
décrivant les zéros des champs de vecteurs sur la surface : s’il est différent de zéro, alors tout
champ de vecteurs continu de la variété doit avoir un zéro quelque part. Il est parfois appelé le
théorème de la boule chevelue : les cheveux correspondent à un champ de vecteurs sur la
variété, et l’existence d’un zéro correspond au fait que toute manière de disposer la coiffure
contient au moins un épi.
La boule chevelue et le tore chevelu démontrent la circulation possible des fibrés vectoriels à travers une surface.
K-théorie
a K-théorie a été développée dans les années 1950 et offre une manière de séparer les
L fibrés vectoriels d’une variété en différentes classes – anneaux et groupes (voir pages 280
et 268). Cette classification conduit à son tour à une autre manière de compter les trous d’une
surface topologique.
La K-théorie a des parallèles avec la cohomologie, une variante plus affinée d’homologie
(voir page 362). Elle s’est avérée être un outil très pratique, avec des applications dans le
domaine des équations différentielles ; de plus, elle fournit la base théorique pour le
développement du domaine de la géométrie non-commutative – la géométrie des espaces dont
les descriptions algébriques sont non-commutatives, autrement dit où xy n’est pas forcément
égal à yx. En physique théorique, la K-théorie joue un rôle important pour certaines des
théories des cordes qui tentent de décrire les particules fondamentales de l’univers en tant que
cordes multidimensionnelles vibrantes.
Théorie des nœuds
n nœud est une courbe fermée dans un espace tridimensionnel. Deux ou plusieurs telles
U courbes sont appelées ficelles. La théorie des nœuds est l’étude mathématique des bouts
de ficelle idéalisés, considérant la manière dont ils doivent être représentés et les règles pour
les distinguer l’un de l’autre.
Dans ce contexte, les nœuds sont équivalents si leurs courbes peuvent se transformer
continuellement l’une dans l’autre en étant déformées sans coupure ou déchirure. Néanmoins,
la comparaison des nœuds n’a pas encore de solution facile. Il existe plusieurs invariants de
nœud, propriétés qui sont les mêmes pour tous les nœuds d’un certain type et qui ne sont pas
modifiées par les transformations. Dans tous les cas connus, il y a différents nœuds qui
peuvent avoir le même nœud invariant.
La théorie des nœuds est utilisée en biologie pour décrire les configurations de l’ADN et
des protéines longues. Elle est aussi utilisée dans les systèmes dynamiques à peu de
dimensions pour déterminer l’interaction des orbites périodiques de certaines équations
différentielles.
Logique et théorèmes
Une fois l’impossible éliminé, ce qui reste, si improbable que ce soit, est la réponse »,
« disait Sherlock Holmes. La méthode de Holmes est celle du mathématicien. On utilise des
termes comme rigueur et précision pour décrire l’état d’esprit qui rend les déductions
possibles – la capacité de voir que toutes les possibilités ont été étudiées et qu’il n’y a pas
d’ambiguïté et pas de cas particulier laissé de côté.
Les conjonctions logiques, telles que « implique » ou « il existe », sont utilisées dans ce
livre sans beaucoup d’élaboration, mais il faut reconnaître que la logique est un domaine de
plein droit des mathématiques.
Les raisonnements mathématiques utilisent des règles de logique, qui déterminent la
manière dont les affirmations concernant les propriétés des objets mathématiques peuvent être
manipulées de sorte que, si certaines affirmations élémentaires sont vraies, alors les
affirmations construites à partir d’elles sont aussi vraies. Mais ce n’est pas juste la
manipulation qui fournit la signification : les propriétés et les objets, étant abstraits, exigent
une définition formelle. Être précis à propos de nos déductions a un sens seulement si les
objets et leurs propriétés sont correctement décrits.
Idéalement, les mathématiques débutent par un ensemble d’objets – les primitives – et
d’axiomes – les propriétés de ces primitives. Des affirmations plus complexes sont construites
à partir de celles-ci en utilisant la logique. Parmi les exemples de tels systèmes axiomatiques il
y a la géométrie classique (voir page 108) et la théorie des ensembles (voir page 48).
À partir des définitions et de l’intuition, on crée des conjectures, affirmations qu’on cherche
à prouver ou à réfuter. Une conjecture avérée – un théorème – doit être correcte, juste et
précise. Les théorèmes prétendent dire quelque chose de nouveau à propos des objets
considérés – quelque chose qui découle logiquement des définitions de départ. Le
mathématicien hongrois Paul Erdõs est censé avoir dit qu’un mathématicien est un mécanisme
transformant le café en théorèmes.
La chose étonnante à propos des mathématiques est qu’il semble possible d’obtenir des
résultats non triviaux, même s’ils sont tautologiques selon la définition stricte de ce terme.
Bien qu’ils découlent logiquement à partir de la vérité supposée, ils ne sont pas facilement
évidents.
Préambule à la démonstration
ne démonstration est un argument qui démontre un résultat, non juste au-delà du doute
U raisonnable, mais au-delà de tout doute. Du moins, c’est le principe. Toutefois, en
pratique, on n’a ni l’espace ni le temps pour réduire chaque argument à sa suite complète
d’étapes logiques. Les détails risquent par conséquent d’être omis en tant qu’évidents ou
triviaux, ce qui peut conduire à des erreurs invalidant la démonstration.
Il est difficile de définir exactement ce qui constitue une démonstration. Pour certains, c’est
un construct sociologique – quelque chose qui, pour les mathématiciens, crée la certitude. Pour
d’autres, c’est une recette qui peut être vérifiée par une machine ou un Martien qui comprend
la syntaxe logique.
Il y a plusieurs stratégies distinctes pour formuler les démonstrations. Différentes approches
peuvent être plus ou moins réussies pour tout problème donné. L’un des aspects des
mathématiques est de trouver la voie la plus facile ou la plus élégante vers un résultat.
Le célèbre livre de Lewis Carroll, Alice au pays des merveilles, est riche en exemples de démonstration et en
sophismes logiques apparaissant quand ses méthodes ne sont pas correctement comprises.
Démonstration directe
e type le plus simple de démonstration est la démonstration directe – celle qui suit une
L série d’affirmations logiques à partir d’un ensemble de suppositions jusqu’à une
conclusion souhaitée.
Toutefois, puisqu’il est presque impossible – et insupportablement ennuyeux ! – de noter
chaque étape élémentaire d’une démonstration, depuis les axiomes initiaux aux moindres
détails, même une démonstration directe implique généralement des raccourcis.
Les arguments standard de la démonstration directe sont des ensembles de règles simples de
déduction, telles que la technique appelée modus ponens (principe de l’implication ou du
syllogisme). Supposons qu’on veut prouver une affirmation Q. Si on peut établir que si P est
vrai, alors Q est vraie, autrement dit que P implique Q, pour une autre affirmation P qu’on
peut déjà prouver être vraie, alors cette démonstration en deux étapes est la même que montrer
que Q est vrai directement.
Pour prendre un exemple simple, supposons qu’on veut montrer que le carré de chaque
nombre pair positif est divisible par quatre. Si un nombre est pair et positif, alors il peut être
écrit sous la forme 2n, pour un quelconque nombre positif naturel n. Son carré est 4n2, qui est
divisible par quatre.
Ici, l’affirmation P est « un nombre pair positif peut être écrite comme 2 fois un nombre
positif naturel » et l’affirmation Q est « le carré d’un nombre pair positif est divisible par
quatre ».
Cela peut sembler trivial – c’est un peu plus qu’un réarrangement des définitions des
nombres impliqués – mais la démonstration directe est la fondation de plusieurs
démonstrations mathématiques.
Bien entendu, toutes les méthodes de démonstration ne sont pas si simples à suivre, et
certaines – démonstration par analyse-synthèse, démonstrations probabilistes et induction
mathématique (voir page 382), par exemple – suscitent des débats philosophiques intéressants.
Démonstration par contradiction
a démonstration par contradiction est la variante mathématique de l’argument logique
L connu comme réduction par l’absurde, où le déni d’une affirmation conduit à un résultat
absurde ou dénué de sens. Pour les mathématiques, l’affirmation absurde est une contradiction
d’une chose connue pour être vraie.
L’argument utilise la ligne de raisonnement suivante :
•· Pour dmontrer que Q doit être vrai, supposons qu’il n’est pas vrai, supposons que la
négation de Q est vraie.
• Utilisons d’autres mthodes de dmonstration pour montrer qu’une conséquence de cette
supposition est une afÞrmation qui est connue comme tant fausse. Par exemple, « prouvez »
que 0 = 1.
• Cela montre que la supposition de travail initiale a dû être fausse et que Q est par
conséquent vrai.
Affirmation : Si un élément est dans un ensemble A, alors il doit être aussi dans l’ensemble B.
Contraposition : Si un élément n’est pas dans l’ensemble B, alors il ne peut pas être dans l’ensemble A.
Affirmation : Si un animal est un oiseau, alors il a des plumes.
Contraposition : Si un animal n’a pas de plumes, alors ce n’est pas un oiseau.
NB – Cela n’est pas une démonstration suffisante que tous les animaux à plumes sont des oiseaux.
Induction mathématique
ertains résultats mathématiques impliquent des affirmations qui dépendent d’un nombre
C naturel, si bien que l’affirmation à être prouvée est quelque chose du genre pour chaque
n = 1, 2, 3,…, P(n) est vrai. L’induction permet de gérer cet ensemble infini d’affirmations en
utilisant une notion théorique.
Au lieu d’établir le résultat séparément pour chaque valeur de n, l’induction mathématique
utilise une suite d’étapes :
1. Montrer que le résultat est vrai si n = 1, autrement dit prouver P(1).
2. Assumer que le résultat est vrai pour n = k, avec k 2: 1.
3. Prouver que si P(k) est vrai, alors P(k + 1) est vrai.
4. Cela tablit P(n) pour tout n.
L’étape 4 découle des trois premiers dans un argument en boucle. P(1) est vrai à l’étape 1.
Puisque P(1) est vrai, alors P(2) est vrai à l’étape 3. Puisque P(2) est vrai, l’étape 3 prouve que
P(3) est aussi vrai, etc. Toutefois, les problèmes philosophiques des concepts d’infini ont
conduit certains à réfuter les arguments inductifs.
La spirale d’Ulam est un modèle remarquable des nombres premiers. Lorsque les nombres sont disposés dans une
spirale rectangulaire simple, les nombres premiers montrent une tendance marquée à se trouver sur les diagonales.
Démonstration d’Euclide des nombres premiers infinis
a démonstration de l’existence d’infiniment de nombres premiers est présente dans les
L Éléments d’Euclide, rédigés il y a plus de 2 000 ans. L’approche la plus simple utilise la
démonstration par contradiction, où la négation d’une affirmation conduit à un résultat absurde
ou contradictoire. On commence donc en supposant qu’il y a exactement N nombres premiers,
qui peuvent être listés p1,…, pN, où N est un nombre fini. Considérons maintenant le nombre x
qui est le produit des N nombres premiers plus 1, qui est x = (p1 × p2 … × pN) + 1.
Diviser x par n’importe lequel des p1,…, pN laissera un reste 1, donc x n’est divisible par
aucun nombre de la liste finie de nombres premiers. Mais puisque tous les nombres non
premiers peuvent être exprimés en tant que produit des nombres premiers (voir page 30), cela
implique que les seuls diviseurs de x sont 1 et x lui-même. Donc, x doit être un nombre
premier. Mais dans ce cas, la liste des N nombres premiers n’est pas complète. Cela contredit
la supposition initiale et montre qu’il y a en fait infiniment de nombres premiers.
Une grande spirale d’Ulam trace la position de 40 000 nombres, où les nombres premiers sont des points noirs.
Nombres premiers jumeaux
es nombres premiers jumeaux sont des couples de nombres premiers qui sont des nombres
L impairs consécutifs ; ils sont séparés par deux nombres premiers. Considérons juste
quelques nombres premiers pour commencer, par exemple : 2, 3, 5, 7, 11, 13, 17, 19, 23, 29,
31, 37, 41, 43, 47, 53… Ici, 11 et 13, 17 et 19, 29 et 31, et 41 et 43 sont des nombres premiers
jumeaux, alors que 3, 5 et 7 forment un triplet de nombres premiers !
Il existe quelque 808 675 888 577 436 nombres premiers jumeaux en dessous de la valeur
de 1018. Pour la plupart des mathématiciens, la conjecture des nombres premiers jumeaux dit
qu’il y en a infiniment, bien que cela n’ait pas été prouvé à ce jour.
D’autres couples de nombres premiers peuvent être construits par analogie avec les nombres
premiers jumeaux – les nombres premiers cousins sont ceux séparés par quatre nombres
premiers, les nombres premiers sexy sont ceux séparés par six. La conjecture de Poignac
propose que pour tout nombre naturel pair k il est possible de trouver un nombre infini de
nombres premiers jumeaux séparés par k.
Théorème des nombres premiers
e théorème des nombres premiers décrit la manière dont les nombres premiers sont
L distribués. Il affirme que le nombre de nombres premiers inférieurs à tout nombre réel x
est équivalent égal à .
En utilisant des tables des nombres premiers connus, Carl Gauss a eu l’intuition que la
densité des nombres premiers est équivalente à . Cela signifie que la probabilité de trouver
un nombre premier dans une petite gamme de taille d autour de x est à peu près . Si cela
est vrai, alors le nombre total de nombres premiers inférieurs à x est à peu près l’intégrale de la
densité , qui est environ de l’ordre de .
Tracé des parties réelle (blanche) et imaginaire (grise) de la fonction zêta de Riemann pour + ix. Un zéro de
Riemann apparaît quand les deux courbes sont simultanément zéro.
Triplets pythagoriciens
rois nombres entiers a, b et c forment un triplet pythagoricien s’ils satisfont l’équation
T
52.
a2 + b2 = c2. Donc (3, 4, 5) est un triplet pythagoricien, puisque 32 + 42 = 9 + 16 = 25, ou
Comme les nombres premiers de la spirale d’Ulam, les tracés des triplets pythagoriciens révèlent aussi une
structure remarquable.
Dernier théorème de Fermat
e dernier théorème de Fermat affirme qu’aucun des trois nombres entiers positifs a, b et c
L ne peut satisfaire l’équation an + bn = cn où n ≥ 2. Ceci est un développement naturel des
triplets pythagoriciens, où n = 2. Le mathématicien français Pierre de Fermat a noté ce
théorème sur la marge d’une page d’un manuel de mathématique de 1637. Il affirmait avoir
découvert une méthode de le prouver (ci-contre), mais si cette démonstration a vraiment
existé, elle n’a jamais été dévoilée, même s’il a laissé une démonstration pour n = 4.
350 ans et beaucoup de mathématiques inventives plus tard, Andrew Wiles a annoncé une
démonstration au Isaac Newton Institute de Cambridge. Même si sa démonstration présentait
un problème, celui-ci a été rapidement réglé et la variante finale a été acceptée en 1995.
L’approche de Wiles était basée sur la théorie des courbes elliptiques (voir page 402),
établissant que si des triples supérieurs existent, cela contredira toute autre conjecture majeure
du moment. En prouvant que cette conjecture est vraie, Wiles a aussi résolu le problème de
Fermat.
Points rationnels sur une courbe
es points rationnels sont des nombres ou des valeurs d’une fonction, qui peuvent être
L exprimés en tant que ratio de deux nombres naturels. L’identification des points
rationnels sur les courbes elliptiques est importante pour la solution du dernier théorème de
Fermat (voir page 400).
Diviser la relation de Fermat an + bn = cn par cn donne . Si les solutions à
cette équation existent, elles doivent correspondre à des points sur une courbe x n + y n = 1, où
x et y sont des nombres rationnels. Pour la courbe x2 + y2 = 1 il y a infiniment de points
rationnels, et donc l’expression a2 + b2 = c2 a infiniment de solutions, les triplets
pythagoriciens infinis. Pour des valeurs de n supérieures à 2, toutefois, les choses deviennent
plus compliquées.
Cette correspondance entre points rationnels sur les courbes et solutions nombres entiers des
équations a conduit à une étude plus attentive de la manière dont les courbes continues
coupent les points rationnels. Pour des courbes simples, il y a soit infiniment de points
rationnels, soit aucun. Les courbes plus compliquées ont un nombre fini de points.
Un groupe commutatif peut aussi être associé à une courbe elliptique. La ligne connectant deux points coupe la
courbe en un troisième point, et la réflexion de ce point sur l’axe x donne la composition du groupe des deux
points.
Conjecture de Birch et Swinnerton-Dyer
a conjecture de Birch et Swinnerton-Dyer est l’un des problèmes du millénaire du Clay
L Institute, non encore résolu. De la même façon que la fonction zêta de Riemann dénombre
les nombres premiers, la conjecture affirme qu’il doit y avoir une série entière similaire qui
dénombre les points rationnels d’une courbe elliptique.
Plus exactement, étant donné une courbe elliptique, Bryan Birch et Peter Swinnerton-Dyer
ont montré comment définir une série entière aux coefficients , dont le comportement pour
s = 1 détermine, selon eux, s’il y a infiniment de points rationnels ou s’il y a un nombre fini de
tels points.
Bien que généralement non encore prouvée, on sait que la conjecture est vraie pour
plusieurs cas particuliers. La conjecture est centrale pour la compréhension du point auquel les
fonctions comme celle-ci peuvent être utilisées pour déterminer plusieurs propriétés
théoriques.
Programme de Langlands
e programme de Langlands est une collection de conjectures liant des sujets dans la
L théorie des nombres et la théorie des groupes, ayant le potentiel d’unifier plusieurs
domaines des mathématiques longtemps considérés comme fondamentalement distincts.
Proposées pour la première fois par le mathématicien canadien Robert Langlands dans les
années 1960, les conjectures prennent la forme d’un dictionnaire de correspondances,
suggérant que si un certain résultat est vrai dans une théorie, alors un résultat analogue est vrai
dans une autre.
Le travail final aboutissant à la démonstration du dernier théorème de Fermat (voir
page 400) a découlé du programme de Langlands. Toutefois, alors qu’il y a eu des progrès
encourageants dans cette direction et quelques autres, beaucoup d’autres domaines restent
ouverts et non prouvés. Quoi qu’il en soit, le programme de Langlands est certainement l’un
des plus grands thèmes unifiants des mathématiques modernes.
Glossaire
Associativité
Calcul infinitésimal
L’étude des fonctions utilisant des limites pour explorer les taux de variation (différentiation)
et sommes ou aires (intégration).
Commutative
Continuité
Une fonction est continue si elle peut être tracée sans lever le crayon du papier.
Autrement dit, la limite de la fonction, évaluée sur une suite de points tendant vers la même
valeur, est égale à la valeur de la fonction en ce point là.
Convergence
Dénombrable
Ensemble qui peut être écrit comme une liste (possiblement infinie).
Les éléments peuvent être associés au sous-ensemble des nombres naturels.
Distributif
Étant donné deux opérations « o » et « × » définies par des paires d’éléments d’un ensemble,
alors × est distributif gauche sur o si a×(b o c) = (a × b) o (a × c), et distributif droit si
(a o b) × c =(a × c) o (b × c) pour tous trois éléments a, b et c de l’ensemble ; × est distributif
sur o s’il est distributif tant gauche que droit.
Ellipse
Courbe fermée qui peut être écrite sous la forme x2/a2 + y2/b2 = 1 pour des nombres entiers
positifs constants a et b. Si a = b, la courbe est un cercle.
Ensemble
Espace vectoriel
Fonction exponentielle
Fractale
Ensemble avec une structure à toute échelle, si bien que de nouvelles caractéristiques
émergent, quelle que soit la distance de l’observateur.
Groupe
Hyperbole
Courbe qui peut être écrite sous la forme x2/a2 – y2/b2 = 1 pour des nombres entiers positifs
constants a et b.
Image
L’ensemble de toutes les valeurs que peut prendre une fonction lorsqu’elle est calculée pour
un domaine donné.
Indénombrable
Ensemble dont aucune liste, finie ou infinie, ne peut contenir tous les éléments.
Intégration
Limite
La valeur vers laquelle tend une suite si elle est convergente, si bien que pour toute précision
désirée après une certaine étape de la suite tous les termes successifs se trouvent dans cette
précision de la limite. des points d’un espace qui peut agir comme une distance. Si d est une
métrique, alors d(x, y) = 0 si, et seulement si, x = y, d(x, y) = d(y, x) et d(x, z) est plus petite ou
égale à d(x, y) + d(y, z) pour tout x, y et z. Peut aussi être construite par intégration.
Mesure
Fonction qui peut être utilisée pour déterminer la taille généralisée de différents sous-
ensembles d’un ensemble. Importante pour l’intégration et la théorie des probabilités.
Métrique
Nombre complexe
« Nombre » de forme a + ib où a et b sont des nombres réels et i est la racine carrée de moins
1 ; a est la partie réelle, b est la partie imaginaire du nombre complexe.
Nombre imaginaire
Nombre complexe différent de zéro, dont la partie réelle est zéro, autrement dit un nombre de
la forme ib où b est différent de zéro.
Nombre naturel
Nombre entier. L’ensemble des nombres naturels est {0, 1, 2, 3, …}, incluant zéro mais pas
l’infini. Certains n’incluent pas le zéro dans leur définition, mais nous appelons l’ensemble {1,
2, 3, …} les nombres entiers positifs.
Nombre premier
Nombre entier positif plus grand que 1, dont les seuls diviseurs sont 1 et lui-même.
Nombre rationnel
Nombre qui peut être écrit comme un nombre entier divisé par un nombre entier différent de
zéro, autrement dit a/b où a et b sont des nombres entiers avec b différent de zéro.
Nombre réel
Nombre qui est soit rationnel soit la limite d’une suite de rationnels. Tout nombre réel peut
être écrit comme un nombre décimal.
Noyau
Parabole
Courbe qui peut être écrite sous la forme y = ax2 + ax + c où a, b et c sont réels et a est
différent de zéro.
Sections coniques
Famille de courbes géométriques obtenues par l’intersection d’un plan avec un cône. Les
cercles, les ellipses, les paraboles et les hyperboles sont tous des sections coniques.
Série
La série de Taylor d’une fonction en un point x est une série entière de termes impliquant
(x – x0)n avec n = 0, 1, 2, 3,… qui convergent pour x suffisamment proche de x0.
Suite
Vecteur