Précis d'épistémologie/La vérité des principes relativistes

Le principe de relativité générale

Les lois de la physique ne doivent pas dépendre du système de coordonnées avec lequel elles sont formulées. (Einstein 1916)

Qu'est-ce que ça veut dire ?

Un système de coordonnées nous permet de nommer des objets physiques. Un point de l'espace par exemple peut être nommé avec trois nombres, ses trois coordonnées, dès qu'on s'est donné un système de repérage. Quand on change de système de coordonnées, on change les noms des objets physiques, mais on ne change pas les objets eux-mêmes ni leurs relations. Les vérités ne doivent pas dépendre de la façon dont les objets sont nommés. Les mêmes vérités peuvent être dites quelle que soit la façon dont nous nommons les objets, elles sont seulement formulées différemment. Le principe de relativité générale, proposé par Einstein comme une avancée théorique majeure, parce qu'il est au fondement de sa théorie de la gravitation, ressemble donc à une trivialité : la vérité demeure quand on change sa formulation.

Une formulation plus moderne du principe de relativité générale ne modifie pas cette apparence de trivialité :

Toutes les lois de la physique doivent pouvoir être formulées par des relations géométriques, indépendantes du système de coordonnées, entre objets géométriques, indépendants du système de coordonnées. (Thorne & Blandford, Modern Classical Physics, p.1154, abrégé dans la suite par MCP)

Plus simplement dit, les lois de la physique doivent énoncer des vérités sur des relations entre des objets.

Mais si le principe de relativité générale est seulement une trivialité, pourquoi est-il le plus grand principe de toute la physique classique ? Pourquoi nous permet-il de comprendre d'une façon unifiée à la fois la physique de Newton, la théorie de la relativité restreinte et la théorie de la relativité générale ? Pourquoi a-t-il conduit Einstein à la découverte de la loi fondamentale de la gravitation ?

La façon dont on applique le principe de relativité générale lui donne une signification physique, c'est à dire qu'elle nous conduit à formuler des lois qu'on peut confronter à l'observation. Plus précisément on postule que tous les objets physiques sont déterminés avec des scalaires, des vecteurs et des tenseurs et que les lois physiques sont toujours des égalités entre scalaires, ou entre vecteurs, ou entre tenseurs. Trois espace-temps sont de première importance pour définir les objets physiques avec des scalaires, des vecteurs et des tenseurs : l'espace-temps classique de Newton, l'espace-temps de Minkowski, pour la théorie de la relativité restreinte, et l'espace-temps courbe de la relativité générale. Les propriétés géométriques de l'espace-temps imposent des contraintes sur les scalaires, les vecteurs et les tenseurs qu'on peut y définir et sur les lois physiques qu'on peut leur appliquer. Le principe de relativité générale à lui tout seul n'a pas de signification physique, mais il en acquiert une dès qu'il est accompagné des principes de la géométrie de l'espace-temps.

Quand on applique le principe de relativité générale on respecte en outre en général le principe de localité :

Les lois de la physique doivent être des égalités entre scalaires, ou entre vecteurs, ou entre tenseurs, définis au même point de l'espace-temps.

La loi de la gravitation universelle de Newton ne respecte pas le principe de localité, parce qu'elle postule une action instantanée à distance, mais c'est une faiblesse de la théorie et une exception dans la physique newtonienne. En général, la physique de Newton et de ses successeurs respecte le principe de localité. La dynamique des solides et des fluides incompressibles est aussi une exception, mais ce n'est pas une objection fondamentale, parce que les solides et les fluides incompressibles ne sont que des modèles approximatifs de la réalité. Tous les solides et tous les fluides sont toujours compressibles, au moins un peu.

Le principe de relativité générale a été curieusement nommé, parce qu'il affirme que les lois de la physique ne sont pas relatives à un système de coordonnées ou à un observateur particulier. C'est donc un principe qui affirme le caractère absolu de la vérité physique. Les théories de la relativité restreinte et générale qu'il permet de fonder sont également des théories de la vérité absolue. Le principe de relativité serait donc mieux nommé si on l'appelait le principe d'absoluité, mais Einstein en a décidé autrement, et son usage s'est imposé.

Qu'est-ce qu'un tenseur ?

Un tenseur de rang n est par définition une application linéaire qui associe un scalaire, c'est à dire un nombre réel indépendant du système de coordonnées, à n vecteurs (MCP, p.11).

Dans un espace vectoriel euclidien $E$ le produit scalaire de deux vecteurs est un tenseur, de rang 2, de toute première importance. En particulier, il permet d'identifier un vecteur $v$ avec le tenseur de rang 1 défini par $F(u)=u.v$ . De même, une application linéaire $A$ de $E$ dans $E$ peut être identifiée à un tenseur de rang 2 défini par $T(u,v)=A(u).v$

Les scalaires et les vecteurs sont des objets géométriques, indépendants du système de coordonnées. Comme les tenseurs sont des applications qui attribuent des scalaires à des vecteurs, ils sont aussi des objets géométriques, indépendants du système de coordonnées.

Un malentendu sur la relativité de la vérité

La théorie de la relativité d'Einstein se distingue de la physique de Newton sur un point principal, la relativité de la simultanéité. Selon Einstein, deux événements simultanés pour un observateur ne sont pas forcément simultanés pour un autre, s'il est en mouvement par rapport au premier, tandis que Newton postule implicitement que la simultanéité des événements est absolue, la même pour tous les observateurs.

Mais on aurait tort de croire que la théorie de la relativité nous force à renoncer à la vérité absolue. Les théories d'Einstein, comme toutes les théories scientifiques, affirment que la vérité est absolue, la même pour tous. Toute vérité qui peut être reconnue comme un savoir scientifique par un être rationnel peut être reconnue ainsi par tous les autres. La vérité est la même pour tous ou elle n'est pas scientifique. Une science qui ne pourrait être connue que par quelques uns est une absurdité. Nous sommes tous égaux devant la vérité scientifique.

Quand des vérités sont relatives, à un observateur, à un point de vue, à des hypothèses ou à des principes, il est toujours absolument vrai qu'elles le sont. Si un énoncé e est vrai du point de vue de A mais pas du point de vue de B, qu'il est vrai du point de vue A est vrai pour A comme pour B. e est une vérité relative, mais l'affirmation que e est vrai du point de vue de A est une vérité absolue.

On croit souvent nier le caractère absolu de la vérité scientifique quand on remarque que la science accueille de très nombreuses théories qui se contredisent parfois les unes les autres, et qu'aucune ne peut prétendre être la vérité absolue. Mais c'est une erreur. Quand nous sommes scientifiques, nous connaissons la vérité absolue tous les jours, puisque même quand nos vérités sont relatives, il suffit d'affirmer qu'elles sont relatives pour dire la vérité absolue. Qu'aucune théorie scientifique ne puisse prétendre être à elle-seule la vérité absolue, complète, ultime et définitive, ne prouve pas qu'il n'y a pas de vérité absolue, mais seulement que nous ne la connaissons pas totalement.

La physique newtonienne et le principe de relativité de Galilée

Newton nous a appris à faire de la physique en étudiant les solutions d'une unique équation :

$f=ma$

$f$ est la force exercée sur une particule, $m$ sa masse et $a$ son accélération. Cette équation est la loi fondamentale de la dynamique newtonienne.

Les particules sont ou bien des points matériels, ou bien des particules de solide ou de fluide. Les points matériels sont les particules élémentaires de la physique classique. Les particules de solide ou de fluide sont de petites régions au voisinage d'un point d'un solide ou d'un fluide.

En plus des points matériels, des solides et des fluides, la physique classique accueille les champs de forces exercées et subies par la matière.

Pour la physique newtonienne, les vecteurs sont toujours des vecteurs de l'espace euclidien à trois dimensions. Un vecteur peut être identifié à une flèche qui sépare deux points de l'espace. Deux flèches qui partent de points différents représentent le même vecteur si elles sont parallèles, de même longueur et de même sens.

Avec un repère, les vecteurs servent à représenter les positions, les vitesses et les accélérations des particules. Un repère, ou un référentiel, est une sorte de rocher à partir duquel on peut faire des mesures géométriques. Si on choisit sur le rocher un point comme origine, la position de tout autre point est repérée par le vecteur qui le sépare de l'origine. Un vecteur vitesse est la dérivée temporelle d'un vecteur position. Un vecteur accélération est la dérivée temporelle d'un vecteur vitesse.

La position et la vitesse d'une particule sont toujours relatives au repère qui permet de les mesurer. En revanche, l'existence des repères inertiels donne un caractère absolu à l'accélération. Un repère inertiel est un rocher qui n'est soumis à aucune force et qui ne tourne pas sur lui-même. La Terre n'est pas exactement un repère inertiel, parce qu'elle tourne sur elle-même et parce qu'elle est attirée par le Soleil, mais en première approximation, elle peut souvent être considérée comme un repère inertiel. Si on est attaché à un repère qui n'est pas inertiel, comme un manège, ou un train qui freine, ou qui accélère, ou qui change de direction, on ressent les effets de la rotation, ou de l'accélération, tandis qu'un repère inertiel, ou presque inertiel, nous laisse nous reposer tranquillement.

Galilée a remarqué que dans un bateau sur une mer calme, on peut faire les mêmes expériences que si on reste au port. Tant que le mouvement du bateau n'est pas agité, aucune expérience sur le bateau ne permet de dire s'il est immobile ou en mouvement par rapport à la Terre. Ceci est général. Si un repère a une vitesse constante par rapport à un repère inertiel alors il est lui aussi inertiel. Tous les repères inertiels ont des vitesses constantes les uns par rapport aux autres et ils sont tous physiquement équivalents, au sens où toute expérience qui peut être faite dans l'un peut être reproduite dans l'autre. C'est le principe de relativité de Galilée :

Les résultats d'une expérience ne dépendent pas du repère inertiel dans lequel elle est faite.

Einstein l'a nommé principe de relativité, parce qu'il montre que la vitesse et l'immobilité sont toujours relatives, qu'il n'y a pas d'espace absolu. Comme aucun repère inertiel n'est privilégié, les lois de la physique interdisent d'identifier un état de repos absolu. Le mouvement et le repos d'un corps sont toujours relatifs à un autre corps. Parler de repos ou de mouvement par rapport à l'espace vide n'a pas de sens physique. Mais ce principe de relativité peut aussi être considéré comme un principe d'absoluité, puisqu'il affirme que les lois de la physique sont les mêmes pour tous les observateurs, quel que soit le repère inertiel où ils font leurs mesures.

Comme tous les repères inertiels ont des vitesses constantes les uns par rapport aux autres, l'accélération d'une particule ne dépend pas du repère inertiel dans lequel elle est mesurée. La loi fondamentale de la dynamique newtonienne est en accord avec le principe de relativité de Galilée parce qu'elle ne mentionne que des forces, qui sont des grandeurs absolues, indépendantes du choix d'un repère, et des accélérations, qui sont elles aussi des grandeurs absolues, indépendantes du choix d'un repère, pourvu qu'il soit inertiel.

Les déformations sont également des grandeurs absolues, les mêmes pour tous les observateurs. Elles sont représentées par des vecteurs qui mesurent l'écart entre la position déformée et la position initiale. Il est naturel de les mesurer dans un repère où le matériau est au repos, mais un autre repère convient également.

La physique newtonienne est en général très bien adaptée à l'étude des mouvements de la matière ordinaire, les solides et les fluides. Il suffit souvent de mesurer quelques paramètres, la densité, l'élasticité, la viscosité ... pour calculer et prédire les mouvements d'un matériau. Quelques lois simples sur l'existence des forces d'élasticité ou de viscosité suffisent pour appliquer la loi fondamentale de Newton, $f=ma$ . Le principe de relativité générale et le principe de localité sont des outils très puissants pour trouver les lois du mouvement, parce que les scalaires, les vecteurs et les tenseurs qui permettent d'énoncer ces lois sont peu nombreux. De fait, toute la physique classique newtonienne peut être retrouvée comme une conséquence du principe de relativité générale quand on l'applique à l'espace-temps newtonien (MCP, p.10).

En revanche, la physique newtonienne n'est pas bien adaptée à l'étude des interactions fondamentales. La loi de la gravitation universelle ne respecte pas le principe de localité et les lois de l'électromagnétisme, les équations de Maxwell et de Lorentz, formulées dans un cadre newtonien, ne respectent pas le principe de relativité de Galilée. La théorie de la relativité restreinte d'Einstein résout le second problème, tandis que sa théorie de la relativité générale résout le premier.

L'espace-temps de Minkowski

La constance de la vitesse de la lumière

Les équations de Maxwell prédisent que la lumière a une vitesse $c$ constante dans le vide, et la même dans toutes les directions. Cette prédiction semble incompatible avec le principe de relativité de Galilée. Si la lumière avance à la vitesse $c$ par rapport à un repère inertiel, alors elle devrait être immobile par rapport à un autre repère inertiel qui avance à la même vitesse $c$ par rapport au premier. Si on était capable d'aller aussi vite que la lumière, elle pourrait être immobile par rapport à nous, et nous ne pourrions même plus nous voir dans un miroir.

La constance de la vitesse de la lumière dans le vide a d'abord été interprétée comme la preuve de l'existence d'une immobilité absolue. Un repère inertiel serait absolument immobile pourvu qu'il attribue toujours à la lumière la vitesse $c$ dans le vide. Dans tout repère inertiel en mouvement par rapport à lui, la lumière aurait une vitesse différente. On supposait aussi que la lumière était une sorte de vibration d'une matière transparente et inconnue qu'on appelait l'éther. L'immobilité absolue était alors conçue comme l'immobilité par rapport à cet hypothétique éther. Il fallait aussi renoncer à la portée universelle du principe de relativité de Galilée, puisqu'il était contredit par les équations de Maxwell.

C'est ce dernier point qui a interpellé Einstein, parce que les lois de l'électromagnétisme semblent souvent au contraire en très bon accord avec le principe de relativité de Galilée. C'est pourquoi Einstein a fait le choix a priori surprenant d'interpréter les équations de Maxwell en conservant le principe de relativité de Galilée. C'est un choix surprenant parce qu'il conduit au principe suivant :

La vitesse de la lumière est la même, dans toutes les directions, quel que soit le repère inertiel où elle est mesurée.

En particulier, la lumière avance à 300000 km/s par rapport à la Terre, mais si je la poursuis à la vitesse de 299000 km/s alors elle avance quand même à 300000 km/s par rapport à moi. C'est une conclusion absurde seulement en apparence. Einstein a montré que la relativité de la simultanéité par rapport au mouvement de l'observateur suffit pour faire disparaître l'apparence d'absurdité.

La relativité de la simultanéité

Que la simultanéité soit relative ou absolue est une question empirique dès qu'on a précisé comment on observe la simultanéité de deux événements. Pour cela il suffit de mesurer des distances sur un repère inertiel et d'y placer un émetteur d'ondes sphériques, des ondes sonores par exemple, qui se propagent dans un milieu matériel attaché au repère. Deux points situés à la même distance de l'émetteur reçoivent une impulsion sonore simultanément, par définition de la simultanéité. Einstein se servait de la lumière elle-même, et non des ondes sonores, pour définir la simultanéité des événements, mais cela affaiblissait son raisonnement, parce qu'il devait postuler que la lumière a la même vitesse dans toutes les directions. Ce postulat n'est pas nécessaire pour définir la simultanéité.

Les résultats empiriques sont clairs. Toutes les expériences jusqu'à ce jour confirment les prédictions de la théorie d'Einstein. La simultanéité des événements est donc relative au mouvement de l'observateur et la vitesse de la lumière est la même dans toutes les directions, quel que soit le repère inertiel où elle est mesurée.

Les dispositifs de mesure spatio-temporelle

Un règle rigide, ou un compas, permet de mesurer la distance entre ses extrémités en la comparant à d'autres distances. Une règle rigide est donc un dispositif de mesure d'une longueur, ou d'un intervalle, spatial. Le point important est que la règle soit rigide, pour que la distance mesurée soit toujours la même. On peut concevoir sur le même modèle des dispositifs de mesure des intervalles spatio-temporels. Une simple horloge est un tel dispositif. Elle permet de pointer deux événements qui sont toujours séparés par la même durée. On peut aussi se servir de deux horloges fixées à un même support rigide, chacune étant utilisée pour pointer un certain événement. Si le dispositif qui déclenche les deux horloges est régulier, l'intervalle spatio-temporel entre les deux événements pointés peut être toujours le même. De tels dispositifs permettent de mesurer l'espace-temps de la même façon que les règles rigides permettent de mesurer l'espace.

Un intervalle est du genre temps lorsqu'il est sur la trajectoire d'un point matériel massif. Il est du genre lumière lorsqu'il est sur la trajectoire d'un rayon de lumière dans le vide. Tous les autres intervalles sont du genre espace. Lorsqu'un intervalle est du genre espace, il existe toujours un repère inertiel pour lequel ses extrémités sont des événements simultanés. Les dispositifs de mesure spatio-temporels permettent de mesurer les trois genres d'intervalle. Une seule horloge suffit pour mesurer les intervalles du genre temps. Deux horloges fixées sur une règle rigide et convenablement synchronisées permettent de mesurer des intervalles du genre espace ou genre lumière.

Tous les intervalles du genre lumière sont égaux

La théorie permet d'attribuer un nombre réel à tous les intervalles spatio-temporels, quel que soit leur genre, ou plus précisément à leur carré. Les intervalles du genre lumière en particulier sont tous égaux à zéro et donc tous égaux entre eux. C'est a priori surprenant. Cela veut dire par exemple que l'intervalle spatio-temporel entre l'émission d'un photon et sa réception trois mètres plus loin est égal à l'intervalle entre son émission et sa réception trois années-lumière plus loin, comme si le photon en avançant ne s'éloignait jamais de son point de départ. N'est-ce pas le pays des merveilles ?

Les dispositifs de mesure spatio-temporelle et la relativité de la simultanéité permettent de comprendre ce résultat contre-intuitif. Imaginons une fusée lancée vers une étoile à trois années-lumière de la Terre. Un photon est émis à l'arrière de la fusée et il est reçu à l'avant, trois mètres plus loin, du point de vue de la fusée, donc une infime fraction de seconde plus tard. Mais à cause de la relativité de la simultanéité, ce qui dure une infime fraction de seconde du point de vue de la fusée peut durer trois années du point de vue de la Terre, pourvu que la fusée soit suffisamment rapide. Le même dispositif spatio-temporel mesure à la fois un intervalle lumière de trois années-lumière et un intervalle lumière de trois mètres. Il établit ainsi leur égalité.

La métrique de Minkowski et les tenseurs de l'espace-temps

Dans l'espace euclidien, la distance peut être définie à partir du produit scalaire, parce que la longueur d'un vecteur est la racine carrée de son carré scalaire :

$||v||={\sqrt {v.v}}$

C'est pourquoi on dit du produit scalaire qu'il définit la métrique de l'espace euclidien.

Inversement le produit scalaire peut être défini à partir de la distance, avec la formule :

$u.v={\frac {1}{4}}(||u+v||^{2}-||u-v||^{2})$

Lorsqu'on introduit des coordonnées cartésiennes $v=(x,y,z)$ le carré scalaire est la formule de Pythagore :

$||v||^{2}=x^{2}+y^{2}+z^{2}$

Dans l'espace-temps de Minkowski, on peut aussi définir un produit "scalaire" à partir de la mesure des intervalles, mais on l'appelle parfois pseudo-scalaire, parce qu'il n'a pas toutes les propriétés du produit scalaire habituel.

Comme dans l'espace euclidien les vecteurs de l'espace-temps peuvent être identifiés à des intervalles, mais ce sont des intervalles entre des événements et non des intervalles entre des points de l'espace. Les vecteurs ont donc quatre composantes, une composante temporelle et trois composantes spatiales.

Les intervalles du genre temps peuvent être mesurés en secondes et les intervalles du genre espace en mètre. Le produit "scalaire" les distingue en leur attribuant aux uns un carré scalaire positif et aux autres un carré scalaire négatif. Le carré scalaire des intervalles du genre lumière est nul.

Si on choisit que les intervalles du genre temps ont un carré scalaire négatif, le carré scalaire d'un intervalle $v=(t,x,y,z)$ est :

$||v||^{2}=-c^{2}t^{2}+x^{2}+y^{2}+z^{2}$

Si on choisit comme unité de distance la seconde-lumière, 300000 km environ, $c=1$ et le carré scalaire s'écrit plus simplement :

$||v||^{2}=-t^{2}+x^{2}+y^{2}+z^{2}$

À partir du carré scalaire et donc de la mesure des intervalles spatio-temporels on peut définir le produit "scalaire" spatio-temporel comme dans l'espace euclidien.

Les tenseurs sont définis comme dans l'espace euclidien, sauf que le tenseur fondamental est le produit "scalaire" de Minkowski.

Pourquoi la physique newtonienne est-elle quand même vraie ?

La physique newtonienne postule implicitement que la simultanéité des événements est absolue et elle applique le principe de relativité générale aux vecteurs tridimensionnels de l'espace euclidien et à leurs tenseurs. Or la théorie de la relativité a montré que la simultanéité des événements est relative et qu'il faut appliquer le principe de relativité générale aux vecteurs quadridimensionnels de l'espace-temps et à leurs tenseurs.

La physique newtonienne est fausse mais seulement un peu fausse, et souvent sa fausseté est négligeable, indétectable compte-tenu de l'imprécision des mesures. Les vecteurs tridimensionnels sont comme des ombres des vecteurs quadridimensionnels. Tant que les vitesses sont petites devant celle de la lumière, ces ombres sont peu déformées, et on commet une faible erreur si on raisonne sur les ombres plutôt que sur les quadrivecteurs. C'est seulement lorsque les vitesses s'approchent de celle de la lumière que la fausseté de la physique newtonienne devient détectable.

La courbure de l'espace-temps et la gravitation

La chute libre et les orbites des planètes

La théorie de Newton explique la chute libre à la surface de la Terre et la trajectoire de la Lune avec la même force d'attraction gravitationnelle :

Tout se passe comme si la Lune n'arrêtait pas de tomber sur la Terre, mais elle tombe toujours à côté, et finalement elle ne fait que tourner autour du corps sur lequel elle tombe. De façon générale, les satellites et les projectiles obéissent tous à la même loi. Les orbites des planètes et les trajectoires de tous les satellites peuvent être considérées comme des trajectoires de chute libre, sauf que c'est une chute qui n' a pas de fin.

La théorie de Newton montre donc, contre Aristote, que les mêmes lois expliquent le mouvement des corps terrestres et célestes.

La grande idée d'Einstein

Einstein a été conduit à la théorie de la relativité générale en comprenant que la chute libre est identique à l'apesanteur. Si on se trouve dans un ascenseur en chute libre, tout se passe comme si on était dans un ascenseur en apesanteur, jusqu'à ce qu'il s'écrase sur le sol. Cela permet de produire expérimentalement de l'apesanteur à la surface de la Terre. Il suffit de se servir d'un avion qui simule une trajectoire de chute libre. Tant qu'il reste sur une telle trajectoire, tous les passagers sont en apesanteur :

Stephen Hawking à bord d'un Boeing 727 lors d'une expérience d'apesanteur

Pour la physique newtonienne, être en chute libre est être soumis à la force de la gravité. Pour la physique einsteinienne, être en chute libre est n'être soumis à aucune force, parce qu'un corps en chute libre se comporte de la même façon que s'il était en apesanteur. Selon Einstein, la force de gravité n'existe pas, la gravitation n'est pas une force.

Pour la physique newtonienne, un corps au repos à la surface de la Terre a une accélération nulle et n'est donc soumis à aucune force, ou plus précisément il est soumis à deux forces qui se compensent exactement, l'attraction gravitationnelle de la Terre et la force de réaction du sol. Pour la physique einsteinienne, un corps au repos à la surface de la Terre est en permanence soumis à la force de réaction du sol. Celle-ci n'est pas compensée par la force de gravité, qui n'existe pas. Si aucune force n'agissait sur le corps, il resterait sur une trajectoire de chute libre et ne serait donc pas au repos à la surface de la Terre.

Dans l'espace-temps de Newton, et dans celui de Minkowski, les corps qui ne soumis à aucune force vont toujours en ligne droite et à des vitesses constantes les uns par rapport aux autres. Ces trajectoires rectilignes sont les géodésiques, c'est à dire les lignes de plus court chemin, de ces espaces-temps. Dans un espace-temps courbe, tous les corps en chute libre et tous les satellites en orbite ne sont soumis à aucune force, et leurs trajectoires sont toutes des géodésiques.

Dans un espace plat, tel qu'une feuille de papier, les lignes de plus court chemin sont toujours des lignes droites, mais un espace courbe peut accueillir d'autres lignes géodésiques. Sur une sphère par exemple, les géodésiques sont les grands cercles. Les espaces-temps de Newton et de Minkowski sont plats, au sens où les géodésiques sont toujours des lignes droites, mais l'espace-temps de la relativité générale est un espace-temps courbe, parce que les géodésiques y sont libres d'adopter davantage de formes.

Dans la théorie de Newton, les corps massifs exercent des forces gravitationnelles les uns sur les autres. Dans la théorie d'Einstein, ces forces n'existent pas, mais les corps affectent la courbure de l'espace-temps là où ils sont présents. Le Soleil par exemple courbe l'espace-temps par sa présence et fait apparaître ainsi à son voisinage des géodésiques qui reviennent sur elles-mêmes. Les trajectoires des planètes sont justement de telles géodésiques.

L'égalité de la masse inerte et de la masse pesante

La masse inerte $m_{i}$ est par définition le coefficient d'inertie qui apparaît dans la loi fondamentale de la dynamique newtonienne :

$f=m_{i}a$

C'est un coefficient d'inertie parce qu'il mesure la capacité d'un corps à résister à l'action d'une force. Plus il est élevé, plus l'effet $a={\frac {1}{m_{i}}}f$ d'une force $f$ est petit.

La masse inerte mesure la façon dont un corps subit les forces exercées par d'autres corps. La masse pesante $m_{p}$ mesure quant à elle la façon dont un corps agit sur les autres corps. Elle est le coefficient qui apparaît dans la loi de la gravitation universelle :

Deux corps de masses $m_{p}$ et $M_{p}$ séparés par une distance $d$ exercent chacun sur l'autre une force attractive égale à $G{\frac {m_{p}M_{p}}{d^{2}}}$

$G$ est la constante de la gravitation universelle.

On observe que tous les corps soumis à la gravitation subissent tous la même accélération, quelle que soit leur masse et le matériau dont ils sont faits. On peut expliquer cette observation en postulant que la masse inerte est toujours égale à la masse pesante $m_{i}=m_{p}$ , parce qu'un corps de masse inerte $m_{i}$ et de masse pesante $m_{p}$ soumis à la gravitation d'un corps de masse pesante $M_{p}$ a une accélération égale à

$a=G{\frac {m_{p}}{m_{i}}}{\frac {M_{p}}{d^{2}}}=G{\frac {M_{p}}{d^{2}}}$ si $m_{i}=m_{p}$

La théorie de Newton n'impose pas l'égalité $m_{i}=m_{p}$ . En principe ces deux coefficients pourraient être différents, et l'accélération d'un corps soumis à la gravitation pourrait dépendre du matériau qui le constitue. Mais les mesures plus précises n'ont jamais permis d'observer une telle variation.

La théorie d'Einstein quant à elle impose que la trajectoire d'un corps soumis à la gravitation ne dépende pas de son matériau, parce que tous les corps, quelle que soit leur matériau, doivent suivre les mêmes géodésiques. Elle impose donc que les masses inerte et pesante soient égales, ce qui est très exactement ce qu'on observe.

Relativité restreinte et relativité générale

La métrique de l'espace euclidien est décrite avec le tenseur métrique euclidien, c'est à dire le produit scalaire, qu'on peut définir à partir de la longueur des vecteurs et donc à partir de la mesure des longueurs dans l'espace.

La métrique de l'espace-temps de Minkowski est décrite avec le tenseur métrique minkowskien, c'est à dire le produit "scalaire" de Minkowski, qu'on peut définir à partir de la mesure des intervalles dans l'espace-temps.

La métrique d'un espace-temps courbe est décrite avec un tenseur métrique riemannien. C'est l'analogue pour un espace-temps courbe du tenseur métrique minkowskien pour un espace-temps plat.

La géométrie différentielle est l'outil mathématique adapté pour définir les espaces-temps courbes et leurs tenseurs métriques. Elle permet ainsi de définir tous les vecteurs et les tenseurs qui peuvent exister dans ces espaces-temps. Pour autoriser toutes les formes d'espace-temps concevables, elle autorise tous les systèmes de coordonnées. Le même objet peut donc toujours être représenté même après un changement arbitraire du système de coordonnées. Plus précisément, on ne s'intéresse qu'aux changements de coordonnées qui respectent la structure différentielle de l'espace-temps, c'est à dire les difféomorphismes.

Les changements arbitraires de systèmes de coordonnées sont nécessaires pour définir les espaces-temps courbes en toute liberté. Pour les espaces-temps plats, de Newton ou de Minkowski, de tels changements de coordonnées ne sont pas interdits, mais ils ne sont pas nécessaires. On peut toujours se limiter à des coordonnées cartésiennes, définies avec des repères orthonormés. C'est pourquoi l'espace-temps de Minkowski peut être défini avec un principe de relativité restreinte :

Les lois de la physique ne doivent pas dépendre du système de coordonnées orthonormé avec lequel elles sont formulées.

L'espace-temps courbe de la relativité générale doit lui être défini avec un principe de relativité générale :

Les lois de la physique ne doivent pas dépendre du système de coordonnées avec lequel elles sont formulées.

Mais le principe de relativité générale peut aussi être appliqué à l'espace-temps de Minkowski, ou à celui de Newton, et on ne s'en prive pas, puisqu'on ne se sert pas toujours de repères cartésiens pour les étudier.

Les principes relativistes sont confirmés par leurs fruits

Les succès de la physique montrent qu'on peut énoncer des vérités sur les objets et les relations que l'on définit. Le principe de relativité générale, qu'on devrait appeler le principe d'absoluité, est donc confirmé à chaque fois qu'une théorie physique nous fait découvrir des vérités.

La physique newtonienne applique le principe de relativité générale à l'espace euclidien. Les vecteurs et les tenseurs de l'espace euclidien suffisent pour représenter tous les mouvements de la matière ordinaire, pourvu que leurs vitesses soient petites devant celle de la lumière. Le principe de relativité générale appliqué à l'espace euclidien est donc confirmé à chaque fois que les théories qu'il permet de formuler sont en accord avec les observations, c'est à dire toujours, ou presque toujours.

La théorie de la relativité restreinte applique le principe de relativité générale à l'espace-temps de Minkowski. Les vecteurs et les tenseurs de l'espace-temps de Minkowski suffisent pour représenter tous les mouvements de la matière, tant qu'on peut ignorer la gravitation et les effets quantiques. Le principe de relativité générale appliqué à l'espace-temps de Minkowski est donc confirmé par toutes les expériences de physique classique, sauf celles qui mettent en jeu la gravitation.

La théorie de la relativité générale applique le principe de relativité générale aux espace-temps courbes. Les vecteurs et les tenseurs qu'on peut y définir suffisent pour représenter tous les mouvements de la matière, tant qu'on peut ignorer les effets quantiques. Le principe de relativité générale appliqué aux espace-temps courbes a toujours été confirmé par toutes les expériences qui auraient pu le réfuter et il a conduit à des prédictions remarquables : le Big Bang, les trous noirs, les ondes gravitationnelles ...

Chapitre suivant : La théorie quantique des destinées multiples >>>