Les hélices circulaires et une sympathique exponentielle III – L’exponentielle

Dans ce billet qui est la suite du précédent dont nous conservons les notations, nous allons résoudre les équations de Frenet lorsque la courbure et la torsion sont constantes. Ainsi, nous nous donnons des nombres \kappa >0 et \tau et nous cherchons les fonctions \mathbf t,\mathbf n,\mathbf b : I \to \mathbf R^3 telles que

(1) \begin{cases}\mathbf t'=\kappa\mathbf n\\\mathbf n'=-\kappa\mathbf t+\tau\mathbf b\\\mathbf b'=-\tau\mathbf n\end{cases}

et telles que, pour tout u\in I, (\mathbf t(u),  \mathbf n(u),\mathbf b(u)) soit une base orthonormée positive de \mathbf R^3, ce qui revient à dire que la matrice dont les colonnes sont \mathbf t(u),  \mathbf n(u),\mathbf b(u), dans cet ordre, est orthogonale et de déterminant positif.

Nous nous limiterons à déterminer les solutions maximales, c’est-à-dire celles dont l’intervalle de définition est le plus grand possible. Leurs restrictions à des intervalles plus petits fournissent toutes les autres.

Posons

F=\begin{pmatrix}t_1&n_1&b_1\\t_2&n_2&b_2\\t_3&n_3&b_3\\\end{pmatrix}

où les t_i,\ldots sont les composantes de \mathbf t,\ldots et

H=\begin{pmatrix}0&-\kappa&0\\\kappa&0&-\tau\\0&\tau&0\end{pmatrix}

Le système (1) se réécrit alors sous la forme matricielle

(2) F'=FH

Voici quelques remarques.

  • Cette équation admet une solution maximale passant par la matrice identité en u=0. Elle est définie dans \mathbf R et s’exprime au moyen de l’exponentielle matricielle. C’est la fonction

    F_0:u \mapsto e^{uH}

  • Les valeurs de F_0 sont des matrices orthogonales de déterminant positif. En effet, comme H est antisymétrique, on a

    ^t\left(e^{uH}\right)=e^{u (^tH)}=e^{-uH}=\left(e^{uH}\right)^{-1}

    et

    \det e^{uH}=e^{u\mathrm{tr\ }H}=1

    puisque la trace de H est nulle.

  • Soient une solution F de (2), définie dans un intervalle I\subset \mathbf R, u_0\in I et A_0=F(u_0). Clairement, A_0e^{-u_0H}F_0 est une solution de (2). Elle est définie dans \mathbf R et sa valeur en u_0 est A_0. Elle coïncide par conséquent avec F dans I. Ainsi, les solutions maximales que nous cherchons sont les fonctions AF_0A décrit l’ensemble des matrices orthogonales de déterminant positif et de dimension trois.

Nous voici donc à pied d’œuvre : nous devons calculer F_0.

Calcul de l’exponentielle d’une matrice antisymétrique de dimension trois

Nous allons calculer l’exponentielle e^M d’une matrice antisymétrique quelconque

M=\begin{pmatrix}0&-c&b\\c&0&-a\\-b&a&0\end{pmatrix}

de dimension trois (réelle). Il y a pour cela plusieurs stratégies parmi lesquelles : diagonaliser la matrice, utiliser une équation différentielle, utiliser une équation de récurrence.

Compte tenu du contexte, nous allons utiliser la seconde méthode qui exploite le fait que la fonction définie sur \mathbf R par u \mapsto e^{uM} est l’unique solution maximale de l’équation X'=XM dont la valeur en zéro est la matrice unité (que nous noterons I).

Nous allons ramener cette équation à une équation différentielle scalaire, linéaire et à coefficients constants en profitant du fait que(*)

(3) M^3+(a^2+b^2+c^2)M=0

Nous cherchons notre fonction sous la forme

e^{uM}=\alpha(u)M^2+\beta(u)M+\gamma(u)I

\alpha,\beta et \gamma sont des fonctions à valeurs réelles. En injectant ceci dans l’équation X'=XM, en utilisant (3) puis en identifiant les coefficients des puissances de M, nous obtenons les équations, où \ell=\sqrt{a^2+b^2+c^2},

\begin{cases}\alpha'=\beta\\\beta'=-\ell^2\alpha+\gamma\\\gamma'=0\end{cases}

assorties des conditions initiales

\alpha(0)=0,\ \beta(0)=0,\ \gamma(0)=1

La fonction \gamma est constante et vaut 1. Quant à \alpha, il vérifie

\alpha''+\ell^2\alpha=1,\ \alpha(0)=\alpha'(0)=0

une équation très facile à résoudre. Après de petits calculs, on trouve alors, si \ell n’est pas nul,

e^{uM}=\frac{1}{\ell^2}[1-\cos(\ell u)]M^2+\frac{1}{\ell}\sin(\ell u)M+I

En particulier,

e^M=\frac{1}{\ell^2}[1-\cos(\ell)]M^2+\frac{1}{\ell}\sin(\ell)M+I

Si \ell est nul, alors M l’est aussi et e^{uM}=I. On peut alors considérer que les deux formules précédentes sont correctes dans ce cas, d’autant que

\begin{cases}\lim_{\ell\to 0}\frac{1}{\ell^2}[1-\cos(\ell u)]=\frac 1  2 u^2\\[1ex]\lim_{\ell\to 0}\frac{1}{\ell}\sin(\ell u)=u\end{cases}

Retour aux hélices circulaires

Revenons-en au système (2). En appliquant ce qui précède à H, pour lequel \ell=\sqrt{\kappa^2+\tau^2}>0, on voit que la première colonne de F_0=e^{uH} est

\mathbf t_0=\begin{pmatrix}\frac{\kappa^2}{\ell^2}\cos(\ell u)+\frac{\tau^2}{\ell^2}\\[1ex]\frac{\kappa}{\ell}\sin(\ell u)\\[1ex]-\frac{\kappa\tau}{\ell^2}\cos(\ell u)+\frac{\kappa\tau}{\ell^2}\end{pmatrix}

dont les primitives sont les applications \gamma_0 données par

\gamma_0(u)=\begin{pmatrix}\frac{\kappa^2}{\ell^3}\sin(\ell u)+\frac{\tau^2}{\ell^2}u\\[1ex]-\frac{\kappa}{\ell^2}\cos(\ell u)\\[1ex]-\frac{\kappa\tau}{\ell^3}\sin(\ell u)+\frac{\kappa\tau}{\ell^2}u\end{pmatrix}+\mathbf a

\mathbf a décrit \mathbf R^3.

Provenant d’une solution des équations (1), chaque application \gamma_0:\mathbf R\to\mathbf R^3 est un paramétrage d’une courbe \Gamma_0 dont la courbure est \kappa et la torsion \tau et, vu la dernière remarque que nous avons faite plus haut à propos de l’équation (2), toute courbe ayant ces courbure et torsion s’obtient en appliquant un déplacement à \Gamma_0.

Il existe une matrice orthogonale de déterminant positif A telle que

\forall u\in\mathbf R,\quad \gamma_0(u)=A\varphi(u)+\mathbf a

\varphi est le paramétrage d’une hélice circulaire présenté dans le billet précédent. Pour le voir, exprimons d’abord \varphi à l’aide de \kappa et \tau. Les relations

\kappa=\frac{r}{r^2+h^2} \quad \& \quad \tau=\frac{h}{r^2+h^2}

s’inversent en

r=\frac{\kappa}{\kappa^2+\tau^2}=\frac{\kappa}{\ell^2} \quad \& \quad h=\frac{\tau}{\kappa^2+\tau^2}=\frac{\tau}{\ell^2}

En reportant ceci dans l’expression de \varphi donnée au billet précédent, il vient

\varphi(u)=\left(\frac{\kappa}{\ell^2}\cos(\ell u),\frac{\kappa}{\ell^2}\sin(\ell u),\frac{\tau}{\ell}u\right)

Par conséquent, comme on le voit immédiatement, la matrice orthogonale de déterminant positif

\begin{pmatrix}0&\frac{\kappa}{\ell}&\frac{\tau}{\ell}\\[1ex]-1&0&0\\[1ex]0&-\frac{\tau}{\ell}&\frac{\kappa}{\ell}\end{pmatrix}

est la matrice cherchée A.

J’avais promis, dans le premier billet de cette série de trois articles, de vérifier le théorème de classification des courbes dans le cas particulier où la courbure et la torsion sont constantes et cela en résolvant explicitement les équations de Frenet. Voilà qui est fait!😉

__________
(*) Toute matrice annule un polynôme ne serait-ce que son polynôme caractéristique et la méthode que j’utilise ici est applicable à n’importe quelle matrice; elle permet aussi de calculer par récurrence les puissances d’une matrice.

Les hélices circulaires et une sympathique exponentielle II – Les hélices circulaires

Imaginons nous enrouler une feuille de papier sur un cylindre circulaire droit comme suggéré sur ce dessin :

helice_circulaire_2

Un segment de droite tracé sur la feuille dessine alors une courbe sur le cylindre. C’est un morceau d’hélice circulaire dont voici un exemple :

helice_circulaire

Nous allons paramétrer une hélice circulaire(*) de \mathbf R^3 au moyen d’une abscisse curviligne. Nous noterons u celle-ci. Pour cela, on lui fait subir, ainsi qu’au cylindre sur laquelle elle est tracée, un déplacement amenant l’axe du cylindre sur l’axe des z et donnant les coordonnées (r,0,0) au point à partir duquel on mesure l’abscisse curviligne, P_0 (r>0 désigne le rayon du cylindre). L’hélice circulaire admet alors un paramétrage de la forme

\varphi: u\in \mathbf R\mapsto \left(r\cos\frac{u}{\sqrt{r^2+h^2}},r\sin\frac{u}{\sqrt{r^2+h^2}},\frac{hu}{\sqrt{r^2+h^2}}\right)\in\mathbf R^3

Voici les explications. Le plan de coordonnées x, y coupe le cylindre selon un cercle, de rayon r, représenté à gauche dans la figure ci-dessous. Il est paramétré par un angle, noté t, mesuré à partir de P_0 dans le sens trigonométrique (sur le dessin, t est positif).

helice_calcul

L’hypoténuse du triangle rectangle situé à droite du cercle sur la figure, dessinée en rouge, est le segment de droite obtenu en déroulant l’hélice sur le plan tangent au cylindre en P_0 en faisant rouler celui-ci « sans glisser » perpendiculairement à la génératrice de P_0 selon l’angle t. Sa longueur est u, à condition que nous orientions l’hélice dans le sens des t croissants, ce que nous conviendrons de faire. Le côté « horizontal » du triangle est de longueur rt : c’est celle de l’arc sous-tendu par l’angle au centre t du cercle. La longueur de l’autre côté est également proportionnelle à t et nous notons |h| le coefficient de proportionnalité. Le nombre h mesure ce dont l’hélice « monte », ou « descend », selon son signe, lorsque t varie d’un radian (il est positif sur le dessins). Le théorème de Pythagore donne u^2=r^2+h^2 de sorte que

t=\frac{u}{\sqrt{r^2+h^2}}

car, vu notre choix d’orientation de l’hélice, u et t ont le même signe.

Le point P de l’hélice correspondant à t est donc bien \varphi(u).

La dérivée

\left(-\frac{r}{\sqrt{r^2+h^2}}\sin\frac{u}{\sqrt{r^2+h^2}},\frac{r}{\sqrt{r^2+h^2}}\cos\frac{u}{\sqrt{r^2+h^2}},\frac{h}{\sqrt{r^2+h^2}}\right)

de \varphi(u) est de longueur 1. C’est le vecteur tangent unitaire \mathbf t de l’hélice associé à l’orientation choisie. Par définition, la courbure \kappa de l’hélice est la longueur de la dérivée

\frac{r}{r^2+h^2} \left(-\cos\frac{u}{\sqrt{r^2+h^2}},-\sin\frac{u}{\sqrt{r^2+h^2}},0\right)

de \mathbf t et sa normale principale est, sous réserve que \kappa ne soit pas nul, \mathbf n=\mathbf t'/\kappa. Ainsi,

\kappa=\frac{r}{r^2+h^2}

et

\mathbf n=\left(-\cos\frac{u}{\sqrt{r^2+h^2}},-\sin\frac{u}{\sqrt{r^2+h^2}},0\right)

Par définition, de nouveau, la binormale est le produit vectoriel \mathbf b=\mathbf t\wedge\mathbf n et la troisième équation de Frenet — nous reparlerons très bientôt de ces équations — permet de calculer la torsion \mathbf \tau de l’hélice : \mathbf b'=-\tau\mathbf n. Je ne détaille pas le calcul, fort simple du reste, qui nous donne ainsi

\mathbf b=\left(\frac{h}{\sqrt{r^2+h^2}}\sin\frac{u}{\sqrt{r^2+h^2}},-\frac{h}{\sqrt{r^2+h^2}}\cos\frac{u}{\sqrt{r^2+h^2}},\frac{r}{\sqrt{r^2+h^2}}\right)

puis

\tau=\frac{h}{r^2+h^2}

La tangente unitaire, la normale et la binormale de l’hélice constituent ce qu’on appelle le trièdre de Frenet de l’hélice et vérifient, comme c’est le cas de toute courbe pour lequel ce trièdre est défini, les équations de Frenet

\begin{cases}\mathbf t'=\kappa\mathbf n\\\mathbf n'=-\kappa\mathbf t+\tau\mathbf b\\\mathbf b'=-\tau\mathbf n\end{cases}

Pour une hélice circulaire, la courbure et la torsion sont constantes et les équations de Frenet forment un systèmes d’équations différentielles linéaires à coefficients constants.

Il est particulièrement simple à résoudre et nous verrons en le résolvant explicitement dans un prochain billet, que les hélices circulaires sont les seules courbes dont la courbure (supposée non nulle) et la torsion sont constantes, conformément au théorème de classification mentionné au début du billet précédent.

__________
(*) Complète, c’est-à-dire qui se déroule sur une droite entière lorsqu’on fait rouler le cylindre sur un de ses plans tangents.

Les hélices circulaires et une sympathique exponentielle I

La courbure et la torsion permettent de classifier les courbes suffisamment régulières(*) de \mathbf R^3.

On peut d’abord montrer que ces courbes sont caractérisées à déplacements près par leur courbure et leur torsion. Par exemple, les hélices circulaires sont les seules dont ces deux attributs soient constants.

Ensuite, on sait prouver, à l’aide des équations de Frenet, qu’étant donné un intervalle ouvert I et des fonctions \kappa,\tau:I\to\mathbf R, où \kappa est à valeurs strictement positives, il existe une courbe définie sur I dont \kappa soit la courbure et \tau la torsion.

Lorsque \kappa et \tau sont constants, les équations de Frenet forment un système d’équations différentielles linéaires à coefficients constants. Ses solutions, qui donnent les hélices circulaires, sont donc décrites à l’aide d’une exponentielle matricielle.

Il s’avère qu’il est facile de calculer cette exponentielle et d’ainsi illustrer le théorème de classification par un bel exemple. C’est ce que je me propose de faire, au long de quelques billets dans lesquels je présenterai le trièdre et les équations de Frenet des hélices circulaires avant de parler de l’exponentielle en question.

Le reste du présent billet est une petite incursion dans le monde des groupes de Lie. Je vais y présenter une fort jolie interprétation des équations de Frenet. Ce qui suit est donc relativement abstrait et utilise un peu de géométrie différentielle. Mais ces considérations n’étant pas utilisées par la suite — sauf celles relatives aux équations de Frenet sur lesquelles je reviendrai plus loin, le lecteur qu’elles pourraient rebuter peut sans problème sauter ce passage.

Comme on va le voir, les équations de Frenet appartiennent à une famille intéressante d’équations différentielles posées sur les groupes de Lie, équations parmi lesquelles ont trouve aussi les systèmes d’équations différentielles linéaires.

Voici l’énoncé clé concernant cette famille d’équation(**).

(1) Soit un intervalle ouvert I et une fonction \mathbf h de I dans l’algèbre de Lie \mathfrak g d’un groupe de Lie G. Pour tout s\in I et tout a\in G, la solution maximale de l’équation différentielle

x'=x\mathbf h

qui passe par a en t=s est définie dans I tout entier. De plus, si (J,x) est une solution de cette équation et si b\in G, alors bx:t\in J\mapsto bx(t)\in G en est encore une solution. En conséquence si (J_1,x_1) et (J_2,x_2) sont des solutions de cette équation, alors l’application t\in J_1\cap J_2\mapsto x^{-1}_2(t)x_1(t)\in G est constante.

La preuve de cette propriété est assez simple et classique. Cependant, je ne la détaillerai pas ici. Voici quelques cas particuliers intéressants.

  • Si G est le groupe GL(n,\mathbf R) des matrices carrées de dimension n non singulières, alors \mathfrak g est l’algèbre de Lie gl(n,\mathbf R) des matrices carrées de dimension n et l’application linéaire tangente de la multiplication à gauche par une matrice est encore la multiplication à gauche par cette matrice. Ainsi, dans le cas du groupe GL(n,\mathbf R), les équations différentielles dont il est question dans l’énoncé ne sont autres que les systèmes de n équations différentielles linéaires à n inconnues.
  • Si \mathbf h est constant, alors l’équation x'=x\mathbf h est celle du flot du champ de vecteur invariant à gauche de G engendré par \mathbf h. On retrouve ainsi le fait que ce champ est complet. Son flot est l’application

    (t,g)\in \mathbf R\times G\mapsto g\exp_G(t\mathbf h)\in G

    \exp_G est l’application exponentielle de G.

  • Dans le cas où G=GL(n,\mathbf R), \exp_G est l’exponentielle matricielle. Elle associe à une matrice M\in gl(n,\mathbf R) la matrice

    e^M=\sum_{k=0}^{+\infty}\frac{1}{k!}M^k

    La fonction t\in\mathbf R\mapsto e^{tM}\in GL(n,\mathbf R) est alors la solution maximale de l’équation x'=xM pour laquelle x(0) est la matrice unité, I_n.

Voyons à présent comment la proposition (1) s’applique aux équations de Frenet. Celles-ci s’écrivent

\begin{cases}\mathbf t'=\kappa\mathbf n\\ \mathbf n'=-\kappa\mathbf t+\tau\mathbf b\\\mathbf b'=-\tau\mathbf n\end{cases}

\mathbf t,\mathbf n et \mathbf b sont la tangente unitaire, la normale principale et la binormale d’une courbe régulière (I,\gamma) de \mathbf R^3 paramétrée par à une abscisse curviligne. Les fonctions \kappa et \tau sont la courbure, supposée sans zéros, et la torsion de cette courbe.

En fait, \mathbf t=\gamma' et la première équation de Frenet condense, en quelque sorte, les définitions de \kappa=\|\mathbf t'\| et de \mathbf n=\mathbf t'/\|\mathbf t'\|. La binormale est alors simplement le produit vectoriel \mathbf t\wedge \mathbf n.

Comme \mathbf t,\mathbf n et \mathbf b forment, dans cet ordre, une base orthonormée positive, en les disposant en colonnes, nous obtenons une fonction F:u\in I\mapsto (\mathbf t(u),\mathbf n(u),\mathbf b(u)) dont les valeurs sont des matrices orthogonales et de déterminant positif, c’est-à-dire des éléments du groupe de Lie SO(3). Avec la courbure et la torsion, nous obtenons une fonction à valeurs dans l’espace des matrices antisymétriques, qui est l’algèbre de Lie so(3) de SO(3), à savoir

H:u\in I\mapsto \begin{pmatrix}0&-\kappa(u)&0\\\kappa(u)&0&-\tau(u)\\0&\tau(u)&0\end{pmatrix}\in so(3)

Avec F et H, les équations de Frenet s’écrivent F'=FH : elles sont donc de celles dont il est question dans la proposition (1) lorsqu’on y prend pour G le groupe des rotations SO(3)!

Forts de cette observation, nous pouvons vérifier très simplement ce qui est annoncé plus haut, à savoir qu’il existe une courbe (I,\gamma) rapportée à une abscisse curviligne dont on prescrit la courbure \kappa, supposée sans zéros, et la torsion \tau et que cette courbe est déterminée à un déplacement près.

En effet, d’après (1), ces fonctions étant données, les solutions maximales de l’équation F'=FH dont on impose une condition initiale dans SO(3) sont définies sur I et prennent toutes leurs valeurs dans SO(3). Soit F_0=(\mathbf t_0,\mathbf n_0,\mathbf b_0) l’une d’elles. Les primitives de \mathbf t_0 vérifient les équations de Frenet de sorte que ce sont des paramétrages de courbes dont la courbure est \kappa et la torsion est \tau. Ces primitives diffèrent d’un vecteur constant et, vu (1) de nouveau, toute solution de l’équation F'=FH est de la forme AF_0, où A\in SO(3), ce qui prouve notre affirmation.

__________
(*) Je parle ici des courbes dont le vecteur tangent est unitaire et dont la courbure est sans zéro. Ce n’est pas une hypothèse optimale mais, dans ce billet et les deux suivants, les courbes et les fonctions seront de plus supposées de classe C^\infty.

(**) Je note multiplicativement l’application linéaire tangente de la multiplication à gauche L_g:g'\mapsto gg' par g\in G : pour tout vecteur tangent \mathbf u de G, L_{g*}\mathbf u est noté g\mathbf u.

A propos d’un problème d’optimisation « élémentaire »

Je reviens ici sur le problème présenté à la fin de ce billet.

Pour rappel, il s’agit de déterminer en quel point A du rivage doit accoster un bonhomme qui quitte un îlot I en canot afin de se rendre au plus vite dans sa maison M située sur le rivage (supposé rectiligne), sachant que sur l’eau, il canote à deux km/h et qu’il marche le long du rivage à quatre km/h.

Ce problème semble anodin. De fait, il n’est pas conceptuellement très sophistiqué et les mathématiques du niveau de la fin de l’enseignement secondaire suffisent pour trouver sa solution. Cependant, il est techniquement assez délicat à résoudre proprement car il revient à déterminer le minimum d’une fonction qui n’est pas dérivable en un point dont il s’avère, pour de nombreuses dispositions de I et M, qu’il est le seul en lequel elle atteint sa plus petite valeur.

De plus, mais je ne sais pas pourquoi, lorsqu’on l’aborde sans trop de précautions, on fait souvent des hypothèses qu’on tient à tort pour évidentes et qui ne sont d’ailleurs pas toujours pertinentes. C’est sans doute un peu ce que j’ai fait dans le billet cité ci-dessus, raison pour laquelle, entre autres, je présente dans celui-ci une résolution détaillée de la question.

Notons I' la projection orthogonale de I sur le rivage. Nous allons la prendre pour origine d’un repère dont « l’axe des y » est I'I orienté de manière telle que l’ordonnée de I soit un nombre strictement positif d et dont « l’axe des x » soit le rivage, orienté en sorte que l’abscisse de M soit un nombre positif ou nul m.

En fait, nous supposerons m>0 car il est clair que si M=I', le plus rapide est de rallier la maison en canotant en ligne droite de l’îlot vers celle-ci.

Avec ces notations, le temps mis par le bonhomme pour rentrer chez lui s’il accoste en le point X d’abscisse x est

t(x)=\frac{1}{v_1}\|IX\|+\frac{1}{v_2}\|XM\|=\frac{1}{v_1}\sqrt{x^2+d^2}+\frac{1}{v_2}|m-x|

v_1 est la vitesse à laquelle il canote et v_2 celle à laquelle il marche, valeurs que nous laisserons quelconques sauf dans les exemples illustrant ce qui suit et qui seront alors celles de l’énoncé.

La fonction t n’est pas dérivable en m aussi l’étudierons-nous séparément dans les intervalles ]-\infty,m[ et ]m,+\infty[ dans lesquels elle l’est.

a) \boxed{\mathrm{Dans}\  ]-\infty,m[}

Dans cet intervalle, t coïncide avec la fonction

f:x\mapsto \frac{1}{v_1}\sqrt{x^2+d^2}+\frac{1}{v_2}(m-x)

dont la dérivée est donnée par

f'(x)=\frac{1}{v_1}\frac{x}{\sqrt{x^2+d^2}}-\frac{1}{v_2}

Si celle-ci s’annule, c’est en un x vérifiant

x=\frac{v_1}{v_2}\sqrt{x^2+d^2}

qui est donc strictement positif. De plus, en élevant cette relation au carré, il vient

(v_2^2-v_1^2)x^2=v_1^2d^2

Par conséquent

  • Si v_1\geqslant v_2 alors f n’a pas de point stationnaire et est strictement décroissant (puisque f'(0)<0).
  • Si v_1 < v_2 alors f a un seul point stationnaire, en lequel il atteint son minimum absolu, à savoir

    a:=\frac{v_1}{\sqrt{v_2^2-v_1^2}}d

Donc, si a n’existe pas (v_1\geqslant v_2) ou existe mais est au moins égal à m, alors t est strictement décroissant dans ]-\infty,m[, sinon t atteint en a son minimum absolu dans ]-\infty,m[.

Or, un calcul facile montre que lorsque a existe, il est strictement plus petit que m si, et seulement si,

(1) \frac{v_1}{v_2}<\frac{m}{\sqrt{m^2+d^2}}

condition sous laquelle v_1<v_2. Elle implique donc que a existe.

En conclusion,

Si (1) est vrai, alors t admet en a son minimum absolu dans ]-\infty,m[ sinon, il est strictement décroissant dans cet intervalle.

b) \boxed{\mathrm{Dans}\  ]m,+\infty[}

Dans cet intervalle, t coïncide avec la fonction

f:x\mapsto \frac{1}{v_1}\sqrt{x^2+d^2}+\frac{1}{v_2}(x-m)

dont la dérivée, donnée par

f'(x)=\frac{1}{v_1}\frac{x}{\sqrt{x^2+d^2}}+\frac{1}{v_2}

est strictement positive. Ainsi,

La fonction t est strictement croissante dans l’intervalle ]m,+\infty[.

c) Pour conclure …

Les paragraphes a) et b) montrent que

Lorsque

\frac{v_1}{v_2}<\frac{m}{\sqrt{m^2+d^2}}

le bonhomme doit accoster en le point d’abscisse a et son temps de parcours minimum est donné par

f(a)=\frac{\sqrt{v_2^2-v_1^2}}{v_1v_2}d+\frac{1}{v_2}m

sinon il doit directement aller en M, avec le temps de parcours minimum \frac{1}{v_1}\sqrt{m^2+d^2}.

La figure suivante représente le graphe de t, limité aux abscisses positives, pour (d,m,v_1,v_2)=(2,5,2,4); (1) est alors vérifié,

min_1

et celle-ci pour (d,m,v_1,v_2)=(2,1,2,4); (1) est alors faux.

min_2

Dans chaque image, le point P est celui du graphe dont l’abscisse est donnée par la formule définissant a (qui ne dépend que des v_i et de d) mais dans la seconde, il ne correspond pas au minimum absolu de t car celui-ci est atteint en m (où t n’est pas dérivable).

Le résultat précédent a une interprétation géométrique simple (qui rejoint la conclusion du billet cité au début de cet article, en la complétant).

Si v_1 \geqslant v_2, alors A=M. Autrement, v_1/v_2 est le cosinus d’un angle \theta\in[0,\pi/2[. La tangente de cet angle est la pente d’une droite passant par I'. Notons A_0 la projection orthogonale sur le rivage de son intersection avec la parallèle à celui-ci menée par I. Alors si M est dans le segment [I',A_0], A=M, sinon, A=A_0.

Ceci est corroboré par les exemples ci-dessus dans lesquels \theta=\pi/3.

😉

La règle des multiplicateurs de Lagrange et les lois de l’optique géométrique

Je consigne ici une leçon que je donne régulièrement dans un cours d’introduction à la géométrie différentielle. Elle intrigue les étudiants qui, le plus souvent, l’aime beaucoup.

Il s’agit de retrouver les lois de Snell-Descartes à partir du principe de Fermat selon lequel le chemin suivi par la lumière rend stationnaire le temps de parcours. Dans un milieu homogène, sa vitesse est constante et elle suit donc des segments de droites.

La question est de savoir comment est modifiée sa trajectoire lorsqu’elle traverse la surface \Sigma(*) séparant deux milieux homogènes dans lesquels elle circule à des vitesses différentes (lois de la réfraction) ou lorsqu’elle se réfléchit en un point de \Sigma (lois de la réflexion).

Dans le premier cas, un rayon lumineux issu d’une source ponctuelle s placée dans le premier milieu traverse \Sigma en a et poursuit sa trajectoire jusqu’en un point cible c du second.

Dans le second, a est le point en lequel le rayon se réfléchit vers la cible et celle-ci est dans le même milieu que la source.

Dans les deux cas, le temps mis pour joindre s et c via un point x\in\Sigma est

t(x)=\frac{1}{v_1}\|sx\|+\frac{1}{v_2}\|xc\|

v_1 est la vitesse de la lumière avant l’incidence et v_2 après (on a donc v_1=v_2 en cas de réflexion).

Par hypothèse, t|_\Sigma est stationnaire en a. Par conséquent, d’après la règle des multiplicateurs de Lagrange, le gradient de t en a,

\mbox{grad}_at=\frac{1}{v_1}\frac{\overrightarrow{sa}}{\|sa\|}-\frac{1}{v_2}\frac{\overrightarrow{ac}}{\|ac\|}

est normal à \Sigma en a. Nous en déduisons une première loi :

Le rayon incident, sa, le rayon réfracté (ou réfléchi), ac, et la normale au point d’incidence à la surface de séparation sont dans un même plan.

Ce plan coupe la surface \Sigma selon une courbe et le plan tangent de \Sigma en a selon une droite, tangente à la courbe, comme illustré sur le dessin suivant.

descartes

En exprimant que le produit scalaire de \mbox{grad}_at avec un vecteur directeur unitaire de cette droite est nul, on voit facilement, avec les notations de la figure, que

\sin r=\frac{v_2}{v_1}\sin i

C’est la seconde loi de Snell-Descartes.

Dans le cas de la réflexion, v_2=v_1; elle exprime donc le fait que l’angle de réflexion est égal à l’angle d’incidence.

Pour la réfraction, v_1\neq v_2 et donc i et r sont différents. Il peut même arriver que r soit égal à \pi/2. On parle alors de réflexion totale ou d’incidence rasante. L’angle d’incidence correspondant est alors donné par

\sin i=\frac{v_1}{v_2}

Le phénomène ne se présente donc que si v_1<v_2.

D’habitude, j’achève la leçon par une application amusante du phénomène de réflexion totale.

Il s’agit de déterminer en quel point A du rivage doit accoster un bonhomme qui quitte l’îlot I en canot afin de se rendre au plus vite dans sa maison M située sur le rivage, sachant que sur l’eau, il canote à deux km/h et qu’il marche le long du rivage à quatre km/h.

Les données du problèmes sont représentées sur ce dessin, où I' est la projection orthogonale de I sur le rivage, supposé rectiligne.

ile

En fait, comme il s’agit de minimiser le temps de parcours, le bonhomme doit suivre le trajet d’un rayon lumineux émis depuis I et formant l’angle d’incidence correspondant à l’incidence rasante. Un tel rayon existe car la vitesse v_1 du bonhomme dans l’eau est plus petite que sa vitesse v_2 sur terre. D’après ce qui précède, l’angle \alpha est donné par

\sin\alpha=\frac{v_1}{v_2}

de sorte que

\|I'A\|=\|II'\|\tan\alpha=\|II'\|\frac{v_1}{\sqrt{v_2^2-v_1^2}}

et le problème est résolu.

Notez que si le bonhomme se déplaçait plus vite sur l’eau que sur terre (par exemple en utilisant un Jet Ski😉 ) alors le trajet le plus rapide consisterait à aller directement en ligne droite de l’îlot à sa maison.

P.S. En fait, la solution du petit problème donnée ci-dessus n’est correcte que si M est assez éloigné de I', c’est-à-dire si le point A est entre I' et M. J’aurais dû le mentionner d’emblée. Je vais bientôt revenir sur cette observation dans un prochain billet. P.L. 30/04/2016
__________
(*) Nous supposons que \Sigma est une variété plongée (dans \mathbf R^3).

A propos des angles d’un triangle

Introduction

Comme je le précisais ici, je définis — à l’instar beaucoup d’autres du reste — la notion d’espace affine en donnant un rôle central aux translations. Ainsi, une structure d’espace affine modelée sur un espace vectoriel E est une action à droite libre et transitive du groupe additif de cet espace sur un ensemble \mathcal E. L’action de \mathbf u est la translation de vecteur \mathbf u.

L’espace affine \mathcal E est alors un espace euclidien si E est lui-même un espace vectoriel euclidien, c’est-à-dire s’il est réel et muni d’un produit scalaire, disons g, ce qui permet d’introduire sur \mathcal E les notions d’angle et de distance.

La distance de deux points A,B de \mathcal E est la longueur

\|\overrightarrow{AB}\|=\sqrt{g(\overrightarrow{AB},\overrightarrow{AB})}

de l’unique vecteur dont la translation transforme A en B.

Quant à l’angle de deux vecteurs non nuls \mathbf u,\mathbf v\in E, plus précisément, l’angle non orienté, il est défini par son amplitude, avec laquelle je le confond. C’est l’unique nombre \varphi\in[0,\pi] dont le cosinus soit donné par

\cos\varphi=\frac{g(\mathbf u,\mathbf v)}{\|\mathbf u\|\|\mathbf v\|}

Ceci permet de définir les attributs métriques usuels des triangles, comme illustré sur le dessin suivant.

Triangle

Par définition, les longueurs des côtés du triangles sont les nombres

a=\|\overrightarrow{BC}\|,b=\|\overrightarrow{CA}\|, c=\|\overrightarrow{AB}\|

tandis que l’angle en un sommet du triangle est l’angle non orienté entre les vecteurs joignant ce sommet aux deux autres. Par exemple, \alpha est l’angle des vecteurs \overrightarrow{AB} et \overrightarrow{AC}.

Cette façon de faire présente des avantages importants. Elle permet par exemple très facilement de vérifier l’inégalité triangulaire, à savoir

d(A,B)\leqslant d(A,C)+d(C,B)

l’égalité ayant lieu si, et seulement si, le point C appartient au segment [A,B], ce qui montre aussitôt que dans tout triangle, la longueur de chaque côté est strictement inférieure à la somme de celles des deux autres. Elle donne aussi très facilement le théorème de Pythagore généralisé(*) que j’énonce en formule pour simplifier

c^2=a^2+b^2-2ab\cos\gamma

Ces deux résultats résultent trivialement des propriétés élémentaires des produits scalaires, le point de départ consistant à utiliser la relation de Chasles puis à développer le carré scalaire :

\|\overrightarrow{AB}\|^2=g(\overrightarrow{AC}+\overrightarrow{CB},\overrightarrow{AC}+\overrightarrow{CB})

Mais la méthode présente également quelques inconvénients. Elle rend par exemple assez délicate la vérification du fait que la somme des angles d’un triangle vaut \pi(**) et complique un peu celle de la règle des sinus.

Je présente dans ce billet des preuves de ces deux propriétés, développées dans le cadre de l’approche décrite dans cette introduction.

La règle des sinus

En utilisant le théorème de Pythagore généralisé, on obtient, compte tenu du fait que les sinus des angles d’un triangle sont positifs puisque ceux-ci sont compris entre 0 et \pi,

\sin\alpha=\sqrt{1-\cos^2\alpha}=\sqrt{1-\frac{(b^2+c^2-a^2)^2}{4b^2c^2}}=\cdots=\frac{\sigma}{2bc}

où on a posé

\sigma=\sqrt{(a+b+c)(-a+b+c)(a-b+c)(a+b-c)}

(On observe que le produit sous le radical est strictement positif en raison de l’inégalité triangulaire.)

De là

\frac{a}{\sin\alpha}=\frac{2abc}{\sigma}

Comme \sigma est totalement symétrique en a,b,c, il vient finalement

\frac{a}{\sin\alpha}=\frac{b}{\sin\beta}=\frac{c}{\sin\gamma}=\frac{2abc}{\sigma}

Notez que si on disposait de la notion d’aire et si on savait que celle d’un triangle est toujours la moitié du produit des longueurs de deux côtés et du sinus de l’angle qu’ils comprennent, alors on obtiendrait très facilement la règle des sinus car en notant \mathcal S l’aire du triangle ABC, on aurait

\mathcal S=\frac 1 2bc\sin\alpha=\frac 1 2ca\sin\beta=\frac 1 2ab\sin\gamma

et donc

\frac{a}{\sin\alpha}=\frac{b}{\sin\beta}=\frac{c}{\sin\gamma}=\frac{abc}{2\mathcal S}

A ma connaissance, c’est d’ailleurs ce que font la plupart des enseignants des écoles secondaires belges francophones. Il faut dire que dans ce contexte, on ne se tracasse pas beaucoup avec la définition de la notion d’aire, c’est bien normal, et les formules élémentaires donnant celles des figures les plus courantes sont supposées connues depuis l’école primaire (« base fois hauteur sur deux », « longueur fois largeur », « pi fois le carré du rayon », etc.)

Mais il est clair que dans une reconstruction ab initio de la géométrie, l’introduction de la notion d’aire (d’une mesure finalement) est assez délicate(***).

Quoiqu’il en soit, en confrontant les deux calculs, on voit que \mathcal S=\sigma/4. Ce théorème est connu sous le nom de Formule de Héron.

La valeur commune des trois rapports a/\sin\alpha,\ldots est en fait le double du rayon du cercle circonscrit du triangle ABC.

sinus

Pour vérifier cela, on utilise le fait que des angles inscrits dans un cercle qui sont sous-tendus par une même corde et qui sont situés d’un même côté de celle-ci sont égaux. Notons alors A' la seconde extrémité du diamètre passant par B du cercle circonscrit au triangle ABC. Les angles inscrits de sommets A et A' et sous-tendus par [B,C] sont égaux. Mais le triangle A'CB est rectangle en C et, comme dans un triangle rectangle, un côté de l’angle droit est le produit de l’hypothénuse et du sinus de l’angle opposé, nous avons

a=\|BC\|=2R\sin\alpha

R est le rayon du cercle, et le tour est joué.

C’est très simple mais cela repose sur une propriété des angles inscrits qui n’est pas facile à établir dans l’axiomatique de la géométrie utilisée ici.

Incidemment, nous venons de prouver que

R=\frac{abc}{4\mathcal S}

La somme des angles d’un triangle

Nous allons à présent vérifier que la somme des angles d’un triangle vaut \pi.

Commençons par montrer que \alpha+\beta\in[0,\pi]. Pour cela, il suffit de voir que \sin(\alpha+\beta)>0 car \alpha+\beta\in[0,2\pi]. Or, avec les notations du paragraphe précédent,

\sin(\alpha+\beta)=\sin\alpha\cos\beta+\sin\beta\cos\alpha=\frac{\sigma}{2bc}\frac{c^2+a^2-b^2}{2ca}+\frac{\sigma}{2ca}\frac{b^2+c^2-a^2}{2ca}=\frac{\sigma}{2ab}>0

En fait, nous venons de montrer que \sin(\alpha+\beta)=\sin\gamma ce qui, compte tenu de ce que \alpha+\beta,\gamma\in[0,\pi], nous laisse deux possibilités : \gamma=\alpha+\beta et \gamma=\pi-(\alpha+\beta). Pour conclure, il suffit dès lors de prouver que

\cos\gamma=\cos(\pi-(\alpha+\beta))=-\cos(\alpha+\beta)

car \cos est injectif dans [0,\pi]. Or

-\cos\alpha\cos\beta+\sin\alpha\sin\beta=\frac{1}{4abc^2}[\sigma^2-(b^2+c^2-a^2)(c^2+a^2-b^2)]

Un peu de calcul montre que l’expression entre crochets vaut 2c^2(a^2+b^2-c^2) de sorte que

\cos(\pi-(\alpha+\beta))=\frac{a^2+b^2-c^2}{2ab}=\cos\gamma

et l’affaire est conclue.

——————————
(*} Je n’aime pas trop ce nom car, en fait, le théorème de Pythagore et le théorème de Pythagore généralisé sont équivalents, ce qu’on voit facilement en notant que

a^2+b^2-2ab\cos\gamma=\left(a-b\cos\gamma\right)^2+\left(b\sin\gamma\right)^2

(**) Dans l’approche suivie, on ne dispose pas de la méthode d’Euclide, très simple, qui consiste à mener par C une parallèle à AB. Cette parallèle fait un angle de mesure \alpha avec AC et un angle de mesure \beta avec BC. Les trois angles de sommets C ainsi obtenus remplissent un angle plat. Leur somme vaut donc bien \pi.

(***) A cet égard l’approche de John Roe, présentée au chapitre 9 (dans l’édition de 1993) de son excellent livre Elementary Geometry paru aux Oxford University Press, est fort intéressante.