Une remarque sur une forme de linéarité faible

Dans le billet précédent, nous avons rencontré l’équation fonctionnelle suivante(*)

\forall \lambda,\mu\in\mathbf R,\quad P(\lambda+\mu,\lambda)+P(\lambda,\lambda-\mu)=P(\lambda+\mu,\lambda-\mu)

Toutes les fonctions P de la forme \partial Q:(x,y)\in\mathbf R^2\mapsto Q(x)-Q(y)\in\mathbf R, où Q est une application de \mathbf R dans lui-même, en sont des solutions — c’est immédiat — et nous avons montré que ses solutions polynômiales sont les applications \partial QQ est un polynôme quelconque, ce qui l’est moins.

Les fonctions \partial Q sont exactement les solutions de l’équation fonctionnelle

\forall a,b,c\in\mathbf R,\quad P(c,b)+P(b,a)=P(c,a)

qui se réduit à la précédente lorsqu’on impose à a,b,c d’être en progression arithmétique.

Afin de différencier les deux équations, j’ai cherché, sous une forme très particulière, des solutions de la première qui n’en soient pas de la seconde. Ce faisant, je suis tombé sur un amusant petit problème auquel est consacré le présent billet.

Clairement, pour qu’une fonction P de la forme (x,y)\mapsto f(x-y) soit solution de la première équation, il est nécessaire, et suffisant, que

\forall x\in\mathbf R,\quad f(2x)=2f(x)

et le petit problème en question consiste plus généralement, étant donné un nombre \xi, à déterminer les f tel que(**)

(1) \forall x\in\mathbf R,\quad f(\xi x)=\xi f(x)

Naturellement, nous supposerons que \xi\neq 1, ce qui implique en particulier que f(0)=0. Avec \xi=-1, nous obtenons les fonctions impaires tandis que pour \xi=0, la condition se réduit f(0)=0. Nous ne reviendrons pas sur ces deux cas ultérieurement. Voici alors ce qu’on obtient (j’insiste : pour \xi\notin\{-1,0,1\}).

Cas \xi>0

La fonction f vérifie (1) si, et seulement si, elle est de la forme

x\mapsto \begin{cases}xg_+(\log_\xi x)&\mbox{si\ }x>0\\[1ex]0&\mbox{si\ }x=0\\[1ex]xg_-(\log_\xi |x|)&\mbox{si\ }x<0\end{cases}

g_{\pm} sont des fonctions de \mathbf R dans lui-même telles que g_{\pm}(u+1)=g_{\pm}(u) pour tout u\in\mathbf R.

Il est clair en effet que les fonctions de la forme indiquée vérifient (1). Pour la réciproque, le lecteur montrera facilement que

g_+:u\mapsto\frac{f(\xi^u)}{\xi^u} \mbox{\ et\ } g_-:u\mapsto-\frac{f(-\xi^u)}{\xi^u}

répondent à la question.

Cas \xi<0

La fonction f vérifie (1) si, et seulement si, elle est de la forme

x\mapsto \begin{cases}xg(\log_{\xi^2}x)&\mbox{si\ }x>0\\[1ex]0&\mbox{si\ }x=0\\[1ex]xg(\frac{1}{2}+\log_{\xi^2}|x|)&\mbox{si\ }x<0\end{cases}

g est une fonction de \mathbf R dans lui-même telle que g(u+1)=g(u) pour tout u\in\mathbf R.

Notez que \log_{\xi^2}x=\frac 1 2 \log_{|\xi|}x. Cela rend à peu près triviales les vérifications qui suivent.

En premier lieu, on constate aisément, grâce à cette observation, que si f a la forme indiquée, il vérifie (1).
Inversement, si f vérifie (1), alors

\forall x\in\mathbf R,\quad f(\xi^2x)=\xi^2f(x)

Comme \xi^2>0 (et \xi^2\neq 1), vu le cas précédent, il existe des fonctions g_{\pm} telles que

f:x\mapsto \begin{cases}xg_+(\log_{\xi^2} x)&\mbox{si\ }x>0\\[1ex]0&\mbox{si\ }x=0\\[1ex]xg_-(\log_{\xi^2}|x|)&\mbox{si\ }x<0\end{cases}

et g_{\pm}(u+1)=g_{\pm}(u) pour tout u\in\mathbf R.

On constate alors que (1) est satisfait par f si, et seulement si, g_-(\cdot)=g_+(\frac 1 2 +\cdot) ce qui conclut la preuve.

Voici deux conséquences de ce que nous venons de constater.

a) Si f vérifie (1) pour un \xi\notin\{-1,0,1\} et est dérivable en 0, alors il est linéaire.

En particulier, si f donne une solution de la première équation fonctionnelle dont nous avons parlé et est dérivable en 0, alors celle-ci est une solution de la seconde.

La propriété annoncée résulte de ceci (je suppose \xi>0 le cas \xi < 0 se traitant de façon similaire). Si f'(0) est un nombre réel alors il vaut

\lim_{\stackrel{h \to 0}{h>0}}\frac{f(h)}{h}=\begin{cases}\lim_{u\to-\infty}g_+(u)&\mbox{si\ }\xi>1\\\lim_{u\to+\infty}g_+(u)&\mbox{si\ }\xi<1\end{cases}

Par conséquent, vu que g_+(u+1)=g_+(u) pour tout u, g_+ est constant et vaut f'(0). On démontre de même que g_- le vaut aussi, ce qui prouve la propriété!

b) Les solutions de la première équation fonctionnelle ne sont pas toutes des solutions de la seconde.

En effet, avec

f:x\mapsto \begin{cases}x\sin(2\pi\log_2 x)&\mbox{si\ }x>0\\[1ex]0&\mbox{si\ }x=0\\[1ex]x\sin(2\pi\log_2 |x|)&\mbox{si\ }x<0\end{cases}

on obtient une solution de la première équation fonctionnelle, (x,y)\mapsto f(x-y), dont il est facile de voir qu’elle n’est pas de la forme \partial Q.

On notera que f n’est pas dérivable en 0 et, pour l’instant, je ne sais pas si on sait différencier les deux équations au moyen d’une solution P de la première qui soit partout dérivable.

😉

––––––––––
(*) Où P est une fonction de \mathbf R^2 dans \mathbf R.
(**) C'est cette condition qui m'a suggéré le titre de cet article, titre dont je ne suis pas complètement satisfait cela dit.

Où il est question de progressions arithmétiques

Sur M@TH en Ligne, quelqu’un a demandé de prouver que si les nombres a,b,c sont en progression arithmétique alors A=b^2 + bc + c^2, B=c^2 + ac +a^2,C= a^2+ab +b^2 le sont aussi.

C’est très simple à faire et plusieurs solutions ont été proposées. Je reproduis ici la mienne car elle conduit à une amusante propriété dont je voudrais discuter dans ce billet(*).

Supposons ainsi que a,b,c soient en progression arithmétique. On a donc c-b=b-a=2(c-a).
Comme

A=\frac{c^3-b^3}{c-b},\quad B=\frac{c^3-a^3}{c-a},\quad C=\frac{b^3-a^3}{b-a}

il vient alors immédiatement

A+C=\frac{c^3-a^3}{\frac 1 2(c-a)}=2B

de sorte que A,B,C sont effectivement en progression arithmétique.

Cette preuve repose sur deux propriétés :

–– d’une part, la relation c-b=b-a=2(c-a), résultant du fait que a,b,c sont en progression arithmétique. Elle permet de ramener les fractions A,B,C au même dénominateur.

–– d’autre part, le fait que la somme des numérateurs de A et C soit égale à celui de B

Dès lors, si on modifie les numérateurs de A,B,C tout en conservant cette dernière propriété, la preuve s’applique encore de sorte que les A,B,C modifiés sont aussi en progression arithmétique lorsque a,b,c le sont. Par exemple, avec les numérateurs c^n-b^n, c^n-a^n, b^n-a^n, on voit ainsi que

\sum_{k=0}^{n-1}c^kb^{n-1-k},\quad \sum_{k=0}^{n-1}c^ka^{n-1-k},\quad \sum_{k=0}^{n-1}b^ka^{n-1-k}

sont en progression arithmétique lorsque a,b,c le sont.

Plus généralement, on peut remplacer les numérateurs de A,B,C par P(c,b), P(c,a), P(b,a)P est une fonction de deux variables astreinte à vérifier la condition

(1) \forall a,b,c\in \mathbf R,\quad P(c,b)+P(b,a)=P(c,a)

La détermination de toutes ces fonctions est triviale. En effet, en faisant a=0 dans (1), on obtient P(c,b)=P(c,0)-P(b,0), ce qui montre que P est de la forme

(x,y)\mapsto f(x)-f(y)

pour une certaine fonction d’une variable f (à savoir x\mapsto P(x,0)). Comme les applications de cette forme vérifient toutes l’identité (1), l’affaire est donc entendue.

Le problème se corse lorsqu’on observe les choses un peu plus finement. Le fait que P vérifie (1) est certainement suffisant pour que la preuve s’applique mais il n’est cependant pas nécessaire. En effet, il est seulement nécessaire d’avoir P(c,b)+P(b,a)=P(c,a) lorsque a,b,c sont en progression arithmétique. En posant b=\lambda et en notant \mu la raison, nous sommes ainsi amenés à remplacer (1) par la condition plus faible suivante

(2) \forall \lambda,\mu\in\mathbf R,\quad P(\lambda+\mu,\lambda)+P(\lambda,\lambda-\mu)=P(\lambda+\mu,\lambda-\mu)

Trouver toutes les fonctions P qui vérifient cette condition me semble difficile, en tout cas, je ne sais pas le faire pour l’instant. Mais je sais quels polynômes la vérifient. Paradoxalement, ce sont les mêmes que ceux qui vérifient (1). En d’autres mots, pour les polynômes, les conditions (1) et (2) sont équivalentes.

Voyons comment vérifier cela.

Un polynôme de degré n se décompose de façon unique en une somme de polynômes homogènes de degré k\in\{0,\ldots,n\} et il est clair que le polynôme satisfait à (2) si, et seulement si, chacune de ses composantes homogènes le fait.

Considérons alors un polynôme homogène P satisfaisant à (2). On va montrer par récurrence sur son degré n qu’il est un multiple de x^n-y^n. Je laisse le soin au lecteur de vérifier que la propriété est vraie pour les premières valeurs de n et je passe à l’étape d’induction et suppose que n vaut au moins deux. En dérivant P(\lambda+\mu,\lambda)+P(\lambda,\lambda-\mu)=P(\lambda+\mu,\lambda-\mu) par rapport à \lambda, nous voyons que le polynôme homogène \frac{\partial P}{\partial x}+\frac{\partial P}{\partial y} vérifie aussi (2). Comme il est de degré n-1, on peut lui appliquer l’hypothèse de récurrence : il existe un nombre s tel que

\frac{\partial P}{\partial x}+\frac{\partial P}{\partial y}=sn\left(x^{n-1}-y^{n-1}\right)

Posons Q=P-s\left(x^n-y^n\right). Ce polynôme vérifie aussi (2) et la relation précédente montre que \frac{\partial Q}{\partial x}+\frac{\partial Q}{\partial y}=0. Comme je l’expliquerai plus bas, ce dernier point implique que Q=t(x-y)^n pour un certain nombre t. On a alors

Q(\lambda+\mu,\lambda)+Q(\lambda,\lambda-\mu)-Q(\lambda+\mu,\lambda-\mu)=\left(2-2^n\right)t\mu^n

Dès lors, vu que n\geqslant 2, Q est nul puisqu’il vérifie (2). La preuve est achevée.

Dans celle-ci, j’ai utilisé la propriété suivante grâce à laquelle on a pu déterminer la forme très particulière de Q.

Soit une fonction F:\mathbf R^2\to\mathbf R, au moins de classe C^1. Alors \frac{\partial F}{\partial x}+\frac{\partial F}{\partial y}=0 si, et seulement si, il existe une fonction \varphi:\mathbf R\to\mathbf R, de même classe que F et telle que F(x,y)=\varphi(x-y) pour tous x,y\in\mathbf R.

Cette propriété est sans doute très classique. J’en indique une preuve, au demeurant très simple, pour être complet.

Posons

F'(u,v)=F\left(\frac{u+v}{2},\frac{u-v}{2}\right)

La propriété résulte alors trivialement des observations suivantes. D’une part F(x,y)=F'(x+y,x-y) et, d’autre part,

\frac{\partial F'}{\partial u}=\frac 1 2\left(\frac{\partial F}{\partial x}+\frac{\partial F}{\partial y}\right)\left(\frac{u+v}{2},\frac{u-v}{2}\right)

Voilà, c’est tout pour ce billet.😉

__________
(*) Je travaillerai uniquement en nombres réels. Les choses pourraient sans doute être développées dans un cadre plus général que je ne chercherai pas à préciser ici.

Les hélices circulaires et une sympathique exponentielle III – L’exponentielle

Dans ce billet qui est la suite du précédent dont nous conservons les notations, nous allons résoudre les équations de Frenet lorsque la courbure et la torsion sont constantes. Ainsi, nous nous donnons des nombres \kappa >0 et \tau et nous cherchons les fonctions \mathbf t,\mathbf n,\mathbf b : I \to \mathbf R^3 telles que

(1) \begin{cases}\mathbf t'=\kappa\mathbf n\\\mathbf n'=-\kappa\mathbf t+\tau\mathbf b\\\mathbf b'=-\tau\mathbf n\end{cases}

et telles que, pour tout u\in I, (\mathbf t(u),  \mathbf n(u),\mathbf b(u)) soit une base orthonormée positive de \mathbf R^3, ce qui revient à dire que la matrice dont les colonnes sont \mathbf t(u),  \mathbf n(u),\mathbf b(u), dans cet ordre, est orthogonale et de déterminant positif.

Nous nous limiterons à déterminer les solutions maximales, c’est-à-dire celles dont l’intervalle de définition est le plus grand possible. Leurs restrictions à des intervalles plus petits fournissent toutes les autres.

Posons

F=\begin{pmatrix}t_1&n_1&b_1\\t_2&n_2&b_2\\t_3&n_3&b_3\\\end{pmatrix}

où les t_i,\ldots sont les composantes de \mathbf t,\ldots et

H=\begin{pmatrix}0&-\kappa&0\\\kappa&0&-\tau\\0&\tau&0\end{pmatrix}

Le système (1) se réécrit alors sous la forme matricielle

(2) F'=FH

Voici quelques remarques.

  • Cette équation admet une solution maximale passant par la matrice identité en u=0. Elle est définie dans \mathbf R et s’exprime au moyen de l’exponentielle matricielle. C’est la fonction

    F_0:u \mapsto e^{uH}

  • Les valeurs de F_0 sont des matrices orthogonales de déterminant positif. En effet, comme H est antisymétrique, on a

    ^t\left(e^{uH}\right)=e^{u (^tH)}=e^{-uH}=\left(e^{uH}\right)^{-1}

    et

    \det e^{uH}=e^{u\mathrm{tr\ }H}=1

    puisque la trace de H est nulle.

  • Soient une solution F de (2), définie dans un intervalle I\subset \mathbf R, u_0\in I et A_0=F(u_0). Clairement, A_0e^{-u_0H}F_0 est une solution de (2). Elle est définie dans \mathbf R et sa valeur en u_0 est A_0. Elle coïncide par conséquent avec F dans I. Ainsi, les solutions maximales que nous cherchons sont les fonctions AF_0A décrit l’ensemble des matrices orthogonales de déterminant positif et de dimension trois.

Nous voici donc à pied d’œuvre : nous devons calculer F_0.

Calcul de l’exponentielle d’une matrice antisymétrique de dimension trois

Nous allons calculer l’exponentielle e^M d’une matrice antisymétrique quelconque

M=\begin{pmatrix}0&-c&b\\c&0&-a\\-b&a&0\end{pmatrix}

de dimension trois (réelle). Il y a pour cela plusieurs stratégies parmi lesquelles : diagonaliser la matrice, utiliser une équation différentielle, utiliser une équation de récurrence.

Compte tenu du contexte, nous allons utiliser la seconde méthode qui exploite le fait que la fonction définie sur \mathbf R par u \mapsto e^{uM} est l’unique solution maximale de l’équation X'=XM dont la valeur en zéro est la matrice unité (que nous noterons I).

Nous allons ramener cette équation à une équation différentielle scalaire, linéaire et à coefficients constants en profitant du fait que(*)

(3) M^3+(a^2+b^2+c^2)M=0

Nous cherchons notre fonction sous la forme

e^{uM}=\alpha(u)M^2+\beta(u)M+\gamma(u)I

\alpha,\beta et \gamma sont des fonctions à valeurs réelles. En injectant ceci dans l’équation X'=XM, en utilisant (3) puis en identifiant les coefficients des puissances de M, nous obtenons les équations, où \ell=\sqrt{a^2+b^2+c^2},

\begin{cases}\alpha'=\beta\\\beta'=-\ell^2\alpha+\gamma\\\gamma'=0\end{cases}

assorties des conditions initiales

\alpha(0)=0,\ \beta(0)=0,\ \gamma(0)=1

La fonction \gamma est constante et vaut 1. Quant à \alpha, il vérifie

\alpha''+\ell^2\alpha=1,\ \alpha(0)=\alpha'(0)=0

une équation très facile à résoudre. Après de petits calculs, on trouve alors, si \ell n’est pas nul,

e^{uM}=\frac{1}{\ell^2}[1-\cos(\ell u)]M^2+\frac{1}{\ell}\sin(\ell u)M+I

En particulier,

e^M=\frac{1}{\ell^2}[1-\cos(\ell)]M^2+\frac{1}{\ell}\sin(\ell)M+I

Si \ell est nul, alors M l’est aussi et e^{uM}=I. On peut alors considérer que les deux formules précédentes sont correctes dans ce cas, d’autant que

\begin{cases}\lim_{\ell\to 0}\frac{1}{\ell^2}[1-\cos(\ell u)]=\frac 1  2 u^2\\[1ex]\lim_{\ell\to 0}\frac{1}{\ell}\sin(\ell u)=u\end{cases}

Retour aux hélices circulaires

Revenons-en au système (2). En appliquant ce qui précède à H, pour lequel \ell=\sqrt{\kappa^2+\tau^2}>0, on voit que la première colonne de F_0=e^{uH} est

\mathbf t_0=\begin{pmatrix}\frac{\kappa^2}{\ell^2}\cos(\ell u)+\frac{\tau^2}{\ell^2}\\[1ex]\frac{\kappa}{\ell}\sin(\ell u)\\[1ex]-\frac{\kappa\tau}{\ell^2}\cos(\ell u)+\frac{\kappa\tau}{\ell^2}\end{pmatrix}

dont les primitives sont les applications \gamma_0 données par

\gamma_0(u)=\begin{pmatrix}\frac{\kappa^2}{\ell^3}\sin(\ell u)+\frac{\tau^2}{\ell^2}u\\[1ex]-\frac{\kappa}{\ell^2}\cos(\ell u)\\[1ex]-\frac{\kappa\tau}{\ell^3}\sin(\ell u)+\frac{\kappa\tau}{\ell^2}u\end{pmatrix}+\mathbf a

\mathbf a décrit \mathbf R^3.

Provenant d’une solution des équations (1), chaque application \gamma_0:\mathbf R\to\mathbf R^3 est un paramétrage d’une courbe \Gamma_0 dont la courbure est \kappa et la torsion \tau et, vu la dernière remarque que nous avons faite plus haut à propos de l’équation (2), toute courbe ayant ces courbure et torsion s’obtient en appliquant un déplacement à \Gamma_0.

Il existe une matrice orthogonale de déterminant positif A telle que

\forall u\in\mathbf R,\quad \gamma_0(u)=A\varphi(u)+\mathbf a

\varphi est le paramétrage d’une hélice circulaire présenté dans le billet précédent. Pour le voir, exprimons d’abord \varphi à l’aide de \kappa et \tau. Les relations

\kappa=\frac{r}{r^2+h^2} \quad \& \quad \tau=\frac{h}{r^2+h^2}

s’inversent en

r=\frac{\kappa}{\kappa^2+\tau^2}=\frac{\kappa}{\ell^2} \quad \& \quad h=\frac{\tau}{\kappa^2+\tau^2}=\frac{\tau}{\ell^2}

En reportant ceci dans l’expression de \varphi donnée au billet précédent, il vient

\varphi(u)=\left(\frac{\kappa}{\ell^2}\cos(\ell u),\frac{\kappa}{\ell^2}\sin(\ell u),\frac{\tau}{\ell}u\right)

Par conséquent, comme on le voit immédiatement, la matrice orthogonale de déterminant positif

\begin{pmatrix}0&\frac{\kappa}{\ell}&\frac{\tau}{\ell}\\[1ex]-1&0&0\\[1ex]0&-\frac{\tau}{\ell}&\frac{\kappa}{\ell}\end{pmatrix}

est la matrice cherchée A.

J’avais promis, dans le premier billet de cette série de trois articles, de vérifier le théorème de classification des courbes dans le cas particulier où la courbure et la torsion sont constantes et cela en résolvant explicitement les équations de Frenet. Voilà qui est fait!😉

__________
(*) Toute matrice annule un polynôme ne serait-ce que son polynôme caractéristique et la méthode que j’utilise ici est applicable à n’importe quelle matrice; elle permet aussi de calculer par récurrence les puissances d’une matrice.

Les hélices circulaires et une sympathique exponentielle II – Les hélices circulaires

Imaginons nous enrouler une feuille de papier sur un cylindre circulaire droit comme suggéré sur ce dessin :

helice_circulaire_2

Un segment de droite tracé sur la feuille dessine alors une courbe sur le cylindre. C’est un morceau d’hélice circulaire dont voici un exemple :

helice_circulaire

Nous allons paramétrer une hélice circulaire(*) de \mathbf R^3 au moyen d’une abscisse curviligne. Nous noterons u celle-ci. Pour cela, on lui fait subir, ainsi qu’au cylindre sur laquelle elle est tracée, un déplacement amenant l’axe du cylindre sur l’axe des z et donnant les coordonnées (r,0,0) au point à partir duquel on mesure l’abscisse curviligne, P_0 (r>0 désigne le rayon du cylindre). L’hélice circulaire admet alors un paramétrage de la forme

\varphi: u\in \mathbf R\mapsto \left(r\cos\frac{u}{\sqrt{r^2+h^2}},r\sin\frac{u}{\sqrt{r^2+h^2}},\frac{hu}{\sqrt{r^2+h^2}}\right)\in\mathbf R^3

Voici les explications. Le plan de coordonnées x, y coupe le cylindre selon un cercle, de rayon r, représenté à gauche dans la figure ci-dessous. Il est paramétré par un angle, noté t, mesuré à partir de P_0 dans le sens trigonométrique (sur le dessin, t est positif).

helice_calcul

L’hypoténuse du triangle rectangle situé à droite du cercle sur la figure, dessinée en rouge, est le segment de droite obtenu en déroulant l’hélice sur le plan tangent au cylindre en P_0 en faisant rouler celui-ci « sans glisser » perpendiculairement à la génératrice de P_0 selon l’angle t. Sa longueur est u, à condition que nous orientions l’hélice dans le sens des t croissants, ce que nous conviendrons de faire. Le côté « horizontal » du triangle est de longueur rt : c’est celle de l’arc sous-tendu par l’angle au centre t du cercle. La longueur de l’autre côté est également proportionnelle à t et nous notons |h| le coefficient de proportionnalité. Le nombre h mesure ce dont l’hélice « monte », ou « descend », selon son signe, lorsque t varie d’un radian (il est positif sur le dessins). Le théorème de Pythagore donne u^2=r^2+h^2 de sorte que

t=\frac{u}{\sqrt{r^2+h^2}}

car, vu notre choix d’orientation de l’hélice, u et t ont le même signe.

Le point P de l’hélice correspondant à t est donc bien \varphi(u).

La dérivée

\left(-\frac{r}{\sqrt{r^2+h^2}}\sin\frac{u}{\sqrt{r^2+h^2}},\frac{r}{\sqrt{r^2+h^2}}\cos\frac{u}{\sqrt{r^2+h^2}},\frac{h}{\sqrt{r^2+h^2}}\right)

de \varphi(u) est de longueur 1. C’est le vecteur tangent unitaire \mathbf t de l’hélice associé à l’orientation choisie. Par définition, la courbure \kappa de l’hélice est la longueur de la dérivée

\frac{r}{r^2+h^2} \left(-\cos\frac{u}{\sqrt{r^2+h^2}},-\sin\frac{u}{\sqrt{r^2+h^2}},0\right)

de \mathbf t et sa normale principale est, sous réserve que \kappa ne soit pas nul, \mathbf n=\mathbf t'/\kappa. Ainsi,

\kappa=\frac{r}{r^2+h^2}

et

\mathbf n=\left(-\cos\frac{u}{\sqrt{r^2+h^2}},-\sin\frac{u}{\sqrt{r^2+h^2}},0\right)

Par définition, de nouveau, la binormale est le produit vectoriel \mathbf b=\mathbf t\wedge\mathbf n et la troisième équation de Frenet — nous reparlerons très bientôt de ces équations — permet de calculer la torsion \mathbf \tau de l’hélice : \mathbf b'=-\tau\mathbf n. Je ne détaille pas le calcul, fort simple du reste, qui nous donne ainsi

\mathbf b=\left(\frac{h}{\sqrt{r^2+h^2}}\sin\frac{u}{\sqrt{r^2+h^2}},-\frac{h}{\sqrt{r^2+h^2}}\cos\frac{u}{\sqrt{r^2+h^2}},\frac{r}{\sqrt{r^2+h^2}}\right)

puis

\tau=\frac{h}{r^2+h^2}

La tangente unitaire, la normale et la binormale de l’hélice constituent ce qu’on appelle le trièdre de Frenet de l’hélice et vérifient, comme c’est le cas de toute courbe pour lequel ce trièdre est défini, les équations de Frenet

\begin{cases}\mathbf t'=\kappa\mathbf n\\\mathbf n'=-\kappa\mathbf t+\tau\mathbf b\\\mathbf b'=-\tau\mathbf n\end{cases}

Pour une hélice circulaire, la courbure et la torsion sont constantes et les équations de Frenet forment un systèmes d’équations différentielles linéaires à coefficients constants.

Il est particulièrement simple à résoudre et nous verrons en le résolvant explicitement dans un prochain billet, que les hélices circulaires sont les seules courbes dont la courbure (supposée non nulle) et la torsion sont constantes, conformément au théorème de classification mentionné au début du billet précédent.

__________
(*) Complète, c’est-à-dire qui se déroule sur une droite entière lorsqu’on fait rouler le cylindre sur un de ses plans tangents.

Les hélices circulaires et une sympathique exponentielle I

La courbure et la torsion permettent de classifier les courbes suffisamment régulières(*) de \mathbf R^3.

On peut d’abord montrer que ces courbes sont caractérisées à déplacements près par leur courbure et leur torsion. Par exemple, les hélices circulaires sont les seules dont ces deux attributs soient constants.

Ensuite, on sait prouver, à l’aide des équations de Frenet, qu’étant donné un intervalle ouvert I et des fonctions \kappa,\tau:I\to\mathbf R, où \kappa est à valeurs strictement positives, il existe une courbe définie sur I dont \kappa soit la courbure et \tau la torsion.

Lorsque \kappa et \tau sont constants, les équations de Frenet forment un système d’équations différentielles linéaires à coefficients constants. Ses solutions, qui donnent les hélices circulaires, sont donc décrites à l’aide d’une exponentielle matricielle.

Il s’avère qu’il est facile de calculer cette exponentielle et d’ainsi illustrer le théorème de classification par un bel exemple. C’est ce que je me propose de faire, au long de quelques billets dans lesquels je présenterai le trièdre et les équations de Frenet des hélices circulaires avant de parler de l’exponentielle en question.

Le reste du présent billet est une petite incursion dans le monde des groupes de Lie. Je vais y présenter une fort jolie interprétation des équations de Frenet. Ce qui suit est donc relativement abstrait et utilise un peu de géométrie différentielle. Mais ces considérations n’étant pas utilisées par la suite — sauf celles relatives aux équations de Frenet sur lesquelles je reviendrai plus loin, le lecteur qu’elles pourraient rebuter peut sans problème sauter ce passage.

Comme on va le voir, les équations de Frenet appartiennent à une famille intéressante d’équations différentielles posées sur les groupes de Lie, équations parmi lesquelles ont trouve aussi les systèmes d’équations différentielles linéaires.

Voici l’énoncé clé concernant cette famille d’équation(**).

(1) Soit un intervalle ouvert I et une fonction \mathbf h de I dans l’algèbre de Lie \mathfrak g d’un groupe de Lie G. Pour tout s\in I et tout a\in G, la solution maximale de l’équation différentielle

x'=x\mathbf h

qui passe par a en t=s est définie dans I tout entier. De plus, si (J,x) est une solution de cette équation et si b\in G, alors bx:t\in J\mapsto bx(t)\in G en est encore une solution. En conséquence si (J_1,x_1) et (J_2,x_2) sont des solutions de cette équation, alors l’application t\in J_1\cap J_2\mapsto x^{-1}_2(t)x_1(t)\in G est constante.

La preuve de cette propriété est assez simple et classique. Cependant, je ne la détaillerai pas ici. Voici quelques cas particuliers intéressants.

  • Si G est le groupe GL(n,\mathbf R) des matrices carrées de dimension n non singulières, alors \mathfrak g est l’algèbre de Lie gl(n,\mathbf R) des matrices carrées de dimension n et l’application linéaire tangente de la multiplication à gauche par une matrice est encore la multiplication à gauche par cette matrice. Ainsi, dans le cas du groupe GL(n,\mathbf R), les équations différentielles dont il est question dans l’énoncé ne sont autres que les systèmes de n équations différentielles linéaires à n inconnues.
  • Si \mathbf h est constant, alors l’équation x'=x\mathbf h est celle du flot du champ de vecteur invariant à gauche de G engendré par \mathbf h. On retrouve ainsi le fait que ce champ est complet. Son flot est l’application

    (t,g)\in \mathbf R\times G\mapsto g\exp_G(t\mathbf h)\in G

    \exp_G est l’application exponentielle de G.

  • Dans le cas où G=GL(n,\mathbf R), \exp_G est l’exponentielle matricielle. Elle associe à une matrice M\in gl(n,\mathbf R) la matrice

    e^M=\sum_{k=0}^{+\infty}\frac{1}{k!}M^k

    La fonction t\in\mathbf R\mapsto e^{tM}\in GL(n,\mathbf R) est alors la solution maximale de l’équation x'=xM pour laquelle x(0) est la matrice unité, I_n.

Voyons à présent comment la proposition (1) s’applique aux équations de Frenet. Celles-ci s’écrivent

\begin{cases}\mathbf t'=\kappa\mathbf n\\ \mathbf n'=-\kappa\mathbf t+\tau\mathbf b\\\mathbf b'=-\tau\mathbf n\end{cases}

\mathbf t,\mathbf n et \mathbf b sont la tangente unitaire, la normale principale et la binormale d’une courbe régulière (I,\gamma) de \mathbf R^3 paramétrée par une abscisse curviligne. Les fonctions \kappa et \tau sont la courbure, supposée sans zéros, et la torsion de cette courbe.

En fait, \mathbf t=\gamma' et la première équation de Frenet condense, en quelque sorte, les définitions de \kappa=\|\mathbf t'\| et de \mathbf n=\mathbf t'/\|\mathbf t'\|. La binormale est alors simplement le produit vectoriel \mathbf t\wedge \mathbf n.

Comme \mathbf t,\mathbf n et \mathbf b forment, dans cet ordre, une base orthonormée positive, en les disposant en colonnes, nous obtenons une fonction F:u\in I\mapsto (\mathbf t(u),\mathbf n(u),\mathbf b(u)) dont les valeurs sont des matrices orthogonales et de déterminant positif, c’est-à-dire des éléments du groupe de Lie SO(3). Avec la courbure et la torsion, nous obtenons une fonction à valeurs dans l’espace des matrices antisymétriques, qui est l’algèbre de Lie so(3) de SO(3), à savoir

H:u\in I\mapsto \begin{pmatrix}0&-\kappa(u)&0\\\kappa(u)&0&-\tau(u)\\0&\tau(u)&0\end{pmatrix}\in so(3)

Avec F et H, les équations de Frenet s’écrivent F'=FH : elles sont donc de celles dont il est question dans la proposition (1) lorsqu’on y prend pour G le groupe des rotations SO(3)!

Forts de cette observation, nous pouvons vérifier très simplement ce qui est annoncé plus haut, à savoir qu’il existe une courbe (I,\gamma) rapportée à une abscisse curviligne dont on prescrit la courbure \kappa, supposée sans zéros, et la torsion \tau et que cette courbe est déterminée à un déplacement près.

En effet, d’après (1), ces fonctions étant données, les solutions maximales de l’équation F'=FH dont on impose une condition initiale dans SO(3) sont définies sur I et prennent toutes leurs valeurs dans SO(3). Soit F_0=(\mathbf t_0,\mathbf n_0,\mathbf b_0) l’une d’elles. Les primitives de \mathbf t_0 vérifient les équations de Frenet de sorte que ce sont des paramétrages de courbes dont la courbure est \kappa et la torsion est \tau. Ces primitives diffèrent d’un vecteur constant et, vu (1) de nouveau, toute solution de l’équation F'=FH est de la forme AF_0, où A\in SO(3), ce qui prouve notre affirmation.

__________
(*) Je parle ici des courbes dont le vecteur tangent est unitaire et dont la courbure est sans zéro. Ce n’est pas une hypothèse optimale mais, dans ce billet et les deux suivants, les courbes et les fonctions seront de plus supposées de classe C^\infty.

(**) Je note multiplicativement l’application linéaire tangente de la multiplication à gauche L_g:g'\mapsto gg' par g\in G : pour tout vecteur tangent \mathbf u de G, L_{g*}\mathbf u est noté g\mathbf u.

A propos d’un problème d’optimisation « élémentaire »

Je reviens ici sur le problème présenté à la fin de ce billet.

Pour rappel, il s’agit de déterminer en quel point A du rivage doit accoster un bonhomme qui quitte un îlot I en canot afin de se rendre au plus vite dans sa maison M située sur le rivage (supposé rectiligne), sachant que sur l’eau, il canote à deux km/h et qu’il marche le long du rivage à quatre km/h.

Ce problème semble anodin. De fait, il n’est pas conceptuellement très sophistiqué et les mathématiques du niveau de la fin de l’enseignement secondaire suffisent pour trouver sa solution. Cependant, il est techniquement assez délicat à résoudre proprement car il revient à déterminer le minimum d’une fonction qui n’est pas dérivable en un point dont il s’avère, pour de nombreuses dispositions de I et M, qu’il est le seul en lequel elle atteint sa plus petite valeur.

De plus, mais je ne sais pas pourquoi, lorsqu’on l’aborde sans trop de précautions, on fait souvent des hypothèses qu’on tient à tort pour évidentes et qui ne sont d’ailleurs pas toujours pertinentes. C’est sans doute un peu ce que j’ai fait dans le billet cité ci-dessus, raison pour laquelle, entre autres, je présente dans celui-ci une résolution détaillée de la question.

Notons I' la projection orthogonale de I sur le rivage. Nous allons la prendre pour origine d’un repère dont « l’axe des y » est I'I orienté de manière telle que l’ordonnée de I soit un nombre strictement positif d et dont « l’axe des x » soit le rivage, orienté en sorte que l’abscisse de M soit un nombre positif ou nul m.

En fait, nous supposerons m>0 car il est clair que si M=I', le plus rapide est de rallier la maison en canotant en ligne droite de l’îlot vers celle-ci.

Avec ces notations, le temps mis par le bonhomme pour rentrer chez lui s’il accoste en le point X d’abscisse x est

t(x)=\frac{1}{v_1}\|IX\|+\frac{1}{v_2}\|XM\|=\frac{1}{v_1}\sqrt{x^2+d^2}+\frac{1}{v_2}|m-x|

v_1 est la vitesse à laquelle il canote et v_2 celle à laquelle il marche, valeurs que nous laisserons quelconques sauf dans les exemples illustrant ce qui suit et qui seront alors celles de l’énoncé.

La fonction t n’est pas dérivable en m aussi l’étudierons-nous séparément dans les intervalles ]-\infty,m[ et ]m,+\infty[ dans lesquels elle l’est.

a) \boxed{\mathrm{Dans}\  ]-\infty,m[}

Dans cet intervalle, t coïncide avec la fonction

f:x\mapsto \frac{1}{v_1}\sqrt{x^2+d^2}+\frac{1}{v_2}(m-x)

dont la dérivée est donnée par

f'(x)=\frac{1}{v_1}\frac{x}{\sqrt{x^2+d^2}}-\frac{1}{v_2}

Si celle-ci s’annule, c’est en un x vérifiant

x=\frac{v_1}{v_2}\sqrt{x^2+d^2}

qui est donc strictement positif. De plus, en élevant cette relation au carré, il vient

(v_2^2-v_1^2)x^2=v_1^2d^2

Par conséquent

  • Si v_1\geqslant v_2 alors f n’a pas de point stationnaire et est strictement décroissant (puisque f'(0)<0).
  • Si v_1 < v_2 alors f a un seul point stationnaire, en lequel il atteint son minimum absolu, à savoir

    a:=\frac{v_1}{\sqrt{v_2^2-v_1^2}}d

Donc, si a n’existe pas (v_1\geqslant v_2) ou existe mais est au moins égal à m, alors t est strictement décroissant dans ]-\infty,m[, sinon t atteint en a son minimum absolu dans ]-\infty,m[.

Or, un calcul facile montre que lorsque a existe, il est strictement plus petit que m si, et seulement si,

(1) \frac{v_1}{v_2}<\frac{m}{\sqrt{m^2+d^2}}

condition sous laquelle v_1<v_2. Elle implique donc que a existe.

En conclusion,

Si (1) est vrai, alors t admet en a son minimum absolu dans ]-\infty,m[ sinon, il est strictement décroissant dans cet intervalle.

b) \boxed{\mathrm{Dans}\  ]m,+\infty[}

Dans cet intervalle, t coïncide avec la fonction

f:x\mapsto \frac{1}{v_1}\sqrt{x^2+d^2}+\frac{1}{v_2}(x-m)

dont la dérivée, donnée par

f'(x)=\frac{1}{v_1}\frac{x}{\sqrt{x^2+d^2}}+\frac{1}{v_2}

est strictement positive. Ainsi,

La fonction t est strictement croissante dans l’intervalle ]m,+\infty[.

c) Pour conclure …

Les paragraphes a) et b) montrent que

Lorsque

\frac{v_1}{v_2}<\frac{m}{\sqrt{m^2+d^2}}

le bonhomme doit accoster en le point d’abscisse a et son temps de parcours minimum est donné par

f(a)=\frac{\sqrt{v_2^2-v_1^2}}{v_1v_2}d+\frac{1}{v_2}m

sinon il doit directement aller en M, avec le temps de parcours minimum \frac{1}{v_1}\sqrt{m^2+d^2}.

La figure suivante représente le graphe de t, limité aux abscisses positives, pour (d,m,v_1,v_2)=(2,5,2,4); (1) est alors vérifié,

min_1

et celle-ci pour (d,m,v_1,v_2)=(2,1,2,4); (1) est alors faux.

min_2

Dans chaque image, le point P est celui du graphe dont l’abscisse est donnée par la formule définissant a (qui ne dépend que des v_i et de d) mais dans la seconde, il ne correspond pas au minimum absolu de t car celui-ci est atteint en m (où t n’est pas dérivable).

Le résultat précédent a une interprétation géométrique simple (qui rejoint la conclusion du billet cité au début de cet article, en la complétant).

Si v_1 \geqslant v_2, alors A=M. Autrement, v_1/v_2 est le cosinus d’un angle \theta\in[0,\pi/2[. La tangente de cet angle est la pente d’une droite passant par I'. Notons A_0 la projection orthogonale sur le rivage de son intersection avec la parallèle à celui-ci menée par I. Alors si M est dans le segment [I',A_0], A=M, sinon, A=A_0.

Ceci est corroboré par les exemples ci-dessus dans lesquels \theta=\pi/3.

😉

La règle des multiplicateurs de Lagrange et les lois de l’optique géométrique

Je consigne ici une leçon que je donne régulièrement dans un cours d’introduction à la géométrie différentielle. Elle intrigue les étudiants qui, le plus souvent, l’aime beaucoup.

Il s’agit de retrouver les lois de Snell-Descartes à partir du principe de Fermat selon lequel le chemin suivi par la lumière rend stationnaire le temps de parcours. Dans un milieu homogène, sa vitesse est constante et elle suit donc des segments de droites.

La question est de savoir comment est modifiée sa trajectoire lorsqu’elle traverse la surface \Sigma(*) séparant deux milieux homogènes dans lesquels elle circule à des vitesses différentes (lois de la réfraction) ou lorsqu’elle se réfléchit en un point de \Sigma (lois de la réflexion).

Dans le premier cas, un rayon lumineux issu d’une source ponctuelle s placée dans le premier milieu traverse \Sigma en a et poursuit sa trajectoire jusqu’en un point cible c du second.

Dans le second, a est le point en lequel le rayon se réfléchit vers la cible et celle-ci est dans le même milieu que la source.

Dans les deux cas, le temps mis pour joindre s et c via un point x\in\Sigma est

t(x)=\frac{1}{v_1}\|sx\|+\frac{1}{v_2}\|xc\|

v_1 est la vitesse de la lumière avant l’incidence et v_2 après (on a donc v_1=v_2 en cas de réflexion).

Par hypothèse, t|_\Sigma est stationnaire en a. Par conséquent, d’après la règle des multiplicateurs de Lagrange, le gradient de t en a,

\mbox{grad}_at=\frac{1}{v_1}\frac{\overrightarrow{sa}}{\|sa\|}-\frac{1}{v_2}\frac{\overrightarrow{ac}}{\|ac\|}

est normal à \Sigma en a. Nous en déduisons une première loi :

Le rayon incident, sa, le rayon réfracté (ou réfléchi), ac, et la normale au point d’incidence à la surface de séparation sont dans un même plan.

Ce plan coupe la surface \Sigma selon une courbe et le plan tangent de \Sigma en a selon une droite, tangente à la courbe, comme illustré sur le dessin suivant.

descartes

En exprimant que le produit scalaire de \mbox{grad}_at avec un vecteur directeur unitaire de cette droite est nul, on voit facilement, avec les notations de la figure, que

\sin r=\frac{v_2}{v_1}\sin i

C’est la seconde loi de Snell-Descartes.

Dans le cas de la réflexion, v_2=v_1; elle exprime donc le fait que l’angle de réflexion est égal à l’angle d’incidence.

Pour la réfraction, v_1\neq v_2 et donc i et r sont différents. Il peut même arriver que r soit égal à \pi/2. On parle alors de réflexion totale ou d’incidence rasante. L’angle d’incidence correspondant est alors donné par

\sin i=\frac{v_1}{v_2}

Le phénomène ne se présente donc que si v_1<v_2.

D’habitude, j’achève la leçon par une application amusante du phénomène de réflexion totale.

Il s’agit de déterminer en quel point A du rivage doit accoster un bonhomme qui quitte l’îlot I en canot afin de se rendre au plus vite dans sa maison M située sur le rivage, sachant que sur l’eau, il canote à deux km/h et qu’il marche le long du rivage à quatre km/h.

Les données du problèmes sont représentées sur ce dessin, où I' est la projection orthogonale de I sur le rivage, supposé rectiligne.

ile

En fait, comme il s’agit de minimiser le temps de parcours, le bonhomme doit suivre le trajet d’un rayon lumineux émis depuis I et formant l’angle d’incidence correspondant à l’incidence rasante. Un tel rayon existe car la vitesse v_1 du bonhomme dans l’eau est plus petite que sa vitesse v_2 sur terre. D’après ce qui précède, l’angle \alpha est donné par

\sin\alpha=\frac{v_1}{v_2}

de sorte que

\|I'A\|=\|II'\|\tan\alpha=\|II'\|\frac{v_1}{\sqrt{v_2^2-v_1^2}}

et le problème est résolu.

Notez que si le bonhomme se déplaçait plus vite sur l’eau que sur terre (par exemple en utilisant un Jet Ski😉 ) alors le trajet le plus rapide consisterait à aller directement en ligne droite de l’îlot à sa maison.

P.S. En fait, la solution du petit problème donnée ci-dessus n’est correcte que si M est assez éloigné de I', c’est-à-dire si le point A est entre I' et M. J’aurais dû le mentionner d’emblée. Je vais bientôt revenir sur cette observation dans un prochain billet. P.L. 30/04/2016
__________
(*) Nous supposons que \Sigma est une variété plongée (dans \mathbf R^3).