Racine d’un nombre complexe et continuité

Lorsque je dois rapidement convaincre mes étudiants du fait qu’il n’existe pas de fonction racine n-ième continue sur \mathbb C\setminus\{0\}, je procède par l’absurde comme ceci. Supposons disposer d’une fonction continue f:\mathbb C\setminus\{0\}\to\mathbb C\setminus\{0\} vérifiant

\forall z\in\mathbb C\setminus\{0\}:\quad f(z)^n=z

Notons S^1 le cercle trigonométrique, ensemble des complexes de module 1, et posons A=f(S^1), \xi=\exp(2i\pi/n).

Les ensembles(*) \xi^kA, k=0,1,\ldots,n-1, partitionnent S^1. Or ils sont compacts car f est continu, donc fermés, car le cercle est séparé. Ils disconnectent dès lors le cercle. L’existence de f est donc contradictoire. ;-)

__________
(*) Pour rappel, si u est une racine n-ième d’un nombre complexe, alors les racines n-ièmes de celui-ci sont les nombres

u,\xi u,...,\xi^{n-1}u

L’orientation canonique des espaces vectoriels complexes

Alors que je faisais une remarque à propos de la notion d’orientation d’un espace vectoriel sur le forum M@th en Ligne, un ami me faisais observer que celle-ci concerne les espaces vectoriels réels, ce que je n’avais pas précisé dans mon commentaire.

Ceci m’a aussitôt mis la puce à l’oreille : les espaces vectoriels sur \mathbb C ne seraient-ils pas naturellement orientés? Plus précisément, un espace vectoriel complexe E est aussi un espace vectoriel réel. Les opérations vectorielles de cet espace, que je noterai E_r, sont les mêmes que celles de E à ceci près que l’on restreint la multiplication par les scalaires aux nombres réels. Je me suis donc demandé si la présence d’une structure complexe sur E_r ne le munissait pas automatiquement d’une orientation.

La réponse est positive et la preuve en est aisée comme on va le voir. Elle repose sur une belle formule qu’il est utile de connaître(*).

La clé réside dans le fait que si \mathbf{b}=(e_1,\ldots,e_n) est une base de E, alors \mathbf{b}_r=(e_1,\ldots,e_n,ie_1,\ldots,ie_n) est une base de E_r, ce qu’il est immédiat de vérifier. Cela étant, si P+iQ\  (P,Q\in\mathrm{gl}(n,\mathbb R)), est la matrice de passage entre des bases \mathbf{b} et \mathbf{b}' de E, alors celle permettant de passer de \mathbf{b}_r à \mathbf{b}'_r est

(1) \begin{pmatrix}P&-Q\\Q&P\end{pmatrix}

Or il se fait que

\det\begin{pmatrix}P&-Q\\Q&P\end{pmatrix}=|\det(P+iQ)|^2

En particulier, le déterminant de la matrice (1) est positif. Les bases \mathbf{b}_r appartiennent donc à la même orientation de E_r qui se voit ainsi naturellement orienté grâce à la structure complexe provenant de E.

P.S. (Ce qui suit résulte des commentaires faits sur ce billet, dont je remercie les auteurs.) Pour orienter E_r, nous pourrions utiliser -i plutôt que i, c’est-à-dire considérer les bases

\overline{\mathbf b}_r=(e_1,\ldots,e_n,-ie_1,\ldots,-ie_n)

à la place des bases \mathbf{b}_r. Lorsque n est impair, les deux orientations obtenues sont opposées. Par contre, lorsque n est pair, elles coïncident. En conséquence, on peut véritablement parler d’orientation canonique de E_r lorsque E est de dimension paire tandis que, en dimension impaire, ce que j’appelle orientation naturelle plus haut est en réalité tributaire du choix de la racine carrée de -1 qu’on convient de désigner par i. P.L. 31/05/2012
__________
(*) Avant qu’un ami ne m’en fasse la remarque, je précise que les espaces vectoriels considérés ici sont de dimension finie. ;-)

En guise d’exercice, un lemme sur les paraboles

Considérons deux fonctions

f:x\mapsto px^2+qx+r \mbox{   et   } g:x\mapsto ux^2+vx+w

à coefficients réels, avec pu\neq 0. On se pose la question de savoir quand f(\mathbb N)=g(\mathbb N).
Voici la réponse dont j’ai eu besoin un jour et que je vous invite à prouver.

On a f(\mathbb N)=g(\mathbb N) si, et seulement si, soit f=g soit p=u et il existe des entiers positifs ou nuls k,l tels que k+l>0 et

f(x)=ph(x-k), g(x)=ph(x-l)

pour tout x, où h est de la forme

x\mapsto x^2+\alpha \mbox{   ou   } x\mapsto (x+\frac 1 2)^2+\alpha

pour un certain réel \alpha

Perles …

Chaque année, j’organise un examen écrit fait de questions de théorie et d’exercices pour une classe comptant de l’ordre de 250 étudiants de première année d’université, dans une filière assez orientée vers les mathématiques. Il n’est pas rare de découvrir des erreurs savoureuses sur certaines copies, erreurs qui ont au moins le mérite de divertir mes collègues lorsque je les leur rapporte autour d’une bonne tasse de café. Rien d’original à cela, bien entendu. Cependant, une année — que je ne préciserai pas, on comprendra pourquoi — j’ai eu la surprise de relever les mêmes erreurs sur un nombre anormalement élevé de copies, copies dont on ne pouvait raisonnablement soupçonner les auteurs d’avoir triché, ce qui aurait pourtant pu expliquer l’anomalie. Non, une étrange et fascinante impression m’encombrait l’esprit après avoir corrigé la dernière copie, celle que ces erreurs avaient leurs racines dans les dernières années du secondaire, qu’elles n’étaient pas tout à fait dues au hasard mais plutôt à la lente (?) érosion de l’enseignement de base des mathématiques. J’en ai fait un minuscule catalogue que je vous présente dans ce bref billet d’humeur…

Simplifions, simplifions

La simplification miraculeuse suivante a été trouvée dans plus d’une dizaine de copies:

\frac{a}{\not{2}\ b}=\frac{\not{2}\ c}{d}

Pour deux inconnues, il faut deux équations

Egalement très courante, l’erreur suivante prend la forme

Si \frac a b =\frac c d alors a=c et b=d

C’est très commode quand a,b,c,d s’expriment à l’aide de deux inconnues car cela donne alors deux équations. Au passage, les élèves ignorent totalement la notion d’homogénéité, ce qui les prévient de s’étonner de trouver des valeurs pour chaque inconnue alors même que par essence, c’est impossible. L’exemple type est celui-ci

\frac{a^2-b^2}{a^2+b^2}=\frac{2}{4}

qui permet seulement de déterminer le rapport a/b mais que l’on transforme allègrement en

a^2-b^2=2,\quad a^2+b^2=4

Un grand classique

Dans la foulée, après avoir déterminé a^2,b^2 grâce aux deux équations inespérées, on poursuit avec des bi-implications (ils rafolent de ces symboles dont ils ne comprennent généralement pas le sens…) du genre

a^2=3 \quad \Longleftrightarrow \quad a=\sqrt 3

Sur les traces du logarithme

Assez stupéfiante voici une nouveauté impressionnante, également repérée de nombreuses fois!

\sqrt{a^2+b^2}\sqrt{a^2+b^2}=2\sqrt{a^2+b^2}

Le signe égal a transformé un produit en une somme! Quand ce produit se trouve au dénominateur, cela permet d’enchaîner avec la première faute afin de se débarrasser d’un 2 gênant. Tout cela est, somme toute, assez cohérent, autre aspect frappant de ces fautes.

;-)

Question ouverte à propos des matrices à deux lignes et trois colonnes

Comme je le signalais dans ce billet, le théorème de Rouché-Fontené donne des équations cartésiennes locales pour la variété M(p,q,r) des matrices réelles de rang r ayant p lignes et q colonnes.

Cela fournit par exemple trois jeux d’équations cartésiennes permettant de décrire M(2,3,1). En notant

M=\begin{pmatrix}x &y &z\\u& v& w\end{pmatrix}

un élément quelconque de l’ensemble M(2,3) des matrices réelles ayant deux lignes et trois colonnes, et \Omega_i l’ouvert de cet ensemble formé des M dont la i-ème colonne est non nulle, le premier a pour domaine de définition \Omega_1 et pour équations(*)

F_1=(f_2,f_3)=(zu-xw,xv-yu)

Les deux autres jeux sont définis dans \Omega_2 et \Omega_3 et sont donnés par F_2=(f_3,f_1) et F_3=(f_1,f_2) respectivement, où

f_1=yw-zv

Ces équations sont locales en ce sens qu’aucune ne décrit M(2,3,1) en entier, contrairement à, par exemple, x^2+y^2+z^2-1=0 qui décrit globalement la sphère de rayon 1 centrée à l’origine de \mathbb R^3.

J’ai l’impression que M(2,3,1) n’admet pas d’équations cartésiennes globales, autrement dit qu’il n’existe pas de fonction F de classe C^\infty d’un ouvert \Omega de M(2,3) à valeurs dans \mathbb R^2 qui soit partout de rang 2 et dont M(2,3,1) soit l’ensemble des zéros, mais je ne sais pas le prouver!

J’aimerais bien que cela soit vrai, cependant, car cela fournirait un bel exemple de variété plongée justifiant, de façon non triviale, l’utilisation d’équations cartésiennes locales.

La question est donc ouverte et je lirai avec plaisir toute remarque, suggestion voire — ce serait l’idéal — démonstration que vous pourriez proposer. ;-)

P.S. On peut naturellement formuler une conjecture analogue à propos de M(p,q,r) mais j’aimerais déjà comprendre ce qu’il se passe dans le cas de M(2,1,3), en apparence si anodin.

__________
(*) Cela signifie que F_1 est partout de rang 2 dans \Omega_1 et que ses zéros sont les points de \Omega_1\cap M(2,3,1).

La droite projective réelle — Equations différentielles ou les avatars d’un champ de vecteurs

En géométrie différentielle, la contrepartie de la notion de système d’équations différentielles autonomes :

(1) \left\{\begin{array}{ccc}\dot{x}^1&=&f^1(x^1,\ldots,x^n)\\ &\vdots &\\ \dot{x}^n&=&f^n(x^1,\ldots,x^n)\end{array}\right.

est celle de champ de vecteurs : si les seconds membres du système (1) sont les composantes de l’expression locale d’un champ de vecteurs dans une carte d’une variété, alors une solution de (1) est l’expression locale dans cette carte d’une courbe intégrale de ce champ (c’est-à-dire une courbe le long de laquelle le champ coïncide avec son vecteur tangent).

Les équations (1) ne constituent qu’une description locale du champ de vecteurs et les propriétés de leurs solutions dépendent en partie de la carte choisie; elle peuvent être assez différentes d’une carte à l’autre et ne pas refléter pleinement celles des courbes intégrales maximales du champ. Par exemple sur une variété compacte, les courbes intégrales maximales des champs de vecteurs sont définies sur \mathbb R tout entier ce qui n’est pas nécessairement le cas des solutions maximales des systèmes d’équations qui les représentent dans les cartes de la variété.

Je vais illustrer ce phénomène à propos des équations de Riccati à coefficients constants

\dot x= ax^2+bx+c \quad (a,b,c\in\mathbb R)

en montrant qu’elles sont les expressions locales d’une famille de champs de vecteurs de la droite projective réelle. Dans la foulée, nous obtiendrons ainsi aisément les solutions de ces équations. Nous utiliserons les notations introduites dans ce billet.

Les champs H^* de la droite projective réelle

Le groupe SL(2,\mathbb R) des matrices carrées réelles de dimension 2 et de déterminant 1 opère à gauche de façon naturelle sur \mathbb R^2 privé de l’origine par (A,\xi)\mapsto A\xi. Cette action se projette via \pi en une action différentiable sur la droite projective réelle. Nous la noterons (A,\mathcal D)\mapsto A\cdot\mathcal D.

Considérons un élément H de l’algèbre de Lie sl(2,\mathbb R) du groupe.

Le champ fondamental qui lui est associé par la première action est le champ de vecteurs défini par

\overline H_\mathcal \xi=\frac{d}{dt}\exp(tH)\cdot \xi_{|t=0}

et son flot est l’application

(t,\xi)\in\mathbb R\times \mathbb R^2\setminus\{0\}\mapsto \exp(tH)\xi\in\mathbb R^2\setminus\{0\}

Il est \pi-lié au champ fondamental associé à H par la seconde action dont le flot est dès lors

(t,\mathcal D)\in\mathbb R\times P^1\mathbb R\mapsto \exp(tH)\cdot\mathcal D\in P^1\mathbb R

Nous noterons H^* ce champ de vecteurs.

Expression locale de H^* dans les cartes canoniques

Commençons par exprimer localement l’action d’une matrice

A=\begin{pmatrix}a&b\\c&d\end{pmatrix}\in SL(2,\mathbb R)

dans la carte (U_1,\varphi_1). Si la droite \mathcal D\in U_1 admet le vecteur directeur \xi=(\xi_1,\xi_2), alors

(a\xi_1+b\xi_2,c\xi_1+d\xi_2)

est un vecteur directeur de A\cdot \mathcal D. Pour autant que cette dernière appartienne aussi à U_1(*), il vient ainsi

\varphi_1(A\cdot\mathcal D)=\frac{c\xi_1+d\xi_2}{a\xi_1+b\xi_2}

L’expression locale de l’action de A dans la carte (U_1,\varphi_1) est donc l’application homographique(**)

h_A: x\mapsto \frac{c+dx}{a+bx}

Soit à présent H\in sl(2,\mathbb R). Prenons pour A la matrice \exp(tH). L’expression locale de H^* dans la carte (U_1,\varphi_1) n’a qu’une composante. C’est la fonction

f_1: x\mapsto \frac{d}{dt}h_A(x)_{|t=0}

Compte tenu des propriétés de l’application exponentielle, elle est facile à calculer. Pour(***)

H=\begin{pmatrix}p&q\\r&-p\end{pmatrix}

on trouve

f_1(x)=-qx^2-2px+r

Semblablement, l’expression locale de H^* dans la seconde carte canonique a pour composante(****)

f_2(x)=-rx^2+2px+q

En choisissant convenablement H, on peut donner des valeurs arbitraires aux coefficients de f_1. Idem pour f_2. Ainsi,

Les équations différentielles représentants les champs de vecteurs H^* dans les cartes canoniques sont les équations de Riccati à coefficients constants.

Solutions des équations de Riccati à coefficients constants

Les expressions locales des courbes intégrales de H^* décrivent les solutions des équations qui lui sont associées dans les deux cartes. Par exemple, la solution de l’équation \dot x = -qx^2-2px+r passant par \varphi_1(\mathcal D) en t=s est l’application

t\mapsto \varphi_1(\exp((t-s)H)\cdot\mathcal D)

restreinte à la composante connexe de s dans l’ensemble des t tels que \exp((t-s)H)\cdot\mathcal D\in U_1. Le fait que ce ne soit éventuellement pas \mathbb R tout entier est donc lié à la possibilité pour les courbes intégrales maximales de H passant par les points de U_1 de sortir de celui-ci et non au fait que ces courbes ne seraient pas partout définies . Pour résoudre effectivement l’équation considérée, il suffit donc de calculer l’exponentielle de la matrice H, ce qui est trivial, et de déterminer la composante connexe en question.

Considérons par exemple l’équation

(2) \dot x= x^2

Elle est l’expression locale dans la première carte canonique du champ fondamental de la matrice

H=\begin{pmatrix}0&-1\\ 0&0\end{pmatrix}

On a

\exp((t-s)H)=\begin{pmatrix}1&s-t\\ 0&1\end{pmatrix}

Donc, en notant x la coordonnée locale de \mathcal D, en dehors du cas trivial où x=0, la solution maximale de (2) passant par x en t=s est la fonction

t\mapsto \frac{x}{1+(s-t)x}

restreinte à celui des intervalles ]-\infty, s+1/x[, ]s+1/x,+\infty[ qui contient s.

L’équation différentielle associée à H^* dans la seconde carte canonique est \dot x =-1. Par contraste, ses solutions sont définies sur \mathbb R tout entier. (Au passage, on notera que nous sommes en présence d’un bel exemple de champ de vecteurs redressé, i.e. auquel on a donné une expression locale constante dans une carte appropriée.)

On voit bien que les singularités des solutions de (2) sont des artéfacts créés par le passage en coordonnées locales, chose qu’on ne soupçonne pas lorsqu’on rencontre ce genre d’équations en première année à l’université, faute de disposer du langage de la géométrie différentielle.

Un exemple amusant pour conclure

Pour rappel, nous avons construit dans le billet mentionné plus haut un difféomorphisme canonique \tau de P^1\mathbb R sur le cercle trigonométrique S^1. Par ailleurs, ce dernier possède un champ de vecteurs distingué \Theta, celui qui au point z=x+iy associe le vecteur tangent iz=-y+ix.
Je vous propose de montrer que

\tau_*H^*=\Theta\circ\tau

H est la matrice

\frac 1 2 \begin{pmatrix}0&-1\\1&0\end{pmatrix}

__________
(*) Cela signifie que a\xi_1+b\xi_2\neq 0.
(**) En exprimant qu’on a affaire à une action, on retrouve ainsi une jolie propriété des fonctions homographiques :

h_A\circ h_B=h_{AB}

(***) L’algèbre sl(2,\mathbb R) est l’espace des matrices réelles carrées de dimension 2 dont la trace est nulle (muni du commutateur en guise de crochet de Lie).
(****) On peut déduire une expression de l’autre en utilisant la fonction de transition entre les deux cartes. En l’occurrence, on observe que

f_2(x)=-x^2f_1(\frac 1 x)

La droite projective réelle et le cercle trigonométrique II

L’application \tau décrite dans ce billet n’est pas seulement une bijection entre la droite projective réelle(*) et le cercle trigonométrique. Il s’avère en effet que c’est un difféomorphisme pour les structures naturelles de variété différentielle dont sont dotés ces deux ensembles.

Ce fait est bien connu mais je trouve instructif de le vérifier. Je crois en effet qu’il est intéressant pour ceux qui font leur premiers pas en géométrie différentielle de voir sur ce joli exemple comment fonctionnent les définitions de base de cette discipline dont le premier abord est, je le constate chaque année, assez difficile.

La droite projective réelle

L’ensemble P^1\mathbb R possède un atlas formé de deux cartes (U_i,\varphi_i), i=1,2. Le domaine U_i est l’ensemble des droites vectorielles de \mathbb R^2 qui ne sont pas perpendiculaires à \overrightarrow e_i. Autrement dit, ce sont les droites dont la i-ème composante des vecteurs directeurs n’est pas nulle :

U_i=\left\{\mathbb R\xi\ |\ \xi\in\mathbb R^2, \ \xi_i\neq 0\right\}

Les composantes d’un vecteur directeur \xi=(\xi_1,\xi_2) d’une droite \mathcal D en sont des coordonnées projectives ou homogènes. Les applications \varphi_i lui associent les coordonnées non homogènes correspondantes. Plus précisément,

\varphi_1(\mathcal D)=\frac{\xi_2}{\xi_1} \quad \& \quad \varphi_2(\mathcal D)=\frac{\xi_1}{\xi_2}

Elles ont toutes les deux \mathbb R pour image.

L’interprétation géométrique de ces applications est très simple. Par exemple, comme illustré sur le dessin suivant, \varphi_2(\mathcal D) est l’abscisse de l’intersection de \mathcal D avec la droite d’équation \xi_2=1.

coordonnees

Les deux cartes construites sont compatibles et forment donc bien un altlas (leurs domaines recouvrent la droite projective). En effet,

\varphi_2\circ\varphi_1^{-1}=\varphi_1\circ\varphi_2^{-1}: x\in\mathbb R\setminus\{0\}\mapsto \frac 1 x\in\mathbb R\setminus\{0\}

C’est cet atlas que l’on choisit pour faire de la droite projective réelle une variété différentielle. La topologie dont elle est alors munie n’est pas bien difficile à identifier(**): l’application

\pi:\xi\in\mathbb R^2\setminus\{0\}\mapsto \mathbb R\xi\in P^1\mathbb R

qui associe à \xi la droite vectorielle dont il est un vecteur directeur est surjective. Elle permet d’identifier P^1\mathbb R à un quotient de \mathbb R^2\setminus\{0\}. La topologie de la variété P^1\mathbb R est alors la topologie quotient associée, c’est-à-dire la plus fine qui rende cette application continue. En particulier, P^1\mathbb R est compact et connexe car c’est l’image par \pi du cercle trigonométrique.

L’application \tau est un homéomorphisme

A ce stade, c’est facile à voir. D’une part, par définition de \tau, le diagramme suivant est commutatif :

Par conséquent \tau est continu, en vertu des propriétés de la topologie quotient. Mais, comme P^1\mathbb R est compact et S^1 est séparé, il en résulte que \tau est un homéomorphisme.

L’application \tau est un difféomorphisme

Pour le vérifier, nous allons constater que ses expressions locales dans les cartes canoniques (U_i,\varphi_i) et des cartes bien choisies du cercle trigonométrique sont des applications de classe C^\infty dont les différentielles sont non singulières. La démarche est la même pour les deux cartes canoniques; je la détaille pour la première.

L’image \tau(U_1) est le complémentaire V de i^2=-1 dans le cercle trigonométrique, ce qui nous incite à prendre pour carte de ce dernier celle donnée par la projection stéréographique \psi de pôle -1, dont le domaine est précisément V. Elle associe à z=x+iy l’ordonnée de l’intersection avec l’axe vertical de la droite qui joint z à -1 :

projection

Elle est donnée par

\psi(x+iy)=\frac{y}{x+1}

Nous devons déterminer

\psi\circ\tau\circ\varphi_1^{-1}:\mathbb R\to \mathbb R

Au nombre réel x, \varphi_1^{-1} associe la droite de vecteur directeur (1,x)\equiv 1+ix. Pour lui appliquer \tau, nous devons le normer puis élever le résultat au carré, ce qui donne

\left(\frac{1+ix}{\sqrt{1+x^2}}\right)^2=\frac{1}{1+x^2}(1-x^2+2ix)

Appliquant ensuite \psi, nous obtenons ainsi quelque chose d’extrêmement simple : l’expression locale de \tau dans les cartes (U_1,\varphi_1) et (V,\psi) est l’identité! Nous trouverions la même chose avec la seconde carte canonique et la projection stéréographique de pôle 1.

La cause est donc entendue. ;-)

__________
(*) C’est l’ensemble des droites vectorielles de \mathbb R^2. Plus généralement, l’espace projectif réel de dimension m est l’ensemble des droites vectorielles de \mathbb R^{m+1}. On le note P^m\mathbb R.
(**) Mais je ne le ferai pas ici.

Droite projective réelle et cercle trigonométrique I — Equations non linéaires de droites

On a sans doute chacun plus ou moins l’habitude d’associer droites et équations du premier degré. Dans le cas du plan complexe, regardé comme plan affine euclidien réel, les droites possèdent d’autres équations, de nature bien différente. Bien entendu, il est toujours loisible de manipuler des équations données pour les remplacer par des équations équivalentes. Elles risquent de ne pas être très naturelles à cause de l’arbitraire des transformations mais celles que je vais montrer ont une origine très simple et très jolie : l’identification de la droite projective réelle avec un cercle laquelle repose à son tour sur le fait que tout nombre complexe non nul possède exactement deux racines carrées.

On regarde l’ensemble \mathbb C des nombres complexes comme un plan affine euclidien rapporté au repère dont l’origine est 0 et dont la base, orthonormée et positive, est (1,i).

Dans ce plan, le cercle de rayon 1 centré à l’origine n’est autre que le fameux cercle trigonométrique

S^1=\{\cos t+i\sin t|t\in \mathbb R\}

formé des nombres complexes de module égal à 1.

Toute droite \mathcal D passant par l’origine le coupe en deux points diamétralement opposés \pm z que l’on peut interpréter comme ses deux vecteurs directeurs unitaires. L’application

\tau:\mathcal D\in P^1\mathbb R \mapsto z^2\in S^1

est une bijection entre l’ensemble des droites de \mathbb C passant par l’origine — la droite projective réelle — et le cercle trigonométrique. Sa réciproque associe à un point de ce dernier la droite passant par ses deux racines carrées(*). A travers cette correspondance, on peut donc voir le cercle trigonométrique comme l’ensemble des directions du plan euclidien \mathbb C.

Une droite quelconque de \mathbb C est déterminée par sa direction et un de ses points. Notons \mathcal D_{a,u} celle qui passe par le point a et qui est parallèle à la droite passant pas les racines carrées du nombre complexe u de module 1. Par définition, z\in\mathbb C appartient à cette droite si, et seulement si,

(1) (z-a)^2=u|z-a|^2

En effet, en dehors du cas trivial où z=a, cette condition exprime que z-a est parallèle à la droite.

La relation (1) est donc une équation de \mathcal D_{a,u}. Comme annoncé, elle n’est pas du premier degré en les coordonnées mais sa signification géométrique est d’une simplicité enfantine.

La condition de parallélisme des droites \mathcal D_{a,u} et \mathcal D_{b,v} est u=v; celle de perpendicularité est u+v=0. Vous pourriez être tentés de trouver, plus généralement, une formule simple permettant de calculer l’angle de ces droites au moyen de u,v. Aussi ne vais-je pas le faire ici. ;-)

__________
(*) L’application \tau n’est pas seulement une bijection; elle a d’excellentes propriétés analytiques dont je dirai un mot dans un billet à venir.

Polynômes de degré impairs et zéros réels : une remarque en passant

On sait que tout polynôme à coefficients réels de degré impair possède au moins un zéro réel.
En préparant des questions d’interrogation, un collaborateur et moi en sommes venus à discuter de la manière de vérifier ce fait.

Lui, il compte les zéros complexes : allant par paires de nombres complexes conjugués, leur nombre est nécessairement pair et le théorème de d’Alembert permet de conclure.

Pour ma part, j’utilise le théorème des valeurs intermédiaires : le degré du polynôme étant impair, ses limites en \pm\infty sont \pm\infty; il prend donc des valeurs de signes opposés et s’annule par conséquent quelque part.

La première méthode n’est plus guère accessible aux élèves de l’enseignement secondaire francophone de Belgique car l’étude des nombres complexes n’est au programme que de quelques classes, et encore, en option. Par contre la seconde y est tout à fait exploitable : dans la lente érosion de l’enseignement, l’analyse résiste mieux que l’algèbre et la géométrie.

La première méthode montre directement quelque chose de plus précis : le nombre des zéros réels d’un polynôme à coefficients réels est impair (donc n’est pas nul). La seconde s’adapte sans trop d’efforts pour aboutir à la même conclusion mais c’est moins élégant et direct qu’avec la première.

;-)

Espaces affines et polynômes

Dans un article consacré à certaines représentations affines de l’algèbre de Lie des champs de vecteurs d’une variété(*), Sarah Hansoul et moi avons été amenés à utiliser la notion de polynômes sur un espace affine dans le cas d’espaces de dimension infinie.

Pour introduire cette notion, nous ne pouvions réellement utiliser des bases car nous devions contrôler, dans les applications, le caractère différentiable des objets manipulés et il ne nous semblait pas évident que cela puisse se faire avec des changements de bases de dimension infinies.

Nous nous sommes inspirés de la manière dont Henri Cartan introduit les polynômes sur des espaces vectoriels dans son ouvrage Calcul Différentiel(**). Chose surprenante — du moins pour moi qui n’ai guère d’expérience en algèbre — les espaces de polynômes sur un espace affine ne sont pas gradués mais seulement filtrés par le degré. C’est une des raisons pour lesquelles j’écris ce petit billet.

Les considérations qui suivent s’appliquent à des espaces affines et des espaces vectoriels sur un corps de caractéristique nulle, disons \mathbb K.

Applications multilinéaires symétriques

Notons \mathscr{S}_k(\mathbf{A},\mathbf{B}) l’espace des applications k-linéaires symétriques d’un espace vectoriel \mathbf A à valeurs dans un espace vectoriel \mathbf B. A tout p\in\mathscr{S}_k(\mathbf{A},\mathbf{B}), on associe une application, notée \hat p:\mathbf A \to \mathbf B, en posant

\forall u\in\mathbf A,\quad \hat p(u)=p(u,\ldots,u)

Le lemme suivant est la clé de ce qui suit.

L’application p\mapsto \hat p est injective.

Nous allons le vérifier par récurrence sur k. On en trouvera une autre preuve, plus classique, dans le livre de Henri Cartan cité plus haut. Je me contente d’expliquer la phase d’induction, le cas de base étant évident. Supposons donc l’application injective pour les valeurs de k moindres que l et supposons que p\in\mathscr{S}_l(\mathbf{A},\mathbf{B}) vérifie

\forall u\in\mathbf A, \quad p(u,\ldots,u)=0

Alors, en utilisant la multilinéarité de p et le fait qu’il soit symétrique, il vient (c’est la formule du binôme de Newton!)

p(u+tv)=\sum_{i=0}^l{ l \choose i}t^ip(u,\ldots,u,\underbrace{v,\ldots, v}_i)=0

pour tous u,v\in \mathbf A et tout t\in\mathbb K. En particularisant cette relation pour l+1 valeurs distinctes de t, on en déduit que les coefficients des puissances de t y sont nuls. En particulier, p(u,\ldots,u,v)=0 pour tous u,v\in \mathbf A. Par suite, vu l’hypothèse de récurrence, p=0 et le lemme est prouvé.

Polynômes sur un espace affine

Soit un espace affine \mathscr A modelé sur \mathbf A. Nous dirons qu’une application p:\mathscr A\to\mathbf B est un polynôme de degré inférieur ou égal à k (à valeurs dans \mathbf B) s’il existe un point a_0 de \mathscr A et des p_i\in\mathscr{S}_i(\mathbf A,\mathbf B), i=0,\ldots,k, tels que

(1) \forall u\in\mathbf A,\quad p(a_0+u)=\sum_{i=0}^k\frac{1}{i!}\hat p_i(u)

Les applications p_i ne dépendent alors que de p et du point a_0(***). Nous dirons que ce sont les composantes de p relatives à a_0.

Le fait, pour p, d’être un polynôme sur \mathscr A est indépendant du point a_0 utilisé pour le formuler. En effet, un calcul simple permet de voir que si a_0'\in\mathscr A, alors, p vérifiant (1), il vient

\forall u\in\mathbf A,\quad p(a_0'+u)=\sum_{i=0}^k\frac{1}{i!}\hat q_i(u)

(2) q_j(u_1,\ldots,u_j)=\sum\limits_{i\geqslant j}\frac{1}{(i-j)!}p_i(a_0'-a_0,\ldots,a_0'-a_0,u_1,\ldots,u_j)

La suite des espaces vectoriels \mathscr P^k(\mathscr A,\mathbf B) des polynômes de degré au plus k de \mathscr A dans \mathbf B est donc une filtration croissante. Sa limite \mathscr P(\mathscr A,\mathbf B) est l’espace des polynômes sur \mathscr A à valeurs dans \mathbf B.

Il résulte de la formule (2) que p_k=q_k : la composante dominante de p relative à un point est la même pour tous les points de \mathscr A. Nous la noterons \sigma_k(p). La filtration de \mathscr P(\mathscr A,\mathbf B) nous donne ainsi des courtes suites exactes d’espaces vectoriels

0\to \mathscr P^{k-1}(\mathscr A,\mathbf B)\to \mathscr P^k(\mathscr A,\mathbf B)\stackrel{\sigma_k}{\to}\mathscr S_k(\mathbf A,\mathbf B)\to 0

Par définition de \mathscr P(\mathscr A,\mathbf B), chaque point de \mathscr A fournit une scission de chacune d’elle mais ces suites ne sont pas canoniquement scindées : \mathscr P(\mathscr A,\mathbf B) ne coïncide pas avec son espace gradué associé

\mathscr S(\mathbf A,\mathbf B)=\bigoplus_{k\in\mathbb N}\mathscr S_k(\mathbf A,\mathbf B)

qui, selon la définition proposée dans le livre de Henri Cartan, est l’espace des applications polynomiales de \mathbf A dans \mathbf B.

__________
(*) Affine Representations of Lie Algebras and Geometric Interpretation in the Case of Smooth Manifolds, IMRN 2005, 16, 981—1003.
(**) Collection Méthodes, Hermann, Paris, 1967.
(***) En considérant k+1 valeurs t_j\in \mathbb K, on obtient un système d’équations

\sum_{i=0}^k\frac{1}{i!}t_j^i\hat p_i(u)=p(a_0+t_ju)

qui permet de calculer les \hat p_i(u) en terme des p(a_0+t_ju) par la méthode du pivot; on applique le lemme pour conclure.

Suivre

Get every new post delivered to your Inbox.