Une belle variété différentielle

Dans ce billet, je vais présenter quelques propriétés de l’ensemble

V_n=\{x\in\mathbf R^n|x_1\cdots x_n=1\quad \&\quad x_1,\ldots, x_n>0\}

n est un entier au moins égal à 2.

Variété différentielle
Cet ensemble est une variété de classe C^\infty plongée dans \mathbf R^n — une hypersurface. Elle admet en effet l’équation cartésienne globale

F:x\in\omega_n\mapsto x_1\cdots x_n-1\in\mathbf R

\omega_n=\{x\in\mathbf R^n|x_1,\ldots,x_n>0\}

De fait, V_n est l’ensemble des zéros de F et le gradient de ce dernier ne s’annule nulle part puisque(*)

F'_i(x)=x_1\cdots x_{i-1}x_{i+1}\cdots x_n>0

lorsque x\in\omega_n.
En particulier, si u\in V_n,

\mathrm{grad}_uF=(F'_1(u),\ldots,F'_n(u))=\left(\dfrac 1{u_1},\ldots,\dfrac 1{u_n}\right)

de sorte que

(1) La variété affine T_uV_n tangente à V_n en u est l’hyperplan d’équation cartésienne

\dfrac{x_1}{u_1}+\cdots+\dfrac{x_n}{u_n}=n

La variété V_n est connexe. En effet, l’application

x\in\omega_{n-1}\mapsto \left(x_1,\ldots,x_{n-1},\dfrac 1{x_1\cdots x_{n-1}}\right)\in V_n

est un homéomorphisme de \omega_{n-1}, qui est connexe, sur V_n, qui l’est donc aussi(**).

Un difféomorphisme
Notons \alpha_n l’hyperplan de \mathbf R^n d’équation cartésienne x_1+\cdots+x_n=0.
Il se fait que

1) Chaque droite perpendiculaire à \alpha_n coupe V_n en exactement un point.
2) La restriction à V_n de la projection orthogonale de \mathbf R^n sur \alpha_n est un difféomorphisme.

Nous noterons \varphi la restriction à V_n de la projection orthogonale de \mathbf R^n sur \alpha_n.
Cela étant, prouvons 1). Soit \mathcal D une droite perpendiculaire à \alpha_n. Si u est un de ses points, alors

\mathcal D=\{(t+u_1,\ldots,t+u_n))|t\in\mathbf R\}

car (1,\ldots,1) est orthogonal à \alpha_n.

— Afin de voir que \mathcal D rencontre V_n, prenons pour u le point d’intersection de \mathcal D et de \alpha_n et notons P l’application polynômiale

t\mapsto (t+u_1)\cdots(t+u_n)

Puisque u_1+\cdots +u_n=0, la plus petite composante de u, disons u_i, est inférieure ou égale à 0. On a P(-u_i)=0 et la limite de P en +\infty est +\infty. En vertu du théorème des valeurs intermédiaires, il existe donc t>-u_i tel que P(t)=1. Comme u_i est la plus petite composante de u, les nombres t+u_k, k\in\{1,\ldots,n\}, sont strictement positifs. Ainsi

(t+u_1,\ldots,t+u_n)\in\mathcal D\cap V_n

— On va ensuite vérifier, par l’absurde, que \mathcal D ne rencontre V_n qu’en un seul point. Pour cela, nous prenons pour u l’élément de \mathcal D\cap V_n le plus proche de \alpha_n. Vu ce choix, les composantes d’un second élément de cette intersection sont de la forme u_i+tt est strictement positif. Leur produit vaut 1, ce qui donne

(2) \sum_{k=0}^nc_kt^{n-k}=1

c_k=\sum_{i_1<\cdots<i_k}u_{i_1}\cdots u_{i_k}

Comme u\in V_n, ces ceofficients sont strictement positifs et c_n=u_1\cdots u_n=1. Vu (2), cette dernière égalité implique que

\sum_{k=1}^nc_kt^{n-k}=0

C’est absurde car tous les termes du membre de gauche de cette relation sont strictement positifs.

Voici alors une preuve de 2).

On va vérifier que \varphi est un difféomorphisme en montrant que c’est une bijection de classe C^\infty dont la différentielle est partout non singulière.

— L’application \varphi est injective. En effet, vu 1), les perpendiculaires à \alpha_n menées par des points distincts u,v de \in V_n sont disjointes (elles sont parallèles et disjointes). En particulier, leurs intersections avec \alpha_n, \varphi(u) et \varphi(v), sont distinctes. Vu 1) de nouveau, elle est aussi surjective. C’est donc une bijection.

— L’application \varphi est la composée \mathcal A\circ i de la projection orthogonale \mathcal A de \mathcal R^n sur \alpha_n et du plongement i de V_n dans \mathbf R^n. Ces deux fonctions sont de classe C^\infty. La première parce que c’est une application affine et la seconde en raison du fait que V_n est une variété plongée de classe C^\infty de \mathbf R^n.

— L’application linéaire tangente de \varphi en un point u est \varphi_{*u}=\mathcal A_{*u}\circ i_{*u}.

D’une part, l’application \mathcal A_{*u} est l’application linéaire A associée à l’application affine \mathcal A(***). En l’occurrence c’est la projection orthogonale de \mathbf R^n sur \alpha_n (qui est son propre espace vectoriel directeur puisqu’il contient 0). En particulier, le noyau de A est la droite d’équations x_1=\cdots =x_n.

D’autre part, i_{*u} est une bijection de l’espace tangent de V_n en u sur l’espace vectoriel directeur de la variété affine tangente à V_n en u. Vu (1), il s’agit du sous-espace vectoriel de \mathbf R^n d’équation

\dfrac{x_1}{u_1}+\cdots+\dfrac{x_n}{u_n}=0

On a donc \ker \mathcal A_{*u}\cap\mathrm{im\ } i_{*u}=\{0\}. Ceci montre que \varphi_{*u} est injectif mais comme les dimensionns de V_n et \alpha_n sont égales, il est dès lors bijectif, ce qui achève la preuve de 2).

Un convexe
Nous allons montrer, de deux façons différentes, que

V_n^+=\{x\in \omega_n|x_1\cdots x_n\geqslant 1\}

est convexe. Nous verrons d’abord que c’est une intersection de convexes puis nous verrons qu’il est l’image par une bijection linéaire de \alpha_n\times\mathbf R sur \mathbf R^n de l’épigraphe d’une fonction de classe C^\infty strictement convexe f: \alpha_n\to\mathbf R.

Dans les deux cas, nous utiliserons l’inégalité suivante

(\star) Si les nombres réels a_1,\ldots a_m sont strictement positifs et si leur produit vaut 1, alors leur somme est plus grande ou égale à m et elle vaut m si, et seulement si, ces nombres sont tous égaux à 1.

Elle résulte immédiatement de l’inégalité entre les moyennes géométrique et arithmétique

\sqrt[m]{a_1 \cdots a_m}\leqslant\dfrac { a_1+\cdots+a_m}m

et du fait que, dans celle-ci, l’égalité est réalisée si, et seulement si, les a_i sont égaux.

Pour tout u\in V_n, notons \xi_u le demi-espace fermé de \mathbf R^n délimité par T_uV_n et contenant u+\delta, où \delta=(1,\ldots,1).
L’hyperplan T_uV_n délimite deux demi-espaces fermés. Vu (1), il s’agit de l’ensemble des solutions de l’inéquation

(3) \dfrac{x_1}{u_1}+\cdots+\dfrac{x_n}{u_n}\geqslant n

et celui des solutions de

\dfrac{x_1}{u_1}+\cdots+\dfrac{x_n}{u_n}\leqslant n

Le premier contient u+\delta. C’est donc \xi_u.

On a

(4) \displaystyle V_n^+=\omega_n\cap\bigcap_{u\in V_n}\xi_u

Montrons d’abord que si x\in V_n^+ et u\in V_n, alors x\in\omega_n\cap\xi_u. Puisque x appartient à V_n^+, il appartient à \omega_n et a:=x_1\cdots x_n\geqslant 1. D’après (\star), on a alors

\displaystyle \frac{x_1}{\sqrt[n]{a}\ u_1}+\cdots+\frac{x_n}{\sqrt[n]{a}\ u_n}\geqslant n

En effet, le produit des nombres positifs x_k/(\sqrt[n]{a}\ u_k) vaut 1. En multipliant les deux membres de cette inégalité par \sqrt[n]{a}, on voit que x\in\xi_u puisque \sqrt[n]{a}\ n\geqslant n.

Ensuite, vérifions qu’un point x de \omega_n appartenant à chaque \xi_u, u\in V_n, appartient à V_n^+. Avec de nouveau a=x_1\cdots x_n, u=x/\sqrt[n]{a}\in V_n. Puisque x\in \xi_u, il vérifie l’inégalité (3), ce qui donne n\sqrt[n]{a}\geqslant n. Dès lors a\geqslant 1 et x\in V_n^+. L’égalité (4) est ainsi établie.

Elle montre que V_n^+ est convexe car \omega_n et les \xi_u, u\in V_n, sont convexes. Il est même strictement convexe en ce sens que chaque hyperplan d’appui T_uV_n, u\in V_n, ne le rencontre qu’en u. En effet si x\in V_n^+\cap T_uV_n alors

\displaystyle \frac{x_1}{u_1}+\cdots+\frac{x_n}{u_n}=n

D’après l’inégalité entre les moyennnes arithmétique et géométrique, le produit des nombres x_k/u_k, qui vaut x_1\cdots x_n, ne dépasse pas 1. Or il vaut au moins 1 puisque x\in V_n^+. Il est donc égal à 1. Vu (\star), les x_k/u_k sont égaux à 1 et x=u.

Un convexe (suite)
Je vais à présent donner la seconde preuve de la convexité de V_n^+ annoncée au début de la section précédente.

La fonction f Soit un point x de \alpha_n. Par définition de \varphi, le point \varphi^{-1}(x) appartient à la perpendiculaire à \alpha_n menée par x. Il existe donc un nombre t, et un seul, tel que \varphi^{-1}(x)=x+t\delta. Nous le noterons f(x), introduisant ainsi une fonction f:\alpha_n\to \mathbf R qui, tout comme \varphi^{-1}(x), est de classe C^\infty. Nous désignerons ci-dessous par \mathcal G et \mathcal G^+ le graphe et l’épigraphe de f. Le graphe de f est, bien entendu, une variété différentielle plongée dans \alpha_n\times\mathbf R.

L’épigraphe de f Nous allons voir que la restriction de la bijection linéaire

T : (x,t)\in\alpha_n\times\mathbf R\mapsto x+t\delta\in\mathbf R^n

à l’épigraphe de f est une bijection entre celui-ci et V_n^+.

Montrons d’abord que T(\mathcal G^+)\subseteq V_n^+. Soit (x,t)\in\mathcal G^+. On a

u:=T((x,t))=x+f(x)\delta+(t-f(x))\delta

y:=x+f(x)\delta\in V_n et s:=t-f(x)\geqslant 0. Par suite

u_1\cdots u_n=(y_1+s)\cdots(y_n+s)\geqslant y_1\cdots y_n=1

ce qui montre que u appartient à V_n^+.

Vérifions ensuite que T_{|\mathcal G^+} est surjectif. Soit u=T(x,t)\delta\in V_n^+. Nous allons  voir que t\geqslant f(x), ce qui suffit pour conclure. Posons t=f(x)+s. On a

u_1\cdots u_n=\underbrace{(x_1+f(x)+s)\cdots(x_n+f(x)+s)}_{\geqslant 1}\geqslant \underbrace{(x_1+f(x))\cdots(x_n+f(x))}_{=1}

et les x_i+f(x) sont strictement positifs. Par conséquent,  $layex s\geqsalnt 0$ et t\geqslant f(x) comme annoncé.

Notons que \tau_{|\mathcal G} est aussi une bijection, de \mathcal G sur V_n. Il est facile de voir que c’est un difféomorphisme entre ces deux variétés.

Convexité stricte de f La fonction f est strictement convexe c’est-à-dire que tout segment de droite délimité par deux points distincts de son graphe est entièrement contenu dans son épigraphe et ne rencontre son graphe qu’en ces points. C’est une façon géométrique de formuler l’inégalité stricte de Jensen. En formules, cela donne : si \lambda\in]0,1[ et si x,y\in\alpha_n sont distincts, alors

f((1-\lambda)x+\lambda y)<(1-\lambda)f(x)+\lambda f(y)

Mais puisque T est linéaire, T_{|\mathcal G^+}:\mathcal G^+\to V_n^+ est une bijection et T(\mathcal G)=V_n, ceci est équivalent à : tout segment de droite délimité par deux points de V_n est entièrement contenu dans V_n^+ et ne rencontre V_n qu’en ces points. Soit en formules : si \lambda\in]0,1[ et si u,v\in V_n sont distincts, alors

(5) \displaystyle \prod_{k=1}^n[(1-\lambda)u_k+\lambda v_k]>1

Démonstration Nous allons à présent vérifier que f est strictement convexe en utilisant cette dernière caractérisation. Supposons que \lambda\in ]0,1[ et que u,v\in V_n. On a

\displaystyle \prod_{k=1}^n[(1-\lambda)u_k+\lambda v_k]=\sum_{p=0}^n\gamma_p(1-\lambda)^p\lambda^{n-p}

Bien entendu, \gamma_0=\gamma_n=1 et nous montrerons plus bas que, pour p\in\{1,\ldots n-1\}, \gamma_p\geqslant {n \choose p}, l’égalité ayant lieu si, et seulement si, u=v. Comme les nombres (1-\lambda)^p\lambda^{n-p} sont strictement positifs, on a donc

\displaystyle \sum_{p=0}^n\gamma_p(1-\lambda)^p\lambda^{n-p}\geqslant \sum_{p=0}^n{n \choose p}(1-\lambda)^p\lambda^{n-p}=1

l’égalité ayant lieu si, et seulement si, u=v. L’inégalité (5) est donc démontrée, sous l’hypothèse que u\neq v.

Démonstration (suite) Nous allons prouver ici nos allégations relatives aux coefficients \gamma_p. Nous supposons d’emblée que p\in\{1,\ldots n-1\} car il est évident, comme nous l’avons laissé entendre, que \gamma_0=\gamma_n=1.

Le coefficient \gamma_p s’obtient en choisissant de toutes les façons possibles le terme en 1-\lambda dans p facteurs du membre de gauche de l’inégalité (5) et le terme en \lambda dans les autres facteurs. Donc

\displaystyle \gamma_p=\sum_{(I,J)}\left(\prod_{i\in I}u_i\right)\left(\prod_{j\in J}v_j\right)

où la somme porte sur les couples formés d’un ensemble à p éléments I\subset \{1,\ldots,n\} et de son complémentaire J=\{1,\ldots,n\}\setminus I. Comme v\in V_n, v_1\cdots v_n=1 de sorte que

\displaystyle \prod_{j\in J}v_j=\prod_{i\in I}\frac 1{v_i}

Par suite,

\displaystyle \gamma_p=\sum_I\underbrace{\prod_{i\in I}\frac{u_i}{v_i}}_{s_I}

Le produit des {n \choose p} nombres s_I vaut 1. En effet, chaque nombre k\in\{1,\ldots,n\} figure exactement dans

{n \choose p}-{n-1 \choose p}={n-1 \choose p-1}

sous-ensembles à p éléments de \{1,\ldots,n\}. Par conséquent,

\displaystyle \prod_Is_I=\left(\frac{u_1\cdots u_n}{v_1\cdots v_n}\right)^{n-1 \choose p-1}=1

Vu (\star), on a donc \gamma_p\geqslant {n \choose p}, l’égalité ayant lieu si, et seulement si, les s_I sont égaux à 1.

Pour conclure, il nous reste donc à montrer que les s_I sont égaux à 1, alors u=v, la réciproque étant évidente.

Supposons donc que les s_I sont égaux à 1. Soient k\in\{1,\ldots n\} et \mathcal I_k l’ensemble des I contenant k. Comme on l’a observé plus haut, il y en a {n-1 \choose p-1}. De plus, chaque nombre l\in\{1,\ldots n\}\setminus\{k\} figure dans exactement {n-2 \choose p-2} éléments de \mathcal I_k puisque I\in\mathcal I_k si, et seulement si, I\setminus\{k\} est un sous-ensemble à p-1 éléments de \{1,\ldots n\}\setminus\{k\}. Par conséquent,

\displaystyle 1=\prod_{I\in\mathcal I_k}s_I=\left(\frac{u_k}{v_k}\right)^{{n-1 \choose p-1}}\left(\frac{u_1\cdots u_{k-1}u_{k+1}\cdots u_n}{v_1\cdots v_{k-1}v_{k+1}\cdots v_n}\right)^{{n-2 \choose p-2}}=\left(\frac{u_k}{v_k}\right)^{{n-2 \choose p-1}}

puisque u_1\cdots u_n=v_1\cdots v_n=1. Dès lors u_k=v_k pour tout k\in\{1,\ldots n\} : u=v.

Conclusion Puisque la fonction f est strictement convexe, son épigraphe est convexe et, dès lors, V_n^+=T(\mathcal G^+) l’est aussi.

Un convexe (suite)

Il y a en fait une troisième façon de prouver que V_n^+ est convexe. Elle vient assez facilement à l’esprit et est plus expéditive que les précédentes. Mais, contrairement à celles-ci, qui sont fort instructives, elle ne révèle pas grand chose de la géométrie de V_n. En plus, elle ne respecte pas du tout l’invariance de V_n et V_n^+ sous l’action du groupe des permutations \mathfrak S_n. Je n’en raffole pas, vous l’aurez compris, mais je la propose quand même, pour être complet. Cela dit, elle ferait sans doute l’objet un bon exercice pour les étudiants des premières années d’étude en sciences mathématiques.

La fonction

\displaystyle g:x\in\omega_{n-1}\mapsto \frac 1{x_1\cdots x_{n-1}}\in\mathbf R

est convexe. En effet, un calcul facile montre qu’en chaque point x de \omega_{n-1}, sa matrice hessienne H(x) vérifie

\displaystyle \forall h\in \mathbf R^{n-1}, \quad H(x)h\cdot h=\sum_{i,j}H(x)_{ij}h_ih_j=g(x)\left(\sum_{i=1}^{n-1}\frac{h_i}{x_i}\right)^2

Elle est donc semi-défini positive.

Par ailleurs, V_n et V_n^+ sont respectivement le graphe et l’épigraphe de g. En particulier, V_n^+ est convexe.
__________
(*) Pour alléger l’écriture, nous désignerons par f'_i(x) la dérivée partielle d’une fonction f par rapport à sa i-ème variable calculée en x.
(**) En fait cette application est un paramétrage de V_n. Les \omega_m sont connexes car ils sont convexes puisque ce sont des intersections de demi-espaces.
(***) Si \mathcal T:\mathcal E\to\mathcal F est une application affine, alors il existe une, et une seule, application linéaire T: E\to F, où E et F sont les espaces vectoriels directeurs de \mathcal E et de \mathcal F, vérifiant

\mathcal T(Y)=\mathcal T(X)+T(\overrightarrow{XY})

Lorsque \mathcal E et \mathcal F sont de dimensions finies, alors \mathcal T est de classe C^\infty et son application linéaire tangente est partout égale à T.

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.