En mathématiques, et plus précisément en analyse convexe, le sous-différentiel est un concept permettant de décrire la variation locale d'une fonction convexe (à valeurs réelles donc) non nécessairement différentiable dans un sens classique, celui auquel on attache aujourd'hui le nom de Fréchet. Au lieu d'être la pente de l'application linéaire tangente (c'est-à-dire, la dérivée) au point considéré, qui n'existe pas nécessairement, le sous-différentiel d'une fonction convexe est l'ensemble des pentes de toutes les minorantes affines de la fonction, qui sont exactes en ce point, c'est-à-dire qui ont en ce point la même valeur que la fonction convexe qu'elles minorent. Dans cette description, le mot pente peut être entendu comme un élément de l'espace dual. La convexité de la fonction assure qu'on peut lui trouver des minorantes affines exactes en presque tout point de son domaine ; on met donc à profit cette propriété pour définir le sous-différentiel. Si l'on peut trouver une minorante affine exacte en un point donné, on dit que la fonction convexe est sous-différentiable en ce point.
On sait que la notion de dérivée est fondamentale en analyse car elle permet d'approcher localement des fonctions par des modèles linéaires, plus simples à étudier. Ces modèles fournissent des renseignements sur les fonctions qu'ils approchent, si bien que de nombreuses questions d'analyse passent par l'étude des fonctions linéarisées (stabilité, inversibilité locale, etc). On rencontre beaucoup de fonctions convexes qui ne sont pas différentiables au sens classique, en particulier lorsque celles-ci résultent de constructions qui n'ont rien pour assurer la différentiabilité des fonctions qu'elles produisent. Il en est ainsi de la fonction duale associée à un problème d'optimisation sous contraintes, pour en citer un exemple emblématique. Pour ces fonctions convexes non lisses, le sous-différentiel joue donc un rôle similaire à celui de la dérivée des fonctions plus régulières.
La notion de sous-différentiel connaît diverses extensions aux fonctions non nécessairement convexes, par exemple aux fonctions localement lipschitziennes[1].
Connaissances supposées : l'algèbre linéaire, le calcul différentiel (notamment les propriétés de la dérivée directionnelle au sens de Dini pour les fonctions convexes prenant des valeurs infinies), les bases de l'analyse convexe (notamment les principales notions attachées aux ensembles et aux fonctions convexes, mais surtout la notion de fonction conjuguée).
Fonction d'une seule variable
Définition
De manière rigoureuse, une sous-dérivée d'une fonction convexe  en un point
 en un point  de l'intervalle ouvert
 de l'intervalle ouvert  est un nombre réel
 est un nombre réel  tel que
 tel que
 
pour tout  dans
 dans  . On peut montrer que si
. On peut montrer que si  est dans l'intérieur de
 est dans l'intérieur de  , l'ensemble des sous-dérivées en
, l'ensemble des sous-dérivées en  est un intervalle fermé non vide, donc de la forme
 est un intervalle fermé non vide, donc de la forme ![{\displaystyle [a,b]}](./9c4b788fc5c637e26ee98b45f89a5c08c85f7935.svg) , avec des bornes
, avec des bornes  et
 et  données par
 données par
 
qui sont finies et qui vérifient  .
.
L'ensemble ![{\displaystyle [a,b]}](./9c4b788fc5c637e26ee98b45f89a5c08c85f7935.svg) de toutes les sous-dérivées est appelé le sous-différentiel de la fonction
 de toutes les sous-dérivées est appelé le sous-différentiel de la fonction  en
 en  .
.
Exemples
Considérons la fonction f(x)=|x| qui est convexe. Alors, le sous-différentiel à l'origine est l'intervalle [−1, 1]. Le sous-différentiel en n'importe quel point x0<0 est le singleton {−1} et le sous-différentiel en n'importe quel point x0>0 est le singleton {1}.
Propriétés
- Une fonction convexe f:I→R est différentiable en x0 si et seulement si le sous-différentiel ne contient qu'un seul point, qui est alors la dérivée de f en x0.
- Un point x0 est un minimum local de f si et seulement si zéro est contenu dans le sous-différentiel, c'est-à-dire, dans la figure ci-dessus, on peut tracer une droite horizontale "sous-tangente" au graphe de f en (x0, f(x0)). La dernière propriété est une généralisation du fait que la dérivée d'une fonction dérivable en un minimum local est nulle.
Fonction définie sur un espace euclidien
On suppose dans cette section que  est un espace euclidien (de dimension finie donc) dont le produit scalaire est noté
 est un espace euclidien (de dimension finie donc) dont le produit scalaire est noté  et la norme associée
 et la norme associée  . On note par ailleurs
. On note par ailleurs
 la droite réelle achevée, la droite réelle achevée,
 le domaine d'une fonction le domaine d'une fonction , qui peut donc prendre la valeur , qui peut donc prendre la valeur sur son domaine, sur son domaine,
 l'ensemble des fonctions l'ensemble des fonctions qui sont convexes (c'est-à-dire, leur épigraphe est convexe) et propres (c'est-à-dire, elles ne prennent pas la valeur qui sont convexes (c'est-à-dire, leur épigraphe est convexe) et propres (c'est-à-dire, elles ne prennent pas la valeur et ne sont pas identiquement égales à et ne sont pas identiquement égales à ), ),
 la partie de la partie de formée des fonctions qui sont aussi fermées (c'est-à-dire, leur épigraphe est fermé), formée des fonctions qui sont aussi fermées (c'est-à-dire, leur épigraphe est fermé),
 l'intérieur et l'intérieur et l'intérieur relatif d'un convexe l'intérieur relatif d'un convexe . .
Définition
La notion de sous-différentiel peut être généralisée à une fonction convexe de plusieurs variables réelles, pouvant également prendre la valeur  . Cette dernière extension trouve son utilité, par exemple en optimisation, lorsque la fonction résulte d'une construction qui n'assure pas a priori la finitude des valeurs qu'elle prend. Comme pour la notion de gradient, on a besoin que l'espace sur lequel est définie la fonction soit muni d'un produit scalaire si l'on veut construire des objets dans cet espace et non dans son dual. Les concepts seront mieux révélés en travaillant sur un espace euclidien abstrait, qui pourra, si on le souhaite, être vu comme
. Cette dernière extension trouve son utilité, par exemple en optimisation, lorsque la fonction résulte d'une construction qui n'assure pas a priori la finitude des valeurs qu'elle prend. Comme pour la notion de gradient, on a besoin que l'espace sur lequel est définie la fonction soit muni d'un produit scalaire si l'on veut construire des objets dans cet espace et non dans son dual. Les concepts seront mieux révélés en travaillant sur un espace euclidien abstrait, qui pourra, si on le souhaite, être vu comme  muni du produit scalaire euclidien.
 muni du produit scalaire euclidien.
Sous-gradient — Soit  , une fonction convexe et propre. On dit que
, une fonction convexe et propre. On dit que  est un sous-gradient de
 est un sous-gradient de  en
 en  si l'une des propriétés équivalentes suivantes est vérifiée :
 si l'une des propriétés équivalentes suivantes est vérifiée :
 , ,
 , ,
 minimise minimise , ,
 , ,
 . .
 
La lettre  renvoie à slope (pente) ou sous-gradient (si l'on préfère). La propriété 1 exprime le fait que la fonction
 renvoie à slope (pente) ou sous-gradient (si l'on préfère). La propriété 1 exprime le fait que la fonction  est une minorante linéaire de la fonction dérivée directionnelle
 est une minorante linéaire de la fonction dérivée directionnelle  (que l'on sait toujours exister lorsque
 (que l'on sait toujours exister lorsque  est convexe), exacte en
 est convexe), exacte en  . La propriété 2 exprime le fait que la fonction
. La propriété 2 exprime le fait que la fonction  est une minorante affine de
 est une minorante affine de  exacte en
 exacte en  . Les propriétés 4 et 5 expriment la même chose que la propriété 2 en utilisant la fonction conjuguée
. Les propriétés 4 et 5 expriment la même chose que la propriété 2 en utilisant la fonction conjuguée  de
 de  .
.
Propriétés
Optimalité
La propriété 2 de la définition du sous-différentiel permet d'obtenir immédiatement une expression simple de l'optimalité d'un point.
Cette condition nécessaire et suffisante d'optimalité du premier ordre (ainsi qualifiée parce qu'elle ne fait intervenir que les « dérivées » premières de la fonction) est typique des problèmes d'optimisation convexes (voir la section Conditions du premier ordre sans contrainte de l'article Conditions d'optimalité).
Trouver les minimiseurs d'une fonction convexe propre revient donc à trouver les « zéros » de son sous-différentiel. Ce résultat est à rapprocher de celui selon lequel les minimiseurs d'une fonction convexe différentiable sont les points qui annulent son gradient. Ce résultat est plus riche qu'il ne paraît à première vue. En effet, du fait que la fonction peut prendre la valeur  , il traite également de la minimisation d'une fonction convexe sous contraintes convexes (l'ensemble admissible étant le domaine de la fonction).
, il traite également de la minimisation d'une fonction convexe sous contraintes convexes (l'ensemble admissible étant le domaine de la fonction).
Lorsque  est polyédrique, on a les caractérisations supplémentaires suivantes[2], liées au concept de minimum saillant.
 est polyédrique, on a les caractérisations supplémentaires suivantes[2], liées au concept de minimum saillant.
Caractérisations de l'intériorité relative et de l'unicité d'un minimiseur de fonction polyédrique — Soit  une fonction polyédrique. Alors
 une fonction polyédrique. Alors
 
 
La polyédricité de la fonction joue un rôle majeur dans les caractérisations précédentes. Ainsi chacune des implications de la première équivalence peut être fausse pour une fonction non polyédrique : l'implication " " est fausse pour la fonction
" est fausse pour la fonction  en
 en  et l'implication "
 et l'implication " " est fausse pour la fonction
" est fausse pour la fonction  en
 en  . Pour la seconde équivalence, l'implication "
. Pour la seconde équivalence, l'implication " " est fausse pour la fonction
" est fausse pour la fonction  en
 en  , mais l'implication "
, mais l'implication " " reste vraie même si
" reste vraie même si  n'est pas polyédrique.
 n'est pas polyédrique.
Règle de bascule
Les sous-différentiels de  et de sa conjuguée
 et de sa conjuguée  jouissent d'une belle règle de réciprocité, parfois appelée règle de bascule[3].
 jouissent d'une belle règle de réciprocité, parfois appelée règle de bascule[3].
La réciproque n'a pas lieu au point 1, pour la fonction  ci-dessous
 ci-dessous
 
puisque l'on a  , alors que
, alors que ![{\displaystyle 0\in \partial f^{*}(0)={]-\infty ,0]}}](./f309ddc52daf0a01825b26a16bc8f511c2c1c347.svg) .
.
Sous-différentiabilité
Rappelons que l'on dit que  est sous-différentiable en
 est sous-différentiable en  si
 si  . Affirmer qu'un ensemble est non vide est une propriété forte qui, dans certains cas, revient à montrer qu'un certain problème a une solution.
. Affirmer qu'un ensemble est non vide est une propriété forte qui, dans certains cas, revient à montrer qu'un certain problème a une solution.
La propriété 1 définissant un sous-gradient  , à savoir
, à savoir
 
montre clairement que  ne peut être sous-différentiable en
 ne peut être sous-différentiable en  si la dérivée directionnelle
 si la dérivée directionnelle  prend en une direction la valeur
 prend en une direction la valeur  puisque le membre de droite de l'inégalité ci-dessus est toujours fini. La réciproque de cette observation est le sujet de la proposition qui suit. Une telle situation se présente pour la fonction convexe définie par
 puisque le membre de droite de l'inégalité ci-dessus est toujours fini. La réciproque de cette observation est le sujet de la proposition qui suit. Une telle situation se présente pour la fonction convexe définie par
 
Cette fonction n'est pas sous-différentiable en zéro, parce que  . Évidemment, si
. Évidemment, si  , alors
, alors  , mais ce n'est pas la valeur
, mais ce n'est pas la valeur  de la dérivée directionnelle qui empêche
 de la dérivée directionnelle qui empêche  d'être sous-différentiable en
 d'être sous-différentiable en  . C'est ce que montre la fonction indicatrice de l'intervalle
. C'est ce que montre la fonction indicatrice de l'intervalle  , dont le sous-différentiel en zéro est l'intevalle
, dont le sous-différentiel en zéro est l'intevalle ![{\displaystyle {]-\infty ,0]}}](./b9e2fbb8a8d2104072f2104ba4074e038d0daa6d.svg) .
.
Propriétés géométriques et topologiques
On note ci-dessous  l'enveloppe affine d'une partie
 l'enveloppe affine d'une partie  .
.
Propriétés géométriques et topologiques du sous-différentiel — Soient  ,
,  le sous-espace vectoriel parallèle à
 le sous-espace vectoriel parallèle à  ,
,  le projecteur orthogonal sur
 le projecteur orthogonal sur  et
 et  . On note
. On note  la restriction de
 la restriction de  à
 à  . Alors
. Alors
 , en particulier , en particulier , ,
 est convexe et fermé (éventuellement vide), est convexe et fermé (éventuellement vide),
 est non vide et borné, est non vide et borné,
 est non vide et borné. est non vide et borné.
 
Si  ne prend que des valeurs réelles, alors
 ne prend que des valeurs réelles, alors  et son sous-différentiel est un ensemble non vide, convexe et compact (par les points 2 et 4).
 et son sous-différentiel est un ensemble non vide, convexe et compact (par les points 2 et 4).
Le sous-différentiel peut être défini en utilisant la dérivée directionnelle (propriété 1 de la définition). La proposition suivante montre que l'on peut retrouver les dérivées directionnelles à partir du sous-différentiel :  est la fonction d'appui de
 est la fonction d'appui de  .
.
Formule du max — Si  et
 et  , alors
, alors
 
Le supremum est atteint si  .
.
 
Le résultat précédent ne tient plus si  est sur la frontière relative du domaine de
 est sur la frontière relative du domaine de  . Voici un contre-exemple :
. Voici un contre-exemple :  est l'indicatrice de la boule-unité fermée de
 est l'indicatrice de la boule-unité fermée de  , pour la norme euclidienne, et
, pour la norme euclidienne, et  . Alors
. Alors  et si
 et si  :
 :
 
Dès lors, la fonction  n'est pas fermée et ne peut donc être la fonction d'appui d'un ensemble, en particulier elle n'est pas la fonction d'appui du sous-différentiel. D'ailleurs, ce dernier s'écrit
 n'est pas fermée et ne peut donc être la fonction d'appui d'un ensemble, en particulier elle n'est pas la fonction d'appui du sous-différentiel. D'ailleurs, ce dernier s'écrit  et
 et
 
est l'enveloppe convexe fermée de  . Cette propriété est tout à fait générale pour les fonctions de
. Cette propriété est tout à fait générale pour les fonctions de  .
.
La multifonction sous-différentiel
On peut voir  comme une multifonction ou fonction multivoque, qui à un élément de
 comme une multifonction ou fonction multivoque, qui à un élément de  fait correspondre une partie de
 fait correspondre une partie de  , c'est-à-dire un élément de l'ensemble
, c'est-à-dire un élément de l'ensemble  des parties de
 des parties de  . On note
. On note
 
cette correspondance.
Rappelons quelques notions d'analyse multifonctionnelle. Soit  une multifonction. On définit le domaine, l'image et le graphe de
 une multifonction. On définit le domaine, l'image et le graphe de  respectivement par
 respectivement par
 
On notera bien que l'on a choisi de définir le graphe comme une partie de  et pas de
 et pas de  . La multifonction réciproque
. La multifonction réciproque  de la multifonction
 de la multifonction  est définie en
 est définie en  par
 par
 
Lorsque  est un espace euclidien dont le produit scalaire est noté
 est un espace euclidien dont le produit scalaire est noté  et que
 et que  , on dit que
, on dit que  est monotone si
 est monotone si
 
On dit que  est monotone maximale si
 est monotone maximale si  est monotone et si son graphe n'est pas strictement contenu dans le graphe d'un opérateur monotone. On vérifie facilement que cette dernière propriété s'écrit aussi
 est monotone et si son graphe n'est pas strictement contenu dans le graphe d'un opérateur monotone. On vérifie facilement que cette dernière propriété s'écrit aussi
![{\displaystyle {\Bigl [}\langle v-u,y-x\rangle \geqslant 0,\quad \forall \,(x,u)\in {\mathcal {G}}(\varphi ){\Bigr ]}\quad \Longrightarrow \quad (y,v)\in {\mathcal {G}}(\varphi ).}](./00204ceea9fafb4f59495061622f4441fc9725ed.svg) 
Dans le résultat ci-dessous, on note  la conjuguée de
 la conjuguée de  .
.
On rappelle que  est fortement convexe, de module
 est fortement convexe, de module  , si pour tout
, si pour tout  et
 et  et pour tout
 et pour tout ![{\displaystyle t\in [0,1]\subset \mathbb {R} }](./14ad501ba684a87f19b701325df081da30539836.svg) , on a
, on a
 
Rappelons aussi qu'une multifonction  est dit fortement monotone, de module
 est dit fortement monotone, de module  , si
, si
 
La forte convexité de  peut s'exprimer par la forte monotonie de
 peut s'exprimer par la forte monotonie de  [4].
[4].
Sous-différentiel fortement monotone — Pour une fonction  et un réel
 et un réel  , les propriétés suivantes sont équivalentes :
, les propriétés suivantes sont équivalentes :
 est fortement convexe de module est fortement convexe de module , ,
 est fortement monotone de module est fortement monotone de module , ,
 et et , on a , on a
  
 
 
Lien avec la différentiabilité
Rappelons les trois notions de différentiabilité d'une fonction  dont il est question dans cette section. On suppose que
 dont il est question dans cette section. On suppose que  est finie au point
 est finie au point  où sont prises ces dérivées.
 où sont prises ces dérivées.
- On dit que  a une dérivée partielle en a une dérivée partielle en suivant un vecteur suivant un vecteur si la fonction si la fonction est différentiable en est différentiable en . .
- On dit que  est Gâteaux-différentiable en est Gâteaux-différentiable en si la dérivée directionnelle si la dérivée directionnelle existe pour tout existe pour tout et si et si est linéaire. est linéaire.
- On dit que  est Fréchet-différentiable en est Fréchet-différentiable en s'il existe un vecteur s'il existe un vecteur tel que tel que
  
 Dans ce cas, le vecteur est appelé le gradient de est appelé le gradient de en en . On le note . On le note
  
 D'après la définition, si est Fréchet-différentiable en est Fréchet-différentiable en , , prend des valeurs finies dans un voisinage de prend des valeurs finies dans un voisinage de . .
Ces trois propriétés sont de plus en plus fortes (la Fréchet-différentiabilité implique la Gâteaux-différentiabilité, qui implique elle-même la différentiabilité partielle). Pour une fonction convexe, les trois notions sont équivalentes[5], si bien qu'il n'y a alors pas lieu de faire de distinction entre celles-ci.
Le résultat suivant[6] établit un lien entre la différentiabilité et la sous-différentiabilité : en bref, une fonction est différentiable en un point si, et seulement si, elle est sous-différentiable en ce point et son sous-différentiel est un singleton.
Calcul sous-différentiel
Combinaison conique
Voici une conséquence immédiate de la définition du sous-différentiel.
On remarquera bien que le scalaire multiplie une fonction dans le membre de gauche de l'identité ci-dessus et un ensemble dans son membre de droite.
À l'inverse, comme le montrera un exemple ci-dessous, l'égalité entre le sous-différentiel de la somme de fonctions convexes et la somme des sous-différentiels n'est pas nécessairement assurée. On aura certainement l'égalité si toutes les fonctions ne prennent que des valeurs finies. On notera également que la somme se fait sur des fonctions dans le membre de gauche de l'identité et sur des ensembles dans celui de droite.
Sous-différentiel d'une somme — Soient  et
 et  . Alors
. Alors
 
avec égalité si
 
Dans cette dernière condition, on peut remplacer  par
 par  si
 si  est polyédrique.
 est polyédrique.
 
Voici un exemple où l'égalité n'est pas assurée dans la formule de la somme ( est la fonction indicatrice de
 est la fonction indicatrice de ![{\displaystyle {]-\infty ,0]}}](./b9e2fbb8a8d2104072f2104ba4074e038d0daa6d.svg) ):
):
![{\displaystyle f_{1}:x\in \mathbb {R} \mapsto \left\{{\begin{array}{ll}-{\sqrt {x}}&{\mbox{si}}~x\geqslant 0\\+\infty &{\mbox{sinon}}\end{array}}\right.\qquad {\mbox{et}}\qquad f_{2}={\mathcal {I}}_{]-\infty ,0]}.}](./6f4d6aa605b7b7c487546b59eb66e3e4f0017360.svg) 
Comme la somme  est l'indicatrice de
 est l'indicatrice de  , on a
, on a  , alors que
, alors que  , parce que
, parce que  .
.
Pré-composition par une fonction affine
Le cadre est le suivant. On dispose d'une fonction affine  entre deux espaces euclidiens
 entre deux espaces euclidiens  et
 et  . Celle-ci est supposée être définie en
. Celle-ci est supposée être définie en  par
 par
 
où  est linéaire et
 est linéaire et  . On note
. On note  l'Image directe de
 l'Image directe de  par
 par  et
 et  l'application linéaire adjointe de
 l'application linéaire adjointe de  pour les produits scalaires que l'on s'est donnés sur
 pour les produits scalaires que l'on s'est donnés sur  et
 et  , défini donc par la relation
, défini donc par la relation
 
L'application affine  est composée avec une application
 est composée avec une application  .
.
Fonction marginale
Soient  et
 et  deux espaces euclidiens et
 deux espaces euclidiens et  une fonction. On associe à cette dernière la fonction marginale
 une fonction. On associe à cette dernière la fonction marginale  définie par :
 définie par :
 
Le sous-différentiel de  dépend de celui de
 dépend de celui de  qui est supposé calculé pour le produit scalaire de
 qui est supposé calculé pour le produit scalaire de  suivant :
 suivant :  .
.
Ce résultat appelle quelques remarques.
- Il faut bien noter que, si la borne inférieure  est atteinte en plusieurs est atteinte en plusieurs , , ne dépend pas du minimiseur ne dépend pas du minimiseur choisi. choisi.
 
 On a un autre éclairage sur cette indépendance par rapport à en observant que en observant que est constante sur l'ensemble est constante sur l'ensemble   minimise minimise , si bien que , si bien que est aussi constant sur l'intérieur relatif de est aussi constant sur l'intérieur relatif de . Cependant . Cependant peut varier lorsque peut varier lorsque passe de l'intérieur relatif de passe de l'intérieur relatif de à son bord. C'est le cas de la fonction définie par à son bord. C'est le cas de la fonction définie par , dont la fonction marginale est nulle : , dont la fonction marginale est nulle :
 
 ![{\displaystyle M(x)=\{x\}\times [-1,1]\quad {\mbox{et}}\quad \partial \varphi (0,y)=\left\{{\begin{array}{ll}\{(0,0)\}&{\mbox{si}}~-1<y<1\\\{0\}\times [0,1]&{\mbox{si}}~y=1.\end{array}}\right.}](./4065df99d426ee59b9e97926dabbf6c0ab3eb129.svg) 
 
- D'autre part, si  est différentiable en est différentiable en , où , où est un minimiseur quelconque de est un minimiseur quelconque de , alors , alors est également différentiable en est également différentiable en (car son sous-différentiel est un singleton) et on a (car son sous-différentiel est un singleton) et on a
 
  
 C'est comme s'il y avait un minimiseur unique , fonction différentiable de , fonction différentiable de , que l'on écrivait , que l'on écrivait et que l'on calculait et que l'on calculait par une dérivation en chaîne : par une dérivation en chaîne :
 
  
 On retrouverait le résultat ci-dessus en observant que car car minimise minimise . .
- Le fait que  ait un minimum unique n'implique nullement la différentiabilité de la fonction marginale en ait un minimum unique n'implique nullement la différentiabilité de la fonction marginale en . Par exemple, . Par exemple, est la fonction marginale de est la fonction marginale de définie par définie par . Cette dernière a un minimum . Cette dernière a un minimum unique en unique en quel que soit quel que soit , alors que , alors que peut ne pas être différentiable. peut ne pas être différentiable.
Fonctions concave et convexe-concave
Certaines constructions conduisent naturellement à des fonctions concaves plutôt que convexes. Il en est ainsi, par exemple, lorsque l'on prend l'enveloppe inférieure d'une famille de fonctions linéaires (la fonction duale d'un problème d'optimisation est construite de cette manière). On peut alors prendre le sous-différentiel de la fonction opposée, qui est convexe, mais il est parfois plus naturel de se passer de la multiplication par moins un. Si  est concave, on définit donc le sous-différentiel concave de cette fonction en un point
 est concave, on définit donc le sous-différentiel concave de cette fonction en un point  où elle est finie, comme l'ensemble noté et défini par
 où elle est finie, comme l'ensemble noté et défini par
 
Certains auteurs ne mettent pas le signe  au-dessus de
 au-dessus de  ; il faut alors se rappeler que
 ; il faut alors se rappeler que  est concave. Si
 est concave. Si  est concave différentiable, son sous-différentiel concave se réduit bien au gradient de
 est concave différentiable, son sous-différentiel concave se réduit bien au gradient de  . Les propriétés suivantes sont équivalentes :
. Les propriétés suivantes sont équivalentes :
 , ,
 , ,
 , ,
 maximise maximise . .
Il est aussi intéressant de définir le sous-différentiel d'une fonction convexe-concave. Si  et
 et  sont deux espaces vectoriels, on dit que
 sont deux espaces vectoriels, on dit que  est convexe-concave si
 est convexe-concave si
- pour tout  , , est convexe et est convexe et
- pour tout  , , est concave. est concave.
Le lagrangien d'un problème d'optimisation convexe avec contraintes a cette propriété. La situation est plus complexe que dans le cas d'une fonction concave, car il ne suffit pas de multiplier (une partie de) la fonction par  pour retrouver une fonction convexe et lui appliquer la notion de sous-différentiel convexe que l'on connait.
 pour retrouver une fonction convexe et lui appliquer la notion de sous-différentiel convexe que l'on connait.
Sous-gradient d'une fonction convexe-concave — Soient  et
 et  deux espaces vectoriels et
 deux espaces vectoriels et  une fonction convexe-concave. On dit que
 une fonction convexe-concave. On dit que  est un sous-gradient (convexe-concave) de
 est un sous-gradient (convexe-concave) de  en un point
 en un point  où
 où  prend une valeur finie si
 prend une valeur finie si  vérifie l'une des propriétés équivalentes suivantes :
 vérifie l'une des propriétés équivalentes suivantes :
 et et , ,
 , ,
  , ,
 est un point-selle de est un point-selle de . .
On note  l'ensemble des sous-gradients et on le nomme le sous-différentiel (convexe-concave) de
 l'ensemble des sous-gradients et on le nomme le sous-différentiel (convexe-concave) de  . Par convention, ce sous-différentiel est vide si
. Par convention, ce sous-différentiel est vide si  n'est pas fini.
 n'est pas fini.
 
De manière synthétique :
Dans cette définition, on a noté  le sous-différentiel ordinaire en
 le sous-différentiel ordinaire en  de la fonction convexe
 de la fonction convexe  et
 et  le sous-différentiel concave en
 le sous-différentiel concave en  de la fonction concave
 de la fonction concave  . Certains auteurs ne mettent pas le signe
. Certains auteurs ne mettent pas le signe  au-dessus de
 au-dessus de  ; il faut alors se rappeler que
 ; il faut alors se rappeler que  est convexe-concave.
 est convexe-concave.
Exemples
Voici quelques exemples de sous-différentiels de fonctions convexes classiques.
Fonction indicatrice
On suppose ici que  est un espace euclidien et que
 est un espace euclidien et que  est un convexe de
 est un convexe de  .
.
Le sous-différentiel de la fonction indicatrice  est le cône normal
 est le cône normal  de
 de  :
 :
Norme
Soit  une norme sur un espace euclidien
 une norme sur un espace euclidien  , non nécessairement dérivée du produit scalaire
, non nécessairement dérivée du produit scalaire  de
 de  . On introduit la norme duale
. On introduit la norme duale
 
et la boule-unité duale fermée
 
Une norme est évidemment une fonction convexe (par l'inégalité triangulaire), partout sous-différentiable (elle ne prend que des valeurs finies). Son sous-différentiel est donné par les formules
En particulier :
- si  , les sous-gradients , les sous-gradients sont sur la frontière de sont sur la frontière de : : ; ;
 . .
La puissance  d'une norme
 d'une norme
 
est aussi une fonction convexe (composition de fonctions convexes dont la seconde est croissante) propre (elle ne prend que des valeurs finies) fermée (elle est continue) et partout sous-différentiable (elle ne prend que des valeurs finies). Son sous-différentiel est donné par les formules
où ![{\displaystyle p':=p/(p-1)\in {]0,1[}}](./a0b4205f3185df08ca72a1436b7e783230ab257c.svg) est le nombre conjugué de
 est le nombre conjugué de  :
 :
 
La dernière expression du sous-différentiel  rappelle la dérivation en chaîne de la composition de
 rappelle la dérivation en chaîne de la composition de  et de
 et de  .
.
Distance à un convexe
Soit  une norme sur un espace euclidien
 une norme sur un espace euclidien  , non nécessairement dérivée du produit scalaire
, non nécessairement dérivée du produit scalaire  de
 de  . On introduit la norme duale
. On introduit la norme duale
 
et la boule-unité duale fermée
 
Soit  un ensemble convexe fermé non vide de
 un ensemble convexe fermé non vide de  . On considère la fonction
. On considère la fonction  , la distance à
, la distance à  , définie par
, définie par
 
C'est une fonction convexe propre et fermée (elle ne prend que des valeurs finies). On note  une projection d'un point
 une projection d'un point  sur
 sur  : c'est une solution du problème
 : c'est une solution du problème  . Cette dernière n'est pas nécessairement unique car la norme n'est pas nécessairement associée à un produit scalaire.
. Cette dernière n'est pas nécessairement unique car la norme n'est pas nécessairement associée à un produit scalaire.
Le sous-différentiel en  de la distance à
 de la distance à  est donné par la formule
où
 est donné par la formule
où  pour tout
 pour tout  est le cône normal à
 est le cône normal à  en
 en  .
.
Lorsque la norme  est celle associée au produit scalaire
 est celle associée au produit scalaire  , les boules-unités primale et duale coïncident (c'est-à-dire,
, les boules-unités primale et duale coïncident (c'est-à-dire,  ) et on a les propriétés suivantes :
) et on a les propriétés suivantes :
- si  , alors , alors est différentiable en est différentiable en et et ; ;
- si  , l'intérieur de , l'intérieur de , alors , alors est différentiable en est différentiable en et et ; ;
- si  , la frontière de , la frontière de , alors , alors . .
En l'absence de convexité d'un ensemble  , la distance
, la distance  n'est pas nécessairement différentiable sur le complémentaire de
 n'est pas nécessairement différentiable sur le complémentaire de  .
.
Valeur propre maximale
On note  l'ensemble des matrices réelles d'ordre
 l'ensemble des matrices réelles d'ordre  symétriques, que l'on munit du produit scalaire canonique
 symétriques, que l'on munit du produit scalaire canonique  (
 ( désigne la trace de la matrice
 désigne la trace de la matrice  ). On note aussi
). On note aussi  le cône de
 le cône de  formé des matrices semi-définies positives. On note enfin
 formé des matrices semi-définies positives. On note enfin
 
l'application valeur propre maximale, qui à une matrice symétrique  associe sa plus grande valeur propre (on rappelle qu'une matrice symétrique d'ordre
 associe sa plus grande valeur propre (on rappelle qu'une matrice symétrique d'ordre  a
 a  valeurs propres réelles). C'est une fonction propre, convexe et continue (donc fermée). Son sous-différentiel en
 valeurs propres réelles). C'est une fonction propre, convexe et continue (donc fermée). Son sous-différentiel en  est donné par la formule
où
 est donné par la formule
où  désigne l'enveloppe convexe d'un ensemble
 désigne l'enveloppe convexe d'un ensemble
 . L'enveloppe convexe ci-dessus est compacte (par exemple, parce que le sous-différentiel d'une fonction convexe ne prenant que des valeurs finies, comme
. L'enveloppe convexe ci-dessus est compacte (par exemple, parce que le sous-différentiel d'une fonction convexe ne prenant que des valeurs finies, comme  , l'est).
, l'est).
On en déduit que :
- si  est simple, est simple, est différentiable en est différentiable en et son gradient s'écrit alors et son gradient s'écrit alors où où sont les uniques vecteurs propres unitaires associés à la valeur propre maximale ; sont les uniques vecteurs propres unitaires associés à la valeur propre maximale ;
 ; ;
- la dérivée directionnelle de  en en dans la direction dans la direction s'écrit s'écrit où où est une matrice dont les colonnes forment une base orthonormale de l'espace propre associé à est une matrice dont les colonnes forment une base orthonormale de l'espace propre associé à . .
Fonction spectrale
La présentation ci-dessous synthétise celles de Lewis (1996), Hiriart-Urruty (1998), Borwein et Lewis (2000).
On note  l'ensemble des matrices réelles d'ordre
 l'ensemble des matrices réelles d'ordre  symétriques, que l'on munit du produit scalaire canonique
 symétriques, que l'on munit du produit scalaire canonique  , la trace de la matrice
, la trace de la matrice  . Par ailleurs, pour
. Par ailleurs, pour  , on note
, on note ![{\displaystyle [x]\in \mathbb {R} ^{n}}](./4bb2cff7a4bdb95a78af07eb3e3661e7c29b8e02.svg) le vecteur formé des composantes de
 le vecteur formé des composantes de  en ordre décroissant.
 en ordre décroissant.
On se donne une fonction  symétrique, c'est-à-dire qui vérifie
 symétrique, c'est-à-dire qui vérifie
![{\displaystyle \forall \,x\in \mathbb {R} ^{n}:\qquad f(x)=f([x]),}](./9cb45bf1c245ee248d36fc0390a7fd77a6a62bb1.svg) 
ce qui revient à dire que l'on ne modifie pas la valeur de  en permutant les composantes de
 en permutant les composantes de  . On note
. On note
 
la fonction donnant les valeurs propres de  en ordre décroissant :
 en ordre décroissant :
 
On appelle fonction spectrale une fonction de la forme  , avec
, avec  et
 et  comme ci-dessus. Ce sont donc des fonctions définies sur
 comme ci-dessus. Ce sont donc des fonctions définies sur  , mais dont les valeurs ne dépendent que du spectre des matrices.
, mais dont les valeurs ne dépendent que du spectre des matrices.
On peut alors caractériser la convexité-fermeture de  à partir de celle de
 à partir de celle de  [7].
[7].
Convexité-fermeture d'une fonction spectrale — Dans le cadre défini ci-dessus, si  est symétrique, alors
 est symétrique, alors
 
 
On peut aussi calculer le sous-différentiel de  à partir de celui de
 à partir de celui de  .
.
Sous-différentiel d'une fonction spectrale — Dans le cadre défini ci-dessus, si  est symétrique, alors les trois propriétés suivantes, reliant
 est symétrique, alors les trois propriétés suivantes, reliant  et
 et  , sont équivalentes :
, sont équivalentes :
 , ,
 et et , ,
- il existe une matrice orthogonale  et des vecteurs et des vecteurs , , tels que tels que
 
 
On peut enfin caractériser la différentiabilité de  à partir de celle de
 à partir de celle de  .
.
Les fonctions spectrales sont fréquemment rencontrées. En voici quelques-unes, construites à partir de fonctions  , donnant donc lieu à des fonctions
, donnant donc lieu à des fonctions  . Dans le tableau ci-dessous, les entiers
. Dans le tableau ci-dessous, les entiers  et
 et  peuvent être choisis arbitrairement dans
 peuvent être choisis arbitrairement dans  , un vecteur de
, un vecteur de  dont toutes les composantes sont strictement positives est signalé par
 dont toutes les composantes sont strictement positives est signalé par  , une matrice
, une matrice  définie positive est signalée par
 définie positive est signalée par  .
.
|   |   | 
| ![{\displaystyle [x]_{1}=\max(x_{1},\ldots ,x_{n})}](./7e45fc22d376f40494dc8df21aed7eb34f6f50cf.svg)  |   | 
| ![{\displaystyle -[x]_{n}=-\min(x_{1},\ldots ,x_{n})}](./0561bcfc714d7d4cfa705cc54fdbb5f396eb1af2.svg)  |   | 
| ![{\displaystyle \sum _{i=1}^{p}[x]_{i}-\sum _{i=n-q+1}^{n}[x]_{i}}](./6cacdfcde87ee80d9b8b6818ed486c355287ca5a.svg)  |   | 
|   |   | 
|   |   | 
Fonction définie sur un espace localement convexe
La présentation ci-dessous synthétise celle de Bonnans et Shapiro (2000).
Cadre
On suppose donnés deux espaces espaces vectoriels topologiques localement convexes  et
 et  sur
 sur  couplés, dans le sens où il existe une application bilinéaire continue
 couplés, dans le sens où il existe une application bilinéaire continue
 
telle que
- le dual topologique de  coïncide avec coïncide avec , ,
- le dual topologique de  coïncide avec coïncide avec . .
Comme exemples de tels couples d'espaces vectoriels topologiques localement convexes, citons
Définitions
Les définitions de sous-gradient, de sous-différentiel et de sous-différentiabilité sont essentiellement les mêmes que celles introduites en dimension finie.
Sous-gradient, sous-différentiel, sous-différentiabilité — Soit  , une fonction convexe et propre. On dit que
, une fonction convexe et propre. On dit que  est un sous-gradient de
 est un sous-gradient de  en
 en  si l'une des propriétés équivalentes suivantes est vérifiée :
 si l'une des propriétés équivalentes suivantes est vérifiée :
 , ,
 minimise minimise , ,
 , ,
 . .
L'ensemble des sous-gradients de  en
 en  est appelé le sous-différentiel de
 est appelé le sous-différentiel de  en
 en  ; il est noté
 ; il est noté
 
On dit que  est sous-différentiable en
 est sous-différentiable en  si
 si  . Par convention,
. Par convention,  si
 si  .
.
 
Annexes
Notes
- ↑ Voir Clarke (1983).
- ↑ La caractérisation de l'intériorité relative est peut-être due à Gilbert (2015). La caractérisation de l'unicité peut s'obtenir à partir de résultats plus généraux de Burke et Ferris (1993).
- ↑ J.-B. Hiriart-Urruty (2013). Bases, outils et principes pour l’analyse variationnelle. Mathématiques et Applications 70. Springer Verlag.
- ↑ Proposition 6 chez Rockafellar (1976).
- ↑ Proposition IV.4.2.1 chez Hiriart-Urruty et Lemaréchal (2001).
- ↑ Théorème 25.1 chez Rockafellar (1970).
- ↑ Voir Davis (1957) et la section 5.2 chez Borwein et Lewis (2000).
Bibliographie
- (en) A. Auslender, M. Teboulle (2003). Asymptotic Cones and Functions in Optimization and Variational Inequalitites. Springer Monographs in Mathematics. Springer, New York.
- (en) J. F. Bonnans, A. Shapiro (2000). Perturbation Analysis of Optimization Problems. Springer Verlag, New York.
- (en) J.M. Borwein, A.S. Lewis (2000). Convex Analysis and Nonlinear Optimization. Springer, New York.
- (fr) H. Brézis (1973). Opérateurs Maximaux Monotones et Semi-groupes de Contractions Dans les Espaces de Hilbert. Mathematics Studies 5. North-Holland, Amsterdam.  (ISBN 978-0-7204-2705-9).
- (en) J.V. Burke, M.C. Ferris (1993). Weak sharp minima in mathematical programming. SIAM Journal on Control and Optimization, 31, 1340–1359. DOI
- (en) C. Davis (1957). All convex invariant functions of Hermitian matrices. Archiv der Mathematik, 8, 26-278.
- (en) F.H. Clarke (1983). Optimization and Nonsmooth Analysis. John Wiley & Sons, New York.
- (en) J.Ch. Gilbert (2015). On the solution uniqueness characterization in the  norm and polyhedral gauge recovery. Rapport INRIA. norm and polyhedral gauge recovery. Rapport INRIA.
- (fr) J.-B. Hiriart-Urruty (1998). Optimisation et Analyse Convexe. Presses Universitaires de France, Paris.
- (en) J.-B. Hiriart-Urruty, Cl. Lemaréchal (2001). Fundamentals of Convex Analysis. Springer.  (ISBN 978-3-540-42205-1).
- (en) A.S. Lewis (1996). Convex analysis on the Hermitian matrices. SIAM Journal on Optimization, 6, 164-177.
- (en) R.T. Rockafellar (1970). Convex Analysis. Princeton Mathematics Ser. 28. Princeton University Press, Princeton, New Jersey.
- (en) R.T. Rockafellar (1976). Monotone operators and the proximal point algorithm. SIAM Journal on Control and Optimization, 14, 877–898.
- (en) R.E. Showalter (1997). Monotone Operators in Banach Space and Nonlinear Partial Differential Equations. American Mathematical Society.  (ISBN 978-0-8218-0500-8).