Approximation de rang faible

En mathématiques, et plus précisément en algèbre linéaire et en théorie de l'approximation, une approximation de rang faible est une manière d'approcher une matrice ou un opérateur par une construction dont le rang est plus petit que le rang de la matrice ou opérateur d'origine. La qualité de l'approximation est quantifiée au moyen d'une norme sur l'espace considéré, et le problème de l'approximation de rang faible peut donc être vu comme un problème d'optimisation sous une contrainte de rang.

Problème (cas matriciel)

Soit une matrice , et une norme matricielle. Le problème d'approximation de rang peut être formulé comme le problème d'optimisation suivant:

.

Une manière d'imposer la contrainte de rang consiste simplement à chercher un minimiseur sous la forme avec et .

Théorème d'Eckart-Young-Mirsky

Pour certaines normes, la meilleure approximation est donnée directement par la troncature de la décomposition en valeurs singulières. Cela correspond à effectuer une analyse en composantes principales du nuage de points formé des colonnes de la matrice .

Théorème d'Eckart-Young — Soit de valeurs singulières , , et la décomposition en valeurs singulières tronquée de . Alors

.

Le résultat a été obtenu par Carl Eckart et Gale J. Young (en) pour le cas de la norme de Frobenius[1], puis étendu au cas des normes invariantes par transformation unitaire par Leon Mirsky (en).

Dans le cas de la norme d'opérateur, l'approximation optimale est toujours donnée par la décomposition en valeurs singulières, toutefois .

Approximation de rang faible contrainte

De nombreux problèmes d'approximation matricielle peuvent s'écrire sous la forme

correspondent à des ensembles de contraintes qui peuvent dépendre de , et est une mesure de l'éloignement de l'approximation à la matrice . Cette dernière peut par exemple être issue d'une norme, ou correspondre à une divergence statistique.

Approximation par matrices non-négatives

Le problème d'approximation par matrices non-négatives correspond au cas où ont des éléments non-négatifs.

Approximation à partir de lignes et de colonnes

Certaines approximations reposent sur la sélection des lignes et des colonnes de la matrice d'origine. C'est le cas de l'approximation CUR (également appelée « pseudo-skeleton approximation » en anglais), qui est de la forme est une matrice obtenue en sélectionnant des colonnes de et obtenue en sélectionnant des lignes de .

L'approximation de Nyström (également appelée « adaptive cross-approximation » en anglais) correspond au cas particulier où est une matrice semi-définie positive.

Analyse archétypale

L'analyse archétypale correspond à une classe d'approximation où les colonnes de sont contraintes à être des combinaisons convexes des colonnes de , et chaque colonne de est également contrainte à être une combinaison convexe[2].

Analyse factorielle

L'analyse factorielle est une technique d'analyse de données, qui consiste à expliquer des observations multivariées comme des combinaisons linéaires d'un petit nombre de facteurs. Il s'agit d'une classe de méthodes plus générale, et fondée sur un modèle statistique[3]. De multiples techniques d'analyse factorielles sur données continues reposant sur un modèle à bruit additif peuvent toutefois s'écrire comme des problèmes d'approximation de rang faible sous contraintes. Le choix de la fonction utilisée pour mesurer l'erreur d'approximation dérive alors typiquement des hypothèses de modélisation formulée sur le bruit.

Références

  1. C. Eckart, G. Young, « The Approximation of One Matrix by Another of Lower Rank », Psychometrika, Cambridge University Press (CUP), vol. 1, t. 3,‎ (ISSN 1860-0980, DOI 10.1007/bf02288367)
  2. A. Cutler, L. Breiman, « Archetypal Analysis », Technometrics, [Taylor & Francis, Ltd., American Statistical Association, American Society for Quality], vol. 36, t. 4,‎ (ISSN 0040-1706, DOI 10.2307/1269949)
  3. I. T. Jolliffe, Principal component analysis, Springer, coll. « Breakthroughs in statistics », , 2ᵉ éd. (ISBN 0-387-95442-2), Chapitre 7
  • Portail des mathématiques