Descripteurs aléatoires

En statistiques et en apprentissage automatique, le calcul de descripteurs aléatoires est une technique d'approximation permettant d'évaluer de manière approchée certains noyaux définis positifs. Cette technique consiste à construire un plongement du domaine de définition du noyau vers un espace euclidéen de faible dimension qui approche la géométrie induite par le noyau.

Le calcul des descripteurs pour un ensemble de points permet de construire une approximation de faible rang de la matrice à noyau associée, et par conséquent de développer des approximations de méthodes à noyaux et de processus gaussiens ayant des coûts de calculs réduits.

Les descripteurs sont typiquement construits en utilisant une approximation de Monte-Carlo d'une représentation intégrale du noyau, d'où leur nature « aléatoire ».

La méthode a été initialement proposée par Ali Rahimi et Benjamin Recht en 2008[1].

Descripteurs de Fourier aléatoires

La construction repose sur une approximation d'une représentation intégrale du noyau. Soit un noyau continu et invariant par translation, c.-à-d. de la forme . Par le théorème de Bochner, un tel noyau admet une représentation intégrale de la forme

est la transformée de Fourier de .

Définition

Un descripteur aléatoire est une fonction construite telle que la quantité est une approximation numérique de la représentation intégrale du noyau (uniformément pour tous ).

La définition n'est donc pas unique, mais les descripteurs les plus courants sont obtenus par une approximation de Monte-Carlo de l'intégrale, c.-à-d. reposent sur le tirage de vecteurs de fréquence tirés de manière i.i.d. selon  :

  • où les sont tirés i.i.d. et uniformément sur

Références

  1. A. Rahimi, B. Recht « Random features for large-scale kernel machines » () (lire en ligne)
    Advances in neural information processing systems
  • Portail des probabilités et de la statistique