Une classe de Vapnik-Tchervonenkis ou classe VC (suivant la translitération anglaise) est un sous-ensemble d'un ensemble donné dont la dimension VC est finie. Cette notion est utilisée en apprentissage machine (« machine learning ») puisqu'elle est une condition nécessaire et suffisante au principe de minimisation du risque empirique (principe MRE).
Définition
Classe VC d'ensemble
Soit  une classe de sous-ensembles d'un ensemble
 une classe de sous-ensembles d'un ensemble  . Soit
. Soit  des éléments de
 des éléments de  . On dit que
. On dit que  prélève un sous-ensemble
 prélève un sous-ensemble  s'il existe
 s'il existe  tel que
 tel que  . On dit que
. On dit que  pulvérise
 pulvérise  si tous les sous-ensembles de ce dernier sont prélevés par
 si tous les sous-ensembles de ce dernier sont prélevés par  .
.
On appelle taille VC ou dimension VC de l'ensemble  le plus petit
 le plus petit  pour laquelle aucun élément de
 pour laquelle aucun élément de  est pulvérisé par
 est pulvérisé par  . Si
. Si  pulvérise tous les ensembles de tailles arbitraires, sa taille VC est infinie. Cette dimension est notée en général
 pulvérise tous les ensembles de tailles arbitraires, sa taille VC est infinie. Cette dimension est notée en général  ou
 ou  . De manière plus formelle, on introduit la taille des prélèvements
. De manière plus formelle, on introduit la taille des prélèvements  qui correspond au nombre de sous-ensembles que
 qui correspond au nombre de sous-ensembles que  que
 que  peut prélever, et la taille VC d'une classe
 peut prélever, et la taille VC d'une classe  par
 par
 
L'ensemble  est appelé classe de Vapnik-Tchervonenkis ou classe VC si sa taille VC est finie :
 est appelé classe de Vapnik-Tchervonenkis ou classe VC si sa taille VC est finie :  . On peut également préciser qu'il s'agit d'une classe VC d'ensembles.
. On peut également préciser qu'il s'agit d'une classe VC d'ensembles.
Remarque : la définition de la taille VC peut être différente selon les sources. En effet, certains auteurs prennent comme définition le plus grand entier  pour lequel la classe de fonctions arrive à pulvériser tout échantillon de taille
 pour lequel la classe de fonctions arrive à pulvériser tout échantillon de taille  . La différence entre ces deux définitions n'est que de 1.
. La différence entre ces deux définitions n'est que de 1.
Exemples :
- La classe des intervalles ![{\displaystyle {\mathcal {C}}=\{]-\infty ,t]:t\in \mathbb {R} \}}](./fd77d2c897dbd228da46176bf8d12003b32aa23d.svg) est une classe VC de dimension VC 1. La classe est une classe VC de dimension VC 1. La classe arrive à expulser un point mais pas deux points. En effet si arrive à expulser un point mais pas deux points. En effet si avec avec alors alors n'arrive pas à prélever n'arrive pas à prélever puisque puisque![{\displaystyle \forall t\geq t_{2},]-\infty ,t]\cap \{t_{1},t_{2}\}\neq \{t_{2}\}}](./08e0b683659bb89cc5ddefeb55a1f58229d2d699.svg) . .
- La classe des intervalles ![{\displaystyle {\mathcal {C}}=\{[a,b]:a,b\in \mathbb {R} \}}](./61885cfdc0dcd7c00026c5d50f3d7b761b81cfdd.svg) est une classe VC de dimension VC 2. est une classe VC de dimension VC 2. n'arrive pas à expulser trois points : si n'arrive pas à expulser trois points : si avec avec alors alors n'arrive pas à prélever n'arrive pas à prélever . . arrive à expulser deux points : soient arrive à expulser deux points : soient avec avec alors si on pose alors si on pose![{\displaystyle t\in ]t_{1},t_{2}[}](./41366e8f3b8081b5ec30ef24792fd014d20d267d.svg) , ,![{\displaystyle [t_{1},t]\cap \{t_{1},t_{2}\}=\{t_{1}\}}](./2b55c7328037dbb13c23f389f90aab63eeba1609.svg) ; ;
![{\displaystyle [t,t_{2}]\cap \{t_{1},t_{2}\}=\{t_{2}\}}](./ab85acfa3bdce1bbebfc83ba7fb8019ef2ca39f9.svg) ; ;
![{\displaystyle [t_{1},t_{2}]\cap \{t_{1},t_{2}\}=\{t_{1},t_{2}\}}](./028ba8e773f797a23eac9ef52753f69602ef3535.svg) . .
 
- La classe boules de  , i.e. , i.e. est une classe VC de dimension est une classe VC de dimension . Rappel : . Rappel : avec avec une distance donnée. une distance donnée.
- La classe  des polygones du plan est de dimension VC infini, autrement dit des polygones du plan est de dimension VC infini, autrement dit peut repousser au moins un ensemble de taille arbitraire. En effet, pour tout peut repousser au moins un ensemble de taille arbitraire. En effet, pour tout , on peut prendre , on peut prendre des points appartenant à un même cercle, tel que le cercle unité. Alors tout sous-ensemble de des points appartenant à un même cercle, tel que le cercle unité. Alors tout sous-ensemble de forme les sommets d'un polygone et ce dernier ne contiendra pas les points de forme les sommets d'un polygone et ce dernier ne contiendra pas les points de n'appartenant pas au sous-ensemble. n'appartenant pas au sous-ensemble.
Classe VC de fonctions
Soit  une classe de fonctions mesurables définies sur
 une classe de fonctions mesurables définies sur  et à valeurs réelles. Si la classe des sous-graphes des fonctions de
 et à valeurs réelles. Si la classe des sous-graphes des fonctions de  (le sous-graphe de
 (le sous-graphe de  est
 est  ) forme une classe VC alors
) forme une classe VC alors  est appelée classe VC (ou classe VC de sous-graphe).
 est appelée classe VC (ou classe VC de sous-graphe).
Exemple : 
- La classe des fonctions indicatrices ![{\displaystyle {\mathcal {F}}=\{\mathbf {1} _{]-\infty ,t]}:t\in \mathbb {R} \}}](./7d50fbf96da2e1c570b9a8956a4f5707eaaebfa7.svg) est une classe VC de dimension 1. est une classe VC de dimension 1.
Propriétés
Lemme de Sauer
Le lemme de Sauer borne le nombre de sous-ensemble d'un échantillon de taille fixée prélevée par une classe VC  que l'on peut avoir au maximum. Formellement, si
 que l'on peut avoir au maximum. Formellement, si  est une classe VC d'ensemble alors (cf. corollaire 2.6.3[1])
 est une classe VC d'ensemble alors (cf. corollaire 2.6.3[1]) 
 
où  .
.
Classe VC
Les classes VC vérifient des propriétés de stabilité. Autrement dit, des opérations de classes VC (comme l'union, l'intersection, ...) de classes VC est toujours une classe VC.
Classe VC d'ensembles
Soit  et
 et  des classes VC d'un même ensemble
 des classes VC d'un même ensemble  et
 et  et
 et  des fonctions. Alors (cf. lemme 2.6.17[1]) :
 des fonctions. Alors (cf. lemme 2.6.17[1]) : 
 est une classe VC ; est une classe VC ;
 est une classe VC ; est une classe VC ;
 est une classe VC ; est une classe VC ;
 est une classe VC si est une classe VC si est injective ; est injective ;
 est une classe VC. est une classe VC.
Si  sont classes VC respectivement des ensembles
 sont classes VC respectivement des ensembles  et
 et  alors
 alors 
 est une classe VC de est une classe VC de . .
Si  est une classe de cardinal fini alors
 est une classe de cardinal fini alors  est une classe VC de dimension VC bornée par
 est une classe VC de dimension VC bornée par 
 
Classe VC de fonctions
Soient  et
 et  des classes VC de fonctions d'un ensemble
 des classes VC de fonctions d'un ensemble  et
 et  et
 et  des fonctions. Alors (cf. lemme 2.6.18[1])
 des fonctions. Alors (cf. lemme 2.6.18[1])
 est une classe VC de fonctions (rappel : est une classe VC de fonctions (rappel : ) ; ) ;
 est une classe VC de fonctions (rappel : est une classe VC de fonctions (rappel : ) ; ) ;
 est une classe VC d'ensemble ; est une classe VC d'ensemble ;
 est une classe VC de fonctions ; est une classe VC de fonctions ;
 est une classe VC de fonctions ; est une classe VC de fonctions ;
 est une classe VC de fonctions ; est une classe VC de fonctions ;
 est une classe VC de fonctions ; est une classe VC de fonctions ;
 est une classe VC de fonctions si est une classe VC de fonctions si est monotone. est monotone.
Recouvrement polynomial
Les classes VC sont des classes polynomiales, i.e. que le nombre de recouvrement est polynomiale. En effet (cf. théorème 2.6.4[1]), il existe une constante universelle  tel que pour tout classes VC
 tel que pour tout classes VC  , pour tout mesure de probabilité
, pour tout mesure de probabilité  , pour tout
, pour tout  et
 et  ,
,
 
Les classes VC de fonctions vérifient également ce type de propriété. En effet (cf. théorème 2.6.7[1]), il existe une constante universelle  tel que pour toute classe VC de fonctions
 tel que pour toute classe VC de fonctions  avec une enveloppe mesurable
 avec une enveloppe mesurable  et
 et  , on a pour toute mesure de probabilité
, on a pour toute mesure de probabilité  vérifiant
 vérifiant  et tout
 et tout  ,
,
 
Références
- (en) A. W. Van Der Vaart et J. A. Wellner, Weak Convergence and Empirical processes, Springer
-  Portail des mathématiques 
-  Portail des probabilités et de la statistique