Qu’est-ce qu’un Réseau Antagoniste Génératif (GAN) ?

Définition

Un réseau antagoniste génératif (GAN) est un système d’intelligence artificielle composé de deux réseaux de neurones qui “jouent l’un contre l’autre”.

definition-gan-iaSource : https://www.jedha.co/formation-ia/generative-adversarial-networks-gan-principes-et-usages 

Le premier, appelé générateur, crée des images ou des données artificielles.

Le second, appelé discriminateur, essaie de déterminer si ces données sont vraies ou fausses.

Avec le temps, le générateur apprend à produire des résultats de plus en plus réalistes, car il essaie de « tromper » le discriminateur.

De son côté, le discriminateur tente également d’être plus performant pour détecter les erreurs. D’où ce nom de réseau antagoniste.

Voici une vidéo qui explique ce concept de façon vulgarisée. La vidéo elle-même a été générée par l’IA (NotebookLM).

Quels sont les avantages clés des GAN ?

1. Générer des contenus très réalistes

Le premier avantage des GAN est leur capacité à créer des contenus synthétiques avec un réalisme bluffant.

Ils peuvent générer des images, des visages, des objets, des textures ou encore des scènes visuelles d’une grande précision.

C’est pour cette raison que les GAN ont longtemps été associés aux progrès spectaculaires de la génération d’images.

L’outil Midjourney illustre bien cette évolution technique.

L’intérêt n’est pas seulement de produire une image de qualité.

Le véritable enjeu est de générer une donnée « nouvelle » à partir des caractéristiques statistiques des données d’entraînement.

Par exemple, un GAN entraîné sur des images de visages peut générer un visage artificiel crédible, sans qu’il corresponde nécessairement à une personne réelle.

2. Apprendre les régularités profondes des données

Un GAN ne se limite pas à copier les exemples qui lui sont fournis.

Son objectif est d’apprendre la structure profonde des données : formes, proportions, textures, relations visuelles, variations possibles.

Cela est possible, notamment grâce à la vectorisation.

Cette capacité est fondamentale, car elle permet au modèle de produire de nouveaux exemples cohérents avec le domaine étudié.

Dans le cas d’images de chaussures, par exemple, le GAN peut apprendre qu’une chaussure possède généralement une semelle, une forme allongée, une ouverture, etc. Il peut alors générer une image de chaussure qui n’existe pas, mais qui paraît crédible.

3. Créer des données synthétiques utiles

Les GAN peuvent aussi servir à produire de nouvelles données artificielles. Elles sont dites « synthétiques ».

Cet usage peut être intéressant lorsque les données réelles sont rares, coûteuses, sensibles ou difficiles à collecter.

C’est de plus en plus le cas, car une grande partie des données ouvertes (Wikipédia, blogs, médias…) a déjà été exploitée par les modèles d’IA. C’est ce que met en avant le Data wall.

Dans certains domaines, comme la santé, la recherche ou l’industrie, il est complexe d’obtenir suffisamment de données exploitables.

Les données synthétiques peuvent alors compléter un jeu de données existant, tester un système ou entraîner d’autres modèles d’IA.

Cette possibilité doit toutefois être utilisée avec prudence. Une donnée synthétique n’est pas automatiquement fiable.

Elle peut reproduire les biais des données d’origine, manquer de diversité ou donner une impression trompeuse de réalisme.

Quelles sont les limites des GAN ?

Malgré leur intérêt, les GAN présentent plusieurs limites importantes.

Cela explique pourquoi cette technique n’est pas toujours la plus adaptée aujourd’hui selon les cas d’usage.

1. Un entraînement difficile à stabiliser

La première limite des GAN tient à leur mode d’entraînement.

Comme le générateur et le discriminateur apprennent en même temps, l’équilibre est fragile.

Si le discriminateur devient trop performant, le générateur peut ne plus réussir à progresser.

À l’inverse, si le discriminateur est trop faible, le générateur reçoit un signal d’apprentissage peu utile.

L’entraînement d’un GAN peut donc devenir instable. Le modèle peut ne pas converger correctement, produire des résultats médiocres ou nécessiter de nombreux ajustements techniques.

C’est l’une des raisons pour lesquelles les GAN sont souvent difficiles à maîtriser en pratique.

2. Le risque de “mode collapse”

Le mode collapse est l’un des problèmes les plus connus des GAN.

Il se produit lorsque le générateur trouve une solution trop limitée pour tromper le discriminateur. Au lieu de produire une grande diversité de résultats, il génère toujours des contenus très similaires.

Le modèle peut donc sembler performant à première vue, car certaines sorties sont réalistes. Mais en réalité, il ne représente pas correctement toute la diversité des données d’origine.

Par exemple, un GAN entraîné à générer des visages pourrait produire plusieurs visages crédibles, mais avec des caractéristiques très proches : mêmes formes, mêmes expressions, mêmes types de traits.

Le résultat est alors réaliste, mais trop pauvre.

3. Des risques éthiques liés aux contenus synthétiques

Les GAN posent aussi des questions éthiques importantes.

Leur capacité à produire des contenus réalistes peut être utilisée pour des usages légitimes : création visuelle, simulation, recherche, anonymisation partielle.

Mais elle peut aussi être détournée.

Les GAN peuvent contribuer à la création de deepfakes, de fausses images, de contenus trompeurs ou de supports de désinformation (propagande).

deep-fake
Source : https://www.wired.com/story/deepfakes-getting-better-theyre-easy-spot/

Le problème ne vient donc pas uniquement de la performance technique du modèle, mais de l’usage social qui peut en être fait.

Plus un contenu synthétique devient réaliste, plus il devient nécessaire de mettre en place des mécanismes de traçabilité, de transparence et de vérification.

C’est l’enjeu de l’IA éthique.

Ce qu'il faut retenir

Le réseau antagoniste génératif (GAN) représente aujourd'hui une technologie clé du deep learning.

Le GAN permet notamment de créer des images hautement réalistes. C'est cette technique que l'on retrouve dans des outils d'IA comme Midjourney.

Le GAN fonctionne sur un principe de "compétition" entre deux réseaux de neurones artificiels. Ce qui explique le terme "antagoniste".

Malgré sa performance impressionnante, le GAN pose inévitablement des problématiques éthiques.

L'exemple le plus évident est celui de la propagation de deep fakes.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Retour en haut