Elle est plus importante que l’avènement des réseaux sociaux, elle est aussi majeure que l’accès universel à Internet. C’est l’intelligence artificielle générative. Elle va tout simplement changer le monde.
Tout a commencé par ce qu’on appelle les grands modèles de langage. GPT-3 est l’exemple le plus connu. Il est issu de la start-up de San Francisco, OpenAI.
En construisant un superordinateur suffisamment puissant et en l’entraînant avec des milliards de données aspirées de l’Internet, l’IA peut produire quelque chose de totalement nouveau.
Il suffit de la solliciter par un simple texte descriptif en langage naturel (ou prompt), pour qu’elle génère un texte indiscernable de celui rédigé par un humain. Puis des versions modifiées de l’IA ont permis de générer de la même façon, des images, des vidéos ou encore, des fichiers audios.
La puissance de l’IA générative a commencé à entrer dans la conscience collective il y a quelques mois, lors de la sortie de DALL-E 2 d’Open AI, un modèle permettant de produire des visuels époustouflants qui ont ébloui les internautes.
Depuis, Google a sorti sa version Imagen, Microsoft a lancé Midjourney, Meta; Make-A- Video et la start-up britannique Stability AI; Stable Diffusion.
Pourquoi un tel engouement?
L’IA générative se distingue des autres technologies à la mode comme la cryptomonnaie ou les NFT, tous deux acclamés comme des révolutions, mais qui en réalité n’ont jamais décollé auprès du grand public, alors que DALL-E 2 peut se prévaloir de 1.5 million d’utilisateurs et Midjourney, 3 millions de personnes actives sur son serveur Discord. C’est donc un véritable envol.
Différentes industries créatives utilisent déjà ces modèles d’IA dans leur travail au quotidien. Ils sont publicistes, illustrateurs, artistes, architectes ou cinéastes.
Et plus d’un million de programmeurs bénéficient de l’outil d’OpenAI GitHub Copilot, pour exécuter des saisies automatiques. Ils tapent une ligne de code Python et l’IA génère la suite.
Néanmoins il subsiste encore beaucoup d’inquiétudes sur ce type d’IA. Ne serait-ce que la sempiternelle question de savoir si les artistes et les illustrateurs vont perdre leur emploi et qu’en est-il des droits d’auteur. Tous ces modèles d’IA sont formés à partir de différents types de documents, dont certains sont protégés. Et faut-il craindre un déferlement de fake news et de deepfakes?
Les risques de dérives
DALL-E 2 ou Midjourney utilisent des algorithmes propriétaires, accompagnés de règles strictes. Impossible par exemple de solliciter un contenant avec «Donald Trump» ou tout autre personnage public connu. La pornographie, la nudité et la violence sont également proscrites au risque de se faire bannir de la plateforme.
Stable Diffusion de Stability AI par contre est libre d’accès en open source depuis le 22 août dernier. Sans garde-fou. N’importe qui peut télécharger une version totalement gratuite et l’exécuter sur son ordinateur. Il peut le modifier ou l’affiner. Il peut retirer les filtres de sécurité.
Interview de Emad Mostaque, PDG de Stability AI
Des journalistes du New York Times ont interviewé Emad Mostaque, le PDG de Stability AI. Ancien gestionnaire de fonds spéculatifs et négociant en pétrole, il a fait irruption sur la scène de l’IA en provenance de nulle part pour devenir l’une des figures les plus influentes. Sa start-up a atteint une valorisation de près d’un milliard de dollars après avoir levé 101 millions de dollars.
Stability AI a donné cet outil gratuitement à tous ceux qui voulaient l’utiliser, quasiment sans aucune règle. Pourquoi avez-vous adopté cette approche?
Nous croyons que c’est un bien public et un droit à la liberté d’expression. Le débat sur les responsabilités de l’IA ne doit pas avoir lieu derrière les portes fermées d’une poignée de grandes entreprises technologiques.
Ce dialogue me fait penser à celui tenu autour des réseaux sociaux au cours de la dernière décennie, prônant des idées très similaires sur la démocratisation des opinions en donnant la parole à chacun. Dix ans après, même si la technologie a été créée avec les meilleures intentions du monde, beaucoup de mal a été fait. Quand je regarde ce que vous faites, je pense que vous allez accélérer à la fois le bon et le mal à un rythme très rapide. Et donc ma question pour vous est quel est votre argument pour cette accélération? Qu’est-ce qui justifie de tout faire en même temps?
L’approche que nous adoptons consiste à faire confiance aux gens et à la communauté, plutôt que d’avoir une entité centralisée qui contrôle la technologie la plus puissante du monde. Nous venons d’annoncer un prix de $200 000 pour le meilleur détecteur de deepfake open source. Nous lui avons consacré dix fois plus de temps de calcul que pour le modèle de génération d’images. Il sera utilisé pour identifier les contenus illicites et abusifs entre autres.
Une différence intéressante entre l’IA générative et les réseaux sociaux, est que ceux qui sont le moins censurés, comme Parler, Truth Social et Getter, n’ont pas beaucoup de succès. Alors que Twitter, Facebook, Instagram et TikTok, qui ont des règles assez strictes, sont très populaires. Pour ce qui concerne l’IA générative, le marché semble choisir l’ouverture. Stable Diffusion a plus d’utilisateurs que DALL-E 2 ou Midjourney.
Oui, c’est vrai et comment expliquer cette différence? Sur les réseaux sociaux, l’intelligence artificielle partage les informations, alors que les médias génératifs sont une expérience plus personnelle. Il n’y a pas d’aspect social.
Avec 5892 processeurs, vous avez là l’un des plus gros superordinateurs au monde. Quelle taille pensez-vous atteindre?
Nous allons multiplier sa taille par 5 ou 10. Il sera l’un des plus rapides. Pour la diffusion de Stable Diffusion, nous avons pris 100 000 gigaoctets d’images, soit 2 milliards d’images, et nous avons utilisé cet énorme superordinateur pour les réduire à un fichier de 2 gigaoctets. Il fonctionne maintenant sur un iPhone. C’est un fichier qui peut créer n’importe quoi.
À votre avis, au-delà des professions créatives, cette technologie va-t-elle avoir une incidence dans le droit, la médecine, la science, le journalisme?
À 100%. Elle aura une incidence dans tous les domaines. Parce que nous l’avons rendu open source et gratuit pour le monde entier, 200 000 développeurs l’ont téléchargé en quelques semaines et il y a déjà eu 1000 projets différents réalisés. Ils ont créé des choses étonnantes.
Je vous ai livré ici des extraits d’un nouveau podcast du New York Times intitulé Hard Fork, «Offrant un regard hebdomadaire sur l’avenir qui est déjà là».
Vous avez trouvé une erreur?Merci de nous la signaler.
Innovation – Stable Diffusion, l’IA générative sans limites
Alors que Mark Zuckerberg s’enferre dans son projet de métavers et que TikTok prend le contrôle de l’Internet, la prochaine vraie révolution technologique est en train de se dérouler sous nos yeux.