More de l’art

Si vous n’avez pas déjà entendu parler de Midjourney, de DALL.E ou encore de Stable Diffusion, alors apprêtez-vous à recevoir une immense claque. Ces sociétés / logiciels / algorithmes font partie d’une révolution technologique qui me fascine depuis des semaines et dont j’ai encore du mal à réaliser l’ampleur. De la science fiction devenue réalité à la portée du tout venant : bienvenue dans l’ère de l’art généré par intelligence artificielle.

J’ai pu créer l’enemble des images ci-dessous grâce à cette dernière, avec pour seule limite mon imagination. Je n’ai aucune compétence en dessin ni en modélisation 3D, je tiens à le préciser.

cute little blue dragon large black eyes
steampunk laboratory, dramatic blue light, interior design, panorama, glassware, big windows
blackwork back tattoo ornate
aurora borealis and forest in snowglobe

Ma seule contribution à ces créations était une courte description textuelle (en légende) qui a permis à une intelligence artificielle de transformer mes requêtes en images inventées de toutes pièces : « mignon petit dragon bleu aux grands yeux noirs », « dessin d’un chevalier hérisson en armure », « aurore boréale avec une forêt dans une boule à neige », … Chacune d’entre elles a nécessité quelques minutes de calcul à peine pour être dessinée par la machine, complétées par quelques cycles d’ajustements pour atteindre un résultat qui me convient.

Comment est-ce possible ? Par un algorithme de deep learning nommé Stable Diffusion qui permet d’associer des textes à des images. De façon très très grossière, imaginez donner à un logiciel l’ensemble des images de Google et tous les mots-clefs utilisés pour les décrire, ce qui forme une base d’apprentissage. L’intelligence artificielle (IA) va apprendre quelles caractéristiques visuelles correspondent à quels mots (ou ensembles de mots), créant ainsi des modèles. Lorsqu’on lui demandera de produire une image à partir de mots-clefs, le programme va utiliser les modèles correspondants pour reproduire les caractéristiques associées. Et si ces mots ne sont jamais apparus ensemble, il va faire de son mieux pour les combiner !1

More de l’art

The Fifth Element (1997)

Midjourney est le premier laboratoire qui a rendu cette technologie acessible au grand public, et c’est la plateforme que j’ai utilisée pour mes expérimentations. Elle a l’avantage de proposer un essai gratuit d’une vingtaine d’images et une grande facilité d’utilisation (pour peu qu’on sache utiliser le logiciel de chat Discord).

Il suffit de « discuter » avec l’IA en lui envoyant une liste de mots clairs et concis pour qu’elle réponde des propositions d’images une ou deux minutes plus tard. Après quelques premiers essais hasardeux, j’ai réalisé qu’il était préférable de ne pas donner trop de détails qui risquent d’acculer l’algorithme dans la vallée de l’étrange. Il y a un côté bien plus fascinant de le laisser choisir sa propre « direction artistique ».

Par exemple, j’imaginais une femme se tenant au bord d’une falaise au crépuscule. J’ai envoyé « woman standing cliff ocean dusk » dans la fenêtre de discussion avec l’IA, qui m’a répondu avec les propositions suivantes :

Il est fascinant d’observer en direct quatre idées floues prendre de plus en plus de détails au fur et à mesure que l’IA raffine ses réponses. Ces quatre images sont des croquis préliminaires : une fois esquissés, on peut en demander des déclinaisons ou d’en détailler l’un d’entre eux. Ici, j’ai demandé des variations de l’image n°3 qui était ma préférée :

Finalement, c’était la proposition 3 du premier cycle d’esquisses qui me plaisait le mieux. J’ai alors demandé à l’IA de la raffiner au maximum…

… pour atteindre le résultat final ci-dessous !

Alors oui, il y aurait quelques détails à peaufiner sur la silhouette notamment. Je pourrais réitérer le processus de variations et d’amélioration jusqu’à avoir un résultat qui me convient parfaitement, ou bien je pourrais prendre le relais et retoucher l’image à la main. Dans tous les cas cela me paraît bien plus à ma portée que de générer cette image par moi-même depuis zéro !

Par ce procédé, j’ai pu en quelques cycles créer les arcanes majeures d’un jeu de tarot gothicolovecraftien dont la richesse et les détails transcendent de très loin ma propre inventivité et créativité :

Le Chariot, la Grande Prêtresse, le Hiérophante, la Justice

Durant mes nombreux essais, j’ai vu apparaître dans les coins de certaines propositions des glyphes qui ressemblaient fort à des signatures. À y réfléchir c’est plutôt logique : la base d’apprentissage de l’algorithme contient aussi des images signées par leurs auteurs. Les signatures vont donc être intégrées par l’IA à ses modèles, et vont ainsi potentiellement apparaître dans les images qu’elle générera…

Est-ce voler un artiste que d’utiliser ses œuvres pour entraîner une intelligence artificielle ? Les images synthétisées en retour sont-elles une forme de plagiat ? À qui en appartiennent les droits ? Une telle technologie enfermerait-elle notre créativité dans un remâchage d’œuvres existantes ? Si vous apprenez à dessiner en vous inspirant du style de quelqu’un d’autre, ne pourrait-on pas vous poser les mêmes questions ?

Évidemment qu’une telle technologie accessible à tous pose un million de questions et ouvres les portes d’un enfer éthique sans limites. Utilisons notre bonne vieille Règle 34 comme autre exemple : la première utilisation de ces algorithmes en quantité d’images générées est du domaine pornographique, ce qui n’est pas si problématique en soi – jusqu’à ce qu’on y colle la tête de personnes qui n’ont pas donné leur accord pour cet usage. Il n’a certes pas fallu attendre l’IA pour que de tels détournements se fassent, l’inquiétude actuelle réside plutôt dans le fait que ces derniers deviennent de plus en plus faciles d’accès, réalistes et difficiles à détromper. Voyez les deepfakes ci-dessous…

Drobyshev et al. 2022

Outre les risques de détournements identitaires et autres manipulations peu morales, revenons-en au contexte artistique : la critique majoritaire que je lis au sujet de telles technologies est qu’elles signent la mort de l’art. Puisque n’importe qui peut générer une œuvre d’art en quelques clics, les artistes n’ont plus aucun mérite ni crédit et vont tout simplement ne plus pouvoir vivre de leur travail. Une image créée avec Midjourney a même gagné le premier prix d’une compétition artistique, au grand dégoût des autres participants. Je roule toutefois des yeux aussi fort que Brad Pitt ci-dessus quand j’entends que l’intelligence artificielle est une menace à la création artistique ; pour moi au contraire, elle la démultiplie !

Lors d’une chouette expo sur l’intelligence artificielle au Musée de la Main, j’ai découvert l’AI Song Contest : un Eurovision dont toutes les chansons ont été créées sur la base d’intelligence artificielle. Certaines entrées sont plutôt hasardeuses et expérimentales voire même totalement inaudibles, mais dans le tas il y a aussi de merveilleuses trouvailles comme : « tiens, ça donne quoi si on donne à une IA un ensemble de musiques traditionnelles coréennes, de morceaux de dubstep, et de paroles de chansons de K-Pop ? »

HAN:한 MV

The strength of artificial intelligence is the power to generate coincidences.

H:Ai:N

Restons réalistes, la chanson ci-dessus n’est pas (encore ?) un produit 100% généré par intelligence artificielle. Sur la base créée par cette dernière il y a eu un sacré travail humain : redécoupage sonore, enregistrement d’instruments complémentaires et agencement de paroles. L’IA est un outil et non pas une finalité ; par conséquent elle n’a de menaçant que les applications malveillantes que des humains en chair et en os peuvent en dériver.

J’entends bien les artistes terrifiés d’être remplacés par des machines et de ne plus pouvoir vivre de leur art. Je trouve cela toutefois terriblement réducteur de blâmer l’outil et son accessibilité en s’opposant au développement et à l’utilisation de telles technologies. Personnellement, je trouve que l’inquiétude générale – et légitime – face à leur émergence révèle avant tout la vérole d’un système économique qui rend la situation des artistes tellement fragile.

Je n’ai pas beaucoup creusé ma réflexion à ce sujet et l’article cité ci-dessous développe des arguments bien plus robustes que les miens, mais je me pose la question suivante : si l’art était soutenu par une forme de patronage ou pouvait s’appuyer sur un revenu universel, si le système artistique ne dépendait pas tant de la propriété intellectuelle pour tenir debout, les artistes se sentiraient-ils tout autant menacés ?

What I don’t like about AI tech is not that it can produce brand new 70s rock hits like ‘Keep On Glowing, You Mad Jewel’ by Fink Ployd, but how it reveals that that kind of derivative, generated goo is what our new tech lords are hoping to feed us in their vision of the future. I think AI art, just like NFTs, is a technology that just amplifies all the shit I hate with being an artist in this feudal capitalist dystopia, where every promising new tool always ends up in the hands of the least imaginative and most exploitative and unscrupulous people.

Simon Stålenhag, via un article passionnant à ce sujet

Je l’écrivais plus haut, je n’ai aucune compétence en dessin et n’ai pas particulièrement l’intérêt d’en acquérir. Je suis toutefois habitée par des univers imaginaires personnels très chers à mon cœur, que je n’ai jusqu’ici jamais réussi à retranscrire. Par la série d’images ci-dessus, l’intelligence artificielle m’a permis pour la première fois de projeter des scènes qui sont enfermées dans ma tête depuis des années voire décennies. Vous n’avez pas idée à quel point en voir certaines ainsi m’émeut.

Dans un registre moins psychanalytique, je me suis aussi servie de Midjourney pour créer des pochettes de mes playlists musicales et avouez qu’elles en jettent plutôt pas mal :

J’avoue avoir passé plusieurs heures ces derniers jours à générer des centaines d’images de tout ce qu’il me passait par la tête, et tout autant à regarder défiler les requêtes d’autres utilisateurs (à se demander quel est le bilan carbone de calculer ainsi des millions d’images par jour…)

Un raz-de-marée visuel qui donne le tournis et me fait me poser plein de questions sur ma propre créativité. Un tel outil me rend-il plus imaginative, ou plus paresseuse ? Si ce n’est pas la mort de l’art, est-ce la mort de l’effort ? Est-ce que j’ouvre la porte de mondes fictifs qui m’étaient jusqu’ici inaccessibles, ou est-ce que je m’enferme dans des choix prémâchés qui ne sont pas les miens ?

La dernière requête que j’ai envoyée à l’intelligence artificielle avant de publier cet article était mon pseudonyme, « Eliness », sans aucune autre indication. En voici ci-dessous l’interprétation par une machine. Force m’est de constater qu’il me plaît beaucoup, mon portrait robot.

Eliness

J’ai acheté un mois d’abonnement à Midjourney pour financer les ressources nécessaires à la génération de toutes ces images. Il me reste encore quelques crédits aussi n’hésitez pas à passer commande de l’une ou l’autre vision en commentaires si ça vous dit :)

  1. Merci beaucoup Charlotte pour le partage des diaporamas et références auxquelles tu as eu accès, ça m’a été très utile ! Pour les calés, l’article scientifique associé est par ici : Ommer et al. 2022