Arts Générés, le grand chaos…

I – Introduction

Prologue

Au collège je me faisais pourrir quand j’osais utiliser règles et équerres pour créer mes dessins. Pour autant ces mêmes professeurs n’avaient même pas remarqué que leurs gestes démonstratifs « si naturels » ne fonctionnaient pas sur moi parce que j’étais tout simplement gaucher et qu’il me fallait tout inverser, ce qu’ils se passaient bien de préciser et faire appliquer. J’ai donc essentiellement créé mes propres formules plutôt que d’appliquer les recommandations soumises. Toujours détesté la peinture qui ne séchait assez vite pas sous ma main gauche recouvrant un geste de droitier. Et ai quand même fini par créer quasiment toute les illustrations du journal de l’école vu que « ceux qui savaient » ne voulaient pas s’en occuper.

Dans les mid eighties on me répétait que les dessins sur ordinateur que je réalisais à coups de Mac Paint et Deluxe Paint IV ce n’était pas de l’art, « c’est la machine qui fait tout ». C’était dur parce que le terme infographie n’était pas encore reconnu et qu’on se prenait au visage tous les préjugés du monde alors qu’au dessus de la souris ou de la tablette graphique c’était bien une main qui virevoltait au gré des inspirations d’un esprit dans l’effervescence. A aucun moment il ne m’est venu à l’idée de dire à ces gens gratuitement haineux par jalousie que leur « art classique » tenait donc à la qualité exclusive de quelques poils de cul de pécari faisant leurs pinceaux ou au grain de disques de ponceuses utilisées pour leurs statues. Après presque 10 ans à me faire cracher dessus par ces soi disant puristes, plus 4 années à construire de zéro un cours viable et accessible au plus grand nombre, j’ai fait valider le premier diplôme d’infographie en France par le Ministère de l’Education en 1994.

Début 2000 c’était bien entendu ce tout nouvel appareil photo, intégralement numérique, qui faisait la qualité de mes clichés. Surtout pas mon esprit ou mon œil curieux. Ou encore ma manière m’être initié aux techniques de photos classiques tout en jouant des limites de performances drastiques et parfois rédhibitoires d’un support engin qui aujourd’hui est tellement courant qu’on l’a intégré à de simples smartphones et offre de magnifique résultats à quiconque prend le temps d’ouvrir un peu les yeux sur le monde qui l’entoure. Depuis les débuts 2.000 mes clichés se comptent en centaines de milliers et atteignent des niveaux qui me surprennent moi même alors que je ne me considérais pas photographe. Mes images se sont retrouvées pour certaines dans la presse, tant pour les publicités que les illustrations d’article ou couvertures parfois.

Les nouvelles aubes qui effraient…

Aujourd’hui ce sont mes images générées qui ont le privilège des quolibets des âmes sans culture ni maitrise de ce qu’elles critiquent. Et j’avoue qu’une certaine rengaine s’est installée et je n’en tiens plus vraiment compte. Les fielleux ont en commun dans toutes ces évolutions un refus typique d’apprendre, s’initier, et une fois maitrisés détourner les nouveaux outils pour en jouer beaucoup plus loin que ce qui était supposé. Ce sont des gens ternes qui se comportent un peu comme le musicien s’en tenant strictement à la partition, incapable de nuancer ou même improviser en respectant un thème. Des yeux de poissons morts qui consomment juste ce qu’on leur présente mais sont aussi absents que leur curiosité, juste là pour s’empiffrer de consommable juste bien présenté dont ils paient essentiellement le packaging. Et ça fait bien longtemps que j’ai compris que toute discussion avec eux est parfaitement inutile.

Si tu es là c’est parce que ce qu’il reste quelques bouts de curiosité en toi qui t’ont poussé à essayer de comprendre ce qui faisait ce grand bouleversement qu’est l’arrivée des images générées. Et probablement un besoin de clairement distinguer les croyances des réalités dans ce domaine nouveau qui, sans totalement être un art, n’en est pas moins une composante qui peut permettre de créer plus loin.

Les images générées par IA nous sont arrivées à l’aube des années 2020, résultat de plus d’une décennie de cette tendance que le lambda ne comprenait pas vraiment : le Machine Learning. Pendant les années précédentes d’immenses centres de stockage ont écumé le web pour en retirer et classer les informations le constituant. Des textes, images, sons avec le plus souvent une consonance autre que la simple liste des ingrédients avalés au petit déjeuner le matin. Ces informations ont été pendant des années agrégées, condensées et classées pour dans un premier temps faire les bonheurs de statisticiens. Ça n’est que début 2020 qu’ont été tentées d’autres expériences sérieusement plus surprenantes.

L’illusion des pensées numériques

Par principe une machine ne pense pas. Comme son nom l’indique un ordinateur ne sait que ranger ; il ne créé rien, n’argumente rien. Il se contente de prendre les données qu’on lui indique et en extraire en résultats d’autres par manipulations mathématiques.

Face aux quantités massives de données extraites pour le Machine Learning, il s’est avéré impératif de les classer rigoureusement tant par type, catégories, sujets et importance. Et surtout trouver un moyen d’y accéder rapidement, sans se perdre dans des formulations complexes pour désigner ce que l’on souhaitais trouver et manipuler. C’est ainsi qu’ont commencé à émerger les premiers développement des LLM, Large Language Models, sortes d’interpréteurs entre nous et les données brutes pour pouvoir manipuler plus aisément des informations qu’une vie humaine ne suffirait pas à parcrourir puisque elles se chiffrent en milliards. Les LLMs servent pour les moteurs de recherche web par exemple, pour essayer de comprendre ce que vous recherchez et y répondre au mieux. Ce sont des modules qui interprètent vos requêtes dans l’idée de proposer en réponse les meilleurs résultats disponibles et vous autoriser moult manipulations à leurs sujets. Les systèmes en sont même arrivés à être capable de gérer une certaine locution pour proposer des résultats fluides et directement compréhensibles à l’utilisation. Cette technique d’abord pratique pour les textes s’est tout logiquement étendue aux domaines voisins comme l’image, les sons et la vidéo.

C’est ainsi que début 2020 nous avons vu arriver les balbutiements de l’art généré avec les premiers systèmes capables de comprendre une requête complexe qu’on leur posait. Et capables ensuite d’en extraire et fabriquer un résultat plus ou moins répondant à la demande. Des débuts chaotiques, faits de nombreuses erreurs et aberrations, qui en une poignée d’années ont connu une évolution fulgurante. En 2025, je, vous, nous pouvons tous générer des images très crédibles avec plus ou moins de succès en quelques lignes de description texte. Le secret de qualité de la fabrication de ces images ne tient pas tant sur les systèmes utilisés que sur, ce qu’on a tendance à oublier, la qualité de la question / description formulée. Si vous formulez mal une question, il ne faut pas être surpris d’avoir des réponses de piètre qualité ou très sommaires. Si vous maitrisez votre sujet et que nanti d’une dense culture dans ce domaine posez votre requête, vous aurez des résultats sans pareils et bien au delà de ce que n’importe quel utilisateur lambda peut demander à une machine. Comme pour l’infographie, puis la photo numérique : le résultat dépend exclusivement de votre maitrise de l’outil et du niveau de culture que vous utilisateur lui adjoignez ; un idiot ne tirera toujours que des images idiotes d’un système aussi perfectionné soit-il.

Prochains chapitres…

Il m’est impossible de vous emmener plonger dans ce sujet d’une traite car le tout nouveau domaine des images générées, qui n’en est toujours qu’à ses débuts malgré une évolution exponentielle, entraine dans sa révolution autant de chaos que de merveilles.

Les chaos ce sont les pillages massifs d’œuvres de l’esprit qui ont été nécessaires pour nourrir ces avides gouffres à données. Du piratage massif par les entreprises mettant à disposition ces générateurs qui a ce jour n’a toujours pas abouti au dédommagement de tous les créateurs concernés, du journaliste ou romancier au scientifique en passant par les illustrateurs, photographes et vidéastes. Les opportunistes de la Tech ont abusé de réglementations pas encore créées pour authentiquement violer toutes les âmes créatives de la planète. Et sachant qu’une LLM « s’epuise » ou « s’intoxique » si on ne l’alimente pas régulièrement en nouvelles données, nous sommes face à un problème préalable qu’il est vital de solutionner pour ne pas laisser les 3/4 des personnes vivant de la création sur le carreau.

Une autre partie du chaos concerne le filtrage de ces mêmes données. Si on peut admettre pour des raisons de bon sens qu’il y ait des sujets qui soit strictement limités, tels la nudité dans la génération d’images, on peut se poser la question sur d’autres restrictions qui au près d’un utilisateur responsable se révèlent comme un pur et simple bridage. En exemple concret, je travail beaucoup avec des rendus de viande brut. Visuellement ça peut être choquant car on pas l’habitude de voir des êtres vivants avec leurs intérieurs dehors. Et très souvent je doit lutter, voir gruger les systèmes pour leur faire faire l’image que je souhaite (et qu’il me serait évidemment impossible de créer en vrai). Sur cette partie très éthique, nous sommes confrontés à l’esprit purement commercial d’entreprises de la Tech qui veulent « faire bien pour tout le monde » et se foutent totalement des puristes et autres réels créatifs qui souhaiteraient repousser les limites de l’imagination. Ce poids pèse énormément et se trouve être actuellement une des plus grosses sources de l’empoisonnement des bases LLM puisque la majeure partie de ce qui est généré n’est pas original ou le Best Of mais juste « une moyenne convenable » supposée plaire au plus grand monde. Une uniformisation des normes et tendances est en cours ; un authentique danger si l’on souhaite conserver ce qui nous humains nous distingue encore des machines : originalité & caractère.

Il faudra également que je vous clarifie la façon dont une image est générée. Passant d’un brouillard de quelque nuages pixelisés à un visuel au rendu photographique troublant en de savantes passes d’interprétations, moyennes, mises au point et probabilités qui sont calculées à la vitesse de l’éclair (ou prendraient des années pour en équivalence être faites main par un humain).

Je vous donnerai aussi quelques exemples pratiques pour comprendre qu’un prompt, cette requête qu’on balance aux machines pour fabriquer notre visuel, c’est en partie une science qui dépend de 2 facteurs. L’un concernant la syntaxe, nuancée selon les systèmes utilisés, mais implacable à connaitre pour éviter de formuler des demandes de 200 mots qui n’aboutiront finalement qu’à une approximation loin du résultat espéré. L’autre facteur je ne pourrais pas vous l’apprendre car il concerne toute une vie et il s’appelle la culture. Si vous n’avez que trop peu de culture de l’image ou simplement connaissance de l’histoire de l’art vous tournerez très vite en rond sur les mêmes rendus de visuels sans trop de saveurs. Je le rappelle : on ne peut pas obtenir de résultats géniaux si l’on ne sait même pas formuler correctement la question. Et vous comprendrez très rapidement que vos connaissances des arts si disponibles vous offriront des longueurs d’avance d’une efficacité redoutable sur les gens hésitant à formuler leurs premiers prompts.

Une dernière chose…

Pour ma part cela fait 4 ans que j’expérimente, utilise et exploite les générées par IA. Pas tant par flemme (quoi que… ^^) mais surtout par complément. Parce que quand j’entends le quidam moyen hurler que « whooooa les IA say pas bien : gouffres énergétique etc » j’aimerais lui rappeler que mis en rapport avec un jet privé qui fera venir ton modèle sur un plateau qui aura déplacé 1,5 tonne de matériel en camion juste pour un cliché ce n’est peut être pas si éco-friendly que ça. Si je peux comprendre les IA-phobes pour autant je ne tolère pas leur affirmations 90% du temps stupides et sans réels arguments qui démontrent à chaque fois qu’on a une fois de plus affaire à des gens qui n’ont aucune expérience concrète du sujet et caquettent stupidement ce qu’ils ont picoré à droite et à gauche. Comme je l’ai montré en prologue, les haineux qui ont la flemme d’apprendre et ouvrir les portes de nouveaux possibles ça me passe par dessus l’épaule et je ne souhaite même plus argumenter avec ou contre eux. L’ignorance est crasse ; certains s’en feront un cercueil.

POINT TECHNIQUE :

Ces dernières années j’ai partagé assez peu de contenu original nouveau. Avec l’arrivée des images générées dans mes travaux, la quantité annuelle de visuels que j’ai fabriqué a pourtant drastiquement augmenté. D’à peine 400 annuels il y a 4 ans cette catégorie de production flirte désormais avec les 30.000 images/an ! Dans un but de transparence totale j’ai dés les premiers jours décidé de clairement distinguer mes images générées des travaux classiques que je fais. J’ai cherché une manière discrète et élégante de faire ça dans le but de ne grouger personne. Finalement ça a abouti à une modification de la signature visible passant d’un « ©Kyesos.com » à « ©Kyesos.com + LamaSheen™ » pour tout ce qui concerne les images avec plus de 60% de génératif. Un trait d’humour qui rend simple l’identification de mes travaux pour les puristes car même les yeux exercés se font désormais avoir par la majeure partie des visuels que je propose et ne savent souvent pas distinguer l’artificiel du réellement construit.

A venir, de nombreux chapitres pour décoder ensemble l’IA générative, les mythes, les réalités, les techniques et part delà les abus d’entreprise qui en profitent directement en tirer le meilleur dans l’état actuel. Suivez moi sur Bluesky.

Ce contenu a été publié dans News par K.. Mettez-le en favori avec son permalien.

A propos K.

Dompteur de pixels depuis 1984. Disponible pour vos travaux de créations graphiques, photographies, compositing, pour la décoration tant que pour le commercial. No limits.