La structure d'une invite pour créer une image avec l'IA (traduction)

Comprendre comment rédiger une bonne invite vous aidera à obtenir le résultat que vous recherchez.

Bien que certains outils d'interface utilisateur puissent rédiger des invites pour vous, la capacité de modifier, d'affiner et d'élaborer vos propres invites est une compétence qui vous sera utile.
Vous avez peut-être déjà entendu parler de "création d'invites" ou d'"ingénierie des invites".

Bien entendu, il est tout à fait possible d'obtenir des résultats remarquables sans suivre la moindre méthode. J'ai vu des images magnifiques créées à partir d'un simple mot ou d'une simple phrase. Toutefois, si vous souhaitez obtenir des résultats cohérents et améliorer les résultats obtenus, vous devez apprendre comment l'intelligence artificielle réagit aux modèles de langage.

Dans cet article, j'aimerais vous montrer le processus de réflexion que j'utilise lors de la rédaction d'une invite. En effet, s'il existe des différences de syntaxe entre les différents outils, l'approche de l'écriture est en grande partie la même.

Élaboration de l'invite

J'aime penser à l'anatomie de l'invite en quatre ensembles distincts et dans un ordre spécifique (notez que l'ordre affecte la façon dont l'IA hiérarchise les résultats).

  1. Type de contenu
  2. Description
  3. Style
  4. Composition

Examinons chacun d'entre eux dans le processus de rédaction d'une invite. 

1. Type de contenu

Lorsque vous vous apprêtez à créer une œuvre d'art, la première chose à laquelle vous devez penser est le type d'œuvre que vous souhaitez réaliser : s'agit-il d'une photographie, d'un dessin, d'une esquisse ou d'un rendu en 3D ?

L'invite commencerait donc par...

Une photographie de...

2. Description

La description consiste à définir le sujet, les attributs du sujet et l'environnement/la scène. Plus vous serez descriptif en utilisant des adjectifs, meilleur sera le résultat.

Ainsi, une description simple d'un sujet pourrait être...

La photographie d'un loup

Et le résultat pourrait ressembler à quelque chose comme ça...

 

Mais une meilleure description consisterait à ajouter les attributs du sujet aux descriptions de l'environnement/de la scène. 

Une photographie d'un loup au corps plein de colère dans des bois brumeux

Et nous obtenons ceci...

 

En plus de la description textuelle, vous pouvez également faire référence à une image et le modèle d'IA utilisera cette image comme source d'inspiration visuelle. Par exemple...

http://www.wolfsite.com/wolf.jpg Photographie d'un loup en colère dans les bois brumeux 

3. Le style

Le style artistique joue un rôle important dans le rendu, et j'aime considérer le style en trois sous-catégories :

La lumière, les détails et le style artistique.

Voici quelques mots que vous pouvez utiliser pour la lumière :

éclairage d'accentuation, contre-jour, lumière noire, lumière aveuglante, éclairage à la bougie, éclairage de concert, rayons crépusculaires, lumière directe du soleil, crépuscule, ampoule Edison, arc électrique, feu, fluorescent, lueur, lueur radioactive, bâton lumineux, lueur de lave, clair de lune, éclairage naturel, lampe néon, éclairage de boîte de nuit, lueur de déchets nucléaires, affichage à points quantiques, projecteur, stroboscope, lumière du soleil, ultraviolet, éclairage dramatique, éclairage sombre, éclairage tamisé (accent lighting, backlight, blacklight, blinding light, candlelight, concert lighting, crepuscular rays, direct sunlight, dusk, Edison bulb, electric arc, fire, fluorescent, glowing, glowing radioactively, glow-stick, lava glow, moonlight, natural lighting, neon lamp, nightclub lighting, nuclear waste glow, quantum dot display, spotlight, strobe, sunlight, ultraviolet, dramatic lighting, dark lighting, soft lighting)

Le détail d'une œuvre d'art n'est pas seulement une question de netteté, mais découle également des objectifs spécifiques de l'appareil photo ou des moteurs de rendu numérique.

Voici quelques mots que vous pouvez utiliser pour décrire les détails :

très détaillé, granuleux, réaliste, moteur irréel, rendu octane, bokeh, vray, rendu houdini, megascans quixel, profondeur de champ (ou dof), rendu arnold, 8k uhd, raytracing, cgi, réflexions lumen, cgsociety, ultra réaliste, brouillard volumétrique, overglaze, photo analogique, polaroid, 100mm, photographie argentique, dslr, cinema4d, qualité studio (highly detailed, grainy, realistic, unreal engine, octane render, bokeh, vray, houdini render, quixel megascans, depth of field (or dof), arnold render, 8k uhd, raytracing, cgi, lumen reflections, cgsociety, ultra realistic, volumetric fog, overglaze, analog photo, polaroid, 100mm, film photography, dslr, cinema4d, studio quality)

Les styles artistiques peuvent être des descriptions de différentes techniques ou être définis comme des genres artistiques historiques.

Voici quelques mots pour désigner les styles artistiques historiques :

Abstrait, art médiéval, Renaissance, baroque, rococo, néoclassicisme, romantisme, impressionnisme, post-expression, cubisme, futurisme, art déco, expressionnisme abstrait, contemporain, pop art, surréalisme, fantastique (Abstract, Medieval art, Renaissance, Baroque, Rococo, Neoclassicism, Romanticism, Impressionism, post-Expression, Cubism, Futurism, Art Deco, Abstract Expressionism, Contemporary, pop art, surrealism, fantasy)

Voici quelques mots pour désigner des techniques et des techniques artistiques :

Art numérique, peinture numérique, page couleur, présenté sur pixiv (pour anime/manga), tendance sur artstation, dessin au trait précis, carte de tarot, design de personnage, concept art, symétrie, nombre d'or, évocateur, primé, brillant, lisse, surréaliste, divin, céleste, élégant, peinture à l'huile, doux, fascinant, beaux-arts (Digital art, digital painting, color page, featured on pixiv (for anime/manga), trending on artstation, precise line-art, tarot card, character design, concept art, symmetry, golden ratio, evocative, award winning, shiny, smooth, surreal, divine, celestial, elegant, oil painting, soft, fascinating, fine art)

Ajoutons maintenant quelques styles à notre invite sur le loup.

Une photographie d'un loup en colère dans les bois brumeux, au crépuscule, en basse lumière (A photograph of an angry full-bodied wolf in the foggy woods, dusk, low-lighting)


Voici un autre exemple utilisant des éclairages et des détails différents :

Photographie d'un loup en colère dans les bois brumeux, en noir et blanc, avec un contraste élevé et un éclairage dramatique (A photograph of an angry full-bodied wolf in the foggy woods, black and white, high-contrast, dramatic lighting)


Vous pouvez constater que le style a une grande influence sur le résultat généré.

Outre l'éclairage et les détails des images, vous pouvez vous référer à des styles artistiques historiques.

Photographie d'un loup en colère dans les bois brumeux, pop art (A photograph of an angry full-bodied wolf in the foggy woods, pop art)

Voici quelques exemples de différents styles artistiques et vous pouvez constater l'influence de ces styles sur le résultat :

 


4. La composition

L'élément restant est la composition qui se réfère à...

Le rapport hauteur/largeur, la vue de la caméra et la résolution.

Le rapport hauteur/largeur est très important lorsque vous visez des objectifs spécifiques. 

Si vous créez une bannière, le rapport hauteur/largeur sera différent de celui d'un économiseur d'écran.

Voici une excellente publication qui vous montre comment les différents rapports d'aspect s'appliquent aux différentes tailles.


La vue de l'appareil photo dépend de la perspective de l'image. Votre œuvre sera-t-elle un gros plan, un grand angle, un fisheye, etc... ?

La question à se poser est la suivante : quelle est la perspective du spectateur ?

Voici quelques mots que vous pouvez utiliser pour désigner la vue de la caméra :

ultra grand angle, grand angle, portrait, vue aérienne, prise de vue en contre-plongée, prise de vue en contre-plongée, échelle massive, vue au niveau de la rue, paysage, panoramique, bokeh, fisheye, angle hollandais, contre-plongée, très longue vue, longue vue, gros plan, très gros plan (ultra wide-angle, wide-angle, portrait, aerial view, low angle shot, high angle shot, massive scale, street level view, landscape, panoramic, bokeh, fisheye, dutch angle, low angle, extreme long-shot, long shot, close-up, extreme close-up)

La résolution s'applique aux détails, à la qualité et à la taille que vous souhaitez obtenir. Les mots que vous pouvez utiliser pour désigner la résolution sont les suivants :

très détaillé, profondeur de champ (ou dof), 4k, 8k uhd, ultra réaliste, qualité studio (highly detailed, depth of field (or dof), 4k, 8k uhd, ultra realistic, studio quality.)

Ajoutons maintenant à l'invite la perspective de l'appareil photo et le rapport hauteur/largeur :

Une photographie d'un loup en colère dans les bois brumeux, vue à travers un objectif fisheye, le rapport hauteur/largeur est de 16x9 (A photograph of an angry full-bodied wolf in the foggy woods, viewed through a fisheye lens, aspect ratio is 16x9)

Vous pouvez maintenant constater que les choses deviennent vraiment intéressantes lorsque vous appliquez différentes perspectives, différents styles et différents angles de caméra.

La décomposition de la structure de l'invite

Voici la structure de l'invite d'une image :

Photographie d'un loup en colère dans les bois brumeux, avec un éclairage dramatique et le rapport hauteur/largeur est de 16x9

Rouge = Type de contenu / Vert = La description / Violet = Le style / Bleu = La composition

Et voici l'anatomie d'une invite d'art/d'illustration :

Photographie d'un loup en colère dans les bois brumeux, pop art, prise de vue en contre-plongée le rapport hauteur/largeur est de 16x9

Améliorations de l'invite

Bien que la formule fonctionne parfaitement pour obtenir toutes les catégories appropriées dans l'invite, l'amélioration de l'invite par l'ajout de plus de détails permet souvent d'obtenir de meilleurs résultats.

Certains Générateurs d'images le font par défaut, tandis que d'autres proposent une option à cet effet. Vous pouvez également demander à ChatGPT ou à Claude d'ajouter des détails à votre invite de base.

ChatGPT via DALLE améliorera automatiquement l'invite par défaut, comme illustré ici :

 

De plus, certaines générations d'images, comme Ideogram, disposent d'amplificateurs intégrés que vous pouvez activer. Il s'agit de la fonction "Invite magique" d'Ideogram :


Conclusion

J'espère que ce guide de la création d'une invite vous a été utile.

En résumé, commencez par utiliser la formule qui contient le type de contenu, la description, le style et la composition, puis améliorez-la en y ajoutant d'autres détails. Cette méthode vous permettra d'obtenir une image de qualité.

source :

https://generativeai.pub/the-anatomy-of-an-ai-image-prompt-b1b3678d3330

Enregistrer un commentaire

Les commentaires sont validés manuellement avant publication. Il est normal que ceux-ci n'apparaissent pas immédiatement.

Plus récente Plus ancienne