今話題の画像生成AIは、文字を入力として画像を生成するが、その文字列のことをpromptという。
自然言語でも生成出来るが、クオリティを上げるにはpromptを理解するしかない。
その参考文献として、DALL-E2 prompt bookというのがある。
アニメ風の画像を生成するのに、「In the style of Studio Ghibli」を入れれば良いと、日本語で検索すると出てくると思うが、
なんでジブリ?と思った人は居ないだろうか?
おそらくDALL-E2 prompt bookに書かれているので、それで試しているところから広まったのだろう。
さて自分が欲しい画像をどうやって表現するのかだが、DALL-E2 prompt bookを見ると、美術史とも呼べる単語が並んでいる。
Pixar、1990s Disney, cel shading辺りはわかるが、Mythological map、Fayum portraitなどなど。
アーティスト名についても、
「Inspired? Try Google's Arts & Culture Hub to find 13,000 more artists you can work with.」と
自分が生成したい画像が出てこなくて悩んでいるときに、誰と誰の画風を合わせればいいかや、どの美術カテゴリーに入っているか、
教養が試される。
映画やテレビのプロンプトをハックしろとDALL-E2 prompt bookには書かれてるいるが、これも教養の類だろう。
ファッションもそうだ。
>> 異世界転生モノとしてファッションの絵を描く場合、ドレスや装飾の名前をプロンプトに入力出来るだろうか? << そんな必要なときちょっと調べれば分かることを教養だとか...