AIで一言で画像を生成するだけ?あなたも欲しいものをAIで作れる
現在、MidjourneyはBokaが最もよく使うAI画像生成ツールで、彼女の手によってフランス風イラスト、3DスタイルのIPキャラクター、マッチ3ゲームのアート素材などが生み出されています。
あなたのAI、私のAI、どうやら違うようです。AIは素人でも一言で画像を作り出せますが、具体的な特定のスタイルの作品を生成することは、多くの人にとってまだ難しいことです。
理由は主に2つあります。AIが完全にコントロールできないこと、そして私たちがAIをよく理解していないため、適切なアプローチができないことです。
Bokaに「プロンプトを書くコツは何ですか」と尋ねると、Bokaは落ち着いて「実は英語ができれば大丈夫です」と答えました。
これは確かに大前提ですが、AIを思い通りに動かすための具体的で実行可能な方法論もあります。
まず、AIに何を生成させたいのかを知る必要があります。
Bokaが詳しい欧米のマッチ3ゲーム(3つ以上の同じ要素を消すパズルゲーム)を例にとると、背景画像、消去するためのパターン、様々な報酬を表すアイコンがあり、異なるシーンのデコレーション要素を解除するゲームプレイと組み合わせると、ソファなどの家具もあるかもしれません。
この時、どのようなアイテムを生成する必要があるかを直接プロンプトに書けばよいのです。宝箱は「treasure chest」、鍵は「key」といった具合です。
次に、アートスタイルをどのように決定するのでしょうか?
一つの方法は、チュートリアルや他の人のプロンプトを学び、特定のプロンプトを蓄積することです。
AIでマッチ3ゲームのインターフェースを生成するために、BokaはAIを使ってUIアイコンをデザインする多くのYouTubeビデオを見ました。
そこから彼女は重要なプロンプト「multiple item spritedsheet」を学びました。これを使って関連する複数のパターンを含む画像セットを生成することで、アイコンのスタイルや角度の一貫性を保ち、AIが脱線するのを避けやすくなります。
もう一つの方法は、AIに適切なプロンプトを教えてもらうことです。
再びマッチ3ゲームを例にとると、背景画像で天井から見下ろす俯瞰効果を実現したい場合、どのようにプロンプトを書けばよいでしょうか?
Bokaのやり方は、まず急いで書かずに、要求に合った画像を見つけ、それをMidjourneyにアップロードし、Describe機能を使ってその画像のプロンプトを生成させることです。
同時に、AIが提供するプロンプトをそのまま使う必要はありません。視点に関連する部分だけを取り出し、「a top-down view of an interior room」(室内の俯瞰図)を自分のプロンプトに組み込めばよいのです。
しかし、プロンプトを適切に書くだけでは不十分です。多くのAI画像のスタイルは似通っており、明るく、油っぽく、個性に欠け、見てすぐに忘れてしまいます。
Bokaは説明します。これはAIモデルの本質上、その画風が収束的で大衆的なものになるためです。言語だけで画面を描写すると、AIが生成するのはしばしば普通の、退屈な、欧米の美的感覚に合った画像になってしまいます。
同時に、言語は正確ではないため、私たちが望むスタイルを直接生成するのは難しいのです。「中国風」と言っても、千人の心の中に千通りの答えがあるかもしれず、AIも私たちがどのタイプを望んでいるのかを理解できません。
最も簡単な解決策は「画像を添付する」ことで、AIに明示的な指示を与えることです。Midjourneyの場合、関連する画像をアップロードし、スタイル参照機能「--sref」を使用することで、画風を固定できます。
つまり、プロンプトが変わらない場合、添付画像が画像の品質とスタイルを直接決定すると言えます。添付画像のスタイルが独特であればあるほど、生成される画像もありきたりではなくなります。
Bokaの経験によると、添付画像は複雑である必要はなく、シンプルなほど効果が直接的です。欧米のカートゥーンスタイルで背景が白い箱の画像を添付すれば、平凡なアイコンを欧米のマッチ3ゲームのスタイルに合ったアイコンに変えることができます。
これらの画像生成の経験は、すべてBokaがチュートリアルを学び、実践することで得たものです。
Bokaは、試行錯誤を重ねれば、プロンプトにせよワークフローにせよ、すぐに自分なりのAI方法論を見出し、熟練できると信じています。なぜなら彼女は「AIは実際にはハードルが低い」と感じているからです。
AIを急いで受け入れる必要はないが、一度使い始めたら全ての機能を活用すべき
計算すると、Bokaが生成AIを使い始めてからまだ8〜9ヶ月しか経っておらず、最もよく使うツールはChatGPT、Midjourney、KREA(高解像度修復ソフトウェア)の3つだけで、「シンプルイズベスト」の心構えです。
Midjourneyは2022年7月に登場しましたが、以前一文で生成された画像を見たとき、Bokaはあまり強い衝撃を受けませんでした。なぜなら品質があまり良くなかったからです。
今年初め、AI画像生成ツールに大きな更新がいくつかあり、技術がより成熟し、制御可能な小機能が増えたことで、徐々に商業化の可能性が見えてきました。そこでBokaは、真剣に取り組む時が来たと感じました。
新しい技術に対するBokaの態度は、学ぶことは確実に必要だが、より成熟した製品をもう少し様子見してもよいというものです。そうしないと、無駄な労力を費やすことになるからです。実際に使い始めたら、できる限り活用すべきです。
Midjourneyの機能は昔から変わらないいくつかのものですが、これらの機能を上手く使いこなすことも、非常に練習が必要なプロセスだと思います。
AIはまだ完全にコントロールできず、画像生成の試行錯誤は日常的ですが、AIが勝手に暴走しないようにする解決策はいくつかあります。
BokaはMidjourneyを使って多くのIPデザインを行っており、よく2つの機能を使用しています:スタイル参照機能「--sref」で画風を固定し、キャラクターの一貫性機能「--cref」でキャラクターの外見を固定します。
このようにして、複数回生成した後でも、画像間の類似度は80〜90%を維持できます。
時々、AIが生成する画像が不完全な場合があります。例えば、全身のIPキャラクターが欲しいのに、AIが生成した結果に足がない場合です。
Bokaは、何度か試すか、Midjourneyの画像拡張機能「Zoom Out」を使用して画面を拡大し、AIに元々欠けていた部分を生成させることを提案しています。
また、AIはしばしば細かい、不要なものを生成することがあります。Bokaは Midjourneyの特定領域編集機能「Vary(Region)」を使用して、簡単に削除します。