画像生成AI「Stable Diffusion」を使った感想を書いています。手軽に高品質な画像を作成できるようにったのは非常に便利です。とは言え、「絵を描く」というフィジカルな楽しさも人間にはあるわけで、あくまでも「便利なツール」として付き合うのが良い距離感だと感じました。
目次
Stable Diffusionとは?
Stable Diffusionは、入力したプロンプト(いわゆる「呪文」)に沿って、自動で画像を生成するAIです。ユーザーが、作成したい画像のイメージをテキストで入力すると、AIがイメージに近い画像を短時間で生成します。精度の高いプロンプトさえ入力できれば、誰でも高品質な画像を作成できるわけです。
実際に画像を生成してみる
今回は当ブログのタイトルに合う、「羊っぽい少女」を作成してみました。使用した主なプロンプトは下記です。
■プロンプト
(best quality, masterpiece:1.2),ultra detailed,kawaii,simple background,up right,anime,black outline,ray,cinematic lighting,
1 girl,smugness,bullish,open mouth,eye contact,slender,cute eye,tilting head,
white hair,short hair,wavy hair,ahoge,hair intakes,
sheep horn,
ethnic costume-like kimono,blue and white costume,blue eye,fantasy,
■ネガティブプロンプト
EasyNegative, ng_deepnegative_v1_75t,
プロンプトで特に効果を感じたのは、「ray」と「cinematic lighting」です。陰影が鮮やかな画像を生成したかったので、割りとドンピシャでした。他の品質に関するプロンプトは、定番のものを調べて入力し、あとは生成された画像をみて、少しずつプロンプトを追加していきました。
例えば、「slender」ですが、通常は大体細身のキャラが生成されますが、「sheep」のもこもこした印象からか、若干ふくよかなキャラが生成されることが多かったので、それを修正するために追加しました。こんな感じで、生成された画像がイメージに近づくように、徐々に調整していくのが大事だなと思います。
ネガティブプロンプトに関しては、「EasyNegative」と「deepnegative」という、訓練済の学習ファイルを使用しています。長々と「対抗呪文」を記入しなくて良いので便利です。
使った感想は「とにかく便利」
導入のハードルも低いし、基本的にプロンプト次第で高品質な画像を短時間で作れてしまうので、感動を覚えるぐらい便利です。今回は使っていないのですが、棒人間の画像でポーズを制御できる「Control-Net」という拡張機能もあり、もともと画像生成AIでは困難だとされていた、ポーズの指定も簡単にできます。ちなみに指定用の棒人間もBlenderで簡単に作成できました。
ここまでAIが進化してくると、イラストレーターなどの職業がなくなるのでは?と感じる方もいらっしゃると思いますが、個人的には「絵を描く」こと自体をフィジカルで楽しむ人と、「そういう人の絵が見たい!」という人がいる限り、なくなることはないかなと思ってます。自分自身、人間が作ったものが好きなので、少々願望も含まれた意見ではありますが。
まとめ
今回は、画像生成AI「Stable Diffusion」を紹介してみました。いやー何か凄い時代になりましたね。AI開発を6ヶ月停止する要請も出たとかで、まるでSFのような世の中になってきました。前回、AIが肝臓がんの治療法を開発した、という記事を書いたんですが、そんな感じで人間の生活が豊かになるように進化してくれればいいな、と願っています。
使い方が肝心
StableDiffusionの画像管理はEagleがおすすめ