Stable Diffusionの生成モデル、Stable Diffusion XLのベータ版がリリースされました。
Stability AI社が発表したnoteの記事を見ると、企業向けのAPIを通じて提供されるとの記載がありますが、タイトルにある通り、DreamStudioというサイトにて一般公開されていて、すぐに使うことができます。
さっそく触ってみたところ、Stable Diffusion 2.1の生成モデルよりもかなりリアルな画像を生成できるようになっていましたので、サンプルとともに使用感をレビューします。
DreamStudioについて
DreamStudioはStability AI社が運営する、無料で商用利用可能なAIイラストを作ることができる画像生成AIサービスです。
アカウント登録するとクレジットが付与されて、そのクレジットの範囲内では無料で使うことができます。クレジットが足らなくなったら、10ドルで1000クレジット購入することもできます。
こちらがDreamStudioの画面です。
以前はこんな感じの画面でしたが、久しぶりにアクセスしたら上記の画面になっていたので、Stable Diffusion XLのベータ版リリースとともにUIも変更されたのかもしれません。
画面左上のメニューで生成モデルを選択することができて、Stable Diffusion XL以外にもこれまでの生成モデルも選択可能です。
その下にあるスタイルというメニューで、生成される画像の作風をコントロールできます。後ほどサンプルをお見せしますが、スタイルの変更で出力される画像の雰囲気がかなり変わります。
プロンプトとネガティブプロンプトを入れて画像生成してみたのがこちらです。写真のようなかなりリアルなAIイラストが生成されました。
ちなみに、Stable Diffusion XLはクレジットの消費が少し多めです。Stable Diffusion 1.5では3枚当たり1クレジットを消費しますが、Stable Diffusion XLは3枚当たり2.5消費します。画像生成して遊んでいるとあっという間にクレジットがなくなってしまうので、ご注意ください。
Image to Image機能
画像をアップロードできる機能もついていて、Leonardo.Aiのようにプロンプトと画像を掛け合わせて新しい画像を生成できます。
元画像の構図やポーズを活かしてプロンプトの要素を加えた新しい画像が生成されました。今回アップロードした画像はLexicaのCGっぽさが残る「写真風」AIイラストでしたが、Stable Diffusion XLによってかなり写真っぽさが強い画像として生成されています。
スタイルをanimeに変更してみたのがこちら。同じ元画像・同じプロンプトでも、これくらい生成される画像の質感が変わりました。
短いプロンプトでどのような画像が生成されるか
公式の発表によると、より短いプロンプトの使用で描写的なイメージを作り上げると書かれていたので、「beautifle girl」とだけ入力して画像を生成してみます。
短いプロンプトでも、かなりクオリティの高い画像に仕上がりました。この画像はそれぞれスタイルを変えてみてますが、アニメ絵よりも写真系の画像が得意な印象ですね。
こちらは「japanese cute girl with hand」と入力して作った画像です。手の生成に違和感が出たので、短いプロンプトでの生成も上手になったとはいえ、より細かくプロンプトを書いた方がより良い結果になりそうです。
過去の生成モデルとの比較
Stable Diffusion 1.5、2.1とXLの画像を比較してみました。
どの生成モデルも、人の顔っぽさはあるものの、1.5と2.1はどこかAIっぽさが匂います。
Midjourneyとの比較
写真のようなリアルな画像を作るのは、Midjourneyの強みだと思っていましたが、Stable Diffusion XLの画像と並べるとかなりいい勝負してます。
僕は今回の動画制作・記事執筆にあたり、実験として女性の顔でしか比較してないので、Stable Diffusion XLがどれだけ汎用性が高いかわかりませんが、今後は写真風画像が欲しい時にMidjourneyだけでなくDreamStduioでも試してみたいと思えるクオリティでした。
最後に
というわけで、ベータ版がリリースしたばかりの生成モデル、Stable Diffusion XLをDreamStudioで触ってみました。
無料で使えますので、どんな画像が生成されるのか気になった方はぜひお試しください。