画像生成AIを本格的に使い始めたのが2023年2月頃からなんですが、久しぶりに当時生成した画像を見てみて、たった1年でだいぶ進化したなと。
今回は、2024年3月現在の画像生成AIを使って、当時の画像と同じようなものを作るとどんな質感のAIイラストが作れるのか比較してみます。
定番プロンプト「coffee on the table」で作った昔の画像
僕はサンプル画像を作る時によく「coffee on the table」というプロンプトを使ってました。
当時のStable Diffusionで作ったcoffee on the tableの画像がこちら。おそらくバージョン1.5だと思います。結構頑張ったつもりでしたが写真っぽくはならなかったです。
当時よくお世話になっていたLexicaというサービスではこんな感じ。当時はすごく感動しましたが、今見るとCGっぽさを感じますね。
DALL·E 2で作ったコーヒーがこちら。暗がりなのでうまく誤魔化せてる感じの写真風画像という印象です。これはこれで好きです。
現在のMidjourneyで作った「coffee on the table」
画像生成AIを使い始めた当時はあまり触ってなかったんですが、いまではMidjourneyを多用してまして、この記事執筆現在の最新バージョンであるV6で作ったcoffee on the tableの画像がこちらです。かなりリアルですよね。
ちょっと誇張しすぎというか、コントラストが強すぎる感じもしますが、Midjourney V6ってこんな感じの印象です。パキッとした写真風画像を作ってくれます。
一応比較として写真も貼っておきます
画像生成AIのクオリティを実感するために、僕が撮影したコーヒーの写真も貼っておきます。
ブラックコーヒーの写真です。
こちらがカフェラテの写真。
こうやって写真を見ると、Midjourneyの画像はリアルさに欠けるような印象がありますけど、でも現像の時点でコントラスト強めたりしたら結局は写真の方がMidjourneyの画像に寄っていくと思うんですよね。
最後に
ご覧いただいた通り、画像生成AIはこの1年でかなり進化しました。
特にMidjourneyは、僕が作り方に慣れてきたこともあると思いますが、思い描いた画像を作れる確率がだいぶ高まってます。
もちろん全てをコントロールできるわけではないものの、以前よりも試行回数少なめで済むようになりました。
これからは動画生成AIが同じように精度が高まって実践で使えるレベルになっていくと思われますので、1年後の動画生成AIを楽しむために今のうちに動画もちょこちょこ作っておいて比較用の材料を作っておきたいと思います。