「Grokの画像生成ならではの強みとは」という記事を先日書きました。
この記事を書いたときに見落としてたんですが、Grokは「自然な会話で画像生成できる」ことが圧倒的な強みだと感じました。
自然言語での画像生成はこれまでChatGPTだけでできたことだった
ChatGPTにはDALL·E 3という画像生成AIが搭載されていて、自然言語で画像生成できることはChatGPTならではの強みでした。
英単語の羅列のプロンプトを書く必要がなく、自分の母国語を使って、友達と話すような感覚で画像生成ができるのはすごく手軽です。
画像を作る過程についても相談することができて、作りたい画像のイメージを会話の中で明確していき、その上で画像を作ってもらうとイメージにかなり近づきます。
Grokで自然な会話で画像生成してみる
GrokもChatGPTのような対話型の生成AIで、「日本語でプロンプトが書ける」レベルではなく、ちゃんと自然な会話で画像生成できるのが便利です。
日本語でプロンプトが書けることと自然な会話で画像生成ができることは似ているようで全然違います。
例えば「YouTubeのサムネイルを作るにあたり、背景に敷く画像を作りたい。色は青系で波紋が重なり合うようなイメージにしたい。主題となるものは後で載せるので主張するようなものは作らずに、背景として馴染むような画像を作って。」と指示を出してみます。
すると、波紋の画像が出来上がりました。
僕がイメージしていたのはイラレで作ったような画像だったので、「波紋というのは例え話なのでリアルな波紋の画像ではなく、ベクターデータの円を幾重にも重ねたようなデジタルなイメージがいい。」と指示を出してみたところ、先ほどの指示を継承しつつもベクターデータの画像に直してくれてます。
このように、自然な会話で画像を作り、その修正もしていけるのはGrokの強みです。これはMidjourneyではできないことなので。
Grokで画像生成するにあたってのその他の強み
Grokで画像生成することのメリットを下記の記事にまとめてます。
Midjourney愛用者の僕でも、最近ではGrokを使う機会が増えてきました。
FLUX.1という、Midjourneyとは違った味わいの画像生成AIも使いたいっていうこともありますが、強烈なメリットもたくさんあるので、ぜひこちらの記事をご覧ください。
最後に
もちろん、Midjourneyのような画像生成AIでは「ChatGPTでプロンプトを練ってからMidjourneyで出力する」という工程を踏むことで同じようなことができます。
ただ、GrokであればGrokだけで完結できますし、作業時間も短くて済みます。
質で言えばMidjourneyに軍配があがりますし、自然な会話での画像生成の手軽さではGrokですし、ケースバイケースで使い分けていくのが良さそうだなと思いました。