Grokを使ってFLUX.1の画像生成をテストしてみた

Grokを使ってFLUX.1の画像生成をテストしてみた
関連キーワード
WEBサービス

2024年8月14日から、X (旧Twitter) の生成AI機能「Grok」に画像生成機能が追加されました。

現時点では有料ユーザーにだけ開放されているらしいんですが、画像生成AIにはFLUX.1が使われているとのことで、どんな画像が生成されるのかを試してみました。

FLUX.1について

ネット上では「Midjourneyを超えた」と話題になっていたFLUX.1。

2024年8月1日に登場した、Stable Diffusionの共同開発者が開発に関わった画像生成AIで、サービス名としては「Flux」、モデル名としては「FLUX.1」という表記になるそうです。

個人的な感想としてはMidjourneyの方が質感が良いと思ってますけど、作る画像によってはFLUX.1もいい感じっぽいので、同じプロンプトで作ってみて良い方を採用とかでも良さそうな気がします。

一応、下記のサイトでテスト生成ができるので、Xで課金してない方はこちらでお試しください。

XのGrokで画像生成したサンプル

Grokで画像を作ってみたので載せておきます。一緒にプロンプト(というか簡単な日本語の指示ですけど)も見えるようにキャプチャーしてます。

定番のコーヒー画像。結構いい感じです。

ちなみに、プロンプトは日本語じゃなくてもMidjourneyで普段使ってるようなものでもいけます。ただ仕上がりにそんなに差が出る感じはないので、日本語入力で良さそうです。

FLUX.1は破綻が少ないと言われていて、ギターはちゃんと6本の弦であることを認識して作ってくれました。

鍵盤は全然ダメです。黒鍵と白鍵の配置がちゃんとした生成AIはまだ現れてません。

鍵盤の画像を作るならこういう感じでお茶を濁すのが良さそうです。

レコーディングスタジオも、部屋としてもおかしいですし、機材の感じもなかなかそれっぽくならないですね。

女性の質感はかなり美しいです。

機材が入り込んでくるとイマイチですね。みたことないタイプのカメラと、左手もなんかおかしいです。

画質以外のGrokで画像生成する強み

サンプル画像をご覧いただいた通り、生成される画像のクオリティが高いのはお分かりいただけたと思います。

Grokの画像生成を使ったり、仕様について調べてみて、他の画像生成AIサービスと比較した強みについて下記の記事にまとめてますので、こちらもぜひご覧ください。

Grokの画像生成ならではの強みとは
続きを読む

XのGrokで生成した画像は商用利用が可能

Grokでの画像生成は課金ユーザーしか使えないということもあり、生成した画像は商用利用が可能となっているそうです。

SNSに投稿するのに使っても良いですし、仕事で使っても大丈夫です。

画像生成AIはほとんどの場合「課金したら商用利用が可能になる」ことが多くて、今回もこのケースですね。

とはいえ、どのサービスもそうとは限らないので、利用規約をご確認の上お使いください。

最後に

Grokをこれまで全然使ってこなかったんですが、現状だとFLUX.1を最も手軽に使える手段ということでめちゃめちゃ使うようになりました。

今後はGrokでのテキスト生成も試していきますので、また何か気づきがあれば共有します。