画像生成AIのStable DiffusionとDALL·E 2はどっちも無料で商用利用可能!それぞれの違いは?

画像生成AIのStable DiffusionとDALL·E 2はどっちも無料で商用利用可能!それぞれの違いは?
関連キーワード
WEBサービス

画像生成AIについて色々調べていくと、無料で使えて商用利用可能な画像を生成してくれるサービスがStable DiffusionとDALL·E 2(ダリ ツー)の二択になってしまいました。

この記事執筆現在の情報であることと、僕の調査範囲での話なので間違ってることがあるかもしれませんが、現状この2つのサービスについて調べたことをまとめました。

Stable Diffusionはオープンソースで様々なウェブサービスの元に

Stable Diffusionはオープンソースの画像生成AIサービス。Text-to-imageと言って、単語や文章から画像を生成する仕組みです。

2022年8月22日にオープンソース化したそうで、例えばLINE内で使える「お絵描きばりぐっどくん」や、Text-to-imageだけでなく画像を参照したImage-to-Imageも組み合わせて画像を生成してくれる「AI Picasso」など、様々なサービスが作られました。

ただ、いくら調べても、Stable Diffusionを元にしたサービスはどれも有料のものばかりで、無料で使うためにはStable Diffusionの本家のサイトで画像を作るのが手っ取り早く確実です。

Stable Diffusionのサイトはこちら。

ブラウザ上で利用することができるだけでなく、アカウント登録する必要もありません。無料で何枚でも画像生成することができ、商用利用も可能です。

使い方も簡単で、プロンプトというAIに対する指令を入れてクリックするだけで、画像が生成されます。

使い方が簡単と言ってしまいましたが、このプロンプトの取り扱いにコツがあり、イメージしている画像に近づけるのは結構難しいです。

「forest」と単語だけ入れると合成のような不自然な画像になりますが、

同じ森の画像でもうまいことコントロールできるとここまでいい感じにしてくれます。

プロンプトについて

最初はどんな言葉を入れたらいいのか迷いますが、ネット上に先人たちの知恵がたくさんありますので、さまざまなサイトの情報を参考にしながら、自分好みの画像が生成されるまでトライアンドエラーしてみてください。

よく参考にしているサイトはこちら。

上記のサイトを参考に、僕なりの実験結果は別記事でまとめてます。こちらのリンクも貼っておきます。

画像作成AI「Stable Diffusion」を使う時のコツ!digital paintingで生成するとイラスト風になる!
続きを読む

ちなみにChatGPTに、Stable Diffusionで使えるプロンプトを聞いてみたところいくつかプロンプトを教えてくれて、ここからさらに調べたりと発展していくことができました。日本語で聞けるのは手軽なので、うまく活用したいところです。

より高度にStable Diffusionを扱うには

Stable Diffusion web UIというツールを使うことで、Stable Diffusionをより高度に扱うこともできます。

ただ、環境構築の難易度が高いので、今のところ僕はまだ使っていません。

どこかのタイミングでやってみたいと思いますので、実行しましたらこの記事にも使い方などを追記します。

ChatGPTの会社が作っているDALL·E 2

DALL·E 2はChatGPTの生みの親である。OpenAIが作った画像生成AIです。2022年7月21日にDALL·E 2のベータ版がリリースされたことで、Stable Diffusionよりも一足先に話題となってました。

使い方はStable Diffusionとほとんど一緒で、プロンプトを入力したら、

その指令に応じてAIが考えた画像を生成してくれます。

Stable Diffusionとの違いはいくつかありますが、1つはアカウント登録が必要なことです。

これはデメリットではなく、Googleアカウントと連携ができるので登録するのはすごく簡単ですし、アカウント登録しているおかげで画像の保存・履歴の記録・コレクションとして整理することができるなど、Stable Diffusionと比べての強みがあります。

また、生成された画像はブラウザ上で編集することも可能です。例えばこちらの画像の鉛筆とノートを消して再生成してみましょう。

消しゴムでペンを消し去ってから再生成すると、

こんな具合に消すことができました。この編集機能はかなり便利ですね。

Stable DiffusionとDALL·E 2について動画で解説

今回の記事の話題は動画でも解説してます。

内容はほぼ記事と同じですが(というか動画のテロップから記事を書いた)、5分以内の短い動画なので、よかったら観てみてください。

Midjourneyは課金が必須

ちなみに、画像生成AIのサービスを調べると、Midjourneyもかなりの人気と知名度があるようですが、残念ながら課金が必須です。

無料だと25枚が上限で、商用利用もできません。

課金するのであればStable Diffusion派生の優秀なサービスが多数あるので、そちらとも比較してより自分好みのものをチョイスするのが良いと思います。

課金するならLexicaがおすすめ

ちなみに、Stable Diffusionを使ったLexicaというサービスは、画像の質・価格・使用できる枚数・ライセンス・使用感など、かなりバランスが良いので課金しました。

先ほどDALL·E 2のところで作ったコーヒーと同じプロンプトをLexicaで入力して生成された画像がこちら。質感が全然違います。

使用感についてはまた別記事で紹介します。

最後に

Stable DiffusionとDALL·E 2はどちらも無料で使えることもあり、思いついた言葉を適当に放り込んでひたすらガチャしてるだけでも楽しいです。

この画像をどう活かすかはアイデア次第ですが、ブログのアイキャッチ画像やYouTubeのサムネにも組み込めそうです。ただし、解像度が低いため工夫は必要になりますが。