Stable Diffusionで画像からプロンプト（呪文）を抽出する3つの方法を解説！

「好みのAI画像に近いものを生成するために、その画像のプロンプトを知りたい」

「AIで生成された画像からプロンプトを抽出して、自分では思いつかなかったAIアートを作りたい」

と思ったことがありませんか？

実には、画像生成AI「Stable Diffusion」を利用すれば、既存のAI画像からプロンプトを抽出することができます。

今回は、Stable Diffusionで画像からプロンプトを推定・抽出する3つの方法について解説するので、参考にしてください。

プロンプトとは

画像生成AIは基本的にユーザがプロンプトテキストを入力することで、画像を生成する仕組みです。

プロンプトは画像生成AIに生成したい画像のイメージを伝えるテキストのことです。呪文とも呼ばれることもあります。

プロンプトの詳細度や表現方法によって、生成される画像の質やテイストが大きな差があります。だから、画像生成AIでイメージ通りの画像を生成するには、適切なプロンプトを入力することが非常に大切です。

今や、画像生成AIを使う際に、どんなプロンプトを入力したらいいか分からない人が少なくないです。

そういう時、既に生成されたAI画像のプロンプトを抽出して、そのプロンプトを利用して新しい画像を作るのが便利な方法です。特に好みのAIアートと似た画像を生成したい場合に効果的です。

開発元	Stability AI
利用環境	ローカル環境/Webブラウザ
公式サイト	https://ja.stability.ai/stable-diffusion

Stable Diffusionは2022年に初めてリリースされた画像生成AIの1つです。潜在拡散モデルというアルゴリズムが使われており、テキストプロンプトや画像から様々なタイプの画像を生成できます。

また、訓練済みのAIモデルをたくさん搭載しています。これらのAIモデルを活用することで、より効率的にクオリティの高い画像を生成することが可能です。

全世界に向けてオープンソースAIとして公開されているツールなので、皆誰でも簡単に利用できます。

Stable Diffusionは画像生成だけではなく、プロンプトの抽出もサポートします。

Stable Diffusionで画像からプロンプトを抽出する方法は以下の３つあります。

次はそれぞれに詳しく紹介します。

「Tagger」はStable Diffusionの拡張機能の一つであり、画像からプロンプトを自動的に抽出できます。

「Tagger」を活かして、Stable Diffusionで画像からプロンプトを抽出する具体的なやり方は以下の通りです。

STEP.1

「Tagger」をStable Diffusionに導入します。

➀　ローカル環境でStable Diffusionを起動し、「Extensions」＞「Install from URL」をクリックします。

➁ 「URL for extension’s git repository」の欄に下記のURLを入力してください。

http://github.com/picobyte/stable-diffusion-webui-wd14-tagger.git

➂ 「Install」ボタンをクリックすると、Installボタンの下に下記の文字が表示されます。

➃ 「Installed」タブを開き、「stable-diffusion-webui-wd14-tagger」があることを確認してください。

➄ 確認が出来たら、「Apply and restart UI」ボタンをクリックして再起動します。
STEP.2

タブの欄に「Tagger」が追加されているので、それをクリックして開きます。
STEP.3

画像欄に解析したい画像を追加し、「Interrogate」アイコンをクリックします。
STEP.4

画像の解析が終わったら、右側に抽出されたプロンプトが表示されます。あとは、「Send to txt2img」ボタンをクリックして、抽出した呪文(プロンプト)をもとに画像を生成することができます。