超入門!Stable Diffusionの使い方徹底ガイド:インストールからおすすめモデル、基本的な使い方
画像生成AIは近年、大きな注目を集めています。その中でも、Stable Diffusionはテキスト入力に基づいて画像を生成するためのフリーでオープンソースのAIツールで、圧倒的な知名度と人気を誇ります。
しかし、Stable Diffusionを初めて使用する初心者にとって、満足いくもの画像やイラストを生成するまでにどのような手順で進めていけばよいのか、戸惑ってしまう方も多いのではないでしょうか?
そこで今回は、Stable DiffusionとはからStable DiffusionをローカルPCにインストール仕方、具体的な使い方やおすすめモデルまで、初心者にもわかりやすく解説していきます。Stable Diffusionの使い方に関して不安や悩みを抱えている入門者はぜひ参考にしてみてください。
そもそもStable Diffusionとは
Stable Diffusionは、Stability AI、CompVis LMU、Runwayの三者が共同で公開した高度な画像生成モデルです。
潜在拡散モデル(latent diffusion model)を基盤としており、キーワードやテキストを入力するだけで、それらのイメージに近い高品質な画像を作ることができます
クラウドサービス経由でのみアクセス可能なDALL-EやMidjourney(ミッドジャーニー)と異なり、Stable DiffusionはローカルPCにインストールされて無料で使えます。
2022年に一般公開されたら、たちまち全世界でAI画像の熱狂を巻き起こして、日間アクティブユーザー数は1,000万人を突破しました。
1.Stable Diffusion Web UIとは
Stable Diffusionは特定のアルゴリズムとトレーニングデータに基づく画像生成モデルです。
一方、Stable Diffusion Web UIは、Stable Diffusionモデルをより簡単に利用するためのブラウザインターフェースです。直感的に操作しやすいので、Stable Diffusion初心者でも画像生成、インペインティング、アウトペインティング、画像修正などの機能を安心して利用することができます。
Stable Diffusion Web UI(AUTOMATIC1111版)に詳しくない方向けて、Stable Diffusion Web UIとは何かから、インストール手順、必要なPCスペック、日本語化、および主な機能までいろいろ... 分かりやすい説明
2.Stable Diffusionは日本語で使えるの?
Stable Diffusion(Stable Diffusion Web UI)はデフォルトでは英語表記となっていますが、日本語の拡張機能をインストールすることでユーザーインターフェースやメニューの表示などが日本語に変更されることができます。
Stable Diffusion Web UIを日本語化するための設定方法を知りたい場合はこちらを参考にして下さい。
なお、画像を生成する際のプロンプトも日本語で入力することが可能ですが、クオリティが著しく低下してしまう可能性があるので、英語でプロンプトを入力することがおすすめです。
英語に自信のない方は、ChatGPTのようなAIチャットボットやGoogle 翻訳などの翻訳ツールを使って、英語プロンプトを作成することができます。
Stable Diffusionのモデルについて
Stable Diffusionのモデルとは、画像生成を行うために学習するデータセットやアルゴリズムの組み合わせのことです。モデルによっても、生成画像のクオリティやスタイル、雰囲気が大きく左右されます。生成したい画像に近いモデルを利用することで、イメージ通りの画像を生成することができます。
例えば、Stable Diffusionにリアル・実写系のモデルを導入すれば、プロンプトでスタイル、雰囲気を指定しなくても、フォトリアルな画像を生成することが可能です。
CivitaiやHugging Faceなどの外部サイトから、使用したいStable Diffusionのモデルをダウンロード、インストールすることができます。ダウンロードしたモデルを「models\Stable-diffusion」に放り込めば、Stable Diffusion Web UI上で利用できるようになります。
Stable Diffusionのモデルをダウンロードして導入する方法については、以下のページで詳しい手順についてご紹介しています。
Stable Diffusionで利用できる人気のモデルを紹介します。また、モデルの導入方法や使用時の注意点なども合わせてお伝えします。どのモデルを使おうか迷っている方は、ぜひこの文章をチェックしてください。
Stable Diffusionのおすすめモデル
Stable Diffusionのモデルにはいろいろな種類があるが、代表的なものを紹介していきます。
@ DreamShaper(万能型)
- タイプ:CHECKPOINT
- ベースモデル:SD 1.5
- 作者:Lykon
- リンク:https://civitai.com/models/4384/dreamshaper
- サイズ:1.99GBぐらい
- 商用利用:一部可能
実写だけでなく、イラストやアニメ、2.5Dなどさまざまなスタイルに対応できる万能モデルです。 高解像度でクリエイティブな画像を生成できることが特徴です。
A Anything XL(アニメ系)
- タイプ:CHECKPOINT
- ベースモデル:SDXL 1.0
- 作者:Yuno799
- リンク:https://civitai.com/models/9409/or-anything-xl
- サイズ:6.46GBぐらい
- 商用利用:一部可能
大人気のアニメ系モデルです。簡単なプロンプト入力だけで高品質で高精細な漫画やアニメ風の画像を生成することができます。
B ChilloutMix(リアル系)
- タイプ:CHECKPOINT
- ベースモデル:SD 1.5
- 作者:TASUKU2023
- リンク:https:// civitai.com/models/6424
- サイズ:3.97GBぐらい
- 商用利用:不可
Civitaiで最もダウンロードされているモデルです。リアルなアジア美人やAIアイドルに特化したクオリティの高い画像を生成することを得意としています。
Stable DiffusionをローカルPCにインストールする方法
Stable Diffusionをローカル環境で使用するには、Stable Diffusionをローカル環境で構築してなくてはなりません。Stable Diffusionをローカル環境で構築する前に、現在使用しているパソコンが、Stable Diffusionの動作に必要なスペックを満たしているかどうかを確認する必要があります。
Stable Diffusionを動かすために必要な最低スペックは以下の通りです。
- CPU:Intel Core i5以上
- メモリ:8GB以上
- GPU:VRM4GB以上
- ストレージ:50GB以上
- OS:Windows、macOS、Linux
Stable Diffusionを使用する際のPC推奨スペックは以下の通りです。
- CPU:Intel Core i7かAMD Ryzen 7以上
- メモリ:32GB以上
- GPU: RTX 3060 (VRM12GB )以上
- ストレージ:512GB以上(できれば1TB)
- OS:Windows 10以上(64bit)
Stable Diffusion がmacOSとLinuxでも動作できますが、動作速度・安定性の面で優れているわけではありません。そのため、Stable DiffusionをローカルPCにインストールする際に求められる環境がWindowsの64bit版がおすすめです。
それでは、Stable DiffusionをローカルPCにインストールする方法について説明します。
- Pythonのインストール。
Pythonの公式サイトから最新バージョンをダウンロードしてインストールします。
- GITのインストール。
GITの公式サイトから「64-bit Git for Windows Setup」をダウンロードしてインストールします。
- Web UIのダウンロード・インストール
Stable Diffusion Web UIを格納するフォルダを新作して、開いたフォルダ内で、右クリックで表示されるメニューから「Open Git Bash here」を選択します。
ターミナルが開くので、以下のコマンドを入力してEnterキーで実行して、「stable-diffusion-webui」のフォルダが作成されます。
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui
「stable-diffusion-webui」のフォルダ内の「webui-user.bat」をダブルクリックして、インストールが始まります。
- インストールの完了
初回の起動には時間がかかる場合があります。成功すると、ターミナルにWebサーバーのアドレス(通常は http://127.0.0.1:7860)が表示され、Stable Diffusion WebUIが自動的に起動します。
これで、Stable DiffusionをローカルPCにインストールしました。続いては、Stable Diffusioでテキストプロンプトを入力し、画像生成する方法を紹介していきます。
Stable Diffusionをローカル環境で構築・導入する方法がよく分からないという方は次の記事を参考にしてみて下さい。
AIで画像が作成できるStable Diffusionをしっかり使いたくて、自分のパソコンにダウンロードします。この記事でStable Diffusionをローカルに導入する方法をご紹介します。Stable Diffusionのインストールも、ローカル環境の構築も、面々にご説明します。
Stable Diffusionの使い方
ここからは、Stable Diffusionの使い方の基本的な部分を7つに分けて、紹介していきます。日本語化設定の仕方やStable Diffusionの使い方のコツも紹介するので、読み進めながら実際に画像生成を行ってみてください。
まずは、Stable Diffusion Web UIのインターフェイスから見ていきましょう!
1.Stable Diffusionの使い方:画面の見方
「webui-user.bat」をダブルクリックして、Stable Diffusion Web UIがブラウザで開かされると、下記の画面になります。
番号 | 説明 |
---|---|
@ | 画像生成に使うモデルを選択します。 |
A | txt2img(テキストから画像生成)、img2img(画像から画像生成)、Extras(サイズ変更)、PNG info(プロンプト確認)などの間で機能を切り替えます。 |
B | プロンプトとネガティブプロンプトを入力します。 |
C | 画像を生成する際に用いる計算方式です。サンプリング方法によって、ノイズ除去の方式も異なり、最終的に生成される画像のクオリティとスタイルに影響を与えます。 |
D | 画像生成までのサンプリングステップ数です。サンプリングステップ数が多いほど、生成される画像のクオリティが良くなりますが、処理時間も遅くなります。 |
E | 顔の修正を行います。 |
F | 生成される画像をタイルのように並べます。 |
G | 画像を高解像度化して、アップスケーリングします。 |
H | 画像のサイズを指定します。 |
I | 画像生成の繰り返す回数・1回に生成する枚数を指定します。 |
J | 生成される画像が入力されたテキストプロンプトにどれだけ忠実に出力するかを制御するためのパラメータです。一般的には、「5 〜 10」程度がおすすめです。 |
K | シード値も指します。「-1」だとランダム生成となります。特定の画像を生成したい場合は、当該画像のシード値を入力すればOKです。 |
L | 特定のタスクやワークフローを自動化するためのコードの集合です。 |
M | 画像生成が始まります。 |
N | プロンプト、モデルカードに関する便利ツールを納めるためのエリアです。 |
O | 生成される画像が表示されます。 |
P | 生成画像の出力フォルダを開いたり、生成画像を保存したり、生成画像をZipで圧縮したり、生成画像をimg2img、inpaint、extrasに送信することができます。 |
2.Stable Diffusionの使い方:日本語化設定方法
Stable Diffusionを初めて起動した際には、デフォルトでは英語表示になります。英語に慣れていない初心者の方にとっては、Stable Diffusionの世界に足を踏み入れるのは難しいです。無理に英語で始めても途中で諦めてしまう可能性もあります。
インストールしたStable Diffusion(Stable Diffusion Web UI)が日本語表示されていない場合は以下の方法で設定を変更しましょう。
- Stable Diffusionを起動したら、「Settings」タブから「Available」を選択して、「Localization」にチェックを外します。
- 「Load from」ボタンをクリックすると、表示された拡張機能一覧の中から「ja_JP Localization」を選択して右端の「Install」をクリックします。
- インストールが完了したら、「Extensions」タブにある「Installed」を開き、インストールした「ja_JP Localization localization」にチェックを入れます。
- 「Settings」タブを開き、「User interface」の項目にある「Localization(requires Reload UI)」から「ja_JP」を選択します。
- 最後、画面上部の「Apply Settings」→「Reload UI」の順にクリックすれば、Stable Diffusion Web UIが日本語で表示されます。
3.Stable Diffusionの使い方:プロンプト・呪文の書き方
Stable Diffusionで画像生成を行う際に最も重要なのはプロンプト(呪文)です。単語ひとつだけでもStable Diffusionで画像生成は可能ですが、プロンプトの指示内容が具体的で明確であるほど、自分のイメージ通りの画像やイラストを作れます。
Stable Diffusionプロンプトの書き方が分からない初心者は、以下の基本構成を参考にして作成していきます。
描きたい対象+描きたいものの詳細説明+画質+表現スタイル+そのほか(背景や場所、天気、構図など)
例えば、子猫がコロコロと転がる画像が欲しい場合は、入力欄に以下のようなプロンプトを入力します。
下記のような画像が作れます。
ネガティブプロンプト(Negative Prompt)とは、画像生成AIにおいて生成したくない要素や特徴を指定するものです。
例えば、low resolution(低解像度)、blurry(ぼやけた)、missing limbs(手足が足りない)、multiple heads(複数の頭)
Aiarty Image Enhancer
- 使いやすい:非常にシンプルでわかりやすい操作性。
- AI最適化:Stable Diffusionなどの生成AIによって作成した画像に最適。
- バッチ処理:最大100枚の画像を一気に高画質化できる。
- AI超解像:ロスレスで最大32K解像度にアップスケールする可能。
ネガティブプロンプトを使用することで、生成された画像から不適切なスタイルや不要な要素を排除できて、画像生成の精度を上げるのに役立ちます。
一方、Stable Diffusionで画像を生成する際のプロンプトを英語で記述する必要があり、複数の要素や指示をカンマ「,」で区切りましょう。特に自分が優先したい要素があれば、プロンプト(呪文)の先頭に位置すればよいでしょう。
ChatGPTやGoogle 翻訳に加えて、呪文の自動生成ツールも利用することで、Stable Diffusionの英語プロンプト(呪文)を作成することができます。
Stable Diffusionプロンプトの効果的な書き方のコツや呪文の自動生成ツールについて、以下の記事でも詳しく紹介していますので、こちらも参考にしてみてください。
Stable Diffusionを使えば、主に完成形のイメージや雰囲気などを情報として与えるだけで、誰でも簡単にクオリティの高い画像を作成できます。今回の記事では、Stable Diffusionの呪文についての詳細な解説を行っています。
4.Stable Diffusionの使い方:txt2imgでテキストから画像を生成する
Stable Diffusionでテキストから画像を生成するには、txt2img機能を利用しなければならないです。
Stable Diffusionのtxt2img機能は、入力したテキストプロンプトに基づいて写真やイラストなどを生成する機能です。この機能を使用することで、プロンプトの記述を工夫すれば、風景、ポートレート、スケッチ、アートワーク、様々なジャンルの画像さまざまなジャンルの画像を自動生成してくれます。具体的な手順を以下に示します。
- Stable Diffusion Web UIを起動したら、「txt2img」タブを開きます。
- プロンプトのテキストボックスに生成したい画像の内容を英語で入力します。
ここでは、「A white cat sleeping by the window,peaceful,cozy,soft fur,natural lighting,photorealistic,serene atmosphere,warm colors,high resolution」と入力します。
日本語に直訳すると「窓辺で眠る白猫、暖かみのある、居心地の良い、柔らかな毛、自然光、写真のようにリアル、静かな雰囲気、暖色系、高解像度」という意味になります。
- 画面下部のパラメータで画像サイズや生成枚数などを設定したら、「Generate」ボタンをクリックします。
- すると、上記のプロンプトの内容に基づいて、AIが画像を生成してくれます。
5.Stable Diffusionの使い方:img2imgで画像から画像を生成する
画像から画像生成とは、既存の画像を元に新たな画像を生み出すという意味です。構図や画風、スタイルに似た画像を一括で作成するのに非常に役立ちます。
Stable Diffusionのimg2img機能を経由して画像から画像を生成する方法を以下に示します。
- 「img2img」タブを開いたら、「Generation」→「img2img」タブ内のアップロード領域に元の画像をドラッグ&ドロップします。
- 上記のテキストボックスに、下記のプロンプトを入力します。
画像生成の精度をあげていくためには、画像品質の向上についてのプロンプトを入力しなければなりません。
- 画面下部のパラメータで画像サイズや生成枚数、ノイズ除去強度などを設定したら、「Generate」ボタンをクリックします。
- すると、元の画像に似た画像が新たに生成されます。
初心者の方向けに、Stable Diffusionのimg2img機能について、基本操作から具体的な使い方まで詳しく解説していきます。また、Stable Diffusionで画像から画像生成の具体例も載せています。
6.Stable Diffusionの使い方:Extrasで画像を高解像度化する
Stable DiffusionのExtrasには、画像を高画質化したり、アップスケールしたりする機能があります。この機能を利用することで、Stable Diffusion で生成された512x512〜512x768解像度の画像を4倍まで拡大すると同時に、さらに高画質にしてくれます。
- 「Extras」タブを開いたら、高解像度化したい画像をアップロード領域にドラッグ&ドロップします。 または、txt2img・img2imgの「その他に転送」から画像を送信することもできます。
- 画像下部にある「Scale by」タブの「Resize」のスライドバーをスライドさせると拡大の倍率を変更します。「Scale to」タブで希望の解像度を直接に指定することもできます。
- Upscaler 1・2で画像をスケールアップする際に用いる計算方式を選択します。
- 「Generate」ボタンをクリックすると画像がアップスケールされます。
でもStable Diffusionで画像を高画質化する場合は、PCのメインメモリが大幅に占有され、GPUやCPUの使用量も増えるので、処理速度が遅くなったり、動作が不安定こともあります。特に一般的な家庭用のパソコンでは、ほぼ90%の確率で正常に動作しません。
その場合は、AI画像に特化した高画質化ソフトの「Aiarty Image Enhancer」を導入することで、Stable Diffusionの生成画像を高画質化したり、最大32K解像度までアップスケールしたりすることができます。
7.Stable Diffusionの使い方:生成した画像はどこに保存されるのか?
Stable Diffusion Web UIで作成された画像やイラストは、 デフォルトで特定のディレクトリ(フォルダー)に自動的に保存されます。通常は、「outputs」のフォルダーおよびそのサブフォルダーに格納されることが多いです。
具体的な保存場所は下記の通りと表示されています。
- テキストから生成された画像の保存場所:stable-diffusion-webui\outputs\txt2img-images
- 画像から生成された画像の保存場所:stable-diffusion-webui\outputs\img2img-images
- Extrasで加工した画像の保存場所:stable-diffusion-webui\outputs\extras-images
Stable Diffusionの商用利用・著作権について
Stable Diffusionで生成した画像やイラストは、基本的に商用利用が可能です。
というのも、Stable Diffusionで生成した画像やイラストの著作権は、作成したユーザーに帰属しているため、ユーザー自身がStable Diffusionによって生成されたものを商用利用含めて自由に利用することができます。
ただし、場合によっては著作権侵害となる可能性もありますので注意が必要です。
例えば、商用利用が認められないモデルによって生成されている画像の場合、商用利用は禁止されています。
また、img2imgの機能を使って画像から新たな画像を生成する場合、参考の画像によっては、著作権侵害になってしまいかねません。
そのため、Stable Diffusionで画像生成を行う前に、各ライセンスや利用規約を必ず確認することが大切です。
この記事を書いた人:かほ
画像補正や写真加工を中心に、最新のAIソリューションやソフトウェアなどに関する役立つ情報をタイムリーにお届けします。