Stable Diffusion img2imgの使い方は簡単!img2imgで画像生成する方法やコツを徹底解説
以前記事でもStable Diffusionの基本的な使い方を紹介しました。しかし、Stable Diffusion img2imgの情報量が多すぎてどうすれば画像から思い通りの画像を生成したらいいのかわからないと戸惑われている人も大勢います。
そこで今回は初心者の方向けに、Stable Diffusionのimg2img機能について、基本操作から具体的な使い方まで詳しく解説していきます。
また、Stable Diffusionで画像から画像生成の具体例も載せているので、Stable Diffusion img2imgの使い方を迷っている方はぜひ最後まで読み進めて参考にしてください。
img2imgとは?なにができる?
img2imgとは、img to imgの略で、Stable Diffusionで既存の画像を元に新しい画像を生成することです。画像生成AIであるStable Diffusionの最も基本的な機能として、「画像から画像生成」か「画像to画像」とも呼ばれています。
img2imgを使用することで、テキストから画像生成(txt2img)と比べて、より効率的にイメージに近い画像を生成することができるのは大きなメリットです。
なぜなら、Stable Diffusionのtxt2imgはランダム性が高いため、自分が納得できるものができるまで時間がかかります。それに、思い通りの画像を生成しても、部分修正や変更ができません。
【Stable Diffusion】img2imgの画面構成と機能一覧
次は、img2imgの主要機能および画面構成などについてご説明します。Stable Diffusion のimg2imgはどこに何があるのか、各種アイコンが実際になんの役に立つのかを見ていきましょう。
Stable Diffusion Web UIを起動して「img2img」タブを選択すると下記の画面になっています。
@ プロンプトエリア
txt2imgと同じで、生成して欲しい画像のイメージを伝えるテキストのことを入力します。
A 機能選択メニュー
画像のアップロードエリアの上に表示されているのが「機能選択メニュー」です。img2imgには、「img2img」、「Sketch」、「Inpaint」、「Inpaint sketch」、「Inpaint upload」、「Batch」といった以下6つの主要機能があります。各タブをクリックすると、その機能を利用できます。
B 画像のアップロードエリア
「クリックしてアップロード」をクリックし参照元にしたい画像を選択するか、アップロードする画像をドラッグ&ドロップします。
C 生成エリア
生成された画像が表示されるエリアです。生成画像の下側にある「send image and generation parameters to img2img tab」ボタンをクリックしたら、生成した画像が参照元画像になります。
D パラメーターエリア
サイズ変更の方式や、サンプリング方法、画像サイズ、ノイズ除去強度などの画像生成に関するパラメーターを設定するエリアです。
img2imgの画面構成はStable Diffusion初期の画面レイアウトと大体同じなので、下記からご確認ください。
Stable Diffusion Web UIを日本語化する方法、プロンプトの書き方、Stable Diffusionで画像生成する方法など、Stable Diffusionの使い方について、初心者にもわかりやすく解説していきます。Stable Diffusionの使い方に関して不安や悩みを抱えている入門者はぜひ参考にしてみてください。
Stable Diffusion img2imgの使い方講座
ここからは、Stable Diffusion img2imgの使い方(初め方)について、アニメ画像の生成を例に解説します。
Stable Diffusion img2imgの使い方講座@:画像から画像生成する
- まずは、Stable Diffusionに参照元にしたい画像をアップロードします。今回はStable Diffusionで生成した写真風の画像を使います。
- 使用したいモデルを「Stable Diffusion checkpoint」から選択します。写真風の画像をアニメ画像に変換するには、アニメ絵生成の人気モデル「anything」を選択します。
- 次は、テキストプロンプト入力欄に生成したい画像の指定文を入力します。
a young girl sitting at a street corner café, best quality,masterpiece, highres, original, perfectlighting
blurry,low resolution,cartoon,realistic,abstract,monochrome,pixelated,futuristic,crowded café,dark and gloomy,cluttered,distorted faces,surreal,fantasy elements
イメージ通りの画像を上手く生成させるには、生成画像のクオリティを上げるためのプロンプトを入力する必要があります。
- 続いて、画像生成に必要なパラメーターを設定します。
img2imgには多くのパラメーターが用意されていますが、変更せずに初期設定のまま利用できるパラメーターが多数を占めます。Stable Diffusionで画像から画像生成を行うときに、サイズ変更の方式や、出力画像のサイズ、ノイズ除去強度だけ設定すればよいのです。
- Resize mode(サイズ変更の方式):
生成する画像のサイズが参照元となる画像のサイズと異なる場合、そのサイズ比率をどのように変更するのか設定することができます。
「Just resize」(引き伸ばし)、「Crop and resize」(トリミング)、「Resize and fill」(拡張)、「Just resize (latent upscale) 」(直接リサイズ)という4つの方式があります。
生成画像が参照画像と同じサイズにする場合、「Just resize」、「Crop and resize」、「Resize and fill」、「Just resize (latent upscale) 」のいずれか1種類でも構いません。
- Resize to Width・Height:
生成する画像の幅と高さを指定します。最小64×64、最大2048×2048サイズの画像を生成できます。
- Denoising strength(ノイズ除去強度):
デフォルトは0.75で、参照元の画像と生成する画像との類似性を制御します。 値が低いほど元の画像に近く、値が大きいほど参照元から離れている画像を生成します。
- 「Batch size」で生成される画像の枚数を設定したら、「Generate」ボタンをクリックしてStable Diffusionで画像から画像生成が始まります。
「Batch Count」は画像生成の繰り返す回数を設定できます。
- しばらく待つと、生成された画像が生成エリアに表示されるので、生成画像の下にあるフォルダアイコンをクリックしたら、保存した生成画像を確認することができます。
Stable Diffusionで画像から画像生成する基本的な方法は以上となります。
Stable Diffusion img2imgの使い方講座A:画像をアップスケール(高画質化)する
以前、Stable DiffusionのHires.fixとExtrasで画像をアップスケールする方法を紹介しました。実は、img2imgには画像をアップスケールして高画質化することも可能です。
ここからimg2imgで画像を高画質化していきます。
- まずは、Stable Diffusionに高画質化にしたい画像をアップロードします。今回は上記で生成した画像を使います。
- 「Denoising strength」の値を0.2に設定します。
- 「Script」のドロップダウンリストから「SD upscale」を選択します。
画像を2倍に拡大するには、「Scale Factor」の値を2に設定します。
「Upscaler」の項目で、二次元の画像に適した「R-ESRGAN 4x+ Anime6B」を選択します。
- 設定が完了したら、「Generate」をクリックして画像の高画質化(アップスケール)がスタートします。
- 画像のアップスケールが完了すると生成エリアに表示され、PCに自動で保存されます。元画像は以下のように変わりました。
SD upscaleはStable Diffusionの内蔵スクリプト機能で、元画像をいくつかの小領域に分割して、これら領域それぞれを拡大して細部を再構成した後、1枚にまとめることで、画像の高画質化を簡単に実現することができます。
だたし、img2imgのSD Upscalerで画像を高画質化する際には、元の画像を細かく分割して処理する必要があるため、通常の生成よりも多くの時間がかかります。特に、拡大率が高いほど画像の処理時間も大幅に増えます。さらに、継ぎ目部分に目に見える隙間が発生したり、不自然な画像が出力されたりすることもあります。
その場合は、AI画像に特化した高画質化ソフトの「Aiarty Image Enhancer」を導入することで、素早く手軽にStable Diffusionの生成画像を高画質化したり、32K解像度までアップスケールしたりすることができます。なおノイズ除去、細部復元、アップスケールなどの加工も可能です。
Aiarty Image Enhancer
- 使いやすい:非常にシンプルでわかりやすい操作性。
- AI最適化:Stable Diffusionなどの生成AIによって作成した画像に最適。
- バッチ処理:最大100枚の画像を一気に高画質化できる。
- AI超解像:ロスレスで最大32K解像度にアップスケールする可能。
Aiarty Image Enhancerを使って、Stable Diffusionの生成画像を高画質化する手順は次の通りです。
- Stable Diffusionが生成した画像を、Aiarty Image Enhancerにドラッグ&ドロップで追加します。
- 画像を読み込んだら、画面の右側の「AI細部加工」項目で画像の高画質化に使用しているAIモデルを選択します。ここでは、細部の復元に適した「細部加工 GAN v2」を選択します。
- 「拡大」項目で拡大率を必要に応じて設定したら、「2_パス処理」にチェックを入れます。
- フォーマットと書き出し先を設定できたら画面右下の「RUN」をクリックします。するとStable Diffusionの生成画像の高画質化が始まります。
ライブラリ内の画像を複数選択して、Aiarty Image Enhancerで複数枚の画像を一気に高画質化することも可能です。
Stable Diffusion img2imgの使い方講座B:スケッチからimg2imgで画像生成する
Stable Diffusionで落書きやラフスケッチからきれいなイラスト画像を生成するには、img2imgの「Sketch」機能が使えます。
ここでは、すいかのかわいい画像を作成したい場合を例に挙げて、スケッチからimg2imgで画像生成するための具体的な操作方法について解説します。
- Windowsの「ペイント」またはMacの「プレビュー」を使って色の無地の背景画像を作成します。
- img2imgの「Sketch」タブを開き、作成した無地の背景画像をアップロードすると、「Start drawing」を押します。
- アップロードした背景ですいかを描きましょう。アップロードエリアの右上のアイコンにより行った操作を取り消したり、ペンの太さや色を変更したり、描いたものを消したりすることができます。
- 「Stable Diffusion checkpoint」から、アニメ系モデル「anything」を選択します。
- テキストプロンプト入力欄に描いた画像に近いプロンプトを入力する必要があります。
a illustration of a watermelon, best quality, masterpiece, green rind and juicy red flesh, simple and clean design, solid color background, light-hearted atmosphere, comic
realistic, 3D, dark colors, overly detailed, messy, blurry, abstract, deformed, low quality, excessive shadows
- 「Width・Height」項目で、生成する画像の幅と高さを指定してください。ここでは、アップロードした背景画像と同じのサイズに設定します。
- 「Denoising strength」の値を0.7に設定します。
- 設定が完了したら、「Generate」をクリックしてスケッチからimg2imgで画像生成することが開始されます。
以下は、筆者が描いた落書きと指定したプロンプトから作成したすいかのイラスト画像です。
Stable Diffusion img2imgの使い方講座C:同じ顔で様々な髪型や衣装などを生成する
img2imgの中にあるinpaintもSable Diffusionでよく使う機能です。inpaintは、画像の一部を変更、削除、追加することができるので、画像の背景や表情、ポーズ、服装などのみを書き直したいときに大いに役立ちます。
ここでは、img2imgで同じ顔を使って異なる髪型を生成したい場合を例に挙げて、具体的な操作方法について解説します。
- img2imgの「inpaint」タブを開き、元の画像をドラッグ&ドロップでinpaintにアップロードします。
- 「Stable Diffusion checkpoint」から、元の画像と同じのモデルを選択します。
- 修正したい部分をブラシで塗りつぶします。今回は、髪型だけ変えたいため、髪の部分を塗りつぶします。
- プロンプト入力欄に髪の部分に関するプロンプトを入力します。
best quality, masterpiece, red hair
realistic, low quality, bad anatomy, bad hands, nsfw
- 「Mask Mode」項目で「Inpaint masked」にチェックを入れて、「Masked content」で「original」を選択します。
- 「Width・Height」で元の画像と同じのサイズに設定できたら、「Denoising strength」の値を1に設定します。
- 設定ができたら、「Generate」をクリックして画像生成が始まります。
以下は、img2imgで同じ顔を使って異なる髪型を生成した画像です。
img2imgで同じ顔を維持したまま表情だけ変えます。
img2imgで画像生成を思い通りにするコツ3つ
img2imgで画像生成を思い通りにするためのコツは以下の3つです。これらのコツを理解したうえで、より高品質で望ましい画像を生成することが可能になります。
1.参照元画像の選択
Stable Diffusionで画像から画像生成を行うとき、参照元となる画像の選択が大切です。
構図やフォーカスが明確にわかる画像の場合、AIがスタイルの変更や要素の追加などを行うことで、よりイメージ通りの画像を生成しやすくなります。非常に詳細で複雑なディテールを持つ元画像の場合、繰り返し学習が足りないと画像生成が思い通りにならないことがあります。
2.プロンプトの内容を詳細に作成
テキストプロンプトは、生成する画像の品質とスタイルに大きな影響を与えます。具体的で詳細なプロンプトを作成すれば、希望する結果により近づけます。また、特定のスタイルや雰囲気を明確に述べる必要があります。
ChatGPTやGoogle翻訳などのツールを利用することで、日本語で指示されたテキストから英語プロンプトに簡単に作成することができます。
3.ノイズ除去強度を適切に調整
Denoising strength(ノイズ除去強度)は、生成画像と元の画像が、どの程度似ているか決定するところです。値が低いほど元の画像に近く、値が大きいほど元画像から離れていきます。一般的には中間値(0.5~0.7)から始めて調整し、結果を確認しながら調整していくとよいでしょう。
また、img2imgで同じ顔を維持したまま髪型だけ変える場合は、Denoising strength(ノイズ除去強度)の値を0.7以上にすることをおすすめします。Denoising strengthの値が小さすぎると、髪型に差分が見られない可能性があります。
さいごに
Stable Diffusionのimg2imgは、類似の画像を作成したり、画像を別の画像のスタイルで描画したり、画像をアップスケール高画質化したり、落書きをきれいなイラストに変換したりするのに役立つ機能です。
今回は、Stable Diffusion img2imgの機能から具体的な使い方、コツまで、総合的に解説しました。基本的な操作を理解し、img2imgで画像生成を思い通りにするための使い方とコツを活用することで、たいていの画像生成作業は難なくできるようになります。
以上、最後まで読んでいただき、ありがとうございました。
この記事を書いた人:かほ
画像補正や写真加工を中心に、最新のAIソリューションやソフトウェアなどに関する役立つ情報をタイムリーにお届けします。