以前、Midjourney を試してみました。Discord を通じてアクセスしましたが、すぐに無料の試用回数を使い果たしてしまいましたので、淘宝で共有アカウントの 1 ヶ月分を購入して試し続けました。しかし、新鮮さは 2、3 日で過ぎ去り、ほとんど触れなくなりました。この 2 日間、また少し興味が湧いて、Stable Diffusion のローカルデプロイを試してみました。
私は、この記事「本地部署 Stable Diffusion 教程,亲测可以安装成功」を参考にしました。著者は Pancras Wen です。
基本的に、彼の説明に従ってインストールしましたが、少し問題がありました。
まず、git と Python をダウンロードする必要があります。彼は Python 3.10.9 をインストールすることを提案していますが、理由は説明されていませんので、私もわかりません。
次に、stable-diffusion-webui ソフトウェアライブラリをダウンロードします。新しいフォルダを作成し、git を使用してクローンします。
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
ダウンロードが完了したら、webui-user.bat バッチファイルを実行して、他のコンポーネントを自動的にダウンロードしてインストールします。
途中で pip の更新プロンプトが表示された場合は、新しい cmd を開いて、表示されたコマンドを実行してください。
このプロセスで、taming-transformers と CodeFormer のクローン時に問題が発生し、エラーコード 128 が表示されました。ここでの報告を参照してください。
taming-transformers については、webui-user.bat バッチを再起動して問題を解決しましたが、かなりの時間がかかりました。
CodeFormer については、何度も webui-user.bat を再起動しても解決しなかったため、git bash を使用してクローンし、完了後に webui-user.bat を実行しました。
その後は特に問題はありませんでしたので、ダウンロードを続けます。
その後、Stable Diffusion を呼び出すためにブラウザで http://127.0.0.1:7860 にアクセスできます。
非常に使いやすく、各パラメータの設定には説明があり、マウスを重ねると表示されます。
デフォルトの設定を数回呼び出してみましたが、効果はかなり悪いと感じました。
図 1:デフォルトの設定の結果、prompt は「a man is standing in front of a tank with the muzzle pointing at the man」です
高品質の画像を生成するためには、適切な設定が必要です。その中で、サンプラーの選択は非常に重要です。以下のガイドが参考になります:「Stable Diffusion Samplers: A Comprehensive Guide」。いくつかの使用上のアドバイスが提供されています:
- 比較的新しいモデルを使用して、高速に生成し、品質の良い結果を得たい場合は、次のいずれかを選択します:
- DPM++ 2M Karras、20-30 ステップを実行
- UniPC、20-30 ステップを実行
- 高品質の画像を生成したいが、収束状況にはあまり関心がない場合は、次のいずれかを選択します:
- DPM++ SDE Karras、8-12 ステップを実行(注意:速度が遅くなります)
- DDIM、10-15 ステップを実行
- 安定した、再現可能な結果を得たい場合は、Euler a、DPM2 a、DPM++ 2S a、DPM++ 2S a Karras などの古いサンプラーを使用しないでください。
- 簡単な選択を好む場合は、EulerとHeunを使用できます。Heun のステップ数は多すぎないようにし、時間を節約します。
図 2:UniPC サンプラーを 22 ステップ実行した結果、prompt は「a crying Chinese woman with iron chain around the neck」です
他にも 2 つのチュートリアルを見ましたので、ここで索引を示します: