Stable DiffusionでAIによる絵を描いてみた

AIで絵を描くアプリはたくさんありますけど、そのうちのStable Diffusionなるものを試してみました。

Stable Diffusionって、正確にはアプリというよりはAIモデルですね。

Pythonコードで動かすことができます。

だから普段プログラミングをしていない人が簡単に試すにはちょっとハードルが高いです。

言葉で、こんな画像を描いて!と呪文を唱えることで画像生成してくれます。

それはそうと、ローカルのGPUを使って画像生成するか、Google Colaboratoryを使って画像生成するかで悩みましたが、

まずはローカルで環境構築することに挑戦しました。

以下のブログを全面的に参考にしました。

【簡単】ローカル環境でStable Diffusionを実行する方法
https://self-development.info/%E3%80%90%E7%B0%A1%E5%8D%98%E3%80%91%E3%83%AD%E3%83%BC%E3%82%AB%E3%83%AB%E7%92%B0%E5%A2%83%E3%81%A7stable-diffusion%E3%81%A7%E5%AE%9F%E8%A1%8C%E3%81%99%E3%82%8B%E6%96%B9%E6%B3%95/

ところが丸二日かかって環境を構築したものの、最後の最後の画像生成コードを実行するところのエラーを回避できず失敗

具体的には、単純に私のグラフィックボードのGPUの能力不足でした。

4GBじゃ動かないです。8GBかできれば10GB以上のメモリが必要な感じがします(正確なところわからないです)

というわけでGoogle Colaboratoryを使うことにしました。

karaage0703さんがノートブックを作ってくれていたのを見つけたので、簡単に動かせました。

Stable Diffusionのサンプルコード(text2img/img2img)をGoogle Colabで動かす方法
https://zenn.dev/karaage0703/articles/22ee47b71fab9c

3匹の豚がテーブルを囲ってコーヒーを飲んでいるところを画像生成しました。

まずは最初の挑戦。

なんか微妙に変。だけどすごい!

次はルノワール風にという呪文に変えて2枚作製。

やばくないですか?ちゃんとルノワールになってる!
なぜか何回やっても豚が3匹に増えないですが……

最後にバスキア風。

やった!バスキア風で豚も3匹になった!

呪文の唱え方を工夫すると、いろいろな用途に使えそうですね。

絵を描けなくてもイラストレーターになれてしまう。
これ、商用利用OKなそうなので。

ただ、個人的には呪文を考えて試行錯誤するより自分で絵を描いた方が楽しいな、と思いました。

『Pythonで動かして学ぶ!あたらしい機械学習の教科書 第3版』伊藤真

shizukiaki

札幌で絵やイラストを描いています。音楽や読書も好きなので、ブログではいろいろなジャンルの投稿をしています。