オタクは世界を救えない

AIイラストを触ってみた感想とか

 皆さんご存知AIイラスト。そして俺はクリエイタビリティのない虚無のオタク。イラスト生成AIソフト『Stable Diffusion』を触ってみた感想、始めます。

ソフトについて

 導入したのは『Stable Diffusion webUI AUTOMATIC1111(ローカル版)』。恐らく一番定番なんだと思う。なんかよくわかんないのを色々インストールしておいて、起動はブラウザでやるっていうのが情弱には新鮮で面白かった。

 GWの初日、導入にあたって参考にしたのはこの動画。

日本一わかりやすいStableDiffusion WebUI AUTOMATIC1111(ローカル版)のインストール方法と基本的な使い方 - YouTube

 意外だったのは、Stable Diffusion(以下SD)の解説動画とかがyoutubeにあんまりなかったこと。導入編とかはそこそこあるけど、その後の拡張機能だとか、実践的な絵の生成とかに触れてる動画は話題性のわりに少ない印象だった。

とりあえず基本機能を触る

 ↑は初日にとりあえず簡単なプロンプト(いわゆる呪文)だけ入れて生成したやつ。ピンク髪とか巨乳とか入れてたはず。

 まず感想としては、適当なプロンプトだけでそれなりのクオリティの画像が10秒足らずで出てくるのは普通にすごい。
 これは先人たちが作ったモデル(AnythingV4とかcounterfeitV2、abyssorangemixなんちゃら)が絵柄を作ってくれると共にクオリティを保証してくれるのと、勝手にクオリティが上がるようなテンプレに近いプロンプトがいっぱいあるおかげでもある。

 個人的に難しかったのは、プロンプトのための語彙がないこと。プロンプトは英語のため、日本語以外喋れない俺は必死に翻訳サイトに「巨乳」とか「乳首」とか入れながら平成の中学生が海外動画サイトでエロ動画を探すときみたいな真似をする必要があった。

 ただこれはえっちな単語一覧を載せてる記事とか、プロンプト用によく使われる単語を予測変換してくれる拡張機能などである程度カバーはできた。

拡張機能を触る

 まず触れなきゃいけないのは「Lora」
 モデルとは違って特定のキャラやシチュエーション、服装などを学習させたファイルのことで、特定のキャラの画像を大量生産してるのはこれを使ってる。基本的にはCivitai(Civitai | Stable Diffusion models, embeddings, hypernetworks and more)というサイトに有志が作った学習ファイルを上げているので、それをダウンロードして使う感じ。

 ただキャラものは著作権的に厳しいのと、好みのキャラのLoraがなかったのであんまり触れなかった。逆に面白いなと思ったのは服装系とかシチュエーション系。プロンプトだけだと上手く出ない衣装とか、セックスでいう特殊な体位とか、そういうのをLoraで補強してやる、みたいなのは有用かもしれない。(そのたびにいちいちLoraを探すのはだるいかもだが)

 ちなみに俺はスカトロ系が好きなのでその辺のLoraを探したのだけど、おしっこはあまり再現性が高くないものしかなくて、うんちに関してはパッと探した感じ見当たらなかった。悲しいので知っている人は教えてほしい。

 それからControlnet

 これはいろいろ入ってる拡張機能で、特定の画像から要素を抽出してその要素を使いながらプロンプトとかと一緒に画像生成できる機能。

 わかりやすいのだと、線画を抽出する「canny」とか「lineart」とかの機能で、これはいわゆるトレースみたいなのを出来る機能。シンプルなトレース問題とかで出てくるのはこれを使ってるんだと思う。既存画像でこの機能を使うのはだいぶ危険なので、自分の趣味用に留めるか、あるいは線画用の生成画像を自分で用意する必要がある。

 あとは「openpose」なんかは、人体のポーズだけを棒人間みたいに抽出してくれる機能。こっちは元画像とまんま同じってわけじゃないので、トレースって程ではない気がする(セーフなのかは知らないけど)。棒人間を自分で書いたり、3Dモデルを自分で作成してポーズ用人形にしちゃうとかできると可能性は広がる。
 AIイラストはキャラの容姿とかより構図やポーズを指定する方が難しいとされているので、上記の二つやこれなんかは上手く使えるとよいなと思う。

 それから「shuffle」機能。元画像の雰囲気だけを残しつつ、構図やポーズは新しく作り直せる機能。可能性の塊らしいけど、俺は使い道がいまいちわからなくてスルーしてる。どちらかというとアイデアを膨らませるための機能なのかもしれない。

 あとは「inpaint」。既に生成した画像の特定の部位だけに加筆修正できる機能で、何もない空間に小物を追加したり、気に入らない手の形を直したり、形はそのままで塗りとか色だけを直したりできる。ちゃんとした一枚の絵を生成するには最終的にこれを使って細かい部分の完成度を上げていく形になるんだと思う。

いろいろ試してみた

 ↑はとりあえずおっぱいの大きい女の子を生成したかったのと、プロンプトで色々試してた途中のやつ。

 顔がみんな同じになるよなーと思って垂れ目とか丸顔とかプロンプトに加えてみたものの、効果があったかはよくわからない。(ぶっちゃけGWでAI絵を見過ぎてゲシュタルト崩壊気味)。
 ちなみに眼鏡はgrassesじゃなくてeyewersらしい。形や色はinpaintで後から変えられるみたい。セーターもよく見ると黒の下に白を着てる謎構成だけど、これも後から直せた。精子はcum on breasts。ちなみに精子のかかり方のプロンプトはバリエーション豊富で、強調度合いで量も変えられる(しかも精度が高い。精子だけに)

 個人的にはもっと乳首の色や乳輪の大きさについても検証したかったが、これはプロンプトの予測変換があんまりバリエーションをよこしてこなかったのであんまり試せてない(僕は乳輪の色は薄い方が好みです)。

 あとこだわり所としては服と下着におっぱいが挟まれている点なんだけど、全然ガチャを回しても出てこなくてようやく出てきたのがこれだった。というか下着が弱いのかもしれなくて、そもそも出てこないとか胸に同化してるのとか出てもセクシー下着みたいなのばっかり。普段から可愛い下着を着ている俺としてはその辺も重要視したいので、下着系のプロンプトがあったら誰か教えて欲しい。

まとめ

 可能性の獣って感じはするけど、今のところ出来ることと出来ないことを探ってるって感じ。でもそのうち大体のことはできるようになるんじゃないかとも思う。それこそ2か月前の解説記事ですら微妙に古臭く思えてしまうこともあるので、科学の進歩は凄まじい。

 問題はこれで生成したものをどう使うかで、結局自己満足して終わることがほとんどだと思う。さすがにAIイラスト集みたいなのしか作れんのは微妙だろうし、ビジネスで絵やってる人間が使いだしてからが本番だと思う。

 すごいなーと思うのは効率性の部分で、なんだかんだ言って数秒とか数分で何枚も絵を生成できるのはバグってる。誤差みたいなのばっかりファイルに溜まっていくのはポケモンの厳選みたいでウザいけど。

 あと自分は小説寄りの人間なので、たとえば小説の表紙や挿絵みたいなのを自分で作れるのとかはちょっと期待している。また他所の例だと、出会い系サイトの広告にリアル系のAI画像を使ってるのとかもあったり。そういう『イラストや画像を発注したいけどほどほどのクオリティさえあればいい』みたいなのはAIで足りるようになるかもしれないね。