最近のAI画像生成についての思うところ

どうですか、AI画像生成してますか？

僕は個人で楽しむ程度でちょこちょこやってます。

AI画像生成の先駆けともいえるMidjourneyが23年の夏くらいに一般に公開されて、そこからAI画像生成について爆発的に普及と発展し、これからの進化に目を見張るものがあります。

ゆくゆくは動画生成もしてみたいですが、未だブレが多くて、実用段階ではなさそうです。それに生成に必要なGPUもどんどん進化してくれたら加速度的に進化していくでしょうね！

AIマヤちん

なんかむちむちした表現が嬉しいし、なんだか悔しい！ここまで描いてみたい！

ここからオリジナルキャラクターのデザイン拡張をしてみます

フィギュア化するLoraがあるので試しに使ってみました。

K.C.ちゃん

フィギュア欲しい

設定画的なもの

作画は素晴らしい。けど、細部がひろゆき並に適当なので、この適当さも調節できればなぁ。

Rayちゃん

アイドルオーラが出てるけど、アイドルだったんか。

Flareちゃん

服パーツごとの色指定が不得意らしくて、服の色が毎回ミックスされます。

デザインはかっこいいんだけど、本当に固定させたいとなったら自作でLora作るしかない。

Hermitちゃん

今風っぽくダボっとした服にスニーカーを合わせてイメチェン。

ベースは黒ロリに白衣を羽織る感じ。

眼鏡はあってもいいかなと思う。

Whirlちゃん

たまにしっぽが付くし、ミニスカポリスのコスプレになってしまう。

一応これでも最強キャラとして崇めてください。

Deathちゃん

原初の敵として登場させてみたけど、最初からこのレベルでデザインできていればなぁ。

薄汚れた幽霊っぽい見た目で、大きな鎌を持たせたいけど、なかなか出てこない。

双子のJudgementちゃん

大体はいい感じ。

ここからだいぶ昔に作っていた話である、キャラのAIリファインをしてみます。

もう十数年前の絵なんで、懐かし過ぎて涙が出そう。

当時マウスで描いてました。

エリンちゃん

親の都合でわざわざ片田舎に越してきた元気な子。体力はある。

モーリィちゃん

その片田舎のお嬢様。エリンちゃんが大好き。おっとりしていて冷え性で鶏肉が好き。

エマちゃん

妙に大人びていてクールな教会勤めの子。

クリスちゃん

村中をぶらぶらしている小さい子。

黒い服が好きなのでエマちゃんから「カラス」と呼ばれる。

感無量です。

これならサウンドノベル的なものは簡単に作れそう。

ただ、やっぱり、細部が適当で統一されなくて、手足がウソくさいし、アクロバットな表現は向いてないので、１００％をAI画像で賄うというのはまだまだ厳しいかと思います。生成したものを細部手直しする作業が必要なので、大幅に作業効率が上がったかといえば、全然上がっていないですし、ここに掲げた生成画像の陰に、大量の失敗画像があることは、知っていても良いことです。

なんか例えばこんな感じのもの。

今まで使用したStable Diffusionというのは、平面でノイズからノイズ同士をかき集めて、それっぽく画像を生成するのがこの技術で、ノイズをプロンプト（呪文）に寄せて形成していくというもの。以下wikiより引用。

＞Stable Diffusion（ステイブル・ディフュージョン）は、2022年に公開されたディープラーニング（深層学習）のtext-to-imageモデル（英語版）である。

よくある３Dのゲームからスクショするイメージをしてもらえたらわかりやすいと思いますが、３Dのキャラを仮想的に生成した後に、仮想空間に設置し、それをいろんなアングルから撮影して２D化するプロセスなら、解剖学的に失敗しない（Bad anatomyな）画像はできないはず。まあ、ここで思い付きで無責任なことを言ったとしても、いずれプロたちが近い未来解消していることに期待。

hakt’s life diary

海外のドラマを見たり、麻雀、クイズゲーム、イラスト、１次創作、あとひきこもり

最近のAI画像生成についての思うところ