4月15日土曜日。本日の東京の天気は終日の雨。午前中、食料品の買い物のためイオンに出かけたのと、近所のまいばすけっととセブイレブンに出かけた以外は部屋に閉じこもっていた。
折角の休日ではあるけれど、意外と時間を有効に使えない。これはいつものことだ。
平日よりかは英語の学習をしているとは思うのだけれど、すごく頑張ったという実感がわかない。どうしても日中眠くなるため、買い物に出かける10時半過ぎから、買い物と昼食をはさんでの昼寝をすると、午後は早くても1時半ごろまで、勉強が出来ないからである。極端な朝型のため、昼下がりから夜半にかけて、どんどん気力も体力がなくなってしまうのである。
さて、今日のAI画像生成だ。今日も色々試したところ進展があった。
進展その1.Google corabo上でstable diffusionをほぼ確実に実行できるようになった。これまでも何度も試しているが、安定して動作させることがなかなかできない。一度実行できても、2度目はエラーになったりする。
エラーの原因やよくよく調べてみると、モジュールがインストールされていないことだとわかった。どうやら動作環境がアップデートされても、Google Driveに保存したStable diffusionの実行環境ファイルが古いままであることが原因なのだそうだ。
足りないモジュールを個別にインストールすることを憶えたのだが、一つインストールすると、また違うモジュールでエラーが出るの繰り返しにほとほとまいってしまった。よくよく調べてみると、モジュールを個別にインストールするのではなくパッケージそのものを入れ替える必要があるとのこと。
その通りにやってみたら、安定して動作することを確認できた。
Google corabo上でstable diffusionを実行すれば、非力なパソコンでも画像生成が出来てしまいとても便利だ。しかしインストールに時間がかかるし、動作には制約があるし、エラーが出たらアップデートをしないといけないし、安定した動作を求めることが難しいのだ。
やはりハードの投資に費用はかかるが、ローカル環境でWEBUIを動作させたほうがなにかと捗るのは間違いない。
進展その2.これまでリアリスティックなイラストを作成するとキャラクターの画面が崩壊してしまう現象に悩まされてきた。プロンプトの問題だろうと思い色々と工夫をしても改善せず。作画が崩壊するのはどうしようもないのだとめあきらめていた。しかし原因は解像度不足によるものであることが判明。高解像度で出力すると作画が崩壊せずキレイな表情で画像が出力された。原因はメモリ不足だ。高解像度の画像を生成するには、大容量のVRAMが必要なのだ。これまでローカル環境でのみ画像生成をしていたので、6GBのVRAMでは高解像度の画像を出力することができず。なので原因について気づくことができなかった。
何故気がづいたかというと、Google coraboならサーバーのGPUを使用できるのでローカル環境では作成できない高解像度の画像を生成できるからである。
以前作成した作画が崩壊している画像のプロンプトを再利用し、高解像度で出力するととてもキレイな画像が生成できた。
やはり画像生成には大容量のVRAMが必須なのである。
プロンプト
parameters
(masterpiece, best quality, detailed:1.4) (1girl:1.5), cowboy shot, beautiful detailed face and eye, smooth, A high school girl in a school uniform with very long, pale pink hair is studying English listening at a Coffee shop. She's using a Walkman and wearing headphones while studying. beautiful detailed fullbody, navel, (sitting,:1.5) The video quality is high definition, and the artwork is reminiscent of Makoto Shinkai's style. traditional media, by famous artist, A mix of anime and computer graphics,
Negative prompt: (EasyNegative:0.8), (worst quality, low quality:1.4), deformed,((error, jpeg artifacts, any text)), staked torsos, totem, asia, stand
Steps: 26, Sampler: DPM++ SDE Karras, CFG scale: 8, Seed: 3158368148, Face restoration: GFPGAN, Size: 512x512, Model hash: 83569a04f4, Model: 2dn_1, ENSD: 31337
No comments:
Post a Comment