VAEで画像をエンコードして、ちっちゃくしたやつです。今回はSD3.5のVAEでやってみよーと思います。特にSD3はチャンネルが16もあるのでサイズがおっきいです。 ランダム性を避けるためエンコード時はmode()にしておきます。 整数量子化 latentの値を整数で表す ...
ComfyUI fennec 三姉妹にお手伝いに来てもらいました。苺の旬につき苺柄 今回はVAE処理時のpytorch_attentionに関する2本立て。 1本目の ComfyUI高速化 その5 は初心者向け、 2本目の ComfyUI高速化 その6 は上級者向け。 まずは1本目のこの ComfyUI高速化 その5 では、 独自 ...
ポジティブワン株式会社(本社:東京都渋谷区)は、OpenCV,エンコード、デコードなどの画像処理に関するシステム開発に ...
画像生成AIのStable Diffusionは「潜在拡散モデル」と呼ばれるAIで、テキストを入力するだけで高精度な画像を生成することが可能です。このStable Diffusionに使われている「VAE」に致命的な欠陥があるという報告が、オンライン掲示板サイトのRedditに投稿されてい ...