画像生成AIのStable DiffusionのUIをシンプルにしたFooocusがなかなかお手軽で面白かったです。先日の非プログラマー向け自作PCワークショップでPinokioをインストールしてからStable Diffusion Web UIを動かしたんですが、組み立てたPCでは上手く動かなかったので代替品を探しているときに見つけたのがFooocus。
これは左側のウィンドウがPinokioでFooocusを動かし、右側の2つのウィンドウでhtopとnvtopを動かしてCPUやGPUの稼働状況を監視している様子です。
htopとnvtopはそれぞれ次のコマンドでUbuntuにインストールできます。
$ sudo apt install htop
$ sudo apt install nvtop
世の中には日夜望みの画像を得るためにStable Diffusionのモデルをファインチューニングしプロンプトを工夫している人がたくさんいます。美少女画像の生成に夢中の人が多いようですが、いずれにせよ多くの人が努力しています。
僕なんぞはプロンプト職人のような知識がないので、もっぱらプロンプトは文書生成AIに作らせてから小変更を加えるというやり方をしています。
これは別のサーバーで稼働しているDifyからOllamaで動くGemma2を使ってStable Diffusionのプロンプト作っている様子です。
モノづくり塾では生成AIを3台のPCで動かしているので、一度にいくつもの推論を実行する場合は、それぞれのPCに負荷を分散しています。
Fooocusの良いところは、細かなパラメーターの設定をせずとも、バリエーション豊かな画像を生成できる点。画風のプリセットスタイルがあってアニメ風とか実写風といったプリセット選べばそれなりの画風の画像が生成されます。面白いのでついつい没頭してしまいます。
ChatGPTのようなTransformerベースの文書生成モデルやStable DiffusionのようなDiffusionモデルをスクラッチから開発するための情報はネットを検索すればたくさん見つかります。プログラマーやAI研究者であればそれらを学んで自分で生成AIアプリケーションを作るのも良いと思いますし、是非、そういう挑戦をしてほしいと思っていますが、そうでなければこのようなお手軽なツールを使って生成AIで遊んで馴染むのも良いと思っています。