AMDのRadeonってAIの画像生成には向いてないって聞いたんだけど、Stable Diffusionは使えないの?
(ZACK IT編集)
少し前まではそう言われていたけど、AMD Radeonに最適化されたAI画像生成ソフトウェアも出てきているんだ。「AMUSE」っていうStable Diffusionベースのソフトウェアがある。これならRadeon環境でも超絶簡単にAI画像生成環境を構築出来て、ローカルPCでバンバン生成できるよ!
「AMUSE」とは?
「AMUSE」は、AMDのRadeonに最適化されたAI画像生成ツールで、Stable Diffusionをベースに動作している。Stable Diffusionといえば、Web UIやAutomatic 1111版などいくつか導入方法はあるがいずれもRTX 4070 SUPERや4080などNVIDIAのCUDAコアを活用して大量の画像を生成することで知られているが、Radeonユーザーにとってはパフォーマンス面で劣ることや、そもそも互換性の問題から少なくともWindows上では安定した生成環境を用意するハードルが課題だった。
しかし、この「AMUSE」はAMDの最新のXDNAI技術を用いて、モバイルベースのAPUやデスクトップ向けでもRYZEN AI機能を備えたRYZEN 5 8600Gでも画像生成機能を高速で効率的に画像生成を行えるように設計されている。
さらに、Stable Diffusionのコミュニティが提供する多数のモデルや設定もサポートしているため、カスタマイズの自由度も高い。
推奨環境 | ・AMD Ryzen AI 300シリーズ+24GB RAM(モバイル) ・AMD Ryzen 8040シリーズ+32GB(XDNA、モバイル) ・Radeon RX 7000グラフィックスカードシリーズ |
最低環境 | 24GB VRAM/32GB RAM/40GBディスク領域 |
「AMUSE」のインストール方法
「AMUSE」のインストールは非常に簡単。まず公式サイトからインストーラーをダウンロードし、セットアップファイルを実行する。AMDのRadeon GPUを使用している場合、ドライバやソフトウェアの最新バージョンをチェックしておくことをおすすめする。特にAMUSEは最新のドライバに依存する部分が多いため、古いドライバでは動作が不安定になる可能性があるためAMUSEが推奨するバージョン以前のAdrenalin Editionの場合は先にアップデートしておこう。
インストール後、初回起動時にはいくつかの初期設定が必要だ。Stable Diffusionモデルのダウンロードや、生成に必要なライブラリのインストールが必要な場合があるので、ポップアップででる指示に従って進めれば良い。これらのセットアップが完了すれば、すぐにAMUSEで画像生成を楽しめる。
インストール自体はものの数分もかからず終了し、あまりの簡単さにあっけを取られるレベル。筆者が依然「AUTOMATIC 1111版」のStable Diffuion環境をRTX2070機で構築した際はまずPython環境からインストールする必要があり、1日中パソコンに張り付いてやっとの思いで起動した記憶。
AMUSE」の使い方
AMUSEのUIは直感的で、初めてのユーザーでも使いやすい設計となっている。画面は大きく分けて「EZモード」と「Advancedモード」に分かれている。
EZ Modeの初期設定では「Negative Prompt」は使用できないが、歯車マークの「Settings」の中に「Negative Prompt」を有効化するメニューが存在する。もちろんAdvanced Modeであれば対応するモデルでは「Negative Prompt」を標準で使用可能。
EZモードでは、テキストボックスに生成したい画像の内容を入力するだけで、簡単にAIが画像を生成してくれる。こちらは特に初心者向けで、細かい設定を気にせずに試したい場合に最適だ。
一方、Advancedモードでは、画像生成の細かなパラメータを調整することができる。具体的には、生成する画像の解像度やSeed値、ステップ数などをカスタマイズすることが可能だ。また、複数のStable Diffusionモデルを切り替えたりもできるためより高度な生成プロセスを体験したいユーザーに向いている。
実際に「AMUSE」で画像生成を試してみた。
Text to Image(t2i)のEZ modeとAdvanced modeを試す。先述の推奨環境にはデスクトップ向けRYZEN APUシリーズが入っていないことが気がかりだが遠慮なく検証していく。
試した環境は以下。検証機材常連で毎度おなじみだがPC機材の高価格化が進む昨今において10万円台前半のPCがどの程度実用的か試すにはとてもちょうどいいリファレンス機であるという自負があるためこのまま今年は使い潰すつもり。
パーツ | 型番・品名 | 備考 | 価格 |
OS | Windows 11 Home 23H2 | 最新Update済(24/8時点) | Amazon |
ケース | CX200M RGB ELITE WHITE | 白ケース | Amazon |
CPU | AMD Ryzen 5 8600G BOX | Amazon | |
クーラー | AK400 DIGITAL WH | 白クーラー | Amazon |
M/B | B650M AORUS ELITE AX ICE | 白マザー | Amazon |
メモリ | CMH32GX5M2E6000C36W | 白メモリ | Amazon |
SSD | Samsung 990 EVO 1TB | Amazon | |
電源 | SST-DA750R-GMA-WWW | 白電源 | Amazon |
EZモード
まずはEZモードで試してみた。例えば今回は初回起動時に元々インプットされていたプロンプトである「Orange cat wearing a red hat」をそのまま生成させてみる。
先述の通りモデルのインストールを求められたら問題なければそのまま「Download」を押して進める。
モデルインストール後、ものの十数秒で4枚の生成画像が表示された。シンプルかつドアップ画像とはいえとてもレンダリング速度も速いと感じる。8600Gでもスムーズに動作した。
やはりPromptがシンプルだと面白みに欠ける画像が生成される印象。指示文が多ければ多いほど画像内のオブジェクトやディティールは増加傾向。
次に、EZ Mode内で「Performance」を設定可能の為、前回「Balanced」で生成したが今回は「Quality」優先で生成することにする。そしてPromptも「A boy playing PC game in the gaming room」へ変更。
先ほどとは別のモデルを使用するようで再度ダウンロードを求められる。こちらも容量が比較的大きく、約11GB。
必要なモデルのダウンロードが完了したため生成が開始される。先ほどのBalancedよりかは時間がかかるものの1枚当たり20秒程度で生成される。使用機材は繰り返しにはなるがグラフィックスカードは差さっておらずRYZEN 5 8600Gの内臓グラフィックスの実を使用している状況だ。
下の画像は先ほど生成した4枚の中で一番まともだった物。耳と左人差し指に違和感が残るものの、入力したプロンプトのイメージに近い。
Advancedモード
次にAdvancedモードを試す。
新しいモデルをダウンロードしつつ解像度やネガティブプロンプトを調整しながら画像生成を検証。
いくつかのモデルを試してみると時折下記の画像のような警告に遭遇することがある。これはグラフィックスカードのないAPU(統合グラフィックス)を使用しているため潤沢なVRAM容量がなく、出てくるアラート。メインメモリを32GB搭載しているため試しに「Run Anyway」で警告を無視して画像生成を試す。もしだめなら「Yes」で「Minimum」モードで試すほかないだろう。
今回はアニメキャラ風の女の子キャラを生成。だいぶクオリティが先ほどから向上したような印象を受けるがまだ違和感はある(右手等)。
ちなみに今回は試せなかったため次回に持ち越しとはなるが、「Inpaint」機能もあるため生成された画像の大部分に手は加えることなく一部のみ再生成したい場合に有用な機能も使用可能だ。
まとめ
「AMUSE」は、AMDユーザー、それもAPUなど低コストのグラフィックス環境を導入しているユーザーにとって待望のAI画像生成ツール。もちろんRadeonのミドル~ハイレンジグラフィックスカードを持っている人にとっては非常に使いやすい選択肢だ。
Goodポイントはとにかく導入が簡単。これにつきる。いちいちPython環境のインストールから試す必要がなくAmuseの公式サイトからインストーラを持ってきて終了だ。手軽さに100点を付けたい。
筆者が試した限りだとRYZEN 5 8600Gの内臓グラフィックス(実勢売価3.4万)でも快適に動作し、Stable Diffusionのエコシステムをフル活用できる点も魅力的である。今後、さらに最適化が進むことを期待しつつ、AMD APU/GPUユーザーにはぜひ一度試してみてほしい。