MITがAI消費電力を秒単位で予測するツールを開発
詳細を読む
MITとMIT-IBM Watson AI Labの研究チームが、データセンターで特定のAIワークロードを実行した際の消費電力を数秒で予測できるツール「EnergAIzer」を開発しました。ローレンス・バークレー国立研究所の推計では、2028年までにデータセンターが米国の総電力消費の最大12%を占めるとされており、AI時代のエネルギー効率改善は喫緊の課題です。
EnergAIzerは、AIワークロードに含まれる反復的なパターンに着目しています。ソフトウェア開発者がGPU上で効率的に動作するよう最適化を施す際、並列処理コアへの作業分散やデータ移動に規則的な構造が生まれます。この構造を捉えることで、従来のように個々のステップを逐一エミュレーションする必要がなくなりました。
ただし高速推定だけでは全コストを網羅できない課題もありました。GPUがプログラムを実行する際のセットアップコストや、帯域幅の競合による速度低下に伴う追加電力などです。研究チームは実際のGPUから測定データを収集し、補正項を推定モデルに組み込むことでこの問題を解決しました。
実際のAIワークロードとGPUを使ったテストでは、EnergAIzerの推定誤差は約8%にとどまり、数時間かかる従来手法と同等の精度を実現しています。ユーザーはAIモデルの種類や入力の数・長さといったワークロード情報を入力するだけで、GPU構成や動作速度を変えた場合の電力消費の変化も確認できます。
データセンター運営者にとっては限られたリソースの効率的な配分に、アルゴリズム開発者にとってはモデル展開前のエネルギー評価に活用が期待されます。研究チームは今後、最新GPU構成への対応や、複数GPUが協調するワークロードへのスケーリングを目指すとしています。本研究はIEEE International Symposium on Performance Analysis of Systems and Softwareで発表されました。