今週開催されたDevSummitカンファレンスで、Arm社は、2022年に予定される次世代GPUアーキテクチャにより、FP32機械学習のパフォーマンスに関しては、今年のArm Mali-G710と比較して性能がほぼ倍増すると述べました。Armの2018年の前世代アーキテクチャと比較すると、新GPUは同ワークロードにおいて約5倍の速度を発揮するという。
DevSummitに登壇したArmのイアン・ブラット氏(ArmのML事業部技術担当シニアディレクター)は、ArmのGPUアーキテクチャの機械学習性能がいかに早く進歩するかを示すスライドを示しました。同社の2022年のGPUアーキテクチャは、コア当たりの性能に関しては、FP32のMLワークロードでMali-G76の4.7倍になると予想されています。GPUコアは、実行ユニット、テクスチャユニット、ラスターユニット、およびその他のアプリケーション固有のハードウェアのクラスタです。
FP32 MLの性能向上が、ゲームでの性能や全体のワット当たりの性能にどのような影響を与えるかは不明ですが、最新のArm Mali G-710は、Mali-G78を実装した場合と比較して、ISOプロセスノードのGPU構成において、ML性能が35%、グラフィックス性能が20%向上することがわかります。そう考えると、ArmにとってML性能がいかに重要であるかがわかります。一方で、Armはソフトウェア開発者が自社の最新技術を活用するためのツールを確保する必要があります。
The Registerによると、Bratt氏は「単に命令を追加したり、ハードウェアIPを改良するだけでなく、そのML性能を実現するためのソフトウェア、ツール、ライブラリを提供しなければなりません」と述べました。
Arm社は近年、GPUアーキテクチャの開発を大幅に加速します。かつてのArmは、1つのGPUアーキテクチャを5年ほど放置し、アーキテクチャは時間の経過とともに、コアごとの性能やサポートするコア数の面でかなり意味のある進化を遂げていたが、これらのアーキテクチャの性能向上は決して画期的なものではなかったです。2016年以降、Arm社はGPUアーキテクチャのケイデンスを3年ごとにする一方で、毎年新しいイテレーションのアーキテクチャを導入し続けました。
そのスピードアップにより、機能や性能の進化が非常に早くなりました。例えば、今年発表されたMali-G710(Valhalla 3アーキテクチャベース)は、2018年に発表されたMali-G76(Bifrost 3アーキテクチャ)と比較して、コアあたりのグラフィックス性能に関しては2~3倍高速です。
残るのは、世界中の規制当局が同社のNvidiaによる買収を承認した場合(あるいは承認された場合)、ArmのGPUアーキテクチャがどのように進化するかということです。カリフォルニア州サンタクララに本拠を置く同社は、ディスクリートGPUだけでなく、機械学習を含むさまざまなワークロードに使用されるコンピュートGPUの世界最大のサプライヤーであるため、NvidiaがMali GPUの開発を継続するのか、それともMali GPUの開発者を自社のアーキテクチャに再配置するのかは不明です。