Googleの次世代TPUは4.7倍の性能向上を約束

Googleは、Google I/Oデベロッパーカンファレンスで、データセンターAIチップであるTensor Processing Units(TPU)の次世代、第6世代チップであるTrilliumを今年中に発売すると発表しました。

GoogleのCEOサンダー・ピチャイ氏は、会議の前に行われた記者会見で「Googleはこの瞬間のために作られました。私たちは10年以上にわたってGPUのパイオニアとなっています」と述べました。

トレードマークのようにI/Oで次世代のTPUを発表していますが、そのチップが実際に展開されるのは後になります。しかし、ピチャイ氏によると、第5世代と比較して、第6世代はチップごとの計算パフォーマンスが4.7倍向上する予定です。

Googleは、MXU(Matrix Multiply Units)を拡大し、全体のクロック速度を引き上げることで、これを実現しました。さらに、メモリーバンド幅も2倍に増加しました。

さらに重要なのは、Trilliumに第3世代のSparseCoreが搭載されていることで、これはGoogleが「先進的なランキングと推奨のワークロードで一般的な超大規模な埋め込みを処理するための特殊なアクセラレータ」と説明しています。これにより、GoogleはTrillium TPUがモデルのトレーニングをより迅速に行い、低遅延で提供することができると主張しています。

ピチャイ氏はまた、新しいチップをGoogleの「最もエネルギー効率の高い」TPUと表現しました。特にAIチップの需要が急増している状況で重要です。「過去6年間で、産業のMLコンピューティング需要は100万倍に成長し、おおよそ毎年10倍増加しています」と述べました。これらのチップの電力需要を削減する投資なしには、これは持続不可能です。Googleは、新しいTPUが第5世代のチップよりも67%エネルギー効率が向上していると約束しています。

GoogleのTPUはこれまでさまざまなバリアントで提供されてきました。これまでのところ、Googleは新しいチップに関する追加情報や、Google Cloudでの使用コストについては提供していません。

今年初め、GoogleはNvidiaの次世代Blackwellプロセッサにアクセスできる最初のクラウドプロバイダーの1つとなることを発表しました。しかし、開発者がこれらのチップにアクセスできるようになるのは、2025年初頭まで待たなければなりません。

「AIの進展を支えるインフラへの投資を続け、新たな領域を切り拓き続けます」とピチャイ氏は述べました。

AIニュースレターの配信を開始します!是非、6月5日からお手元に受け取るように登録してください。