テスラのスーパーコンピューターシステム「DOJO」
テスラ車からデータを吸い上げ、ニューラルネット(NN)をトレーニングして、その結果を再びテスラ車に配信する作業は、これまでNvidia社製のGPUサーバーA100を使っていたのですが、複数台をつなげて並列作業をする限界を迎えており、かつ、トレーニングに1ヶ月を要するNNモデルもありました。DOJO(ドージョー)の役割はトレーニング時間を1ヵ月から1日に短縮することです。
以下はこのセクションの冒頭の様子ですが、アップルのA5チップを開発したピーター・バノンと、AMDでデザインエンジニアリングの上級ディレクターを務めたガネッシュ・ヴェンカタラマナンが揃って壇上にいる時点で、テスラは自動車メーカーではなく、ガチのテクノロジー企業だと分かります。
NNのトレーニング時間は増加の一途をたどっており、しかも指数関数的に増えています。従来のGPUクラスタはCPUやGPU、メモリの比率がある程度決まっており、並列化にも限度があります。DOJOは将来を見越して、各要素の比率を任意に変え、高い拡張性を持たせることを設計コンセプトに掲げています。
DOJOは高密度にパーツが集積されており、そこに正確に電力を送ることがハイパフォーマンスの鍵になります。1ミリ四方あたり0.86Aも電流を流すため、膨張率の異なる素材を使うと故障します。ここでもテスラは自社開発で適切な素材を探し、性能も目標値の約3倍を達成しました。
大電流を流すと熱が発生するため、冷却能力も問われます。従来のキャビネットを購入して要求仕様に合わせて加工するぐらいなら、これも自社開発するほうが安いため、これも内製化。この大きなロッカーほどのサイズに負荷試験として先日2.2MWの電流を流し、近所の変電所をダウンさせて市から苦情の電話が来たそうです。プレゼンターのビル氏は自慢気に語ってますが、近隣住民の迷惑だから自社のMegapack(1.9MW)をバッファとして接続したらどうなんだと問い詰めたいですね。
トレーニングタイル(金色の正方形)が6枚乗るシステム・トレイは2000A x 52Vで最大104kWもの電力を消費します。このトレイが6枚のタイルをつなげるだけでなく、トレイ同士も接続する役割を果たします。そして冒頭の写真のように複数のキャビネットがつながって1.1エクサFLOPの性能を持つExaPOD(エクサポッド)が完成します。
DOJOの性能は、テスラが現在GPUクラスタで使用しているNvidia A100と比較しても桁違いに優れています。まず、同じ操作を行った場合の遅延がA100は150μ秒なのに、DOJOだとわずか5μ秒しかありません。
自動ラベリングやOccupancy networkのような実際の業務も、それぞれ3.2倍と4.4倍の速度を達成する予定です。
DOJOのトレーニングタイル1枚で現在使用しているGPUボックス6個分に相当する性能が得られ、コスト面でもDOJOタイルはGPUボックス1個よりも安いのです。
DOJOキャビネット4個で、既存のGPUラック72個を置き換えることができ、来年の第1四半期にはExaPOD(DOJOキャビネット10個)を完成させ、ゆくゆくはテスラ本社のあるカリフォルニア州パロアルトに7台のExaPODを設置する予定です。
最後に、DOJOはこれで完成ではなく、次世代ハードウェアも現在開発中です。これが完成すると更に10倍の性能が引き出せるのです。プレゼンテーションの締めくくりとして「この次世代ハードウェアを一緒に作りたい世界の天才たちはぜひテスラまで」と、本来の人材募集の話につなげます。
シリコンバレーでは優秀なエンジニアの確保が非常に難しいです。テスラは他の自動車メーカーだけでなく、アップルやGoogleといった会社とも人材の取り合いをしなくてはなりません。往々にして天才エンジニアはすでに経済的に困っていないので、給料で釣るのは難しく、このようなイベントで夢や希望を抱かせるほうが結果が出ることは、テスラが何度もリクルーティングイベントを行っていることから明らかです。
プレゼン終了後に登場したイーロン・マスクの表情は生き生きとしており、CEO自らが目を輝かせながらマニアックなオタクトークをしている姿ほど効果のある広告はないだろうと感じました。
Q&Aセッション
ここからはいくつか興味深い質問と回答を解説していきます。
【Q】オプティマスはなぜ腱やバネを使っているのか? リンケージより耐久性が低いのではないか?
【A】 金属ワイヤーなので耐久性はあるし、量産しやすい。バックラッシュも予防できる。手を開く側をバネにすると、閉じ側のアクチュエーターだけ用意すればよい。できるだけ早期に、量産しやすく、人類の役に立つロボットを作りたいから、この選択に至った。
【Q】オプティマスによって、テスラ社のミッション「持続可能な未来のために」は、例えば「無限に豊かな社会のために」などのように変わるのか?
【A】オプティマスの実現により、会社のミッションはより広いものになり、例えば「素晴らしい未来をつくる」などになるだろう。私(イーロン)はオプティマスの5年後10年後を見たいと感じる。様々なテクノロジーが進化の停滞期にある中でオプティマスは伸び盛りだから楽しみで仕方がない。
【Q】オプティマスの最終的なゴールは何? 喋るようになることか?
【A】もちろん喋れるようになるだろう。ゴールが未知数だから面白い。ターミネーターにならないように、オンラインでハッキング不可能な物理停止スイッチなど、安全機構を設ける。
【Q】DOJOはアマゾンAWSのようなサービスか、それともメーカーとして販売するのか?
【A】DOJOは大電力が必要なためテスラで管理してAWS的にサービスを売るだろう。ソフトウェア2.0の世界ではNNのトレーニングが多用されるだろうから、多くの企業が安くて早いExaPODを使いたいと考えるだろう。
【Q】AGIはテスラでもやるのか?安全性はどう確保する?
【A】テスラは安全性を重視する会社だし、車や飛行機のように法規も作られるだろう。テスラは将来、車やオプティマスから現実世界の大量のデータを吸い上げられる。そのデータをトレーニングする能力もある。スパコンにインターネットの情報を読み込ませるのもいいが、競合他社は現実世界にカメラやマイク、その他のセンサーを持っていない。そういう意味でテスラはAGIの発展に寄与できると思う。
【Q】大型トラックのSemiは乗用車と同じセンサー類を使うのか?
【A】車を運転するのに必要なのは考える力と目。ならば8つのカメラで充分だ(訳注:つまり乗用車と同じセットアップ)
【Q】アメリカでβテスト中のFSDはいつ世界に展開する? 現在、何がボトルネックで、同解決して人間より安全なシステムにするのか? シングル・スタック(一般道と高速道路のNNを統合したもの)はいつできるのか?
【A】年内に世界に配信したいが、各国の規制もあるので、それは認可次第。来月大型アップデートをする予定だが、これにより横方向からの交通を飛躍的にうまく処理できるようになるだろう。11~12月にはシングル・スタックに移行する。パーキング・スタックも年末までに統合を予定しているため、自宅駐車場から目的地駐車場までノンストップで自動運転できるようになる。
【Q】20代に若返ったら自分にどういうアドバイスを送りたい?
【A】テスラに就職しろ、頭のいい人と会え、本を読め、頑張りすぎず息抜きもしろ。昔、SpaceXのFalcon 1ロケットを作っていた時、海がきれいな島にいたのにビーチに座ってビールの一杯も飲まなかったのが悔やまれる。
【Q】オプティマスだけで工場を操業できるか?
【A】まずは積み込みや配送など簡単な仕事から始める。溶接などは従来の溶接ロボがやる。オプティマスの役立つエリアは拡大していくだろう。3~5年でオプティマスを購入できるようになる。
【Q】FSD Betaの利用者は多いがリスクはどう考えるのか?データの透明性は?第三者機関に評価させたほうが良いのでは?
【A】テスラは安全を第一に優先している。機械的に見ても衝突安全性は歴代1位だし、APも、AP無し、HW1、HW2、HW3と安全に磨きがかかっている。例えば「人間より3倍安全じゃないと世に出してはならない」などの論争もあるが、人命を救う可能性のある技術を作ったのなら、それを世に出すことが倫理的に正しい行為だと思う。誰かが命を落としたら遺族に訴えられるだろうが、逆にその技術で助かる命もある。フリートデータからAP無しより有りのほうが安全なことは統計的に示されている。
知っておくとさらに楽しいトリビアコーナー
最後に、テスライベントレポートでは恒例となってきたトリビア紹介です。結構本編の中にコメントを書いてしまったのでトリビアが少なくなりましたがご笑覧ください。
●最新のオプティマスは腰にテスラのベルトバックルをしている。
テスラストアでも購入可能です。ベルトに書かれているDon’t mess with Teslaは、意訳すると「テスラなめんなよ」。
●テスラ製品をリバースエンジニアリングしているハッカーはイベントへの出入りが禁止されていた。
噂によるとAI Day 2への招待状を持ったハッカー数名が「今日のイベントは人材募集目的だから」と入場を断られたそうです。もちろん丁重にお断りされ、旅費なども補償されたのですが、テスラでは相当ハッカーに対してピリピリしているようです。
●イベント中にあった「駐車場から駐車場までノンストップで」発言はパークシーク(リバースサモン)を示唆している。
パークシークは「駐車場を探す」と言う意味です。日本でもファームウェアVer 2022.28.2に「スマートサモン」が含まれており、指定地点に車を向かわせたり、自分のところに来るよう指示できるようになりましたが、パークシークは目的地で降車したあとに自動的に駐車スポットを探してくれる機能です。噂によると3つのモードがあり、建物の入口付近、ショッピングカート返却スペース付近、ドアパンチされないように離れた場所から選べるのだとか。日本(と言うかアメリカ以外のほぼすべての国)では6m以上離れて遠隔操作してはいけない法律があるため、この機能は使えたとしても役に立たないでしょうね。
●AI Day のようなイベントは今後も開催する予定で、もしかしたら月に1回のポッドキャストになるかもしれない。
これは断定できませんがもしかしたらルーシッドモーターズがYouTubeでだいたい月に1回発表しているテックトークへの当てつけかもしれません。テックトークでは直接ブランド名を出さないにしても、「アメリカのEV大手」とか「ドイツの高級スポーツカーメーカー」のモーターやバッテリーを引き合いに出して、いかにルーシッドが優れているかを語るインフォマーシャルで、テスラからすると面白くないのでしょうね。
●実はオプティマス君、すでに知性を身に着けており、生みの親であるイーロン・マスクが大好きである。
これに気づいた人はいないでしょう(笑)
まとめ
イベント中にイーロン・マスクは自社のことを「多くの人がテスラを自動車メーカーだと思っている。実際は現実世界を扱ったAIやハードウェア、ソフトウェア企業だということを理解していない」と述べています。6~8ヶ月で自律的に動く二足歩行ロボットを作ったり、機械学習のためのスパコンを作ったりできるのは、エンジニアを軽視せず彼らがのびのびと、そして夢を持って仕事ができる環境を提供しているからに他なりません。そうした社風を感じさせることが優秀な人材を集める一番のスパイスなのかもしれません。
【ライブ配信動画(YouTube)】
※記事中画像はYouTubeライブ配信動画からの引用です。
【関連記事】
テスラ「AI Day 2022」翻訳&解説レポート【Part.1】人型ロボットのお値段は?(2022年10月7日)
テスラ「AI Day 2022」翻訳&解説レポート【Part.2】完全自動運転の現在地とは?(2022年10月8日)
テスラ「AI Day 2022」翻訳&解説レポート【Part.3】完成間近!スーパーコンピューターExaPOD (2022年10月9日)
(文/池田 篤史)