※冒頭写真はテスラのスーパーコンピューターシステム「Dojo」。(画像:テスラ)
大きな進化を遂げたFSDバージョン13
以前よりテスラは11月の感謝祭あたりにFSD(自動運転実現を目指す先進運転支援システム)の最新バージョン13(V. 13)のリリースを行うことを発表し、実際に北米では11月28日前後からテスラオーナーへのロールアウトが始まった。すでにX上などには多くのレビュー動画が上がっており、その進化を見た方は多いのではないだろうか。駐車状態からワンタッチでFSD起動が可能になり、車両が自分で駐車スペースを探して駐車するといった動作に加え、フル解像度のビデオ入力やトレーニング計算能力が5倍にスケールしたことなど、パフォーマンスが大きく改善した。
また、前回の記事では次期トランプ政権や政府効率化省のトップに就任するとされているテスラのイーロン・マスクがもたらす自動車産業への影響についてまとめた。MAGA(Make America Great Again)として強いアメリカや経済回復を訴えるトランプ次期政権にとって、テスラのような新しい「Made in America」ブランドは今後アメリカが世界をテクノロジーや経済で牽引するためにも成長させるべき会社になる。
そして、今後ますます注目を浴びるのはEV産業だけでなく、テスラがかねて注力する自動運転やAIの分野だ。トランプ次期政権下においては規制緩和による自動運転承認プロセスの迅速化が進む可能性が高く、新政権でのイーロンの影響力の増大により、AI分野においても研究開発の促進が予想される。
11月には米中経済安全保障調査委員会(USCC)がAIの開発を支援するため、第二次世界大戦中に初の原子爆弾を開発した「マンハッタン計画」のような大規模な取り組みを提案したこともニュースになった。USCCの委員でありPalantirのCEO、ジェイコブ・ヘルバーグは「歴史を通じて、急速な技術変化を最初に利用した国々が、しばしば世界的な勢力均衡を変化させることができたことがわかっている」と語っているように、AIの開発競争は、単に技術競争を超え、地政学的な競争へとつながる要素を多く含んでいる。
現在、自動車メーカーとしてテスラほどAIに投資している会社は他になく、今回はそのテスラが注力するFSD、そしてAI投資とその開発についてまとめてみたい。
投稿したユーザーが「かなり驚異的」と評する進化
前回の決算発表時にイーロンは必要な介入までのマイル数が以前のバージョン12に比べて5倍から6倍改善し、より良い進化を遂げると示唆していたように、今回のアップデートでは自動運転で遭遇する様々なシナリオにおいて、最小限の人間の介入で対応する能力を向上させているようだ。
X上でもっとも閲覧数の多かったユーザー(@DirtyTesla)のV. 13.2 のレビュー動画を紹介しておく。彼はその体験を「かなり驚異的」と表現し、スクリーン上のFSDを始めるボタンを長押しすると自動的にドライブモードに入り、ガレージから出て、雪に覆われた舗装されていない夜道を走行し、街中の人の操作を必要とせずに到着する様子を説明している。
First drive of FSD V13.2. FSD put itself into drive, drove out of my garage, drove on snow covered dirt roads, and took me to my destination with no help. It then parked itself in a parking spot. pic.twitter.com/lHxa6qC9Ae
— Dirty Tesla (@DirtyTesLa) December 1, 2024
この動画以外にも多くのユーザーレビューがXではポストされている。これらの進化を可能にしたFSD V. 13での特筆すべきアップデートは以下のような点だ。
36Hzフルレゾリューション(解像度)のAI4ビデオ入力。システムはフル解像度でビデオを処理することができ、各フレームにより多くの詳細情報を持たせることで、物体認識、道路状況の理解、障害物など、詳細な視覚情報に基づく意思決定の能力を大幅に向上させることができるようになった。また、ネイティブAI4入力とニューラルネットワークアーキテクチャにおいては、車のセンサーからのデータをAI4がそのデータの変換や前処理を必要とせずに、そのまま利用できることを意味する。これにより、データ処理のレイテンシー(遅延)が減少し、効率性が向上、このようなリアルタイムのデータ分析は自動運転では特に有利だ。
※AI4は以前ハードウェア4(HW4)と呼ばれていた。
また、テキサス・ギガファクトリーにあるCortex(コルテックス)スーパーコンピューティングクラスターはニューラルネットワークのトレーニング速度を5倍にし、より多くのシミュレーション、データ処理などが短時間で可能になった。より大きなモデルのトレーニングや、より広範なデータセットの使用が可能になることで、正確な予測、エッジ(境界)ケースのより良い対応、そして全体的に安全な自動運転につながるということだろう。
また、フォトン(視覚情報)受け取りから制御までの時間を約1/2に短縮した。これは視覚情報が車のセンサーやカメラに入ってからシステムがそれに基づいて制御行動を取るまでの遅延時間短縮を意味し、画像処理、意思決定、そしてステアリングやブレーキといった制御までが含まれる。これにより、素早い反応が求められるような状況下、リアルタイムのシステム応答性の大幅な改善がなされている。
ほかにも街中と高速道路でのスピードプロファイルでは、道路状況に応じた最適な速度調整がされたり、ボタン一つで駐車状態から自動運転を開始することでまったくハンドルを握らなくとも目的地まで行くことができるようになった。さらには駐車、出庫、バックの機能が統合し、車が駐車場所を見つけ、駐車し、駐車スペースから出てくる動作を自動で行えるようになっている。
また、今後追加される機能として、オーディオ入力の処理が可能になり救急車のサイレンのような音を検知することで、緊急時の車両対応が向上する予定だ。車両のカメラが一時的に覆われたり視界が遮られたりする状況を管理する能力の向上も含まれ、カメラの視界が遮られても他センサーのデータを使用することで安全に機能し続けるようにしたり、カメラやセンサーの自己清掃機能やドライバーへの通知も含まれるようだ。
このようにV. 13ではエンドツーエンドの自動運転ネットワーク全体がアップグレードされている。また、V. 13には将来のUnsupervised FSD(監視なしFSD)に必要な全ての機能の実装が済んでいると言われているが、今後の監視なしFSDへの移行には当局の認可がポイントになる。
10月末の決算発表時にイーロンは2025年の第2四半期から第3四半期にFSDは人間の運転よりも安全になるとし、2025年には監視なしFSDがカリフォルニア州とテキサス州で一部のモデル3とモデルYで可能になる予定だと語っていた。今回のV. 13の進化とその実際の性能を見るとこれらのコメントが現実的であるように思うし、トランプ新政権のサポートもこの実現を助けることになるであろう。
加速するテスラのAI投資
テスラは2024年10月の「We, Robot」イベントにおいて、ロボタクシーやオプティマスの様々な試乗や実演で未来社会を垣間見せてくれたが、今後の完全自動運転やヒューマノイドの開発や実装においてAIへの投資は欠かすことができない。どのメーカーにも先駆けて自動運転市場でリーダーシップを確立することはテスラの目下の目標であり、ハードとしてのEV製造だけにとどまらない新たな収益エコシステムをAIを通じて創り出そうとしている。
テスラは2024年を通してトレーニングAIと推論AIに対し、100億ドル(約1兆5000億円)の投資を行うとしている。すでにテキサスのギガファクトリーでは約30,000台のH100クラスターを導入、年末までに85,000台へ拡張する計画で、これらインフラは膨大な計算リソースを必要とするAIモデルのトレーニングに不可欠だ。
そのAIトレーニングプロセスを強化するため、ギガファクトリーを大規模拡張し構築している世界最大級のAIスーパーコンピュータークラスターはCortex(コルテックス)と呼ばれる。コルテックスには、約100,000台のNvidia H100およびH200 GPUが搭載される予定で、これらGPUはFSDやオプティマスのようなAIアプリケーションで使用される複雑なニューラルネットワークをトレーニングするための計算能力を可能にする。その大規模な計算を行うため、高度なインフラを設備し、多くのGPUが同時に稼働することで発生する熱を管理するための大規模冷却システムも導入される。
Video of the inside of Cortex today, the giant new AI training supercluster being built at Tesla HQ in Austin to solve real-world AI pic.twitter.com/DwJVUWUrb5
— Elon Musk (@elonmusk) August 26, 2024
AIトレーニングと推論プロセス
AIトレーニングに関しては、テスラ独自のスーパーコンピュータ「Dojo」の開発も進んでいる。Dojoのアーキテクチャは、特にテスラの車両から収集される膨大なビデオデータを効率的に処理するように最適化されており、このデータを使用してニューラルネットワークをトレーニングし、自動運転の強化を行う。
テスラはこれまで中国市場などで現地メーカーと熾烈なコスト競争を行い、それに打ち勝つために従来の内製化に加え、ギガプレスやアンボックスド・プロセスのような製造のイノベーションを生み出してきた。その内製化はAIにおいても同様で、Dojoにより外部サプライヤーへの依存を減らし、独自のイノベーションパイプラインを確立することで、長期的なコスト削減や開発スピードの向上を目指している。
また、テスラのAI推論は車載FSDコンピュータ上で行われる自動運転機能のリアルタイム意思決定プロセスである。最新バージョンのFSDハードウェア4(AI4)はこれらの目的に特化、テスラに搭載されるカメラやその他のセンサーから取得したデータをリアルタイムで解釈するニューラルネットワークを実行する。テスラの推論プロセスでは、事前にトレーニングされたニューラルネットワークが動作するが、これらのネットワークは、Dojoの膨大なデータセットでトレーニングされ、運転シナリオを認識して対応する能力を備えている。そのソフトウェアスタックには、視覚処理、ルート計画、制御アルゴリズムが含まれており、車両のセンサーから取得したデータに基づいて動作することになる。
エンド・ツー・エンドで向上する運転体験
テスラのFSDは一つ前のV. 12でエンド・ツー・エンドのAIシステムへ移行し、その機能を大幅に進化させた。エンド・ツー・エンドのニューラルネットワークは、カメラやセンサーからの生データ入力をステアリング、アクセル、ブレーキなどの運転指示に直接変換することを意味する。世界中を走るテスラのフリートにより集められた膨大なデータセットを活用して、人間がどのように運転するかを模倣して運転の決定を行うことができるようになった。これまでのモジュラーやルールベースのシステムでは物体認識や予測、運転の決定や実行などの要素において、各モジュールは異なるアルゴリズムを使うことがあり、新しいシナリオへの対応にはコードの更新が必要であった。
フリートが遭遇する様々なシナリオから学習し、人間の運転を模倣して決定を行うことは特に複雑な交通状況下において、加減速やステアリングがより人間的な動きになり、快適でスムーズな運転体験が可能になる。文脈を理解した意思決定は障害物の回避や車線変更、駐車など、特殊な状況でも適切に対処することができる。このように膨大な走行データ、エンド・ツー・エンドによる様々なシナリオへの対応、自動運転の開発に必要なハードとソフト双方の知見など、テスラは現実世界のAIにおいて紛れもなく業界をリードする存在だ。
イーロンとテスラが目指すAIのリーダーポジション
イーロンとテスラはロボタクシーを2026年中に市場投入することを目指しており、2025年の後半には次の自動運転ハードウェア「AI5」をテスラ車両に展開、年内に生産開始を予定している。AI5は現在のAI4/HW4よりも10倍強力とされ、このアップグレードはFSDなどの自動運転機能を向上させるだけでなく、オプティマスへの実装などさらにより広い範囲のAIアプリケーションでの活用が予測される。
ちなみに、前述したテスラのAIへの100億ドルの投資に加えて、先週はxAIがNvidiaのGrace Blackwell GB200 GPUへの優先アクセスを確保し、約10億8000万ドル(約1620億円)規模の取引をイーロンが直接NvidiaのジェンセンCEOと行ったという報道もあった。xAIは2025年1月にこれらのGPUを調達できるとされているが、これによりテスラも間接的に恩恵を受けるであろう。このように加速するテスラやxAIの開発は、彼らの自動運転やロボティクスなど様々な分野でそのリーダーとしてのポジションを強固にしていくに違いない。
文/前田 謙一郎