Dojo的死亡,特斯拉萬億AI帝國夢的破碎與重生
2025年7月23日,特斯拉的Q2財報電話會議。埃隆·馬斯克 (Elon Musk) 一如既往地向華爾街傳遞著樂觀且極具感染力的情緒。當談到公司傾注心血打造的AI超級計算機Dojo時,他充滿了自信:“我們預計Dojo 2將在明年某個時候實現規模化運營,其規模大約相當于10萬塊H100芯片” 。
這番話無疑是一劑強心針。在投資者眼中,Dojo不僅是特斯拉實現完全自動駕駛 (FSD) 的技術基石,也是其從一家電動車公司蛻變為萬億市值AI巨頭的核心引擎。摩根士丹利的分析師甚至曾為其描繪了高達5000億美元的潛在價值 。
然而,沒有人預料到,這場“壯觀”的夢境會如此迅速地走向終結。僅僅三周后,風暴來臨。2025年8月初,彭博社的一則爆料震驚了整個科技圈:Dojo項目團隊已被解散,其負責人彼得·班農 (Peter Bannon) 即將離職 。緊接著,在8月9日至11日的那個周末,馬斯克本人通過他的社交平臺X,用一系列帖子親手為這個曾經的明星項目畫上了句號。他將這一戲劇性的轉折,包裝成了一次深思熟慮的戰略升級,宣稱Dojo 2已經走進了“一個進化上的死胡同”,而特斯拉的未來,將聚焦于另一款名為AI6的“融合架構”芯片。
從“相當于10萬塊H100”的豪言壯語,到“進化死胡同”的殘酷論斷,中間只隔了不到20天。這背后究竟發生了什么?這并非一次簡單的項目調整,而是一場交織著技術豪賭、人才風暴、商業現實與巨頭博弈的硅谷式戲劇。Dojo項目的終結,不僅是特斯拉AI戰略的一次重大挫敗,也為所有試圖在人工智能時代挑戰硬件王權的野心家們,上了一堂價值數十億美元學費的警示課。
一、垂直整合的“第一性原理”與Dojo的誕生
要理解Dojo為何誕生,必須先理解馬斯克和特斯拉對“垂直整合”近乎偏執的追求。從自建超級充電網絡、開創直營銷售模式,到自研電池和自動駕駛芯片,特斯拉的成功在很大程度上源于其對核心技術和供應鏈的絕對掌控。當AI成為公司未來的核心時,將算力這一“新石油”的命脈交到他人手中,是馬斯克無法容忍的。
這個“他人”,主要就是英偉達 (NVIDIA) 。
Dojo項目的種子,早在2019年4月22日的特斯拉“自動駕駛投資者日”上就已埋下了。那時的特斯拉正面臨一個前所未有的挑戰: 如何處理來自全球數百萬輛汽車攝像頭產生的、如洪水般涌入的視頻數據。 這些數據是訓練FSD神經網絡的燃料,而傳統的計算架構,在處理這種規模的視覺數據時顯得力不從心。
馬斯克的解決方案,充滿了“第一性原理”的味道:與其購買昂貴且并非為特斯拉量身定做的通用GPU,不如從零開始,打造一個完全為自家算法優化的專屬計算系統。這一戰略的背后,是三重野心:
1. 擺脫依賴,掌控成本: 徹底告別英偉達,避免被其高昂的定價和緊張的供應鏈所掣肘。馬斯克曾直言:“如果他們 (指英偉達) 能給我們提供足夠的GPU,我們可能就不需要Dojo了。但他們不能,因為他們的客戶太多了。”
2. 極致優化,追求性能: 設計一種專門針對特斯拉計算機視覺工作負載的ASIC,通過架構上的創新,在性能和能效上實現對通用GPU的超越。
3. 構建護城河,定義未來: 通過從芯片、軟件到算法的全棧自研,構建一道任何競爭對手都難以逾越的、深不見底的技術護城河。
2021年8月19日,特斯拉首屆AI日,Dojo項目正式向世界揭開神秘面紗。當特斯拉展示其自主設計的D1芯片和革命性的“訓練模塊” (Training Tile) 時,整個行業為震驚了。這不僅僅是一塊芯片,而是一個宏大的宣言: 特斯拉不僅要造車,還要定義驅動未來AI的基礎設施。
隨后的幾年里,Dojo項目似乎一路高歌猛進。2022年AI日,特斯拉公布了將Dojo擴展為完整“ExaPOD”超級計算機的宏偉藍圖。2023年7月,Dojo V1超級計算機正式投產,標志著項目從研發走向了實際應用。公司更是計劃在2024年底前,為這個項目再投入10億美元。2024年1月,一筆5億美元的投資被宣布用于在紐約州布法羅市建立一個新的Dojo計算中心,這似乎預示著Dojo的光明未來。
然而,就在這片繁榮景象之下,未來的裂痕早已悄然出現。
二、Dojo的技術豪賭與致命缺陷
Dojo的核心,是一場前所未有的技術豪賭。它的設計理念極度激進,旨在通過硬件架構的根本性創新,來解決AI訓練中的兩大核心痛點: 帶寬和延遲 。
1. D1芯片與“訓練模塊”的革命
Dojo的基礎單元是D1芯片。這塊由臺積電7納米工藝打造的芯片,在645平方毫米的巨大裸片上,喪心病狂地集成了500億個晶體管和354個處理核心。其設計功耗高達400瓦,本身就是一頭性能猛獸。
但Dojo真正的革命性之處,在于它如何將這些D1芯片連接在一起。特斯拉的天才工程師們利用了臺積電最先進的InFO_SoW (集成扇出型片上晶圓) 封裝技術,將25個D1芯片無縫地集成在了一塊完整的晶圓上,創造出了所謂的“訓練模塊”。
這堪稱工程學上的奇跡。傳統的超級計算機,需要通過復雜的網絡電纜和交換機將成千上萬的GPU連接起來,芯片間的通信延遲和帶寬瓶頸是永遠的痛。而Dojo的訓練模塊,則像是在一塊巨大的電路板上創造了一個無縫的計算平面。芯片之間的數據交換,不再需要繞道外部網絡,而是可以直接在晶圓內部高速穿梭。其離模塊帶寬高達驚人的36 TB/s,比當時的競爭對手高出一個數量級。理論上,由10個機柜、3000個D1芯片組成的ExaPOD,可以提供高達1.1 ExaFLOPS的BF16性能。
2. 致命的阿喀琉斯之踵:被“渴死”的計算核心
然而,這場豪賭從一開始就埋下了一顆失敗的種子。Dojo的設計團隊為了追求極致的互連速度,犯下了一個致命的錯誤: 忽視了內存的重要性。
在Dojo的架構中,354個計算核心,每個核心僅配備了1.25MB的SRAM (靜態隨機存取存儲器) ,整個D1芯片上沒有了其他大型高速緩存或內存池。這個計算與內存的比例,被行業分析師批評為“完全不足以”支撐特斯拉想要訓練的那些日益龐大的AI模型 。
這就好比建造了一臺擁有F1賽車引擎的汽車,卻只給它配了一個摩托車油箱。引擎的性能再強,沒有足夠的燃料也無法持續飛馳。現代大型AI模型,尤其是像Transformer這樣的架構,在訓練過程中需要頻繁地讀寫海量的參數和中間數據,對內存容量和帶寬的要求極高。Dojo的這點片上內存,在巨大的數據洪流面前,無異于杯水車薪。
為了彌補這一先天缺陷,特斯拉的工程師們被迫采取了一些“曲線救國”的措施,比如創造一種自定義的、精度更低的數據格式:可配置8位浮點數 (CFP8) ,試圖用更少的數據位來表示信息,以塞進那小得可憐的內存里 。后續的報道甚至披露,特斯拉不得不額外設計一款獨立的PCIe內存卡,專門用來為Dojo系統提供足夠的內存連接。這無異于承認了最初設計的重大失誤。
這種對內存的吝嗇,讓人想起了另一家曾經的明星AI芯片公司Graphcore。其設計的IPU也采用了類似的思路,試圖用大量的片上SRAM來替代傳統GPU依賴的HBM (高帶寬內存) ,最終也在與英偉達更均衡、更通用的設計競爭中敗下陣來。
2. 看不見的冰山:軟件生態的鴻溝
如果說硬件上的內存缺陷是Dojo的“明傷”,那么軟件生態的缺失則是其更致命的“內傷”。
一塊定制的芯片,需要一個完全定制的軟件棧來驅動,包括編譯器、編程模型和各種底層庫。特斯拉甚至為此開發了一套自定義的指令集架構 (ISA) ,而不是采用RISC-V這樣的開放標準 。這意味著,特斯拉需要從零開始,重建一個英偉達耗費了十幾年、投入了數百億美元才建立起來的CUDA帝國。
CUDA的強大之處,并不僅僅在于其性能。它是一個成熟、穩定、靈活且擁有龐大開發者社區的生態系統 。無數的AI框架、科學計算庫和應用程序都建立在CUDA之上。對于開發者而言,這是一個熟悉且高效的平臺。而要讓他們放棄這一切,去學習和適應一個全新的、封閉的、未經檢驗的Dojo軟件棧,其難度和阻力可想而知。
開發這個軟件棧的復雜度和成本,很可能是壓垮Dojo項目的、那座不為外人所見的巨大冰山。
3. “進化死胡同”的技術必然性
Dojo的架構,實際是“偏科”的,它為特定的短跑比賽 (低延遲、高互連的視覺模型訓練) 而生,卻犧牲了參加其他項目 (內存密集型、架構多變的大模型) 的能力。然而,AI模型的發展日新月異,從CNN到Transformer,再到混合專家模型 (MoE) ,模型架構的迭代速度遠超硬件的開發周期。
一個內存極度受限的硬件架構,在面對未來模型演進時顯得異常脆弱。一旦FSD的下一代模型需要更大的狀態空間、更復雜的注意力機制,Dojo的性能就可能遭遇“懸崖式”的崩潰。相比之下,英偉達的GPU憑借其巨大而靈活的HBM內存池,展現出了更強的通用性和適應性 。
所以,馬斯克所說的“進化死胡同”,或許不僅僅是項目失敗后的一個體面說辭,它在某種程度上也揭示了一個殘酷的技術現實: AI模型演化的路徑,已經悄然偏離了Dojo最初鋪設的那條狹窄而陡峭的軌道。
三、帝國的裂痕:一場“災難性”的人才雪崩
如果說技術上的缺陷是Dojo的慢性病,那么核心團隊的集體出走,則是壓垮這頭巨獸的最后一根稻草,是導致其閃電崩盤的直接導火索。
故事的核心人物是兩位芯片設計領域的傳奇人物:加內什·文卡塔拉曼 (Ganesh Venkataramanan) 和彼得·班農 (Peter Bannon) 。
文卡塔拉曼,這位印度裔工程師,曾在AMD工作近15年,是芯片設計界的老將 。他于2016年加入特斯拉,從零開始組建了自動駕駛硬件團隊,并領導開發了業界首款FSD芯片。他正是Dojo項目的最初負責人和靈魂人物。然而,在2023年底,文卡塔拉曼悄然離開了特斯拉 。
接替他領導Dojo項目的,是同樣聲名顯赫的彼得·班農。班農的履歷堪稱輝煌,他曾在蘋果公司擔任首席架構師,主導了iPhone 5中首款32位ARM CPU的設計,是蘋果自研芯片王朝的奠基人之一 。在加入特斯拉后,他一直是芯片工程的關鍵人物。
然而,就在馬斯克于2025年7月財報會議上高談闊論Dojo 2的宏偉藍圖時,一場“兵變”正在水面下醞釀。
2025年8月初,媒體爆出,包括班農在內的約20名Dojo核心工程師,已經集體離職。更具戲劇性的是,他們的去向都是一家名為DensityAI的神秘初創公司。而DensityAI的創始人,正是幾個月前離開特斯拉的加內什·文卡塔拉曼。
這已經不是簡單的離職,而是一場釜底抽薪式的“叛逃”。文卡塔拉曼、班農以及這20名工程師,幾乎就是Dojo項目知識產權和工程能力的活載體。他們的集體出走,瞬間掏空了Dojo項目的大腦和心臟。設計和實現Dojo這樣復雜且創新的系統,需要高度專業化的知識和長期的團隊磨合。這種機構知識的流失,在短期內是毀滅性的,幾乎不可能被替代。
DensityAI的目標,是打造一個為汽車行業量身定制的全棧AI平臺,從芯片到軟件,提供一站式解決方案。這聽起來,像極了Dojo項目最初的愿景,只不過這一次,它將在特斯拉的圍墻之外,由Dojo的原班人馬去實現。
這場“災難性”的人才雪崩,讓馬斯克和特斯拉陷入了極其尷尬的境地。一個仍在燒錢、尚未證明其決定性優勢、且失去了核心大腦的項目,其存在的合理性瞬間崩塌。馬斯克在財報會議上的樂觀預測,與幾周后項目的戛然而止形成了強烈的諷刺。這表明,取消Dojo并非一次從容的戰略調整,而是一次對突發危機的被動反應。
馬斯克事后“進化死胡同”的解釋,更像是一種危機公關,一種在項目因人力資本崩潰而被迫終止后,為了挽回顏面而進行的敘事重構。正如一位網友在社交媒體上尖銳評論的那樣:“他 (馬斯克) 別無選擇,只能取消Dojo,因為團隊里太多人不想再為他工作了。”
四、英偉達,無法逾越的護城河
在Dojo的故事中,英偉達就像一個無處不在的幽靈。特斯拉啟動Dojo,是為了擺脫它;而Dojo最終的失敗,卻又一次印證了它的強大。
1. 一場從一開始就不對等的戰爭
與英偉達競爭,尤其是在AI訓練芯片領域,是一項近乎不可能完成的任務。這家由黃仁勛領導的公司,其可怕之處不僅在于硬件性能的持續迭代,更在于其軟件生態構筑的、深不見底的護城河。
從硬件上看,英偉達的創新周期快得令人窒息。當特斯拉的D1芯片 (基于7nm工藝) 在2021年亮相時,英偉達的A100已經占據市場主導。而當Dojo在2023年艱難投產時,基于更先進的4nm定制工藝、性能更強的H100已經開始大規模出貨 。而現在,更為強大的Blackwell架構GPU也已發布。這意味著,像Dojo這樣的自研項目,往往陷入一個尷尬的循環: 當你耗費數年、投入巨資研發的產品終于問世時,它對標的已經是英偉達上一代、甚至上上代的產品。
更重要的是, 特斯拉自身的行為也暴露了Dojo的窘境。 就在大力宣傳Dojo的同時,特斯拉從未停止過對英偉達GPU的瘋狂采購。從最初的數千塊A100,到后來的數萬塊H100和H200,特斯拉一直是英偉達最大的客戶之一。截至2024年4月,已經投入運行的Dojo集群,其算力總和也僅僅相當于7500塊H100 GPU,只占到特斯拉當時H100集群總算力的四分之一左右 。
這組數據無情地揭示了一個事實:在長達數年的時間里,Dojo從未真正成為特斯拉FSD訓練的主力,英偉達的GPU始終是那個不可或缺的“幕后英雄”。Dojo更像是一個昂貴的、充滿不確定性的“B計劃”。
2. CUDA:真正的壁壘
正如前文所述,英偉達真正的護城河是CUDA。這個并行計算平臺和編程模型,經過近二十年的發展,已經成為AI開發的事實標準 。它擁有一個由無數庫、工具和開發者組成的龐大生態系統,其成熟度和易用性是任何競爭對手都難以企及的 。
選擇自研芯片,就意味著要重建這一切。這是一項比設計硬件本身更為艱巨的任務。Dojo的失敗,再次證明了挑戰CUDA生態系統的難度。對于絕大多數AI研究者和工程師來說,時間就是生命,他們寧愿選擇一個性能或許不是100%最優、但穩定、可靠且擁有豐富工具鏈的平臺,也不愿去冒險嘗試一個全新的、充滿未知數的專有系統。
3. 財務壓力下的理性選擇
Dojo項目的終止,也與特斯拉當時面臨的宏觀經濟壓力不無關系。2025年第二季度的財報并不樂觀,電動車業務收入同比下降16%,總收入下降12%。與此同時,由AI研發驅動的運營支出和資本支出卻在持續飆升。
在這樣一個“節衣縮食”的時期,繼續為一個成本高昂、風險巨大、回報周期漫長,且核心團隊已經流失的項目輸血,顯然是不明智的。砍掉Dojo,將寶貴的資本和資源集中到自動駕駛出租車 (Robotaxi) 和擎天柱 (Optimus) 機器人這些更接近商業化的項目上,是一個痛苦但理性的財務決策。
Dojo的取消,對英偉達而言是一次巨大的戰略勝利。老黃再次向世界宣告:在AI算力的牌桌上,所有玩家最終都必須回到我這里來。這不僅鞏固了其市場壟斷地位,也讓所有心懷“造芯夢”的挑戰者們,不得不重新掂量一下自己將要付出的代價。
五、AI6芯片的“融合”新戰略,無可奈何的妥協
在Dojo的廢墟之上,特斯拉迅速構建了一套新的AI硬件架構,其核心是所謂的AI6“融合架構”。
馬斯克的官方解釋是,同時維護Dojo (為訓練優化) 和AI系列芯片 (為車載推理優化) 兩條截然不同的設計路線,是對資源的巨大浪費。因此,未來的戰略是“融合”,即將所有努力都集中在即將推出的AI6芯片上。這款芯片,將“非常適合推理,并且至少在訓練方面也相當不錯”。
馬斯克甚至試圖為Dojo的遺產找到一個歸宿,他聲稱:“Dojo 3可以說以在單塊電路板上集成大量AI6 SoC的形式存在” 。
1. 用“步槍”打“大炮”:一場技術上的豪賭
然而,這套說辭在技術專家看來,充滿了妥協和無奈。AI訓練和AI推理,是兩種在計算需求和架構設計上截然不同的工作負載。
??訓練 (Training) ,好比是煉鋼。它需要在一個巨大的熔爐 (數據中心) 里,用極高的溫度 (大規模并行計算) 、消耗海量的原材料 (數據和能源) ,經過長時間的鍛造 (迭代) ,才能煉出一塊好鋼 (成熟的模型) 。這個過程追求的是極致的吞吐量和強大的并行處理能力,需要高精度的運算、巨大的內存和超高帶寬的互連,以便在數千個處理器之間高效同步。英偉達的H100和Dojo D1,都是為這種“重工業”場景而生的“大炮”。
??推理 (Inference) ,則好比是將煉好的鋼材,打造成一把鋒利的匕首,并在需要時能瞬間出鞘。它追求的是在終端設備 (如汽車、手機) 上,以極低的延遲和能耗,快速地執行已經固化好的模型,做出精準判斷。這個過程對單次運算的性能要求不高,通常使用較低精度的計算,對內存和互連的要求也遠低于訓練。特斯拉的AI系列芯片,就是為這種“輕巧”場景設計的“步槍”。
現在,特斯拉的新戰略,本質上就是想用成千上萬把“步槍”捆綁在一起,去執行原本需要“大炮”才能完成的攻堅任務。盡管馬斯克說它“相當不錯”,但用一款為低延遲、低功耗優化的推理芯片來進行大規模訓練,其效率和性能幾乎不可能與專門為訓練設計的芯片相提并論。這很可能會創造出一個“樣樣通,樣樣松”的系統,為了架構的簡潔而犧牲了最關鍵的訓練性能。
這更像是一個在失去了Dojo這個“大炮”研發團隊后,不得不做出的無奈選擇。設計和驗證兩種頂尖芯片 (一種訓練、一種推理) 成本極高,且需要兩個獨立的精英團隊。特斯拉剛剛失去了其中一個。剩下的團隊,專注于對公司核心產品 (汽車、機器人) 至關重要的推理芯片。因此,用推理芯片來“兼職”訓練,并非源于什么革命性的技術洞見,而更可能源于一個“他們只剩下足夠的資源和人力,來推進這一條芯片設計路線了”的殘酷現實。
2. 重回“懷抱”:對外部伙伴的新依賴
Dojo的終結,也標志著特斯拉在AI訓練硬件上實現完全垂直整合夢想的破滅。公司現在比以往任何時候都更加依賴外部的合作伙伴。
??英偉達:特斯拉仍將是英偉達最重要的客戶之一。數以萬計的H100/H200 GPU將繼續構成其高性能訓練集群的基石。
??三星:一紙價值165億美元的巨額協議,讓三星成為AI6芯片的關鍵代工伙伴,這意味著特斯拉將核心的推理硬件命脈,也部分交到了外部手中。
??AMD:AMD也被提及為潛在的合作伙伴,表明特斯拉正在采取更加多元化的供應商策略,以分散風險。
從試圖顛覆規則的革命者,到重新擁抱行業分工的參與者,特斯拉在AI硬件上的戰略,完成了一次痛苦但務實的回歸。
六、最后
Dojo的故事,為這個高歌猛進的AI時代,提供了一個深刻而及時的警示。
它揭示了在AI硬件領域進行垂直整合的巨大難度。即便是像特斯拉這樣資金雄厚、擁有頂尖人才和明確應用場景的公司,想要從零開始挑戰一個由巨頭和成熟生態系統所統治的領域,也同樣困難重重。
也再次證明了英偉達護城河的深度。這條護城河不僅由一代代領先的芯片構成,更由一個名為CUDA的、幾乎無法被復制的軟件生態系統澆筑而成。任何試圖繞過它的挑戰者,都必須做好付出慘痛代價的準備。
同時,它也引發了關于專業化與通用化路線的重新思考。Dojo代表了專業化路線的極致,為一個特定任務打造的終極武器。它的失敗似乎表明,至少在當前AI模型快速演進的階段,通用GPU所提供的靈活性和適應性,仍然是更穩妥的制勝策略。
對于特斯拉而言,放棄Dojo雖然是一次挫敗,但未必是世界末日。短期內,其FSD訓練本就嚴重依賴英偉達,因此影響有限。長期來看,轉向一個更務實、更開放的混合硬件策略,集中資源攻克自動駕駛和機器人這兩個核心目標,或許是更明智的選擇。
Dojo已死,但它所代表的那種挑戰極限、試圖用“第一性原理”重構世界的硅谷精神,并不會消失。只是這一次,現實給所有懷揣夢想的工程師和企業家們提了一個醒: 在通往星辰大海的征途上,有時,選擇站在巨人的肩膀上,比試圖推倒巨人,是更快的捷徑。
本文來自微信公眾號: 蒸汽貓TechMore ,作者:沸騰的豌豆