英偉達一夜改寫自動駕駛格局!2000TOPS雷神芯片發布,黃仁勛:One chip to rule them all
中國車企第一個吃核彈
賈浩楠 發自 副駕寺
智能車參考 | 公眾號 AI4Auto
雷神Thor來了。
人類有史以來最強自動駕駛芯片,就這樣突如其來!
英偉達2022秋季GTC上,黃仁勛發布新一代自動駕駛計算芯片DRIVE Thor。
單顆算力高達史無前例的2000 TOPS,是特斯拉FSD芯片的14倍。
全球大半個自動駕駛圈的芯片,都是黃老爺在販賣,神通肯定小不了。
但DRIVE Thor問世,還是震驚了所有跟智能汽車相關的人,包括但不限于車圈、科技圈、自動駕駛公司…
因為僅僅半年前,黃仁勛才宣布彼時算力最強的自動駕駛芯片Atlan,1000 TOPS,還說準備量產。
但現在,老黃又改口說Atlan格局小了,干脆取消,直接拿出更加領先一代的量產產品DRIVE Thor。
其他芯片廠商還在追趕Orin性能的時候,英偉達的計劃是用下一代的下一代,降維打擊。
人類史上最強自動駕駛芯片
DRIVE Thor,黃仁勛確認2025年上車量產。
稱人類史上最強,首先是參數。
單顆算力2000TOPS,不僅現世量產產品中沒見過這么高的參數,即使在一眾自動駕駛芯片公司對2025年產品的規劃和構想中,也都還停留在數百只至1000 TOPS之間。
所以說,DRIVE Thor是難有爭議的代差優勢。
而作為替換自家上一代產品Orin,算力數值提升了8倍。
這里還要解釋一下算力大小的定義。
一般針對AI任務、自動駕駛的芯片,常用TOPS描述算力,1TOPS代表每秒能進行1012次操作。
所謂“操作”,是指芯片上實現卷積運算的乘加器的基本功能。DRIVE Thor的2000 TOPS意思是每秒進行2*1015次操作。
黃仁勛同時給出了DRIVE Thor性能的另外一個參考維度:2000 TFLOPS。
TFLOPS是描述傳統GPU性能的指標,1 TFLOPS指每秒進行1012次浮點運算。
兩種單位分屬兩個不同的描述維度,一般沒有絕對的換算關系。但某些特定任務下,1 TFLOPS可以等于1 TOPS。
DRIVE Thor芯片的工藝制程、包含的晶體管數量這些詳細信息,英偉達暫未透露。
不過,DRIVE Thor展現出了幾個重要的領先性指標,既代表自動駕駛技術未來的發展方向,也是其他同類產品所不具備的。
超高集成度
智能汽車在車輛底層架構方面的最大特征,是從原先數百個ECU控制不同功能,演進到幾個集中式域控制器的電子電氣架構。
這是目前正在發生的變革。
而幾乎所有業內玩家都認為,未來的電子電氣架構一定是集中式的,即一個大腦、一個平臺或芯片控制汽車所有功能。
架構是車廠的工作,而高度集成化的芯片,英偉達已經做出來了。
DRIVE Thor集成了一輛智能汽車上所需的一切AI功能的計算需求,包括高階自動駕駛、車載操作系統、智能座艙、自主泊車等等。
車載操作系統中,有對車上所有功能的控制以及不同場景下的聯動,也有連接車輛軟件層和執行機構的“骨架”。智能座艙方面,則包含儀表盤、娛樂影音、語音識別交互等等。
2000TOPS的算力資源,主機廠可以在各種不同AI任務間隨意分配,英偉達提供相關開發工具。
一顆芯片解決所有,DRIVE Thor可能不便宜,但肯定比采購一堆芯片劃算。
One chip to rule them all!
支持超大規模AI模型運算
DRIVE Thor為這兩年自動駕駛流行的超大規模Transformer準備了專用引擎。
最初的Transformer來自于NLP(自然語言處理)領域。從輸入層開始,Transformer每一層結構都可以看到所有的信息,并且建立基本單元之間的關聯。
因此Transformer天然具備超強序列建模能力、全局信息感知能力的特點。
應用到自動駕駛中,Transformer主要干兩件事,對于投影像素平面的“刻畫”、以及對于投影平面和BEV平面之間的“轉化”。
特斯拉最早將Transformer用在自動駕駛任務中,而如今幾乎所有玩家都跟進。
Transformer網絡的參數規模,從一開始的百萬級數,到十億級,再到現在的萬億級,一直呈指數級增加。
DRIVE Thor上的Transformer引擎,能夠將視頻數據作為一個單一的感知幀來處理,使計算平臺能夠在固定時間內處理更多的數據。
集英偉達技術大成
黃仁勛特別解釋了DRIVE Thor超強性能的根源:
Grace、Hopper、Ada Lovelace。
Grace是英偉達的AI專用服務器CPU,基于ARM架構,也是英偉達進軍CPU領域的第一款產品,Grace高度專業化,走的是和GPU向結合的道路,適用于AI 和高性能計算工作。
使用第四代NVIDIA NVLink互聯技術與GPU相融合后,可以處理超過1萬億參數的AI模型訓練任務。
Hopper是英偉達最新的GPU架構之一,其實也是英偉達押注AI的一場豪賭:
將傳統 GPU 計算引擎集中在神經網絡轉換器模型上,并將DGX系統擴展為能夠在機器學習訓練中支持數萬億個參數。
Ada Lovelace么,當然就是剛發布的40系列顯卡新架構。4nm制程,流式多處理器具有高達83TFLOPS 的著色器能力,吞吐量超過上一代產品2倍。
老黃的意思很明白,DRIVE Thor在深度神經網絡任務上,采用Grace+Hopper的CPU、GPU混合架構。
而在具體的圖像處理任務,則和最新的40系列顯卡相同。
是不是說明,DRIVE Thor也采用臺積電4nm工藝?
其實從2025年量產節點看,DRIVE Thor采用2-3年前的消費級芯片成熟架構和工藝,完全符合車規芯片對可靠性的要求和行業慣例。
從摩爾定律來看,芯片集成度的突破已經逼近極限,4nm制程的車規AI芯片量產時,也許和手機、電腦上的消費級處理器差距很小了。
這可能也是DRIVE Thor帶來的另一個里程碑:車規芯片不再有代差。
英偉達的智能車稅,只靠算力嗎?
當然不是,另一個競爭力,是英偉達開放的平臺特性和全套完整的開發工具。
不過,老黃今天介紹的,都是基于已經量產的Orin芯片相關平臺展開。
NVIDIA DRIVE,是一整個自動駕駛開發平臺,既包括硬件Orin芯片,也包含英偉達提供的模擬測試搭建工具、地圖環境實時構建、安全相關測試,以及一些基礎的已經訓練好的算法模塊參考。
在一個自動駕駛算法典型的開發過程中,路測車輛行駛時,NVIDIA DRIVE能夠直接從環境信息中心采集各類不同物體的信息,并完成建模分類,然后儲存在數據庫中,以便日后模擬訓練時使用。
這些數據可以做到非常細致,比如帶有長寬高以及深度信息的4D圖像數據:
根據自動駕駛方案選擇的傳感器不同,NVIDIA DRIVE也可以針對不同傳感器分別建立儲存數據信息。
同時,系統還會實時記錄繪制地圖路線信息,保存在數據庫中。
對真實環境信息實時采集,并保存素材的目的是什么?
當然是為高效的模擬測試開發做準備。模擬取代實際路測,這也是如今自動駕駛開發的一個熱門趨勢。
總之,英偉達不但給自動駕駛算力最大的芯片,如果你想,還會給你高度自動化,甚至是“傻瓜式”的開發工具。
算力一步登天的首發車企,竟是他?
2025年量產2000TOPS的DRIVE Thor,誰第一個實現“算力自由”?
極氪汽車。
你沒看錯,國產自主一哥吉利旗下的純電品牌——
那個一直以機械素質見長,提起智能化卻人人搖頭的極氪汽車。
能不能趕上首發上市,要看車型研發進度。但明確簽約要上車DRIVE Thor的,極氪的確是第一個。
搭載DRIVE Tho的會是什么樣的車?
從業內普遍認知行和已經展現出的規律來看,一般L2級輔助駕駛,需求的算力在幾十TOPS左右。
智能駕駛每提升一個級別,需求算力也呈指數上漲。
例如,目前行業普遍站在L2邁向L3的門檻,需求的算力在幾百TOPS左右。
而為未來幾年算法迭代發展留足升級空間的產品,一般都把算力堆到1000TOPS以上,也就是4塊Orin芯片的方案。
顯然,他們設置的最遠規劃,是L3人機共駕向高階智能駕駛過渡階段。
這個時間點,在DRIVE Thor出現之前,大家的共識是2025年。
也就是說,自動駕駛研發的節奏,是按照2025年L3邁向L4,車端算力剛好在1000T左右的預想規劃。
DRIVE Thor如果順利于2025年上車,造成的影響一定是深遠的。
最重要的,是客觀加速自動駕駛能力的迭代周期。畢竟,這是史上第一次出現“算力等算法”的情況。
其次,DRIVE Thor上車,更加徹底的改變汽車底層架構,在智能化的核心價值上走得更遠更極致。
當然也會加速傳統汽車淘汰出局。
最后總結一下,老黃和英偉達今晚展示的產品和趨勢,一定會寫入自動駕駛大事記,成一個里程碑式轉折。
那么接下來,還有不到10天就是特斯拉AI DAY,會不會出現更加意料之外、震撼人心的產品或技術?
壓力現在來到馬斯克這邊。
最后By the way,英偉達最新4的0系列顯卡,7199元起,最高的RTX 4090售價12999元,沖嗎?
- 摩爾線程新一代GPU架構10天后發布2025-12-09
- 優理奇機器人完成兩輪合計3億元天使++++輪及天使+++++輪融資,“算法-硬件-場景”加速落地2025-12-05
- 2025年的冬天,上海憑什么被稱為“世界具身智能第一戰場”?2025-12-05
- 免費國產Banana真香!我想把PS給卸載了2025-12-01



