特斯拉D1芯片遭實名diss:內存到封裝都成問題,網友:反正不能公開測評
D1真的在神壇之上嗎?
明敏 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
在今年特斯拉AI開放日上,D1芯片風光無限。
獨特的晶圓封裝系統+芯片設計,讓D1在訓練萬億參數級神經網絡時,可以擁有數量級優勢。
特斯拉更在發布會上表示,它在性能上已經完全碾壓英偉達GPU和谷歌TPU。

不過,顛覆性的設計能夠帶來關注,也會遭到質疑。
最近,半導體分析網站SemiAnalysis就表示:
D1芯片存在一些重大技術問題。
內存、成本上都有疑問
作為特斯拉首款AI訓練芯片,D1芯片采用分布式結構和7nm工藝,搭載500億個晶體管、354個訓練節點,實現了超高算力和超高帶寬。
根據特斯拉已經透露的信息,SemiAnalysis從以下幾個方面提出了質疑:
首先是內存問題。
SemiAnalysis認為,D1芯片無論在功能單元層面還是系統層面,想要達到他們所說的算力,內存可能都不夠。

功能單元層面,D1芯片的單個功能單元具有1.25MB SRAM緩存、1TFlop的FP16/CFP8精度計算能力。
在芯片層面,裸片上沒有其他SRAM結構,只有354個單元的1.25MB SRAM來支撐。
基于設計相似的IPU,SemiAnalysis推測這種設計會導致嚴重的內存缺陷,從而影響芯片的算力。
事實上,每個IPU芯片上SRAM的數量還是D1的兩倍,但它在性能上和英偉達A100比起來,劣勢依舊非常明顯。
在BERT和ResNet50訓練中,英偉達A100的速度分別是IPU的1.54倍和1.43倍。

其次,就是在成本問題上。
特斯拉D1芯片之間可以實現無縫融合,這使它能夠達到8 TB/s的IO,比ASIC和英偉達高出一個數量級。
為了滿足這樣大的IO,特斯拉采用了獨特的封裝方式,即InFO_SoW。
這種封裝方式的特點就是可以夠大。
在發布會上,它們也展示了由25個D1芯片組成的訓練模塊。
但這種封裝方式在實際生產中的難度很高,出現報廢的情況會更多,由此也會導致成本突增。

除了這兩方面,SemiAnalysis認為D1還有很多未解決的問題。
比如,在發布會現場被問到軟件方面的問題時,特斯拉工程師甚至回答他們完全沒有準備。

SRAM方面的問題也亟需解決,否則將會面臨運行速度過快的風險。
以上種種,都導致特斯拉的開發人員需要對系統進行大量的優化。
此外特斯拉透露,目前他們已經部署的D1芯片只有3000個。
如此看來,D1芯片的攤銷成本也是非常高了。
D1真的在神壇之上嗎?
事實上,在特斯拉AI開放日的第二天,它的股價上漲甚至還不如英偉達。
可見投資界對于馬斯克帶來的新技術,也都非常冷靜。
有人表示,特斯拉把技術封鎖在自己的堡壘內,外界無法測評,也就無從得知它真正的優勢和局限性。

這一次向特斯拉開懟的是SemiAnalysis,它是一家半導體分析評論網站,首席分析師為Dylan Patel,畢業于佐治亞大學特里商學院。

參考鏈接:
[1]https://semianalysis.com/the-tesla-dojo-chip-is-impressive-but-there-are-some-major-technical-issues/
[2]https://news.ycombinator.com/item?id=28361807
[3]https://www.linkedin.com/in/dylanpatelsa/
- DeepSeek-V3.2-Exp第一時間上線華為云2025-09-29
- 你的AI助手更萬能了!天禧合作字節扣子,解鎖無限新功能2025-09-26
- 你的最快安卓芯片發布了!全面為Agent鋪路2025-09-26
- 任少卿在中科大招生了!碩博都可,推免學生下周一緊急面試2025-09-20




