華爾街尬捧TPU學(xué)術(shù)界懵了:何愷明5年前就是TPU編程高手,多新鮮
Meta、xAI在內(nèi)的大公司和學(xué)術(shù)界多年一直在用TPU,市場(chǎng)突然就拿他當(dāng)成算力救世主了?
克雷西 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
學(xué)術(shù)界看不下去了,直接戳破:華爾街在尬吹谷歌TPU!
起因是Meta被曝要和谷歌簽訂數(shù)十億美元的TPU訂單,消息曝出后英偉達(dá)盤(pán)中最大跌幅達(dá)到了7%,按照現(xiàn)在的市值計(jì)算,一舉蒸發(fā)了超3000億美元。
反觀谷歌,在盤(pán)中情緒最熱烈時(shí)漲幅一度達(dá)4%,換算成市值相當(dāng)于增加了約1500億美元,合人民幣超1萬(wàn)億。
《華爾街日?qǐng)?bào)》將其視為谷歌向英偉達(dá)的市場(chǎng)主導(dǎo)地位發(fā)起沖擊的信號(hào)。
但在從業(yè)人士看來(lái),華爾街對(duì)此舉的看法實(shí)在是外行了:Meta、xAI在內(nèi)的大公司和學(xué)術(shù)界多年一直在用TPU,市場(chǎng)突然就拿他當(dāng)成算力救世主了?

谷歌沒(méi)有護(hù)城河,英偉達(dá)也沒(méi)有
OpenAI技術(shù)人員Clive Chan表示,不僅谷歌自己的Gemini一直在TPU上訓(xùn)練,像Claude、生圖模型MidJourney、Ilya的SSI,也全都用過(guò)TPU。
所以在他看來(lái),Meta和谷歌簽TPU訂單不是什么奇怪的事,如果Meta沒(méi)用過(guò)的話,反而會(huì)更讓他驚訝。

Clive對(duì)Meta的看法也被現(xiàn)實(shí)驗(yàn)證——沒(méi)過(guò)多久謝賽寧就親口證實(shí),Meta早在2020年就已經(jīng)開(kāi)始使用TPU了。
謝賽寧介紹,當(dāng)時(shí)何愷明領(lǐng)導(dǎo)了TF和JAX代碼庫(kù)的初步開(kāi)發(fā),MAE、MoCo v3、ConvNeXt v2和DiT等研究項(xiàng)目都是完全在TPU上開(kāi)發(fā)的。
同時(shí),謝賽寧團(tuán)隊(duì)在紐約大學(xué)的許多研究工作,也都用到了TPU。

在Meta的新訂單被曝光之后,英偉達(dá)這邊也對(duì)谷歌表示了祝賀。
但立馬話鋒一轉(zhuǎn)表示自家產(chǎn)品依然遙遙領(lǐng)先,是唯一能夠運(yùn)行所有AI模型并應(yīng)用于所有計(jì)算場(chǎng)景的平臺(tái)。

有意思的是,這則推文三句話就用了兩個(gè)長(zhǎng)破折號(hào),網(wǎng)友們一度懷疑是不是AI寫(xiě)的。

不過(guò)在Clive看來(lái),所謂的“英偉達(dá)護(hù)城河”,其實(shí)也是十分薄弱的。
比如OpenAI就專門(mén)開(kāi)發(fā)了Triton來(lái)繞過(guò)CUDA,并且只需25行Python代碼就能達(dá)到cuBLAS的性能。
總之,從技術(shù)角度看,對(duì)于谷歌、Meta、OpenAI這樣的巨獸來(lái)說(shuō),至少其自身繞開(kāi)英偉達(dá)不是什么難事。
當(dāng)然了,除了CUDA之外,還有一個(gè)需要考慮的因素,那就是使用成本。
Artificial Analysis用Llama 3.3對(duì)多款英偉達(dá)芯片、AMD的MI300X以及谷歌TPUv6e來(lái)了波性價(jià)比橫評(píng),結(jié)果從H100到B200,每1美元帶來(lái)的Token收益是TPU v6e的5倍。
具體來(lái)說(shuō),用30Tokens每秒的速度跑Llama 3.3,輸入輸出各100萬(wàn)個(gè)Tokens,在H100上只需1.06美元,而在TPU v6e上需要5.13美元。

而谷歌最新的TPU v7成本核算下來(lái),也和B200差不多。
TPUv7的FP8運(yùn)算速度為4.6PFLOP/s,功耗約為1000瓦,GB200的FP8運(yùn)算速度為5PFLOP/s,功耗約為1200瓦。
總之,綜合來(lái)看,不管是技術(shù)還是成本,英偉達(dá)和谷歌都沒(méi)有形成強(qiáng)有力的護(hù)城河。
但也有分析指出,谷歌選擇出售GPU,本來(lái)也不是為了賺錢(qián),瞄準(zhǔn)的目標(biāo)也不是英偉達(dá)。
谷歌賣(mài)TPU不為賺錢(qián)為產(chǎn)能
Artificial Intuition作者Carlos E. Perez分析指出,大家都把Meta與谷歌的TPU交易看作是Meta對(duì)沖NVIDIA風(fēng)險(xiǎn)的一種手段,但事實(shí)并非如此。
Perez認(rèn)為,Meta在這筆交易當(dāng)中也在被谷歌利用,用出貨量換取排產(chǎn)和價(jià)格優(yōu)惠,從而對(duì)沖來(lái)自芯片代工廠的風(fēng)險(xiǎn)。
代工廠需要獲得切實(shí)有效的多年期合約,才會(huì)啟動(dòng)新的2納米生產(chǎn)線,這種“安全感”是初創(chuàng)公司無(wú)法給予的。
Perez想象了這樣一個(gè)場(chǎng)景:
谷歌走進(jìn)代工廠,說(shuō)道:
“我和Meta以及蘋(píng)果都簽了六年云服務(wù)合同,不管他們?cè)覆辉敢猓麄兠磕甓紩?huì)消耗20萬(wàn)個(gè)TPU。把你們N2容量的 25%按成本價(jià)給我。”
而代工廠垂涎三尺,欣然應(yīng)允。
現(xiàn)在任何一家小型芯片公司(Groq、Cerebras、Tenstorrent等等)都可以進(jìn)來(lái)索要同樣的晶圓。
Perez繼續(xù)暢想,當(dāng)這些小公司走進(jìn)代工廠時(shí),得到的回應(yīng)就會(huì)變成“抱歉,未來(lái)24個(gè)月的房源都已經(jīng)賣(mài)給了谷歌。剩下的零碎貨,您只能按原價(jià)購(gòu)買(mǎi)。”
他們正在利用Meta和蘋(píng)果的資本支出作為抵押,預(yù)購(gòu)了未來(lái)的尖端芯片供應(yīng)。這和蘋(píng)果當(dāng)年在iPhone顯示屏上用的伎倆如出一轍。
當(dāng)時(shí)蘋(píng)果用巨額預(yù)付款鎖定所有優(yōu)質(zhì)面板 ,導(dǎo)致其他廠商多年來(lái)只能使用二流屏幕。
當(dāng)然谷歌一個(gè)巴掌自然是拍不響,但Meta和蘋(píng)果也都樂(lè)于簽署這些協(xié)議,因?yàn)槟壳肮雀璧腡PU是唯一可以批量獲得的芯片。
這樣做的結(jié)果就是,在代工廠那里,能和谷歌相抗衡的,也就只有英偉達(dá)了。
參考鏈接:
[1]https://x.com/itsclivetime/status/1993869419337142772
[2]https://x.com/ArtificialAnlys/status/1993878037226557519
[3]https://x.com/IntuitMachine/status/1993117888140439943




