微軟機(jī)房大量英偉達(dá)GPU開(kāi)始吃灰……
奧特曼也愁著呢
衡宇 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
你敢想,微軟堆成山的GPU,只能在庫(kù)房里吃灰?
在最新播客節(jié)目BG2中,微軟CEO納德拉親口承認(rèn)公司正面臨一個(gè)前所未有的尷尬:微軟手上有成堆的GPU,卻因?yàn)槿彪姟⑷笨臻g,只能閑置在那兒。
但最大的問(wèn)題不是算力過(guò)剩的現(xiàn)狀——
最大的問(wèn)題不是芯片供應(yīng),而是供電能力,以及我們能否足夠快地建成靠近電源的數(shù)據(jù)中心。
如果做不到,你就會(huì)有一堆芯片只能躺在倉(cāng)庫(kù)。
微軟缺電,大量GPU閑置
在微軟內(nèi)部,大量英偉達(dá)AI芯片被閑置。
不是因?yàn)樗懔σ呀?jīng)足夠或者“過(guò)剩”了,而是現(xiàn)在的基礎(chǔ)設(shè)施不足以支撐這些芯片運(yùn)行起來(lái)。
一是因?yàn)槿狈﹄娏Α?/strong>
二是因?yàn)槿鄙倏梢粤ⅠR投入使用的數(shù)據(jù)中心——也就是納德拉口中的“warm shells”,即已經(jīng)建好、具備足夠供電與冷卻能力的機(jī)房外殼。
這并不是他第一次對(duì)外談及微軟的煩惱。
去年,當(dāng)被問(wèn)及微軟在2024年是否仍然受到英偉達(dá)芯片的供應(yīng)限制時(shí),納德拉是這么說(shuō)的:
我們受到的是電力限制,而不是芯片供應(yīng)限制。

到了今年,這似乎成為了所有大模型巨頭們共同面臨的問(wèn)題。
奧特曼也在同期討論中提到,行業(yè)面臨的總體挑戰(zhàn)不僅僅是算力問(wèn)題,更多還有能源和基礎(chǔ)設(shè)施的匹配問(wèn)題。
而奧特曼對(duì)這個(gè)問(wèn)題的敏感,比多數(shù)科技公司來(lái)得早。
過(guò)去兩年,他陸續(xù)投資了裂變能源公司Oklo、聚變能源公司Helion,以及太陽(yáng)能創(chuàng)業(yè)公司Exowatt。
只不過(guò),這些新型能源技術(shù)離大規(guī)模商用還很遠(yuǎn),短期內(nèi),數(shù)據(jù)中心仍得依賴(lài)燃?xì)夂涂稍偕茉椿旌瞎╇姟?/strong>
缺電之外:囤芯片也不再安全
過(guò)去五年,美國(guó)整體電力需求曲線突然被拉高。
隨著AI和云計(jì)算帶動(dòng)的數(shù)據(jù)中心建設(shè)進(jìn)入高峰期,用電需求開(kāi)始以超出預(yù)期的速度增長(zhǎng),遠(yuǎn)遠(yuǎn)超過(guò)公用事業(yè)公司原本的新增發(fā)電規(guī)劃。
供給端反應(yīng)明顯滯后。
傳統(tǒng)電廠從立項(xiàng)到并網(wǎng)通常需要數(shù)年周期,而AI產(chǎn)業(yè)擴(kuò)張的節(jié)奏以季度計(jì)算。于是,為了追上算力擴(kuò)張的步伐,越來(lái)越多的數(shù)據(jù)中心開(kāi)發(fā)商不得不自己為AI發(fā)電。
因此,越來(lái)越多的數(shù)據(jù)中心開(kāi)發(fā)商選擇采用所謂的“計(jì)量表后”(behind-the-meter)供電方式——直接將電力接入數(shù)據(jù)中心,繞過(guò)公共電網(wǎng),以彌補(bǔ)供能缺口。
盡管如此,數(shù)據(jù)中心、電力與冷卻系統(tǒng)的建設(shè)節(jié)奏還是遠(yuǎn)遠(yuǎn)跟不上現(xiàn)實(shí)需求。

光伏太陽(yáng)能被視為目前建設(shè)周期最短、部署最靈活的能源形式,但在時(shí)間維度上,它與數(shù)據(jù)中心幾乎同步——從選址、施工到并網(wǎng)動(dòng)輒數(shù)月甚至一年。
而AI需求的變化往往只需要一次模型更新或一次產(chǎn)品發(fā)布。
舉個(gè)具體點(diǎn)的例子來(lái)說(shuō)吧:當(dāng)算力曲線每季度刷新紀(jì)錄時(shí),能源系統(tǒng)還在審批表格上打轉(zhuǎn)(無(wú)奈攤手.jpg)。
部分業(yè)內(nèi)人士擔(dān)心,如果未來(lái)AI需求增速放緩,當(dāng)前為了支撐AI算力而大規(guī)模投資的電廠和儲(chǔ)能項(xiàng)目可能會(huì)出現(xiàn)閑置風(fēng)險(xiǎn)。
但奧特曼并不這么看。
奧特曼認(rèn)為,AI的用電需求不可能回落,只會(huì)持續(xù)增長(zhǎng)。也就是說(shuō),更高效、更便宜的算力,只會(huì)激發(fā)出更多應(yīng)用場(chǎng)景。
如此來(lái)看,奧特曼似乎是一個(gè)杰文斯悖論信徒。
該悖論認(rèn)為,資源的更高效利用將導(dǎo)致更大規(guī)模的使用,從而增加整體需求。
如果算力成本明天下降100倍,用量會(huì)增長(zhǎng)遠(yuǎn)超100倍。越便宜的計(jì)算力,只會(huì)帶來(lái)更大的總體需求。
為此,奧特曼呼吁美國(guó)政府每年增加100吉瓦發(fā)電能力,并將其視為“AI戰(zhàn)略資產(chǎn)”。
與此同時(shí),算力端的企業(yè)也在重新調(diào)整策略。
納德拉明確表態(tài),微軟不會(huì)再囤積單一代GPU。
理由很現(xiàn)實(shí)——
一臺(tái)昂貴的英偉達(dá)芯片,如果暫時(shí)插不上電,兩、三年后又被新架構(gòu)取代,那等于在折舊周期內(nèi)就提前貶值。
而根據(jù)微軟經(jīng)驗(yàn),數(shù)據(jù)中心設(shè)備的折舊周期通常是六年,盲目囤貨不僅占用現(xiàn)金,還會(huì)造成資源浪費(fèi)。
網(wǎng)友建議:不如開(kāi)發(fā)點(diǎn)能耗降低的芯片?
自20世紀(jì)90年代末以來(lái),美國(guó)電力生產(chǎn)一直徘徊在約約4萬(wàn)億千瓦時(shí)/年。
但這個(gè)世界變化太快了:
人口增長(zhǎng)了20%,部分物理電網(wǎng)老化,新的城市生活和科技進(jìn)步都對(duì)電力需要提出了不斷增長(zhǎng)的需求。
如上所述,GPU生產(chǎn)可以按季度迭代,但電力系統(tǒng)、數(shù)據(jù)中心冷卻與輸電網(wǎng)絡(luò)的建設(shè),卻是以年為單位的工程。
AI產(chǎn)業(yè)算力增長(zhǎng)能否延續(xù),關(guān)鍵已不在芯片產(chǎn)量,而在能源與基礎(chǔ)設(shè)施是否能同步擴(kuò)張。
這也讓行業(yè)目光重新轉(zhuǎn)向上游芯片廠商。
過(guò)去,英偉達(dá)等公司拼的是峰值性能:算力越強(qiáng)、速度越快越好。
但當(dāng)限制從“算力短缺”變成“電力短缺”后,標(biāo)準(zhǔn)是否有可能開(kāi)始反轉(zhuǎn)?
reddit相關(guān)討論帖中,有網(wǎng)友表達(dá)了自己的建議:
如果你是受電力限制而不是芯片限制,你會(huì)想要每工作最節(jié)能的芯片,對(duì)吧?
如果你已經(jīng)被能耗閑置,而英偉達(dá)推出一款速度提升1.2倍但能耗降低25%的芯片,那將非常有吸引力。

One More Thing
周一,微軟在上宣布,相關(guān)部門(mén)已經(jīng)批準(zhǔn)它向阿聯(lián)酋運(yùn)送英偉達(dá)芯片,用來(lái)建設(shè)訓(xùn)練AI模型所需的數(shù)據(jù)中心。
微軟還表示,未來(lái)四年將在海灣國(guó)家投資80億美元用于數(shù)據(jù)中心、云計(jì)算和其他人工智能項(xiàng)目。
中東地區(qū)資金豐厚,能源豐富,外媒分析,這筆交易也標(biāo)志著AI基礎(chǔ)設(shè)施正在從硅谷遷往能源充足的新興市場(chǎng)。
或許去了那里,微軟買(mǎi)下的英偉達(dá)GPU可以不再吃灰吧……
參考鏈接:
[1]https://www.reddit.com/r/hardware/comments/1onawsk/microsoft_ceo_says_the_company_doesnt_have_enough/
[2]https://x.com/rohanpaul_ai/status/1985462248349766076
[3]https://finance.yahoo.com/news/microsoft-gets-u-approval-export-134300053.html




