明敏 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
AMD造勢已久、面向高性能計算的MI200,終于來了!
在拿下元宇宙大客戶Meta后,AMD乘勢而上官宣一系列新芯片,其中就包括這張不斷有消息曝出的計算加速卡。
它采用6nm工藝,擁有580億個晶體管、超過14000個內核、128GB的HBM2e顯存,FP32性能達到95 TFLOPs 。
官方表示,它可以加速機器學習等任務,對標英偉達A100。
沒錯,是要和老黃搶盤中餐的節奏。
并且該芯片之后還將被用于美國橡樹嶺國家實驗室的超算系統中。
所以,MI200性能到底如何呢?
FP64性能是A100的4.9倍
本次發布的MI200系列中,包含Instinct MI250X和Instinct MI250兩款芯片。
與120個計算單元(CU)、7689個內核的MI100相比,其性能有了大幅提升。
- MI250X有220個計算單元 (CU) 和14080個內核。
- MI250則有208個計算單元 (CU) 和13312個內核。
它們采用了全新的CDNA? 2 架構,可加速FP64和FP32矩陣運算,與上一代MI100相比,FP64理論峰值性能最多可高出4倍。
2.5D Elevated Fanout Bridge(EFB)封裝技術讓MI200在內核數上較上一代增加了1.8倍,內存帶寬增加了2.7倍,聚合理論峰值內存帶寬也高達每秒3.2TB。
與此同時,第三代AMD Infinity Fabric? 技術可管理8條Infinity Fabric鏈路,讓MI200計算節點可與第三代霄龍(EPYC)處理器或其他GPU相連,從而實現統一的CPU/GPU一致性、并最大限度地提升系統吞吐量。
既然說對標英偉達A100,那具體表現如何呢?
制作工藝上,A100采用7nm制程,集成超過540億個晶體管,顯存為80GB。
MI200系列則采用6nm工藝,擁有580億個晶體管,顯存達到了128GB。
性能對比中,MI200的FP64性能是A100的4.9倍。
在處理加速任務中,AMD也對MI200系列和A100進行了對比:
以處理分子動力任務為例,MI250的性能表現是A100的2.2倍。
在其他幾項任務中,MI250的表現也都優于A100(具體數據可參看文末參考鏈接4)
AMD愈加搶眼
此次除了發布MI200之外,AMD還發布了首款采用3D V-Cache 技術的服務器處理器產品——EPYC Milan-X。
這款芯片之后將被用于微軟的Azure云計算服務。
而在產品之外,AMD近期的財務表現也非常搶眼。
先與Meta達成合作,后又發布系列新芯片,讓AMD的股價也在這周第一個交易日大漲10%以上。
上個月發布的Q3財報中顯示,AMD營收同比增長54%,較老對手英特爾表現亮眼,也讓不少人更加看好AMD。
這一次,AMD的這次動作更是瞄準英偉達的王炸A100發布對標產品。
而且網友表示,與Meta合作意味著AMD的卡將來可能可以移植Pytorch,英偉達在機器學習上的壟斷地位或許會被撼動。
參考鏈接:
[1]https://ir.amd.com/news-events/press-releases/detail/1032/new-amd-instinct-mi200-series-accelerators-bring
[2]https://www.reuters.com/technology/amd-lands-meta-customer-takes-aim-nvidia-with-new-supercomputing-chips-2021-11-08/
[3]https://www.tomshardware.com/news/amd-instinct-mi200-chiplet-datacenter-gpu
[4]https://www.amd.com/en/graphics/server-accelerators-benchmarks




