存算一體芯片已到大規模應用前夜,兩大技術方向怎么走?丨對撞派 · 圓桌實錄
?量子位智庫 發自 凹非寺
量子位 | 公眾號 QbitAI
存算一體技術已成為目前芯片領域的熱門話題之一,學術界與產業界都在關注其發展動態。
對于一項創新技術,從理論到應用落地會經歷哪些環節?怎樣布局以確保把風險降到最低?
過去兩周,量子位對撞派推出了「存算一體芯片」專題,先后邀請到做存算一體大算力AI芯片研發的后摩智能,和國內最早入局存算一體且已實現量產的知存科技,從不同角度與我們探討了存算一體技術的價值、潛力以及關于商業化的思考。
在這一系列專題中,我們聊到了存算一體芯片的定義、技術路線、行業現狀、產業生態等等……
精華版文字內容在此,快來看看業內人士怎么說~(文末還有彩蛋噢)
第一場:對話后摩智能
后摩智能專注于存算一體技術的大算力AI芯片研發。通過底層架構創新,大幅提升芯片性能,可用于智能駕駛、泛機器人等邊緣端及云端推理場景。
對談嘉賓:
信曉旭(左一):后摩智能創始人兼產品副總裁
孫廣宇(右一):北京大學集成電路學院副教授

Q1:如何定義存算一體,以及如何理解其深層價值?
A1:存算一體是讓計算單元和存儲單元的距離拉近,從而增大它們之間的帶寬。從這個角度講,存算一體會有不同的技術路線(計算單元和存儲單元距離的遠近),核心目的是減少距離和增大帶寬。
不同路線的技術成熟度:
從學術界來講,在計算上不存在技術成熟度,畢竟都是用logic來做,成熟度指的更多是存儲成熟度。SRAM、DRAM、Flash相對來說是成熟的存儲工藝,新型工藝像MRAM、RRAM,成熟度各不相同。成熟的工藝并不代表一定會比其他都好,這里面需要做各種設計權衡。具體來講,不能單一地認為距離近了就一定好,或者距離遠了就一定不好,同時需要考慮場景和工藝成熟度以及應用特點。應該在整個大的領域里根據應用選擇最合適的工藝和制程,去做最合適的設計。
從器件來說,可以進行成熟度分類,但從設計本身來講成熟度/優勢對比,沒有唯一的答案。
Q2:在產業應用當中應該如何進行技術路線選擇?哪些因素會影響優先選擇的方向?
A2:技術路線和應用場景是強相關的,現在存算有兩個大方向,一個是偏digital(數字)的CIM-D,一個是偏analog(模擬)的CIM-A,這兩種路線適合的技術場景不太一樣,由它們的技術特點決定。CIM-A看起來精度比較低,但其能效比在低精度的情況下更好,在AIoT中偏consumer的場景里,CIM-A更有競爭力;對精度要高的場景,比如自動駕駛領域,會用CIM-D的方案。
需要充分考慮技術特點能不能解決場景里面用戶和客戶的實際問題,對于后摩來說,從定義最后的目標市場,產品整個策略的角度,充分考慮技術和產品的匹配度,是一個綜合考量。
Q3:后摩智能是如何思考和布局軟硬協同的?
A3:首先,簡單拆分軟硬協同,把它分成兩部分,一個是偏應用側的。這部分我們把它留給客戶和合作伙伴去做,因為他們更懂這部分。在更貼近底層硬件的這部分,比如說硬件抽象層、編譯器、基礎的工具鏈等等,這些和硬件貼得更近的這部分是我們自研的,那我其實剛才已經基本提到了您回答的這個問題。我們做這件事情軟硬件協同的整體的考慮就兩點。
后摩做軟硬協同考慮兩點:
1)從目標市場,場景來反推,給硬件團隊一個明確的目標。比如說聚焦在偏CV的場景里,硬件團隊就會針對這個場景做優化。
2)在應用性上,會充分考慮用戶的遷移成本,后摩在這部分的學習成本上做了充分考量。
Q4:業界目前都在關注新型存儲器的研發進展,新型存儲器的優勢和特征是什么?
A4:新型存儲器包括RRAM, MRAM, phase change memory(PCM), 鐵電等。存儲介質最開始做是為了解決存儲本身的問題,在演進過程中發現它的新特點可以去做存算。不同的存儲器在器件本身的設計特點以及反應出來的特性都有所不同,從架構角度講,業內比較關注訪存的延遲(器件如何做),功耗,讀寫的壽命,可靠性等。
新存儲介質里相對成熟的是MRAM,它的好處是讀寫速度快(接近SRAM),密度比SRAM 高,讀寫次數多(耐久性好)。
PCM也有商業化。Intel的3D Xpoint,密度比較高,適用數據中心這種比較大的存儲介質,可以去存比較大的數據。問題:磨損壽命有限,有待優化。
RRAM,做起來簡單(結構簡單),可以用不同的參數來做,未來可以做一個性能不錯,密度比較高且在不同層次都能去用的存儲器。現在面臨的問題是穩定性不夠(variation大),需要器件和foundry層面一起對它進行打磨。
新器件未來會有不同的適用層次,新器件不一定是要替代傳統器件,而且新器件之間也會是協同去做。因為原來的存儲架構是分層次的,走到存算的領域后,不會是一個打平的狀態。這里面也會是不同層次。
Q5:后摩智能對于新型存儲介質的布局和想法是怎樣的?
A5:后摩的規劃有兩條線:一條是產品線,一條是技術線。
產品最后要給到客戶,首先要確保它一定是基于成熟的技術。當前的產品是基于成熟的SRAM在做,基于SRAM做相對于傳統架構也有幾倍的能效比優勢。
技術線會先產品一代做新介質的探索,達到產品可用需要做技術的驗證,會提前摸清楚各個參數是不是能夠達到產品要求。有可能最后的產品是一個mix,RRAM+SRAM的組合,大家在各自里面解決的問題是不一樣的,但整體來說新的技術一旦它在某一個點成熟,能解決問題,就會考慮把它用起來。
一代不止一款產品,當前基于SRAM會有2-3顆芯片出來,根據應用場景(自動駕駛,泛機器人)也會是高中低幾個檔位的——一代芯片里可能會有幾款不同的產品。等這一代芯片差不多之后,新器件的探索有機會幫助進一步提升下一代產品的競爭力。
按照傳統的方法,2-4年之后,產品的提升在10%-20%,看不到非常大的跳躍——技術生命力較差;在存算里,學術界和產業界積極探索,因為它的生命力非常強,一旦一個技術突破后,就會有指數級的跳躍,產品的競爭力會比之前架構下的有非常大的飛躍。
Q6:存算一體在產業界發展的關鍵因素有哪些?
A6:首先要選對方向和場景,存算一體技術能夠真正解決客戶場景里的問題,這樣落地的速度會更快,商業閉環也會更快。存算要有成功的案例,實現商業閉環,能夠給產業界更大的信心。
如果閉環的場景是個相對大的場景,能夠帶動更多人關注更大的產業,這對于存算的發展將會起更大的推動作用。一旦一個大的場景出來,會帶動更多產業界和資本圈的人來關注,加速商業化進程——找對大的場景快速落地。
第二場:對話知存科技
知存科技專注存內計算芯片領域,創新使用Flash存儲器完成神經網絡的儲存和運算,解決AI的存儲墻問題,提高運算效率,降低成本。
對談嘉賓:
王紹迪:知存科技創始人兼CEO

Q1:近存計算和存內計算兩種技術路線會帶來哪些后續的區別,知存如何選擇?
A1:技術路線在后面會完全不同。近存計算解決的是馮諾依曼架構下的數據搬運問題,它面向的是更廣范圍的應用。思考的問題是對于CPU、GPU如何把數據和存儲拉得更近,應用場景針對的是數據量大的場景,包括服務數據中心、礦機;存內計算是用存儲器做計算,在它的系統中沒有GPU、CPU、NPU這些,它本身就是計算類的芯片,它自己去替代計算類的芯片,直接在存儲器上完成計算,它的應用場景大部分在人工智能場景。
知存布局的場景:知存創始團隊從2012年開始做存內計算,主要應用場景是泛人工智能場景,存內計算可以應用在各種各樣的人工智能領域,人工智能中用的計算大部分是深度學習,深度學習95%以上用的都是矩陣乘法,所有矩陣乘法用存內計算去做都可以大幅提高效率。
存內計算可以應用于各種各樣的人工智能場景,在有些場景它的優勢很強,有些場景優勢相對較弱。整體來說,算力需求越大,對能效要求越高的場景,存算一體的優勢越強。
Q2:存算一體目前處在產業發展的哪個階段?
A2:存算一體的概念在上世紀60年代就有,前面沒有興起的原因有兩點,一是那時候存算一體可以解決一部分性能提升,但當時能解決的部分在整個系統中只占到10%-20%,只解決這個問題是沒有意義的,后來隨著人工智能時代到來,需要的算力很大,這時候存算一體就能解決90%計算的問題,它的存在就有意義了。
另外是在過去幾十年存算一體沒有真正出現也是因為摩爾定律還在持續往下走,在摩爾定律能持續往下走的時候,我們看不到任何架構的創新,大家不需要做架構創新,每一到兩年換一代芯片的工藝,性能自然提升幾倍,成本自然降低,并且性能提升的速度非常快,不需要做架構上的創新。
但到2010年之后,進入到后摩爾時代。后摩爾時代的架構創新是必要的,摩爾定律已經走到盡頭,加之人工智能時代到來,存算一體應運而生,受到越來越多關注。最早在2011年,學術圈也開始提倡去研究存算一體。2017年,知存成立,算是第一批做存內計算的公司。目前存內計算中有一些技術已經可以落地了,這個時候需要產業界加大投入,把它做成好的產品。還有很多的技術是需要開發的,存內計算未來的發展還有大概10年的過程,存內計算本身也有一個類似“摩爾定律”的發展過程,快速迭代,包括工藝方面代工廠針對存內計算專用的工藝上的提升。其次是先進的材料,目前能夠量產的存內計算存儲器只有Flash和SRAM新型的存儲器(emerging memory)更適合做存內計算,需要更多在新型存儲器件上的研究。另外,存內計算從算法到供應鏈生態上也需要產學研結合,相互融合促進發展。產業界落地一部分,學術界/研究所繼續研究下一代,不斷地往前推進。知存科技會持續加大對工藝、工具鏈、技術標準化等方面的投入,推動產業生態共建。
Q3:在發展的每個階段中遇到的瓶頸是什么,有哪些解決方法?
A3:知存目前第二代產品已實現量產,約每月10萬片的量級,且已經落地到智能可穿戴設備市場。從16年驗證概念到現在量產落地,需要很多工程化;還有在產品層面去解決存內計算存在的一些問題。
存內計算有自己的優勢:運算效率高,運算密度大,運算成本低;但還是一個新興技術,測試標準、量產方法、測試方法、計算范式跟現有的方式都完全不一樣,需要一步步建立,建立之后還需要保證可靠性。
在量產過程中遇到了很多之前沒有遇到的問題,因為存內計算和存儲器不同,和傳統的計算芯片也不同。比如存儲器覆蓋的應用和存內計算所覆蓋的存儲器的應用方式是完全不一樣的。像存內計算遇到的問題,可能存儲器領域之前幾十年都沒有遇到過,這些都需要一步步去解決,才能把存內計算從技術demo走向量產。
Q4:對于行業而言,目前最重要的一個節點是什么?
A4:存算一體正處在量產到大規模應用的關鍵階段。知存科技研發的存算一體芯片已經達成每年千萬片量級的小規模量產,我認為下一個關鍵節點,算力將達到16Tops以上、精度將達到10-bit以上、成本將比現有芯片有2-5倍的優勢,量產規模上億片。存算一體芯片將在更大規模的應用中具備絕對優勢。
Q5:存算一體領域的進入門檻有哪些?
A5:主要在于工藝、架構層面,做存算一體最大的困難在于,無法預判會遇到什么樣的問題。存算一體的設計方式跟數字電路和模擬電路都不一樣,它是把模擬技術跟存儲器結合在一起,所以應用方式也不一樣。
現在做一個大型芯片通常是通過寫代碼,代碼自動化通過EDA工具生成一個芯片設計,EDA工具保證芯片設計出來的可用性,只要工藝沒有問題。但是存算一體沒有EDA工具指導,很多東西需要手動設計。
另外,存算一體芯片的生產工藝不保證手動設計仿真出來的東西一定可用,因為它的用法跟傳統的芯片不一樣,在foundry廠那邊的工藝上不保證存內計算所應用的部分。只能通過不斷地測試、驗證解決,花費的時間可能是幾年——需要玩家持續性探索的能力。
Q6:存算一體產業的未來趨勢是什么?如何去看待這項技術?
A6:現在在芯片行業,很多人都在觀望下一個關鍵節點的出現,發生大規模的替代。對人工智能整個產業來說,存算一體技術的逐漸成熟,將帶來更低成本,更高算例、更高能效、更低功耗,幫助更多人工智能落地。可以說存算一體將成為是未來人工智能時代的基石之一。
對于存算一體,首先要保持耐心,作為一項全球范圍的新興技術,還有很多待發現和解決的問題;其次要保持期待,重點關注未來存算一體可以做的更多的事情。
One More Thing
錯過了直播的小伙伴可以點擊我們的直播回看視頻,了解更多技術細節和問題詳解~
第一期:后摩智能
https://www.bilibili.com/video/BV1Tv4y1T7xr
第二期:知存科技
https://www.bilibili.com/video/BV1w3411A7v1
在存算一體芯片領域,智庫后續還會推出深度報告與金句視頻。歡迎掃碼添加小助手,進入垂直社群:

如果您深耕于存算一體芯片領域,歡迎掃碼添加分析師進行深度討論與交流。

關于量子位智庫:
量子位旗下科技創新產業鏈接平臺。致力于提供前沿科技和技術創新領域產學研體系化研究。面向前沿AI&計算機、生物計算、量子技術及健康醫療等領域最新技術創新進展,提供系統化報告和認知。通過媒體、社群和線下活動,幫助決策者更早掌握創新風向。
關于對撞派:
量子位智庫旗下的高端圓桌欄目。
對撞派致力于邀請前沿科技領域的專業人士,如創業公司CEO及CTO、資深科學家、專業投資人等,對特定趨勢進行深度討論及解讀。從業內與專業的角度,幫助讀者更為準確地把握未來科技動向。
- 九章云極獨攬量子位三項大獎:以“一度算力”重構AI基礎設施云格局2025-12-10
- 視頻理解霸榜!快手Keye-VL旗艦模型重磅開源,多模態視頻感知領頭羊2025-11-28
- 中國唯一!阿里千問斬獲全球AI頂會最佳論文2025-11-28
- 第19屆中國投資年會·有限合伙人峰會在滬成功舉辦2025-11-28



