日本va欧美va瓶,日韩综合一区二区,久久精品网站免费观看

蘋果AI選Mamba：Agent任務(wù)比Transformer更好

帶工具的SSMs更具潛力

聞樂 2025-10-21

Mamba Transformer 蘋果AI

Transformer作者：DeepSeek才有搞頭，OpenAI指望不上了

“閉源人工智能在阻礙我們探索真正的科學(xué)”

衡宇 2025-09-12

Deepseek Transformer 開源閉源

Transformer危！谷歌MoR架構(gòu)發(fā)布：內(nèi)存減半推理速度還翻倍

保持大模型性能的同時降低計算和內(nèi)存成本

鷺羽 2025-07-17

Transformer 谷歌

Mamba一作預(yù)告新架構(gòu)！長文論述Transformer≠最終解法

而且Attention并非All You Need

一水 2025-07-09

Transformer 模型架構(gòu)

基于能量的Transformer橫空出世！全面超越主流模型35%

像人類一樣“想清楚再回答”

時令 2025-07-08

Transformer 無監(jiān)督學(xué)習(xí)

Meta新注意力機(jī)制突破Transformer上限，還用上了OpenAI的開源技術(shù)

將標(biāo)準(zhǔn)點積注意力推廣到三元線性函數(shù)

魚羊 2025-07-07

Meta Transformer

一句話生成任務(wù)專屬LoRA！Transformer作者創(chuàng)業(yè)公司顛覆LLM微調(diào)

能夠動態(tài)調(diào)制大模型的超網(wǎng)絡(luò)架構(gòu)

鷺羽 2025-06-13

LLM LoRA Transformer

何愷明LeCun改造Transformer！9行代碼替代歸一化性能不減還加速

入選CVPR 2025，代碼已開源

克雷西 2025-03-14

CVPR Transformer 何愷明

嚯！大語言擴(kuò)散模型來了，何必只預(yù)測下一個token | 人大高瓴&螞蟻

正向掩碼+反向預(yù)測

明敏 2025-02-18

Transformer 擴(kuò)散模型

谷歌新架構(gòu)一戰(zhàn)成名，打破Transformer記憶瓶頸，姚班校友鐘沛林新作

新的長期記憶模塊

夢晨 2025-01-14

Transformer

視頻大模型無損提速：刪除多余token，訓(xùn)練時間減少30%，幀率越高效果越好

推理階段也適用

克雷西 2024-11-17

Transformer

o1方法性能無上限！姚班馬騰宇等數(shù)學(xué)證明：推理token夠多，就能解決任意問題

CoT讓Transformer更接近圖靈完備

克雷西 2024-09-17

Transformer

Transformer作者預(yù)警：只賣模型玩不過OpenAI！

預(yù)言5年內(nèi)機(jī)器人領(lǐng)域?qū)⒂瓉泶笸黄疲?/p>

十三 2024-08-24

OpenAI Transformer 谷歌

Transformer“貢獻(xiàn)最大”作者，重返谷歌出任Gemini聯(lián)合技術(shù)主管

與Jeff Dean一起共事

十三 2024-08-23

Gemini Transformer 谷歌

爆火神經(jīng)網(wǎng)絡(luò)架構(gòu)KAN更新2.0！可專屬定制，輕松應(yīng)對經(jīng)典物理學(xué)研究

作者：和MLP不能互相取代

白交 2024-08-21

KAN MIT Transformer

首位AI科學(xué)家問世！已獨立生成10篇學(xué)術(shù)論文，還順手搞了AI審稿人

Transformer作者創(chuàng)業(yè)成果

衡宇 2024-08-13

AI科學(xué)家 Transformer

打亂/跳過Transformer層會怎樣？最新研究揭開其信息流動機(jī)制，一口氣解答8大問題

ViT作者等一眾學(xué)者點贊

西風(fēng) 2024-07-26

Transformer 信息流動機(jī)制

陳丹琦團(tuán)隊揭Transformer內(nèi)部原理：另辟蹊徑，從構(gòu)建初代聊天機(jī)器人入手

數(shù)據(jù)集/架構(gòu)/訓(xùn)練全都新來一遍

一水 2024-07-18

Transformer 陳丹琦

拆分Transformer注意力，韓國團(tuán)隊讓大模型解碼提速20倍

內(nèi)存開銷也大幅降低

克雷西 2024-07-01

Transformer

全面超越Transformer！清華螞蟻純MLP架構(gòu)，長短程時序預(yù)測大提升

性能和效能雙飛升

白交 2024-06-12

MLP Transformer 時序預(yù)測

Transformer

蘋果AI選Mamba：Agent任務(wù)比Transformer更好

Transformer作者：DeepSeek才有搞頭，OpenAI指望不上了

Transformer危！谷歌MoR架構(gòu)發(fā)布：內(nèi)存減半推理速度還翻倍

Mamba一作預(yù)告新架構(gòu)！長文論述Transformer≠最終解法

基于能量的Transformer橫空出世！全面超越主流模型35%

Meta新注意力機(jī)制突破Transformer上限，還用上了OpenAI的開源技術(shù)

一句話生成任務(wù)專屬LoRA！Transformer作者創(chuàng)業(yè)公司顛覆LLM微調(diào)

何愷明LeCun改造Transformer！9行代碼替代歸一化性能不減還加速

嚯！大語言擴(kuò)散模型來了，何必只預(yù)測下一個token | 人大高瓴&螞蟻

谷歌新架構(gòu)一戰(zhàn)成名，打破Transformer記憶瓶頸，姚班校友鐘沛林新作

視頻大模型無損提速：刪除多余token，訓(xùn)練時間減少30%，幀率越高效果越好

o1方法性能無上限！姚班馬騰宇等數(shù)學(xué)證明：推理token夠多，就能解決任意問題

Transformer作者預(yù)警：只賣模型玩不過OpenAI！

Transformer“貢獻(xiàn)最大”作者，重返谷歌出任Gemini聯(lián)合技術(shù)主管

爆火神經(jīng)網(wǎng)絡(luò)架構(gòu)KAN更新2.0！可專屬定制，輕松應(yīng)對經(jīng)典物理學(xué)研究

首位AI科學(xué)家問世！已獨立生成10篇學(xué)術(shù)論文，還順手搞了AI審稿人

打亂/跳過Transformer層會怎樣？最新研究揭開其信息流動機(jī)制，一口氣解答8大問題

陳丹琦團(tuán)隊揭Transformer內(nèi)部原理：另辟蹊徑，從構(gòu)建初代聊天機(jī)器人入手

拆分Transformer注意力，韓國團(tuán)隊讓大模型解碼提速20倍

全面超越Transformer！清華螞蟻純MLP架構(gòu)，長短程時序預(yù)測大提升

熱門文章

52個人用AI做PPT，年賺7個億

奇瑞發(fā)布「安徽版享界S9」，世界模型加持，攜手Momenta挑戰(zhàn)云南山路68彎

垃圾信息刷多了AI也會變蠢！“年度最令人不安的論文”

雷軍罕見硬剛回應(yīng)！同日公關(guān)負(fù)責(zé)人被曝調(diào)整

馬斯克悄然發(fā)布Grok 4.1，霸榜大模型競技場所有排行榜