国产精品91一区,亚洲国产成人av网,欧美理论电影在线播放

LLM強(qiáng)化學(xué)習(xí)新框架！UCSD多智能體訓(xùn)練框架讓LLM工具調(diào)用能力暴增5.8倍

結(jié)合樹狀采樣與角色化獎(jiǎng)勵(lì)機(jī)制

西風(fēng) 2025-11-08

LLM 強(qiáng)化學(xué)習(xí)

不用跟AI客氣了！新研究：語氣越粗魯回答正確率越高

真不用太禮貌，罵得越狠，答得越準(zhǔn)！

聞樂 2025-10-14

GPT LLM

李飛飛一年前究竟說了啥？怎么又火了

大模型的局限在……

聞樂 2025-09-11

LLM 李飛飛空間智能

ChatGPT后遺癥來了！人類日常聊天越來越AI化

2210萬數(shù)據(jù)顯示用詞習(xí)慣大變樣

聞樂 2025-08-28

ChatGPT LLM

斯坦福大模型推理課免費(fèi)了，谷歌推理團(tuán)隊(duì)創(chuàng)始人主講

DeepMind推理專家分享如何提升大模型推理能力

聞樂 2025-07-25

DeepMind LLM 斯坦福

只因一個(gè)“：”，大模型全軍覆沒

LLM會(huì)被表面內(nèi)容操縱，產(chǎn)生假陽性結(jié)果

鷺羽 2025-07-15

LLM 獎(jiǎng)勵(lì)模型

別跟LLM太交心！斯坦福新研究：AI不能完全取代人類心理治療師

AI被爆“過度諂媚”，迎合用戶妄想

聞樂 2025-07-13

LLM 斯坦福

田淵棟：連續(xù)思維鏈效率更高，可同時(shí)編碼多個(gè)路徑，“疊加態(tài)”式并行搜索

聞樂 2025-06-19

LLM 田淵棟

大模型全員0分！謝賽寧領(lǐng)銜華人團(tuán)隊(duì)，最新編程競(jìng)賽基準(zhǔn)出爐，題目每日更新禁止刷題

聞樂 2025-06-19

LLM 謝賽寧

一句話生成任務(wù)專屬LoRA！Transformer作者創(chuàng)業(yè)公司顛覆LLM微調(diào)

能夠動(dòng)態(tài)調(diào)制大模型的超網(wǎng)絡(luò)架構(gòu)

鷺羽 2025-06-13

LLM LoRA Transformer

MSRA清北推出強(qiáng)化預(yù)訓(xùn)練！取代傳統(tǒng)自監(jiān)督，14B模型媲美32B

將強(qiáng)化學(xué)習(xí)深度融入LLM預(yù)訓(xùn)練階段

鷺羽 2025-06-11

LLM 強(qiáng)化學(xué)習(xí) 預(yù)處理

強(qiáng)化學(xué)習(xí)之父：LLM主導(dǎo)只是暫時(shí)，擴(kuò)展計(jì)算才是正解

模仿人類思維方式，只能帶來短期的性能提升

鷺羽 2025-06-10

LLM 強(qiáng)化學(xué)習(xí) 擴(kuò)展計(jì)算

不是視頻模型“學(xué)習(xí)”慢，而是LLM走捷徑｜18萬引大牛Sergey Levine

聞樂 2025-06-10

LLM

大模型能夠自發(fā)形成“人類思維地圖”！Nature子刊重磅研究揭示多模態(tài)大模型類腦機(jī)制

大模型內(nèi)部存在著類似人類對(duì)現(xiàn)實(shí)世界概念的理解

西風(fēng) 2025-06-10

LLM 模型思維

首次解釋LLM如何推理反思！西北大學(xué)谷歌新框架：引入貝葉斯自適應(yīng)強(qiáng)化學(xué)習(xí)，數(shù)學(xué)推理全面提升

聞樂 2025-06-02

LLM

華為攻克AI推理「想太多」問題！新方法讓大模型推理提速60%，準(zhǔn)確率還高了

聞樂 2025-05-30

LLM

阿里通義發(fā)布并行計(jì)算新策略：1.6B等效4.4B，內(nèi)存消耗驟降95%

聞樂 2025-05-28

LLM 并行計(jì)算

AI遭遇靈魂拷問！這道題所有模型集體翻車，網(wǎng)友：我也不會(huì)啊

聞樂 2025-05-19

LLM 圖像推理

首個(gè)獎(jiǎng)勵(lì)模型評(píng)分基準(zhǔn)！清華復(fù)旦港科大聯(lián)合攻克AI評(píng)委“偏科”

評(píng)估獎(jiǎng)勵(lì)模型區(qū)分微妙變化和抵抗風(fēng)格偏差的能力

鷺羽 2025-05-13

LLM 基準(zhǔn)測(cè)試獎(jiǎng)勵(lì)模型

挑戰(zhàn)AI數(shù)學(xué)推理極限！大規(guī)模形式化數(shù)學(xué)基準(zhǔn)FormalMATH發(fā)布，最強(qiáng)模型成功率僅16%

聞樂 2025-05-08

LLM 數(shù)學(xué)推理

LLM