LLM
LLM強(qiáng)化學(xué)習(xí)新框架!UCSD多智能體訓(xùn)練框架讓LLM工具調(diào)用能力暴增5.8倍
結(jié)合樹狀采樣與角色化獎(jiǎng)勵(lì)機(jī)制
斯坦福大模型推理課免費(fèi)了,谷歌推理團(tuán)隊(duì)創(chuàng)始人主講
DeepMind推理專家分享如何提升大模型推理能力
一句話生成任務(wù)專屬LoRA!Transformer作者創(chuàng)業(yè)公司顛覆LLM微調(diào)
能夠動(dòng)態(tài)調(diào)制大模型的超網(wǎng)絡(luò)架構(gòu)
MSRA清北推出強(qiáng)化預(yù)訓(xùn)練!取代傳統(tǒng)自監(jiān)督,14B模型媲美32B
將強(qiáng)化學(xué)習(xí)深度融入LLM預(yù)訓(xùn)練階段
強(qiáng)化學(xué)習(xí)之父:LLM主導(dǎo)只是暫時(shí),擴(kuò)展計(jì)算才是正解
模仿人類思維方式,只能帶來短期的性能提升
大模型能夠自發(fā)形成“人類思維地圖”!Nature子刊重磅研究揭示多模態(tài)大模型類腦機(jī)制
大模型內(nèi)部存在著類似人類對(duì)現(xiàn)實(shí)世界概念的理解
首個(gè)獎(jiǎng)勵(lì)模型評(píng)分基準(zhǔn)!清華復(fù)旦港科大聯(lián)合攻克AI評(píng)委“偏科”
評(píng)估獎(jiǎng)勵(lì)模型區(qū)分微妙變化和抵抗風(fēng)格偏差的能力
















意-2029951756346982425.jpeg)


意-1074386009122013216-1.jpeg)




