o1
讓Qwen2.5 7B超越o1,微軟干的!MSRA推出小模型數(shù)學(xué)推理自我進化新方法
共同一作為MSRA實習(xí)生、北大er
開源Llama版o1來了,3B小模型反超80B,逆向工程復(fù)現(xiàn)OpenAI新Scaling Law
1B小模型數(shù)學(xué)超過CS博士生平均分
OpenAI附議Ilya預(yù)訓(xùn)練終結(jié)!“但Scaling Law還沒死”
Is Scaling is All you Need
北交開源o1代碼版!強化學(xué)習(xí)+蒙特卡洛樹搜索,源代碼、精選數(shù)據(jù)集以及衍生模型通通開源
模型能夠不斷生成推理數(shù)據(jù)
上海AI實驗室版o1已上線!數(shù)學(xué)題、Leetcode全拿下,還會玩24點
上海 AI 實驗室推出強推理模型書生 InternThinker,該模型能快速解決更復(fù)雜的數(shù)學(xué)解題、代碼編程、數(shù)字游戲等任務(wù),具備長思維能力且能在推理過程中自我反思和糾正。
DeepSeek版o1炸場,數(shù)學(xué)代碼超越OpenAI,每天免費玩50次,后續(xù)將開源
新Scaling Laws是真的,計算時間越長,表現(xiàn)越強
楊植麟發(fā)布Kimi新模型:數(shù)學(xué)對標(biāo)o1,中考高考考研成績?nèi)谝?/a>
楊植麟現(xiàn)場回應(yīng)大伙兒感興趣的問題
OpenAI未來猛料全曝光!奧特曼承認(rèn)自己最大弱點是產(chǎn)品
難道大家已經(jīng)忘了幾年前的模型表現(xiàn)多糟糕嗎?



















