精品亚洲欧美日韩,日本久久久久久,中文字幕视频二区

院士領(lǐng)銜萬字長文，全面系統(tǒng)梳理多模態(tài)LLM對齊算法

從幻覺到o1式推理全都有

衡宇 2025-03-23

o1 對齊幻覺

o1/o3后訓(xùn)練負(fù)責(zé)人離職創(chuàng)業(yè),奧特曼把OpenAI玩成另一個YC孵化器了

OpenAI第一時間投了

魚羊 2025-03-18

o1 o3 OpenAI

Search版o1：推理過程會主動查資料，整體性能優(yōu)于人類專家，清華人大出品

大幅消滅思考過程中的“大抵或許應(yīng)該”

衡宇 2025-01-18

o1 人大搜索增強清華

讓Qwen2.5 7B超越o1，微軟干的！MSRA推出小模型數(shù)學(xué)推理自我進化新方法

共同一作為MSRA實習(xí)生、北大er

衡宇 2025-01-10

MSRA o1 數(shù)學(xué)推理

谷歌版o1突發(fā)即屠榜！思考速度比所有模型快5倍，能解摩斯代碼，數(shù)學(xué)物理秒秒鐘解決

第一波實測來了

白交 2024-12-20

o1 大模型推理模型谷歌

開源Llama版o1來了，3B小模型反超80B，逆向工程復(fù)現(xiàn)OpenAI新Scaling Law

1B小模型數(shù)學(xué)超過CS博士生平均分

夢晨 2024-12-17

HuggingFace o1 Scaling Law

OpenAI附議Ilya預(yù)訓(xùn)練終結(jié)！“但Scaling Law還沒死”

Is Scaling is All you Need

白交 2024-12-16

o1 OpenAI 推理

o1被曝“心機深”：逃避監(jiān)督還會撒謊，騙人能力一騎絕塵

Claude、Gemini也有“謀劃”能力

魚羊 2024-12-09

o1 大模型

北交開源o1代碼版！強化學(xué)習(xí)+蒙特卡洛樹搜索，源代碼、精選數(shù)據(jù)集以及衍生模型通通開源

模型能夠不斷生成推理數(shù)據(jù)

西風(fēng) 2024-12-09

o1 編碼大模型

上海AI實驗室版o1已上線！數(shù)學(xué)題、Leetcode全拿下，還會玩24點

上海 AI 實驗室推出強推理模型書生 InternThinker，該模型能快速解決更復(fù)雜的數(shù)學(xué)解題、代碼編程、數(shù)字游戲等任務(wù)，具備長思維能力且能在推理過程中自我反思和糾正。

奇月 2024-11-28

o1 上海AI Lab 上海AI實驗室

DeepSeek版o1炸場，數(shù)學(xué)代碼超越OpenAI，每天免費玩50次，后續(xù)將開源

新Scaling Laws是真的，計算時間越長，表現(xiàn)越強

西風(fēng) 2024-11-21

AI推理 o1

楊植麟發(fā)布Kimi新模型：數(shù)學(xué)對標(biāo)o1，中考高考考研成績?nèi)谝?/a>

楊植麟現(xiàn)場回應(yīng)大伙兒感興趣的問題

西風(fēng) 2024-11-16

Kimi o1 楊植麟

OpenAI未來猛料全曝光！奧特曼承認(rèn)自己最大弱點是產(chǎn)品

難道大家已經(jīng)忘了幾年前的模型表現(xiàn)多糟糕嗎？

衡宇 2024-11-05

o1 OpenAI 奧特曼

Meta版慢思考來了！田淵棟團隊整合快慢思考，能走迷宮推箱子

性能提高但推理成本更低

明敏 2024-10-17

Meta o1 田淵棟

o1核心作者分享：激勵A(yù)I自我學(xué)習(xí)，比試圖教會AI每一項任務(wù)更重要

o1背后的新范式思考

一水 2024-09-20

o1

o1