国产一区二区三区av电影,国产精品亚洲人在线观看,一区二区三区成人

陳丹琦有了個(gè)公司郵箱，北大翁荔同款

被曝加盟Thinking Machines

白交 2025-08-28

Thinking Machines Lab 陳丹琦

打臉！GPT-4o輸出長(zhǎng)度8k都勉強(qiáng)，陳丹琦團(tuán)隊(duì)新基準(zhǔn)測(cè)試：所有模型輸出都低于標(biāo)稱長(zhǎng)度

LLM生成長(zhǎng)段回復(fù)的能力還有待加強(qiáng)

奇月 2025-01-15

LLM 陳丹琦

陳丹琦團(tuán)隊(duì)降本大法又來了：數(shù)據(jù)砍掉三分之一，性能卻完全不減

一作高天宇

白交 2025-01-07

大模型陳丹琦高天宇

陳丹琦團(tuán)隊(duì)揭Transformer內(nèi)部原理：另辟蹊徑，從構(gòu)建初代聊天機(jī)器人入手

數(shù)據(jù)集/架構(gòu)/訓(xùn)練全都新來一遍

一水 2024-07-18

Transformer 陳丹琦

陳丹琦團(tuán)隊(duì)新作：Llama-2上下文擴(kuò)展至128k，10倍吞吐量?jī)H需1/6內(nèi)存

任何僅解碼器架構(gòu)模型都適用

豐色 2024-02-29

大模型陳丹琦

陳丹琦團(tuán)隊(duì)新作：數(shù)據(jù)量砍95%，大模型性能更強(qiáng)了！Less is More

數(shù)據(jù)選擇算法LESS

白交 2024-02-10

大模型陳丹琦

陳丹琦ACL學(xué)術(shù)報(bào)告來了！詳解大模型「外掛」數(shù)據(jù)庫7大方向3大挑戰(zhàn)，3小時(shí)干貨滿滿

突破大模型自身瓶頸

蕭簫 2023-07-10

大模型數(shù)據(jù)庫陳丹琦

陳丹琦帶隊(duì)全員女將發(fā)新論文！提出AI消除性別偏見新方法，適用于任何模型 | EMNLP 2022

方法已開源

Pine 2022-12-08

開源陳丹琦

陳丹琦帶著清華特獎(jiǎng)學(xué)弟發(fā)布新成果：打破谷歌BERT提出的訓(xùn)練規(guī)律！這個(gè)慶祝方式太學(xué)神了吧

進(jìn)一步挖掘NLP大模型潛力

蕭簫 2022-02-17

人工智能清華陳丹琦

陳丹琦團(tuán)隊(duì)最新論文：受GPT-3啟發(fā)，用小樣本學(xué)習(xí)給語言模型做微調(diào)，性能最高提升30%

共同一作之一為清華特獎(jiǎng)得主高天宇

魚羊 2021-01-04

小樣本學(xué)習(xí) 普林斯頓陳丹琦高天宇

陳丹琦

陳丹琦有了個(gè)公司郵箱，北大翁荔同款

打臉！GPT-4o輸出長(zhǎng)度8k都勉強(qiáng)，陳丹琦團(tuán)隊(duì)新基準(zhǔn)測(cè)試：所有模型輸出都低于標(biāo)稱長(zhǎng)度

陳丹琦團(tuán)隊(duì)降本大法又來了：數(shù)據(jù)砍掉三分之一，性能卻完全不減

陳丹琦團(tuán)隊(duì)揭Transformer內(nèi)部原理：另辟蹊徑，從構(gòu)建初代聊天機(jī)器人入手

陳丹琦團(tuán)隊(duì)新作：Llama-2上下文擴(kuò)展至128k，10倍吞吐量?jī)H需1/6內(nèi)存

陳丹琦團(tuán)隊(duì)新作：數(shù)據(jù)量砍95%，大模型性能更強(qiáng)了！Less is More

陳丹琦ACL學(xué)術(shù)報(bào)告來了！詳解大模型「外掛」數(shù)據(jù)庫7大方向3大挑戰(zhàn)，3小時(shí)干貨滿滿

陳丹琦帶隊(duì)全員女將發(fā)新論文！提出AI消除性別偏見新方法，適用于任何模型 | EMNLP 2022

陳丹琦帶著清華特獎(jiǎng)學(xué)弟發(fā)布新成果：打破谷歌BERT提出的訓(xùn)練規(guī)律！這個(gè)慶祝方式太學(xué)神了吧

陳丹琦團(tuán)隊(duì)最新論文：受GPT-3啟發(fā)，用小樣本學(xué)習(xí)給語言模型做微調(diào)，性能最高提升30%

熱門文章

萬卡集群要上天？中國(guó)硬核企業(yè)打造太空超算！

階躍開源4B Agent模型，跑通所有安卓設(shè)備，手搓黨一鍵部署

DeepSeek-V3.2系列開源，性能直接對(duì)標(biāo)Gemini-3.0-Pro

Transformer作者爆料GPT-5.1內(nèi)幕！OpenAI內(nèi)部命名規(guī)則變亂了

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創(chuàng) 語音交互新范式

陳丹琦

熱門文章

萬卡集群要上天？中國(guó)硬核企業(yè)打造太空超算！

階躍開源4B Agent模型，跑通所有安卓設(shè)備，手搓黨一鍵部署

DeepSeek-V3.2系列開源，性能直接對(duì)標(biāo)Gemini-3.0-Pro

Transformer作者爆料GPT-5.1內(nèi)幕！OpenAI內(nèi)部命名規(guī)則變亂了

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創(chuàng) 語音交互新范式

萬卡集群要上天？中國(guó)硬核企業(yè)打造太空超算！

階躍開源4B Agent模型，跑通所有安卓設(shè)備，手搓黨一鍵部署

DeepSeek-V3.2系列開源，性能直接對(duì)標(biāo)Gemini-3.0-Pro

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創(chuàng) 語音交互新范式