色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta

爆這么多猛料,老板奧特曼知道嗎?

西風(fēng) 發(fā)自 凹非寺

量子位 | 公眾號 QbitAI

救大命,OpenAI首席研究官M(fèi)ark Chen最新訪談,信息量有點(diǎn)大呀。

不管是OpenAI的,還是自己個兒的,又或者是同事的,主打一個“我都能聊聊”。

OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta

比如:

  • 爆料Meta搶人大戰(zhàn)私下已經(jīng)升級成送湯大戰(zhàn)了,真能喝的那種湯,小扎熬了親自送到OpenAI研究員嘴邊。OpenAI反擊也送湯。
  • Mark Chen、Scott Gray(OpenAI專門負(fù)責(zé)GPU內(nèi)核優(yōu)化的神秘狠人)等經(jīng)常三五圍坐,打撲克牌。其本質(zhì)被解釋為是概率與期望值的博弈。
  • OpenAI核心研究團(tuán)隊(duì)規(guī)模大概500人,公司內(nèi)大概有300個項(xiàng)目。
  • Mark Chen表示OpenAI本質(zhì)上仍然是一家純AI研究公司。
  • Gemini 3發(fā)布后每個人都會用自己的方式去試探新模型,有個“42問題”從沒見過哪個語言模型能真正把它完全做出來。
  • OpenAI“宮斗”,Mark Chen如何讓研究員們統(tǒng)一意見、促成那封讓Sam回歸的請?jiān)感乓脖涣牧顺鰜怼?/li>
  • 透露過去半年,一直專注在預(yù)訓(xùn)練上,在預(yù)訓(xùn)練方面,有信心輕松與Gemini 3正面對決。
  • 表示內(nèi)部已經(jīng)有性能達(dá)到Gemini 3的模型,很快就會發(fā)布這些模型,并且能發(fā)布表現(xiàn)更好的下一代模型。
  • 當(dāng)被問到“你們真的需要那么多算力嗎”會覺得很震驚:如果今天多10倍算力,可能幾周內(nèi)就能全部用滿。
    ……

網(wǎng)友紛紛表示,這次訪談確實(shí)讓人耳目一新,還有不少人在轉(zhuǎn)發(fā)Mark Chen的觀點(diǎn)。

OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta

Mark Chen之所以能夠言無不盡,一大關(guān)鍵還在于,本期訪談來自于《Core Memory》,其主持人Ashlee?Vance是硅谷知名的科技記者,以深入采訪硅谷人物和講述科技創(chuàng)新故事而聞名,更知名的是他那本《硅谷鋼鐵俠:埃隆·馬斯克,創(chuàng)造未來的人》

OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta

量子位對完整訪談進(jìn)行了翻譯整理,在不改變原意的前提下,對語言做了適當(dāng)潤色。

完整訪談?wù)?/h1>

人才爭奪戰(zhàn)演變成給人才送湯戰(zhàn)

Q:關(guān)于人才爭奪戰(zhàn),Meta的行為看起來很激進(jìn),這種針鋒相對的競爭,目前已進(jìn)入哪個階段?

Mark Chen:其實(shí)就這么一批人才,大家基本都知道他們是誰。很多公司已經(jīng)意識到,要打造一個優(yōu)秀的AI實(shí)驗(yàn)室,其中一個關(guān)鍵因素就是要招到最優(yōu)秀的人才。所以,Meta這么積極采用這種策略,也不奇怪。

我們當(dāng)然也沒有坐以待斃,我其實(shí)想從OpenAI的角度講講這個故事。媒體上把這件事渲染得好像所有人才都單向流向Meta。

但就我看到的情況,Meta去挖了很多人,但多數(shù)并不成功。他們從OpenAI去挖了我大概一半的直接下屬,但他們?nèi)慷季芙^了。當(dāng)然,如果你一年有100億美元的預(yù)算用來挖人,那你肯定會挖到一些人。

所以我其實(shí)覺得,我們在保護(hù)核心人才方面做得相當(dāng)不錯。而且看著這件事情不斷升級,其實(shí)還挺有趣的。

比如扎克伯格真的親自給他想挖的人送湯,我覺得他是親手煮的湯。當(dāng)時我很震驚,但后來我也意識到,這些方式以某種奇怪的方式,其實(shí)是有效的。所以我后來也給我們想從Meta挖的人送過湯

OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta

Q:你們現(xiàn)在是在比誰送湯?

Mark Chen:我還想過,下次團(tuán)隊(duì)團(tuán)建我打算帶大家去上烹飪課。不過我確實(shí)學(xué)到了一些關(guān)于招聘的事情。

Q:你自己煮湯了嗎?

Mark Chen:呃,其實(shí)最好還是買米其林級別的湯,你懂吧?

但我確實(shí)在這件事上學(xué)到了不少,比如怎樣更積極地爭取頂尖人才。讓我很受啟發(fā)的一點(diǎn)是,在OpenAI,即使是那些最后去了Meta的人,我也從來沒聽誰說“AGI會先由Meta做出來”。大家都對OpenAI的研究路線非常有信心。而我明確告訴團(tuán)隊(duì),我們不會跟Meta追逐報(bào)價對標(biāo)。在Meta的報(bào)價倍數(shù)遠(yuǎn)高于我們的情況下,人們?nèi)匀辉敢饬粼贠penAI,這讓我非常有信心。他們真的相信這里的未來,相信我們能做成。

Q:你和Alex呢?他以前擅長數(shù)學(xué)競賽,你們肯定一起玩過。

Mark Chen:我們以前確實(shí)一起玩過幾次,但現(xiàn)在不怎么聯(lián)系了。

Q:為什么湯會變成主流?

Mark Chen:我也不知道。湯、花,或者你能想到的任何東西都出現(xiàn)過。但我覺得人生就是冒險嘛,我也樂得順勢玩玩這個梗。

OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta

△圖片由AI生成

Q:那你在想策略的時候,會用到什么撲克心法嗎?

Mark Chen:我覺得這又回到媒體敘事的問題。目標(biāo)不是留住組織里“每一個人”,而是相信我們的人才培養(yǎng)體系,并弄清楚我們必須留下的是哪一類關(guān)鍵人物,然后確保他們留下。而在這一點(diǎn)上,我們做得非常出色。

Q:Sam一直非常喜歡研究,他是老板是最頂層的那個人。而你和Jakub Pachocki(OpenAl的首席科學(xué)家)則一起塑造OpenAI的研究方向,然后還能決定哪些項(xiàng)目能獲得多少算力。所以你等于既要規(guī)劃OpenAI的前進(jìn)方向,也要負(fù)責(zé)執(zhí)行層面,比如到底怎么把那些算力投入項(xiàng)目中。

而這在我看來完全是個“噩夢級別”的工作,因?yàn)槲夷X補(bǔ)大家為了從你那里弄到GPU會用盡各種手段。

Mark Chen:人們在想辦法搞到GPU時會非常有創(chuàng)造力,各種后門交易的點(diǎn)子都會出現(xiàn)。但你說得對,這確實(shí)是工作中的一個關(guān)鍵部分:確定研究組織的優(yōu)先級,并為執(zhí)行負(fù)責(zé)

關(guān)于第一點(diǎn),其實(shí)Jakub和我有一個流程,大概每1–2個月會整體梳理OpenAI所有在進(jìn)行的項(xiàng)目,這是一張巨大的表格,大約有300個項(xiàng)目。我們盡可能深入地理解每一個項(xiàng)目,并給它們排優(yōu)先級。

對于一家500人規(guī)模的公司來說,讓大家理解組織的核心優(yōu)先事項(xiàng)非常重要。這些優(yōu)先級不僅通過口頭明確傳達(dá),也通過我們?nèi)绾畏峙渌懔韨鬟_(dá)。

Q:你提到500名研究人員,也就是這個現(xiàn)在擁有數(shù)千名員工的組織中最核心的研究團(tuán)隊(duì),對吧?

Mark Chen:對。

Q:你說有300個項(xiàng)目,我想象其中肯定有一些是巨大的前沿模型,也有一些是研究人員正在做的小型實(shí)驗(yàn)。那你們到底如何跟蹤所有這些項(xiàng)目,并得出哪些項(xiàng)目應(yīng)該分到GPU、哪些不應(yīng)該?

Mark Chen:在做這類優(yōu)先級梳理的時候,保持核心路線是很重要的。我認(rèn)為OpenAI與其他大型實(shí)驗(yàn)室最大的不同之一,就是OpenAI從一開始就把探索性研究作為核心。

我們并不是那種去復(fù)現(xiàn)別的實(shí)驗(yàn)室成果、去追趕別人benchmark的公司,那不是我們的核心能力。我們一直在嘗試找出下一種范式是什么,并愿意投入資源確保我們真的能找到它。

可能很多人會對此感到驚訝。事實(shí)上,我們在“探索下一代范式”上投入的算力,比訓(xùn)練最終產(chǎn)物本身還要多

Q:但問題是,你們?nèi)绾伪苊獗粋€人的推銷說服?因?yàn)槊總€人都會覺得自己的項(xiàng)目非常重要。當(dāng)我想到這個,我就會想起《紐約時報(bào)》每天都有頭版頭條,每個人都想上頭版,每個人都覺得自己的故事是最重要的,每個人都竭盡全力告訴你為什么這件事重要。他們都花了數(shù)周甚至數(shù)月做出那個成果,所以對他們來說這就是生死攸關(guān)。

Mark Chen:你必須做的最艱難的決定之一就是:這個項(xiàng)目,我們現(xiàn)在就是沒法給它資源。

但我也認(rèn)為,這是好的領(lǐng)導(dǎo)力。你必須清晰溝通,這些是我們真正的優(yōu)先事項(xiàng),這些是我們要推進(jìn)的內(nèi)容,這些是我們認(rèn)為能推動研究方向的重要結(jié)果。其他事可以做,但它們必須明確是第二優(yōu)先級。

回應(yīng)谷歌Gemini 3

Q:你提到不要被競爭對手牽著走。你認(rèn)為其他公司有時候很被動,而你們過去處在領(lǐng)先位置,制定了行業(yè)標(biāo)準(zhǔn),所以他們才需要對你們的成果做出反應(yīng)。

剛好前幾天Gemini 3發(fā)布,在這種競爭回合中,你們的對手有時顯然會根據(jù)你們來行動。我知道benchmark的價值常被爭論,但大家確實(shí)會比這些。那你們?nèi)绾卧谶@種環(huán)境下,保持那種“我們只做我們認(rèn)為正確的事”的心態(tài)呢?

Mark Chen:

我認(rèn)為如今的AI研究環(huán)境比以往任何時候都更加競爭激烈。但關(guān)鍵是不要被競爭動態(tài)困住。因?yàn)槟阌肋h(yuǎn)可以說:“我們發(fā)布一個小更新,就能領(lǐng)先競爭對手幾周或幾個月?!?/p>

但那不是一種長期可持續(xù)的研究方式。如果你能突破下一代范式,那重要性完全不在一個數(shù)量級,你將決定整個領(lǐng)域的演化,你會理解圍繞這一思想領(lǐng)域所有的旁支方向。

以我們在“思考(Reasoning)”方向的研究為例,在兩年多前,我們就押注我們會在語言模型的思考能力上取得突破。當(dāng)時這個押注非常不受歡迎。

現(xiàn)在看起來顯而易見,但那時的氛圍是:預(yù)訓(xùn)練非常有效,后訓(xùn)練(post-training,包括RLHF等)也非常有效,為什么還要投資源做其他東西?

而今天你問任何人,他們都會說語言模型的思考能力是不可或缺的。所以,我們承擔(dān)的是大膽的押注,去探索如何擴(kuò)展,如何構(gòu)建能在未來成百上千倍算力下仍能工作的算法。

Q:隨著公司發(fā)展,這顯然變得更難了。你們一開始是一個幾乎純研究的組織,但今天的OpenAI有產(chǎn)品線,有些部門看起來更像成熟的微軟或谷歌。通常來說,隨著時間推移,公司會逐漸變成更關(guān)注能帶來營收的部分,而非花大量錢做研究,研究經(jīng)費(fèi)往往會不斷被擠壓。

Mark Chen:我認(rèn)為這正是OpenAI最特別的地方之一。我們本質(zhì)上仍然是一家純AI研究公司。你很難再找到另一家真正能這么說的公司。我們最初成立時是非營利組織,我加入時也是那個時代。

當(dāng)時的精神是,為了推動AGI研究,可以不惜一切代價,當(dāng)然要以安全方式推進(jìn)。

而我確實(shí)認(rèn)為,這反而是創(chuàng)造價值的最佳方式。如果你贏得了研究,價值創(chuàng)造是順帶發(fā)生的。我覺得真正的陷阱是迷失在那些“讓我們提升利潤率吧”的目標(biāo)里。因?yàn)槿绻愕难芯孔龅阶詈?,其?shí)那部分價值非常容易實(shí)現(xiàn)。

Q:你是2018年加入的。那么你覺得,那種“靈魂”、那種核心文化與核心使命……

Mark?Chen:是的,那個核心文化和核心,確實(shí)持續(xù)存在。

Q:埃隆怎么說?他說我們不應(yīng)該叫你們研究員?這只是工程師,對吧?

Mark Chen:我覺得這話有它的道理,因?yàn)橐坏┠阍O(shè)置了一個“層級”,比如把研究科學(xué)置于工程之外的部分,那你在某種意義上就已經(jīng)輸了。

因?yàn)樵跇?gòu)建大型模型時,真正重要的是,你能否在實(shí)踐中不斷優(yōu)化那些1%的細(xì)節(jié),如何讓kernel快一點(diǎn)?如何確保數(shù)值計(jì)算足夠穩(wěn)定?這些都是深度工程能力。

如果你沒有這些東西,就根本無法把訓(xùn)練規(guī)模擴(kuò)大到我們今天使用的GPU數(shù)量。

Q:但我想說的是,研究員和工程師之間確實(shí)有種神秘感上的差別。你覺得保持一種“平視心態(tài)”比較好,是這個意思嗎?

Mark Chen:我覺得研究員的類型其實(shí)非常多樣。我們最優(yōu)秀的一些研究員,他們的特點(diǎn)是,能提出無數(shù)種想法。其中大部分不行,但就在你開始懷疑“這個人真的值得嗎”的時候,他們突然又冒出一個驚為天人的點(diǎn)子。

還有一些研究員非常擅長沿著明確的路徑執(zhí)行,把事情做到極致。所以研究員的類型太多了,根本很難把他們?nèi)M(jìn)一個刻板的類別里。

Q:Gemini 3剛發(fā)布不久,我很好奇,當(dāng)一個競爭對手發(fā)布新模型時,你個人,或者你們團(tuán)隊(duì),會怎樣反應(yīng)?是大家都會去看它能做什么嗎?你們會不會有一些常用的prompt、常用的問題,去試探這些新模型有什么能力?

Mark Chen:關(guān)于Gemini 3,具體來說,它是個不錯的模型。我們會做的一件事是建立內(nèi)部共識。

因?yàn)閎enchmark其實(shí)只能告訴你有限的信息。就benchmark數(shù)據(jù)本身來看,我們其實(shí)相當(dāng)有信心:我們內(nèi)部已經(jīng)有性能達(dá)到Gemini 3的模型,而且我們相當(dāng)確定很快就會發(fā)布這些模型,并且能發(fā)布表現(xiàn)更好的下一代模型。

但再次強(qiáng)調(diào),benchmark只揭示了一部分內(nèi)容。每個人都會用自己的方式去“試探”新模型。我有一個自己常用的題,到目前為止,沒有哪個模型真正解決過,甚至是所謂的“thinking models”也沒完全做出來。所以我還在等。

Q:這是個秘密數(shù)學(xué)問題嗎?

Mark Chen:不是,不過……如果我在這里公開講了,它可能以后就被訓(xùn)練進(jìn)去(笑)。

這是過去一年我很喜歡的一個謎題,叫作“42問題”:核心是借助若干個模數(shù)為小于42的素?cái)?shù)的隨機(jī)數(shù)生成器,用最少的調(diào)用次數(shù)搭建出模數(shù)為42的隨機(jī)數(shù)生成器(RNG)。

這題很可愛。語言模型總是能接近最優(yōu)解,但我還沒見過哪個真正把它完全做出來。

Q:這實(shí)際上引出了我接下來本來就想問的問題。但在此之前,我知道你很有競爭心,你也跟我說過一句我記得很清楚的話“我熱愛競爭,但我極度討厭輸”,所以如果我們知道Gemini 3會在周四發(fā)布,你會不會在凌晨12點(diǎn)就把那道題丟給它?還是沒有那么夸張?

OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta

Mark Chen:不會啦,我認(rèn)為這是一個長周期的事情。

我是那種會有階段性執(zhí)念的人,但任何事業(yè)你都得用長期博弈的心態(tài)去做。例如過去半年,我們一直專注在預(yù)訓(xùn)練(pre-training)上。這是我和Jakub一起推動的方向,打造預(yù)訓(xùn)練的核心能力、組建頂尖團(tuán)隊(duì)、確保預(yù)訓(xùn)練所有關(guān)鍵都得到足夠重視。而正是這些投入,讓我們今天能產(chǎn)出這樣的模型,在預(yù)訓(xùn)練方面,我們就有信心輕松與Gemini 3正面對決。

大學(xué)室友帶入坑編程

Q:我對你剛才說的那個謎題感興趣,是因?yàn)槲业谝淮我奐akub是在OpenAI創(chuàng)立之前,那時他在參加編程競賽。我也有一段時間超迷編程比賽。我去看過一次,當(dāng)時Facebook每年都會搞一個Hacker Cup,那是我第一次見到Jakub。

我知道你高中也參加數(shù)學(xué)競賽,甚至是從小學(xué)一路參加到高中,你是不是也參加IOI(國際信息學(xué)奧林匹克競賽)?

Mark Chen:我很晚才開始寫代碼,是大學(xué)室友帶我入坑的。

當(dāng)時我還是一個滿懷自負(fù)的數(shù)學(xué)人,覺得數(shù)學(xué)才是最純粹、最困難的科學(xué),真正的能力需要在數(shù)學(xué)中證明。回頭看,那時候我可能太沉浸在競爭里了。

但編程后來變成一件非常令人有成就感的事情。開始它只是一個讓我能繼續(xù)和大學(xué)朋友保持聯(lián)系的方式,畢業(yè)之后,我們每個周末都會一起上線做比賽。

漸漸地,我發(fā)現(xiàn)自己挺有天賦。后來我開始在比賽中拿不錯的成績,然后開始給比賽出題,比如給USA Coding Olympiad出題。最終我也開始擔(dān)任教練,這是一個很棒的社區(qū),我也在里面遇到了很多像Scott這樣的人。

Q:你當(dāng)時是在MIT?

Mark Chen:不是,我是畢業(yè)之后參加的。

最近比賽還有一個讓我特別有感的地方,當(dāng)我們把現(xiàn)代語言模型投入這些比賽題目時,它們的表現(xiàn)非常強(qiáng)。而且它們的思維方式跟人類完全不同。

我們一直以為AI擅長模式識別,如果新題能映射到舊題,它就能解。但我注意到,有些題目非常臨時、技巧性、零散,這讓我意識到AI+人類在前沿研究中會出現(xiàn)奇跡,因?yàn)锳I對“什么是簡單/困難”的直覺與人類不一樣。我以為模型絕對做不出來的,結(jié)果它們覺得這些題反而比較簡單。

Q:是類似AlphaGo那種“人類從沒見過的打法”的感覺嗎?

Mark Chen:我覺得是的。

GPT-5 Pro出來之后,我真正感覺到前沿科研出現(xiàn)了一個拐點(diǎn)。

一個最好的例子是,發(fā)布后三天,我見了一個物理學(xué)家朋友,他之前玩過模型,覺得它們可愛但沒啥用,我讓他用Pro模型更大膽地試,他把自己最新論文丟進(jìn)去,模型想了30分鐘,然后就把答案給出來了。他的反應(yīng)讓我想到,李世石看到AlphaGo第37/38手時的表情。我覺得這種場面在數(shù)學(xué)、科學(xué)、生物、材料科學(xué)中只會越來越常見,模型真的已經(jīng)到這個程度了。

Q:我知道這個問題不新鮮——從深藍(lán)、到AlphaGo,人們一直在問,當(dāng)AI開始解決那些被人類視為“巔峰智力成就”的問題時,會不會讓人感到某種悲傷?

Mark Chen:嗯,有,也沒有。我編程水平不錯,但不屬于最頂尖的那一批,所以對我來說……或許這算是“復(fù)仇”。

OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta

但認(rèn)真說,我確實(shí)經(jīng)歷過一種“時刻”。在我們開發(fā)思考模型期間,我們持續(xù)監(jiān)控模型在競賽題的表現(xiàn)。

一開始,它們表現(xiàn)并不好,大概就普通參賽者水平。但隨著時間推移,它們的能力不斷提升,直到有一天,我走進(jìn)會議室,看到模型的評分曲線越過了我自己的最高水平。那一刻我真的震驚,“哇,我們到了這種程度,這么快?”Jakub當(dāng)時還稍稍得意,但也就過了一兩個月,模型也超過了他。

今天,模型已經(jīng)穩(wěn)穩(wěn)站在前沿了。你能從我們今年夏天在Coder比賽上的成績看出來那是世界頂級算法競賽,模型拿了第二名。它在一年內(nèi)從世界第100名,跳到了世界前5。

Q:那十年后,我們還會辦這種競賽嗎?

Mark Chen:我覺得會。它們很好玩。盡管有些人做這些比賽是為了寫簡歷,但真正熱愛它的人,是因?yàn)樗旧碛腥?,這種樂趣不會消失。

Q:在我寫報(bào)道時,有人告訴我,一些國家,IOI拿牌基本等于“隨便挑大學(xué),免費(fèi)入學(xué)”。

Mark Chen:你不覺得面試這些傳統(tǒng)方式,很快也會被模型徹底打破嗎?大學(xué)考試、作業(yè),也基本全被打破了。我們確實(shí)需要新的方式來評估一個人,他學(xué)到了什么?他的實(shí)際能力在哪?

我其實(shí)一直有個想法,也許我們以后的面試,可以直接讓候選人去跟ChatGPT對話。不過是一個“特殊版本”的ChatGPT,這個模型的任務(wù)不是回答問題,而是判斷你是不是真的懂相關(guān)內(nèi)容、你的能力水平有沒有達(dá)到在OpenAI工作的標(biāo)準(zhǔn)。你要通過和它的對話,說服它你是一個適合OpenAI的人。當(dāng)然,你不能“越獄”它,然后我們再去看這段對話的記錄。也許未來這種測試方式,會更準(zhǔn)確地反映一個人到底懂不懂。

Q:我覺得你的背景很有趣,你從小接觸過多個創(chuàng)新中心,尤其是你父母又在Bell Labs。后來你去了MIT,對吧。

Mark Chen:哦天哪,2012那一屆真是太強(qiáng)了。

Q:有沒有那種“全明星名單”?

Mark Chen:比如Jacob Steinhardt,現(xiàn)在在做Transluce公司,我們當(dāng)時還一起上計(jì)算機(jī)課、一起做項(xiàng)目。還有Paul Christiano,他也在OpenAI工作過。剛才說到競技編程那一掛,還有像Scott Wu,現(xiàn)在在Cognition,他現(xiàn)在在X上簡直成了“數(shù)學(xué)梗王”。

Q:現(xiàn)在我看到你們這群人的“競技一面”,已經(jīng)主要轉(zhuǎn)移到撲克上了。之前我們在一個活動上深夜我路過一張桌子,看到你、Scott以及其他幾個人,圍在桌邊打撲克,我不知道對你們來說算不算緊張,但對我來說氣氛挺嚴(yán)肅的。所以你們現(xiàn)在是把數(shù)學(xué)和競爭都用在撲克上了嗎?

Mark Chen:

撲克是個非常有趣的游戲。我之前說過,我的人生就是一系列“階段性癡迷”。撲克曾經(jīng)就是我其中一個超級癡迷的階段。對我來說,撲克的重大啟發(fā)是,它本質(zhì)上遠(yuǎn)非一場讀心和詐唬的博弈,而是一場數(shù)學(xué)游戲。

你對撲克了解得越多,越會往這個方向修正自己的認(rèn)知:它本質(zhì)上是概率與期望值的博弈。當(dāng)你從數(shù)學(xué)角度判斷出詐唬是正確選擇時,做這件事就變得易如反掌了,你不會緊張,因?yàn)槟阒肋@是對的。

而且很有意思的是,撲克在大眾印象中非?!叭祟惢?,好像是關(guān)于心理、直覺、演技的游戲。但真正的獲勝機(jī)制,是極其深度的數(shù)學(xué)。前陣子我還在想,語言模型也有點(diǎn)像這樣。語言的生成是一個非?!叭祟悺钡倪^程,但現(xiàn)在有一臺數(shù)學(xué)機(jī)器,可以做到和我們一樣甚至更好。

OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta

△圖片由AI生成

Q:我自己是寫作的人,這部分我?guī)缀趺刻於荚谙?,我大學(xué)時還學(xué)了一堆哲學(xué),都是在想語言、意義這些東西。你和Scott在我眼里都是“數(shù)學(xué)強(qiáng)得不太像凡人”的那種人,我完全不理解你們怎么在計(jì)算上還能互相拉開差距,你們打牌時,怎么區(qū)分誰更強(qiáng)?

Mark Chen:

其實(shí),說實(shí)話,我們現(xiàn)在更多是把它當(dāng)作一個聚會場合,一個可以坐下來聊天、敘舊的平臺。如果把撲克太當(dāng)回事,反而會把樂趣抽干。

我對撲克的那種“癡迷期”在十多年前就已經(jīng)過去了,現(xiàn)在就是單純覺得好玩。

Q:你這是因?yàn)槲铱吹絊cott連贏了兩天,才這么說的吧?

OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta

Mark Chen:你可能說到點(diǎn)子上了。

Q:他確實(shí)打得挺認(rèn)真。

Mark Chen:不過在回程飛機(jī)上我贏了。不是一對一,大概還有三四個人一桌。

離開華爾街,走向AI

Q:我感覺,尤其如果把時間撥回到2018年前后,在AI領(lǐng)域高層的人,大致能分成三類路徑:一類是學(xué)術(shù)出身;一類是數(shù)學(xué)天才后來去做機(jī)器人、物理之類;還有一類是從華爾街來的,做高頻交易、量化。

你走的是第三條,從MIT畢業(yè)后,直接去了華爾街。

Mark Chen:

我其實(shí)并不為那段經(jīng)歷深以為榮,坦白講。

但這確實(shí)是MIT那些數(shù)學(xué)/量化很強(qiáng)的學(xué)生當(dāng)時常走的一條路。它確實(shí)是一個非常唯才是舉的體系,你只要聰明、會算,你的能力會直接反映成非常具體的獎賞,就是你賺的錢。

但對我來說,那里的文化有點(diǎn)難受。

那地方,如果你發(fā)現(xiàn)了什么突破、什么竅門,你的第一反應(yīng)是盡可能別讓別人知道。因?yàn)槟愕闹R,就是你賴以生存的價值。所以在公司內(nèi)部,你會看到各種競爭性的關(guān)系,人們彼此之間并不真正信任。而且整個生態(tài)系統(tǒng)非常封閉。

比如今天,如果某個團(tuán)隊(duì)讓他們的算法快了,世界上沒有其他人感受到它,它不會對任何更大的世界起作用。

我在那兒待了四五年后,有一天醒來突然意識到,我們還是在和完全相同的一群玩家競爭,大家都變快了一點(diǎn),但世界有因此而變得更好嗎?答案是:沒有。

那一刻我覺得,是時候去做別的事情了。很多事情在那時同時發(fā)生,比如AlphaGo的大戰(zhàn),那對OpenAI很多人都是巨大啟發(fā)。

Q:你下圍棋嗎?

Mark Chen:不下。但關(guān)鍵不是圍棋本身,而是機(jī)器竟然能做出那么有創(chuàng)造力的東西。我特別想弄明白背后到底發(fā)生了什么。

Q:當(dāng)時你有讀AI論文嗎?

Mark Chen:老實(shí)說,完全沒有。直到那場對局,我才真正被點(diǎn)燃。那之后我開始瘋狂深入AI。我給自己定的目標(biāo)之一是復(fù)現(xiàn)DQN的結(jié)果。DQN是能夠在Atari游戲上打出超人水平的深度網(wǎng)絡(luò)。從那里開始,我正式走上了AI之路。

Q:那你是白天工作、晚上回家自己搞研究?

Mark Chen:對,就是這樣。

Q:我還記得2018年左右我采訪George Hotz的時候,他說過一句讓我印象深刻的話。他說AI領(lǐng)域非常年輕,年輕到一個人只要讀10/20/30篇論文(記不清到底多少篇了),就能學(xué)到整個領(lǐng)域的核心。

確實(shí)很有趣,AI是一個歷史很久但“現(xiàn)在這個時刻非常淺”的領(lǐng)域。

Mark Chen:我給那些對AI感到畏懼的人一個建議:它很淺。
花三到六個月,選一個項(xiàng)目(比如復(fù)現(xiàn)DQN),你就能非??斓刈叩角把亍W罱鼛啄赀@個領(lǐng)域是變“深”了一點(diǎn),但和理論數(shù)學(xué)、物理比差得遠(yuǎn)。

Q:我問過Jakub,在數(shù)學(xué)里,很多人都是20多歲做出最偉大的工作,之后再難有突破。AI也是這樣嗎?我們是否依賴年輕人去讀論文、突然靈光乍現(xiàn)?還是說這是一個人可以干一輩子的領(lǐng)域?

Mark Chen:我覺得AI是一個可以一直做下去的領(lǐng)域。雖然OpenAI本身文化相對年輕,但我不認(rèn)為你必須年輕才能做出好研究。

年輕人最大的優(yōu)勢可能是,他們沒有太多先入為主,不會被“事情應(yīng)該怎么做”所框住。隨著年紀(jì)增長,你會形成自己的愿景,這是好事,但也會把你鎖在某種思維模式里“研究就是這樣做的,結(jié)果就是這樣出來的”。

年輕研究員在這方面更有可塑性。

2018年加入OpenAI:20人的小團(tuán)隊(duì)

Q:你職業(yè)生涯在OpenAI的發(fā)展很有意思,看起來你好像一開始就擔(dān)任很重要的位置。但你2018年加入時OpenAI只有……50人?

Mark Chen:更少,大概20人左右。當(dāng)時基本就是兩個團(tuán)隊(duì)。我以Residency(常駐研究員)的身份加入,意思是,不是專家不是PhD,而是OpenAI想要投資、培養(yǎng)、從其他領(lǐng)域轉(zhuǎn)進(jìn)來的人。

Residency的前半段像是一個六個月壓縮版PhD,之后才開始深入項(xiàng)目做研究。

每天都和Ilya聊,他給我定課程、定項(xiàng)目,我遇到不懂的就去問他“這個方向?yàn)槭裁粗匾薄盀槭裁创蠹視芯窟@個”。

Q:領(lǐng)英上寫你加入就當(dāng)了前沿研究主管?

Mark Chen:不,那不是我在Open的第一份工作。我前面大概有三年都是做IC(個人研究員)。我當(dāng)時做的是生成式建模,因?yàn)槟鞘荌lya當(dāng)時最關(guān)注的方向。管理團(tuán)隊(duì)是后來才開始的。

從ImageGPT到DALL·E:語言模型之外的生成模型

Q:DALL·E是公眾第一次真正認(rèn)識OpenAI生成模型的項(xiàng)目嗎?

Mark Chen:對。而DALL·E也標(biāo)志著我從IC轉(zhuǎn)向管理者。在那之前,我最自豪的項(xiàng)目之一是ImageGPT,證明即使不是語言,你把圖像丟進(jìn) Transformer,模型一樣能學(xué)到非常強(qiáng)的表示。

它能理解圖像內(nèi)容,并展示出“語言建模方法可以用在非文本領(lǐng)域”的可行性。

另一個我很驕傲的IC項(xiàng)目是Codex,我搭建了很多評估代碼模型的框架,并深度研究如何讓語言模型變成強(qiáng)大的代碼模型。

Q:所以你為什么選擇OpenAI?我其實(shí)能理解兩種觀點(diǎn),一方面OpenAI是小池塘里的大魚,有趣的人集中在這里;但另一方面,2018年的OpenAI才20個人,在我看來,這東西看起來根本不可能成功。

Google當(dāng)時已經(jīng)主導(dǎo)AI,感覺AI是一件需要幾十億美元、幾十年積累的事情,而那時就算連Scaling Law都還沒真正形成概念。

那對你來說,這是一個困難的決定嗎?還是你只是剛好撞進(jìn)了OpenAI?

Mark Chen:我覺得有兩點(diǎn)非常重要:第一,你需要有宏大的愿景;第二,你需要有能支撐這份愿景的人才。

當(dāng)時的OpenAI具備這兩點(diǎn)。他們的野心非常大,而人才也強(qiáng)到足以把這個愿景變成現(xiàn)實(shí)。

我很幸運(yùn),Greg Brockman,我們大學(xué)以前就認(rèn)識。

Q:你們在MIT有交集?

Mark Chen:其實(shí)我們更早,在高中時就一起參加過數(shù)學(xué)競賽。

所以當(dāng)時我給他發(fā)了條消息:“我不知道自己技能是否合適,但你們在做的事情看起來非常偉大?!?/p>

對我來說,今天這件事仍然很難以置信,我當(dāng)時完全是“從天而降”加入的,而現(xiàn)在卻負(fù)責(zé)研究方向。這對我來說也超現(xiàn)實(shí)。

從IC轉(zhuǎn)成管理者那一步,我其實(shí)一度非常猶豫,因?yàn)槲也恢雷约菏欠襁m合管理,而且那時我真的很享受IC的工作——做研究、合作順暢、成果突出,我玩得很開心。但后來整個旅程就……真的非常瘋狂。

Q:你給人的感覺一直是溫和、理性、好相處的人。但OpenAI的歷史,說實(shí)話,有些部分非常戲劇化,甚至有點(diǎn)像肥皂劇、像《權(quán)力的游戲》那種“宮斗”。要在那樣的環(huán)境中做管理者……回頭看,真的挺難想象的。

我覺得現(xiàn)在比之前平靜了很多,但過去的那些時刻,你需要處理的事情,感覺與你的性格很不一樣。

Mark Chen:老實(shí)說,我在OpenAI非常幸運(yùn)。我的經(jīng)理們都非常支持我、為我發(fā)聲。在我做IC時,Wojciech Zaremba(OpenAI聯(lián)創(chuàng))就說:“哦,CodeX這個項(xiàng)目應(yīng)該押注在他身上?!?/p>

我從未向任何人要求晉升或調(diào)級,這些都是自然發(fā)生的。一路上,我得到很多很好的建議,我覺得管理的成長,本質(zhì)上是靠“次數(shù)”累積,你要不斷練習(xí),沒有比OpenAI更能給你練習(xí)機(jī)會的地方了,永遠(yuǎn)有新的挑戰(zhàn)出現(xiàn)。隨著時間,你也會建立自信。

我現(xiàn)在相信,管理更多是經(jīng)驗(yàn),而不是天賦。

OpenAI“宮斗”那段時期

Q:我猜測你可能不太想詳細(xì)談“宮斗”那次風(fēng)波。

Mark Chen:沒關(guān)系,我愿意談任何事情。

Q:我采訪了很多人,也有不少獨(dú)家素材要留給我的書。但有幾個時刻,我特別想問你,在那段混亂中,你幫助研究員們統(tǒng)一意見、促成那封讓Sam回歸的請?jiān)感拧?/p>

然后一兩天之后,你在Greg家或者Chelsea家,做過一次很重要的短講,是嗎?

Mark Chen:是在Chelsea家。

而那兩個時刻,不管是推動研究員簽聯(lián)名信,還是在那場聚會上的講話,對我來說都是非常重要的瞬間。

Q:你站出來,為你相信的東西發(fā)聲,并把隊(duì)伍重新團(tuán)結(jié)起來。

Mark Chen:是的,對我來說,那確實(shí)是一個關(guān)鍵時刻。在那次風(fēng)波后的幾天里,整個公司都籠罩在不確定性中。

我、Nick(Nick Turley,ChatGPT產(chǎn)品負(fù)責(zé)人)、Barrett(Barret Zoph,OpenAI前研究副總裁)當(dāng)時都感覺到一種責(zé)任感:“狼就在門口了?!贝蠹叶疾粩嗍盏絹碜愿鞔髮?shí)驗(yàn)室的電話:“要不要來我們這兒工作?”

OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta

△圖片由AI生成

我當(dāng)時給自己定下一個目標(biāo),我不會失去任何一個人。而且我們真的沒有失去任何人。那幾天我們幾乎每天都把自己的家打開,讓大家有一個可以來傾訴焦慮、互相陪伴的地方,我們也幫助大家持續(xù)與核心領(lǐng)導(dǎo)層保持聯(lián)系,讓他們感覺自己能參與、有發(fā)聲權(quán)。

隨著時間推移,大家形成了一種非常強(qiáng)烈的共同體精神:“我們一起面對這一切”“我們要向外界表明我們是一條心的”。當(dāng)時我在幾處房子之間來回走,后來我們有了一個想法,我們需要向世界展示,我們團(tuán)結(jié)一致,并且愿意為Sam工作。于是請?jiān)感啪瓦@樣成形了。

這個主意大概在凌晨2點(diǎn)定下來,到了早上,研究組超過90%的人已經(jīng)簽名。大家互相給朋友打電話“你贊成還是不贊成?你要不要簽?”最終,大概近100人簽了那個請?jiān)感拧?/p>

Q:那應(yīng)該讓你陷入一個很困難的位置吧?因?yàn)橐婚_始看起來像是,Ilya和Sam站在對立面。Ilya又是你的導(dǎo)師,后來Sam又回到團(tuán)隊(duì)……這一切會不會讓你覺得尷尬?

Mark Chen:不,不是尷尬,是困難。

在那種信息極少的環(huán)境下,很難看清真相。你完全可以合理地問:“Sam到底做錯了什么?”Greg和Jakub這兩個極具正直的人有辭職來表達(dá)立場嗎?我覺得有部分故事被嚴(yán)重誤解了。

關(guān)于Jakub:大家不知道但應(yīng)該知道的事

Q:Jakub已經(jīng)在OpenAI很久了,你覺得外界不了解但應(yīng)該知道的是什么?

Mark Chen:他其實(shí)超——級——搞笑。真的非常搞笑。是一種非常諷刺式的幽默,經(jīng)常把我笑瘋。我最喜歡OpenAI現(xiàn)狀的一點(diǎn)就是,我和Jakub的高度一致性。我們走進(jìn)會議室,只需要互相拋幾個想法,很快就能達(dá)成一致,然后對外發(fā)出同一個信息,再一起去處理路線圖的不同部分。能和他一起工作,是一種巨大的榮幸。

OpenAI的研究團(tuán)隊(duì)至今仍“被攻擊”。我們是一家人。但我們永遠(yuǎn)都在被攻擊。當(dāng)一個新團(tuán)隊(duì)開始組建時,他們第一步是什么?從OpenAI挖人。
他們想要我們的經(jīng)驗(yàn)、愿景、哲學(xué),畢竟我們培養(yǎng)了大量頂尖研究員。我今天依然有同樣的保護(hù)欲,如果有人來挖我們的人,我會不惜一切讓我們的研究員開心、安心,并讓他們知道自己的角色在路線圖中的位置。

Q:我在寫書時、或?qū)崟r觀察事件時,一直掙扎于一個問題,當(dāng)我回顧整個AI歷史,2012年Ilya產(chǎn)生了重大突破、2017年Vaswani等人提出Transformer,Alec Radford推動了另一批重要成果,這些都是像“英雄人物”一樣的突破,AI領(lǐng)域還非常年輕,看起來可能就是那8到10個人不斷推動領(lǐng)域前進(jìn)。

所以當(dāng)John Schulman離開,Alec離開……我當(dāng)時心里想:哇,如果你們失去這部分全明星陣容,那怎么繼續(xù)?這不像一個能輕易替換人才的領(lǐng)域。

但令人驚訝的是,就在那之后,你們在reasoning方向和其他前沿方向上繼續(xù)取得突破。這一點(diǎn)對我來說一直很難理解……

Mark Chen:我其實(shí)不同意你剛才的說法,把“頂級個人”視為推動研究的唯一方式。當(dāng)然,我們確實(shí)會自上而下押注方向、下注賽道,但OpenAI也有非常深刻、非常真實(shí)的自下而上文化。

很多最好的點(diǎn)子,都來自最意想不到的地方。而最令人興奮的,就是看著這些“下注”逐漸成形、被擴(kuò)展、被放大,比如reasoning(推理/思考)方向,就是這種過程的典型案例。

Q:但我們還是看到谷歌會砸天文數(shù)字把Noam Shazeer挖回去,這似乎說明,明星個人非常關(guān)鍵?

Mark Chen:我認(rèn)為兩者是必須并存的,你必須投資自己的人才管線,因?yàn)槲彝耆嘈盼覀兣囵B(yǎng)明星的能力,同時你也必須承認(rèn),世界上確實(shí)有一些非常頂級的人,每個人都知道他們是誰。

如果我從Meta那邊學(xué)到一件事,那就是,OpenAI也可以非常激進(jìn)地去爭搶明星人才。他們用過的一些激進(jìn)招聘方法,我自己也學(xué)了幾招。但最終目標(biāo)很簡單,為我們的使命,組建最強(qiáng)的團(tuán)隊(duì)。

Q:好笑的是,這個圈子其實(shí)很小。你們明明互相都認(rèn)識、甚至一起玩、一起出去吃飯……但轉(zhuǎn)頭你們卻在互相挖對方的人。

Mark Chen:是啊,這是一個在所有維度都競爭殘酷的行業(yè)。

但我喜歡這樣。我就是極度好勝的人,我討厭輸,不管是在研究還是在招聘上,我都會全力以赴。

Q:你說得沒錯,這一點(diǎn)讓我想到半導(dǎo)體早期,一堆創(chuàng)業(yè)公司同時涌現(xiàn),大家都在突破物理的極限,某家公司剛在一個方向突破,工程師們晚上一起喝啤酒又把想法互相說出來了。工程師就是這樣,他們停不下來,知識自然擴(kuò)散。而同時,人人都在挖每一個可能的突破。

Mark Chen:是的。一個公司面對這件事有兩種選擇:建立深度信息隔離加強(qiáng)封閉性;繼續(xù)保持開放文化,用速度壓制對手。

OpenAI明顯是第二種,我們不認(rèn)為封閉是正確方式。我們的方法是跑得比別人更快。我喜歡我們的開放文化,研究人員之間自由分享想法,大家都能更快推動進(jìn)步。

Q:我知道Sam更熱愛調(diào)研,他對日常經(jīng)營沒那么有激情,從組織結(jié)構(gòu)上也看得出來。而你和Jakub則是每天都深度泡在技術(shù)里。他則在同時和全世界說話。三個人之間到底怎么協(xié)作?你們怎么決定算力與優(yōu)先級?

Mark Chen:這是一個非常緊密的三人組。我每天都和Sam、Jakub說話。Sam喜歡了解研究進(jìn)展、喜歡和研究員聊天。他很擅長把脈整個研究組織,告訴我:“有沒有什么潛在但沒被說出來的問題?”

OpenAI首席研究員Mark Chen長訪談:小扎親手端湯來公司挖人,氣得我們端著湯去了Meta

△圖片由AI生成

有問題,他就會去找出來,并告訴我。Jakub和我則每天在想,如何設(shè)計(jì)好工作結(jié)構(gòu),讓突破更容易發(fā)生。這包括非常具體的事情,比如辦公室的布局會不會妨礙兩個需要協(xié)作的團(tuán)隊(duì)交流?哪些人要被配置到一起?如何激勵大家往我們押注的方向走?這些是我們?nèi)粘9ぷ鞯暮诵摹?/p>

Q:Sam會讀論文嗎?他會跟你們技術(shù)討論嗎?

Mark Chen:會的,他讀論文,也和研究員交流,理解大家怎么看世界、在做什么研究。當(dāng)然,他還負(fù)責(zé)范圍非常廣的其他事務(wù)。

關(guān)于預(yù)訓(xùn)練,OpenAI到底發(fā)現(xiàn)了什么?

Q:接下來我想問一些機(jī)密問題,說不定你說漏嘴就說出來了(doge)。關(guān)于預(yù)訓(xùn)練,我感覺你們最近在預(yù)訓(xùn)練方向突破了某個東西,你們看起來對此非常興奮。你能不能告訴我們:你們到底發(fā)現(xiàn)了什么?

Mark?Chen:

我大概會這樣概括過去兩年的高層情況,這兩年我們在reasoning上投入了巨量資源,去理解這種“原語”(primitive),并讓它真正跑起來,而且它的確跑起來了。

但這種專注有個副作用,你會在其他“肌肉”上有點(diǎn)退化,比如預(yù)訓(xùn)練
和后訓(xùn)練。過去六個月里,我和Jakub做了很多事,就是把這塊“肌肉”重新練回來。

在我心里,預(yù)訓(xùn)練就是一種需要持續(xù)鍛煉的肌肉:要保證所有相關(guān)知識是新鮮的,要確保有人在最前沿搞優(yōu)化確保有人在最前沿打磨數(shù)值計(jì)算,你還必須保證大家的注意力真的放在這件事上。

這也是我最近非常關(guān)注的一件事之一,在公司內(nèi)部引導(dǎo)、塑造大家討論的重心,而現(xiàn)在,這個重心非常清晰:預(yù)訓(xùn)練。

我們認(rèn)為預(yù)訓(xùn)練還能挖出巨量空間。很多人說“Scaling已經(jīng)死了”我們完全不同意。

某種意義上,現(xiàn)在全世界都盯著強(qiáng)化學(xué)習(xí)、盯著后訓(xùn)練,對我們來說反而是一種信息優(yōu)勢,因?yàn)槲覀冇X得預(yù)訓(xùn)練這邊還藏著太多潛力。

也正是這些努力的結(jié)果,我們最近訓(xùn)練出的模型強(qiáng)了很多,這也讓我們在面對Gemini 3和今年底的其他發(fā)布時,非常有信心。

Q:你剛剛的描述在我腦子里是這樣的,你們這幾年的狀態(tài)就是一路狂奔。整個領(lǐng)域都在狂奔。所以此刻我們站在一個節(jié)點(diǎn)?;ヂ?lián)網(wǎng)上能抓到的數(shù)據(jù)已經(jīng)被大量吸進(jìn)來,丟進(jìn)超級計(jì)算機(jī)里攪一攪,然后ChatGPT這類東西就“蹦”出來了接下來大家就開始進(jìn)入一場不可思議的競賽。

對很多不天天跟的人來說,他們看到的是,起初你們手里有巨量數(shù)據(jù),把這些數(shù)據(jù)扔進(jìn)機(jī)器,一開始你們用比較粗糙的方式來“塑形”這些數(shù)據(jù),而現(xiàn)在你們似乎是在學(xué)習(xí)如何更高效地塑形這些數(shù)據(jù),但外界不總是搞得清之前到底“錯”在了哪?

Mark Chen:你提到了我一直在思考的事情。

如果從預(yù)訓(xùn)練的角度看,你拿的是人類寫的數(shù)據(jù),你在教模型去模仿這些東西。模型于是學(xué)會了人類寫作的模式。

但從某種意義上說,這也給模型的能力加了一個“上限”:當(dāng)你只是在模仿人類寫的東西時,你很難真正超越那堆人類數(shù)據(jù)本身。

所以你會去做RL之類的事情,通過RL,你可以把模型推向人類能構(gòu)造出的最難的問題,讓它跳出“模仿人類”的框框,在框外思考,從而達(dá)到更高的能力。

但現(xiàn)在有個很有趣、也很棘手的問題,你要如何真正超越當(dāng)前人類水平?

在這里我看到一個非常嚴(yán)重的測量問題,比如在科學(xué)領(lǐng)域,人類是否真的有能力去評估超人類水平的表現(xiàn)?我們要如何判斷這個超人類數(shù)學(xué)家比那個超人類數(shù)學(xué)家更強(qiáng)?

我們真的需要建立一套更好的評估體系,來衡量我們是不是在向前推進(jìn)。到目前為止,我們比較幸運(yùn),有IMO、IOI這樣的競賽,可以告訴你誰是這個世界上最強(qiáng)的那一小撮人。但當(dāng)模型的能力超越人類之后,再也沒有這樣的測試可以用了。

Q:你剛剛讓我想到一個問題,回到IOI那塊,我常看到那些在競賽中逆天的少年,后來被Google、Facebook這類公司招進(jìn)去。但他們不總是變成,公司里最高層的技術(shù)領(lǐng)導(dǎo)或者最有名的工程師,有時候他們只是做自己想做的事情,這讓我一直有個疑問:在競賽中表現(xiàn)最頂尖的人,未必就是你能遇到的最強(qiáng)工程師。

那如果一個AI在這種競賽里表現(xiàn)特別好,我們到底在學(xué)到什么信息?

Mark Chen:這是我很喜歡AI研究的一點(diǎn),我覺得在AI里,比起許多傳統(tǒng)工程領(lǐng)域,它更傾向于精英主義。

我多次嘗試、也多次學(xué)到同一個教訓(xùn):你很難讓一個得不到研究員尊重的人,去領(lǐng)導(dǎo)一群研究員。這在研究領(lǐng)域比其他地方都更明顯。

一個研究leader必須能做非常強(qiáng)的技術(shù)判斷,當(dāng)出現(xiàn)分歧時,哪條路是對的?哪個項(xiàng)目值得算力和人力支持?如果你這些判斷持續(xù)做錯,你很快就會失去研究員的尊重。

所以在AI研究里,有一件很有趣也很棒的事是,我的所有上級都異常技術(shù)強(qiáng),和他們聊技術(shù)非常好玩。

Q:接下來我又開始預(yù)訓(xùn)練一下,對我來說,Transformer當(dāng)年開啟了一個巨大的飛躍。Reasoning在我心中已經(jīng)接近這個級別,甚至可能更神奇。

過去幾個月跟你們聊天時,我總有一種感覺,你們在過去三五年里做了很多硬核工程工作,但這些努力還沒有完全在產(chǎn)品層面顯現(xiàn)出來。這讓我很難把握自己“應(yīng)該有多興奮”,當(dāng)你們暗示某些正在出現(xiàn)的東西時,你們內(nèi)部的感覺是這已經(jīng)能看出是一個和之前幾次時代級飛躍同等級的東西了嗎?”

Mark Chen:我個人是這樣覺得的。當(dāng)我們發(fā)布GPT-5時,我們講了很多關(guān)于合成數(shù)據(jù)的內(nèi)容?,F(xiàn)在還有許多類似的“研究線索”,我們覺得非常有前景,并且正在極為激進(jìn)地放大它們的規(guī)模。

關(guān)鍵一直在于:維持一個多樣化的押注組合,把最有實(shí)證前景的那幾條線,大規(guī)模放大與支持。

Q:大概兩周前,Andrej Karpathy在一個播客說了一番話,把整個AI圈嚇了一跳,他的意思大概是AGI還要10年。你是怎么想的?

Mark Chen:我覺得X(推特)很喜歡這種敘事循環(huán),“一切都完了”“不,一切又回來了”。只要符合當(dāng)下情緒的說法,就會被無限放大。你現(xiàn)在也是在想要剪個傳播度很高的片段嘛。

在我看來,AGI這個詞最大的問題是,每個人的定義都不一樣。即使在OpenAI內(nèi)部,你也很難把所有人拉到一個房間,讓大家給出一個一致的、精確的AGI定義。

所以我更傾向于這樣類比,你身處工業(yè)革命過程中,你說“工業(yè)革命完成”的那一刻,是紡織機(jī)出現(xiàn)的時候?還是蒸汽機(jī)出現(xiàn)的時候?

每個人都會選一個不同的點(diǎn)。我更傾向于說,我們現(xiàn)在正處在生產(chǎn)AGI 的過程之中。

對我個人來說,我最看重的指標(biāo)是我們是否在產(chǎn)出新的科學(xué)知識?我們是否在推進(jìn)科學(xué)前沿?

而從今年夏天開始,我覺得在這一點(diǎn)上發(fā)生了一個非常劇烈的階段轉(zhuǎn)變。

OpenAI for Science

Q:是你們在內(nèi)部看到的成果嗎?我腦子里第一反應(yīng)是最近那些生物科技創(chuàng)業(yè)公司“自動設(shè)計(jì)分子”之類的……

Mark Chen:對,我的靈感其實(shí)來自那次和物理學(xué)家的會面。
那次之后我回去想,我們應(yīng)該打造一個OpenAI for Science。目標(biāo)是,對于那一小批已經(jīng)意識到模型潛力、并且想要擁抱它、用它加速科研的人,我們要盡一切所能幫助他們加速。

我知道其他公司也在嘗試推動科研前沿,但我覺得我們和谷歌等機(jī)構(gòu)最大的區(qū)別在于,我們想讓所有科學(xué)家都有能力做出諾貝爾獎級的發(fā)現(xiàn),而不是讓OpenAI自己去得諾貝爾獎。當(dāng)然,OpenAI拿諾貝爾獎也不錯。

但我們真正的目標(biāo)是打造一整套工具與框架,讓全世界的科學(xué)家都感受到加速作用。我們相信這是整個科學(xué)界能一起被推前進(jìn)的方式。

Q:你說你們看到具體的突破,有例子嗎?

Mark Chen:當(dāng)然有。如果你想看一大串例子,去看Sebastian的Twitter。最近有一篇論文解決了一個開放的凸優(yōu)化問題,和我們正在攻克的一些機(jī)器學(xué)習(xí)核心問題非常緊密相關(guān)。

很多人會覺得,“啊,這是不是只是fancy的文獻(xiàn)搜索?”

不是,復(fù)雜得多。這些例子我可以講更多。

Q:但現(xiàn)在說實(shí)話我都有點(diǎn)被淹沒了……我也關(guān)注生物科技,現(xiàn)在真的是每兩天就會聽說一個“AI科學(xué)家”“我們一發(fā)命中抗體了”“AI自動設(shè)計(jì)分子”。

有些我很興奮,因?yàn)槲艺J(rèn)識這些公司的核心科學(xué)家,知道他們是真的人才。但太多了,以至于要么我們真的正在見證奇跡發(fā)生,要么信息量大到人類已經(jīng)無法分辨真實(shí)性了。

Mark Chen:

我一點(diǎn)也不驚訝生物學(xué)會出現(xiàn)這些突破。就我個人而言,我對計(jì)算機(jī)科學(xué)和數(shù)學(xué)最熟,而在這些領(lǐng)域,我們有專家確認(rèn),這些確實(shí)是實(shí)打?qū)嵉陌l(fā)現(xiàn)。這就是我最有信心的地方。

Q:你說的和外界敘事很不一樣。我覺得互聯(lián)網(wǎng)的敘事每三周換一次:“AI全是假的”“沒進(jìn)展”“都是吹的”。如果這些科學(xué)突破是真的,那大眾完全不知道。

Mark Chen:為了搞OpenAI for Science,我們和很多物理學(xué)家、數(shù)學(xué)家聊過,絕大多數(shù)人并不看好AI。

他們的典型想法是,“AI不可能證明新定理”“這肯定是偽裝、幻覺,或者別的什么”。這就是為什么我覺得我們必須賦能那一小批真正相信AI的科學(xué)家,他們會遠(yuǎn)遠(yuǎn)跑在所有人前面。

我們希望打造的工具,能說服更多科學(xué)家相信這就是未來做科研的正確方式。

Q:我承認(rèn),每個人對AGI的定義不一樣。但從你現(xiàn)在說的這些來看……聽起來你認(rèn)為,不管它叫什么名字,未來一兩年我們都將看到劇烈的變化。

Mark Chen:是啊,“AGI還要兩年”已經(jīng)變成一個meme了。但我覺得我們已經(jīng)不再處在那個永遠(yuǎn)是兩年的世界里了。

給我真正信心的,是我們最近在數(shù)學(xué)與科學(xué)上看到的那些結(jié)果。在OpenAI的研究團(tuán)隊(duì)內(nèi)部,我們設(shè)定了兩個非常明確的目標(biāo)。

目標(biāo)1,一年內(nèi)改變研究流程,讓AI成為研究實(shí)習(xí)生。在一年內(nèi),我們要讓AI實(shí)際參與到研究開發(fā)工作中,并且真正提高科研效率。

目標(biāo)2,2.5年內(nèi)實(shí)現(xiàn)AI的端到端研究。也就是說,在兩年半內(nèi),我們希望達(dá)到AI能從頭到尾執(zhí)行研究流程。

現(xiàn)在的流程是,你提出一個想法→你自己實(shí)現(xiàn)→你調(diào)試→你反復(fù)迭代。但一年內(nèi),我們非常有信心做到人類控制外層(提出想法),模型控制內(nèi)層(實(shí)現(xiàn)、調(diào)試、測試),這將非常不同。

Q:你們對預(yù)訓(xùn)練這么樂觀,但我總感覺,我們已經(jīng)建好了如此龐大的算力基礎(chǔ)設(shè)施,模型每10倍擴(kuò)展都會變強(qiáng)……

但也有人說從GPT-4→GPT-5沒看到你們預(yù)期的提升,即使算力更多。你們看起來卻非常自信。我們其實(shí)還沒真正看到那次“10×compute躍遷”的效果。

Mark Chen:我想說的是,當(dāng)有人問我“你們真的需要那么多算力嗎”,我都覺得這問題太震驚了。

因?yàn)槲颐刻於荚谔幚砗A康乃懔ι暾垺N业男膽B(tài)是這樣的,如果今天多3倍算力,我可以立刻有效用完。如果今天多10倍算力,我可能幾周內(nèi)就能全部用滿

所以算力需求是真實(shí)存在的,我看不到任何放緩跡象。當(dāng)有人問“你們真的需要更多算力嗎”,我真的不理解這個問題。

Q:你們對預(yù)訓(xùn)練的突破很樂觀,那你們是否同樣相信——繼續(xù)擴(kuò)大模型規(guī)模會帶來巨大提升?

Mark Chen:我們絕對會繼續(xù)擴(kuò)大模型規(guī)模。而且我們已經(jīng)有算法突破,使得我們能繼續(xù)擴(kuò)大規(guī)模。

Gemini 3有很多令人印象深刻的地方,但我注意到一個細(xì)節(jié):他們的SWE-bench成績里,數(shù)據(jù)效率方面幾乎沒什么進(jìn)展,我們在數(shù)據(jù)效率相關(guān)算法上非常強(qiáng)。

Q:最近有一份泄露的備忘錄,Sam對Gemini 3的態(tài)度挺嚴(yán)肅的。

Mark Chen:我覺得Sam的工作之一就是要注入緊迫感和速度感。這是他的責(zé)任,也是我的責(zé)任。
我們必須保持對scaling的激光般專注。Gemini 3正是谷歌應(yīng)該下注的方向。

但同時也要提醒,作為管理者,我們的部分工作就是不斷給組織注入緊迫性。Gemini 3是個好模型,我們也有對應(yīng)的回應(yīng),而且我們可以更快推進(jìn)下個版本。

聯(lián)手Jony Ive,搞硬件設(shè)備開發(fā)

Q:你會參與像Jony Ive的設(shè)備開發(fā)這種事情嗎?研究團(tuán)隊(duì)也參與?

Mark Chen:是的。而且我昨天我和Jony以及幾位研究人員一起吃了飯,包括我們負(fù)責(zé)預(yù)訓(xùn)練和后訓(xùn)練的負(fù)責(zé)人。

我一直在想一件事,未來的ChatGPT應(yīng)該是什么樣子的?現(xiàn)在的ChatGPT,和它的交互方式,說實(shí)話很笨,完全不是原生思考的那種體驗(yàn)。

你給它一個提示詞,它給你一個回答,之后它基本上不做任何對你有生產(chǎn)力的事情,直到你再給下一個提示。而且如果你再問類似的問題,它還會花一樣久的思考時間。它不會因?yàn)槟阒皢栠^問題而變得更聰明。

我認(rèn)為未來應(yīng)該是這樣:它有更強(qiáng)的記憶,每次你來,它能學(xué)到關(guān)于你的一些深層?xùn)|,它會思考你為什么問這個問題,它會聯(lián)想到相關(guān)的問題,然后下一次你來,它會變得更聰明。

那么問題來了,要怎樣設(shè)計(jì)一個設(shè)備,讓這種思考方式成為核心?
和Jony合作這段時間,我覺得非常有價值。

Q:你現(xiàn)在有一個設(shè)備了嗎?

Mark Chen:我可能有,也可能沒有。

Q:我一想到你們在和Jony合作,我就想到,蘋果是一個以硬件為中心的公司,喬布斯對硬件著迷,把它當(dāng)成一種藝術(shù)。但你們,Sam、Greg、Jakub,據(jù)我所知沒有人真正做過硬件產(chǎn)品。

Sam很重視設(shè)計(jì),從他的房子和辦公室能看出來,但做設(shè)計(jì)這種天賦……我一直覺得喬布斯那叫品味,這是天生的。那你們怎么確定自己有“品味”來塑造一個新的硬件產(chǎn)品?

Mark Chen:老實(shí)說,我們不需要自己有品味,那是Jony的工作,他是我們在“品味”上的鑒別者。

而最有趣的是,我們最近意識到,設(shè)計(jì)團(tuán)隊(duì)的工作方式我們做研究的工作方式,其實(shí)有非常深的相似性,都是大量探索、大量提出假設(shè)、大量試錯、花很多時間沉淀,最終打造一個你滿意的作品。

讓設(shè)計(jì)團(tuán)隊(duì)加入公司之后,我們和他們的溝通更直接了:“這是我們即將交付的能力”“這是設(shè)備的形態(tài)”“我們怎么把這兩個整合起來?”

Q:我花一輩子和這些人打交道,但我常常會想,真的要讓一群數(shù)學(xué)宅男來做一個AI設(shè)備嗎?不過你剛才講的確實(shí)是在談一種“混合型合作”。

Mark Chen:是的,你說得對。擅長構(gòu)建AI能力的人,和有硬件/產(chǎn)品品味的人,通常是完全不同的兩類。但我們內(nèi)部其實(shí)也有一些團(tuán)隊(duì),他們對模型行為的品味(taste for model behavior)特別好。

這種品味完全不同,他們會問非常奇怪、但很關(guān)鍵的問題,比如“ChatGPT最喜歡的數(shù)字應(yīng)該是什么?”

最后幾幾幾個問題

Q:最后幾個問題,ChatGPT提醒我問你,如果5年后回頭看現(xiàn)在,有哪些非常脆弱、非常微妙的小想法,你覺得未來可能變成突破的核心?

Mark Chen:有幾個,我手里大概有一小撮這樣的想法。不能講太細(xì),但我真的非常期待把它們規(guī)?;?。

Q:能不能給點(diǎn)提示?比如方向類別?

Mark Chen:主要還是集中在預(yù)訓(xùn)練相關(guān)的東西,也有少量是RL(強(qiáng)化學(xué)習(xí))相關(guān),也有少量是關(guān)于“如何把所有東西整合起來”的方向。

Q:你覺得外界有哪些關(guān)于OpenAI的誤解?

Mark Chen:我認(rèn)為最重要的一點(diǎn)是,OpenAI本質(zhì)上是一家研究為中心的公司,我們是一家純粹押注AI的公司,公司的核心目標(biāo)就是構(gòu)建AGI,并盡可能減少干擾,產(chǎn)品是順著研究自然流出來的。

至于研究,我們最核心的目標(biāo)是:自動化AI研究、自動化科學(xué)發(fā)現(xiàn)、自動化經(jīng)濟(jì)生產(chǎn)力的工作。而過去一年最大的更新其實(shí)是第二個部分,它正在發(fā)生。

Q:你現(xiàn)在多大?你還有辦法維持社交生活嗎?

Mark Chen:34,快35了。老實(shí)說,沒有。過去兩周每天都是工作到凌晨1–2點(diǎn)。但我很喜歡這樣,有很多事要做、很多人要招、很多方向要推動。如果我們正處在下一次工業(yè)革命里,那為什么不把握這個黃金時刻?

Q:聽說你甚至睡在辦公室?你睡了一個月在辦公室?

Mark Chen:是啊,那段時間挺好玩的。

那是Barret離職、去創(chuàng)立自己公司之后。那段時間工作需求就是這樣。我仔細(xì)想過我當(dāng)時那種強(qiáng)烈的情緒,其實(shí)是一種強(qiáng)烈的保護(hù)研究的本能。

Q:你們經(jīng)歷了“宮斗”、大規(guī)模挖角、Meta啟動巨大的研究團(tuán)隊(duì)……現(xiàn)在的戰(zhàn)火算過去了嗎?

Mark Chen:我每次和團(tuán)隊(duì)開會都會說:“等我處理完這件事,我會抬起頭看看有沒有新的火要救?!?/p>

但現(xiàn)在我已經(jīng)完全接受,構(gòu)建AGI的賭注夠大,所以永遠(yuǎn)會有新的火。關(guān)鍵是,在混亂中,你要能判斷什么才是真正重要的事。

Q:DeepSeek那個時刻,你對開源模型,尤其是中國的開源模型,有什么看法?

Mark Chen:我覺得那是我第一次真正意識到,我們必須死死守住自己的研究節(jié)奏。

DeepSeek發(fā)布的時候,它火得不得了,網(wǎng)絡(luò)上全在問“OpenAI迷失方向了嗎”“是不是別人的模型已經(jīng)追上來了”“你們的回應(yīng)是什么?回應(yīng)呢?回應(yīng)呢?”

我認(rèn)為我們當(dāng)時做的,完全是正確的選擇。我們只是更加扎實(shí)地按照自己的研究路線往前走。我一點(diǎn)都不覺得這是錯誤決定。后續(xù)版本的DeepSeek模型我還沒仔細(xì)看,我覺得他們是一個非常強(qiáng)的實(shí)驗(yàn)室,

但從根本上說。我們要做的就是持續(xù)創(chuàng)新。在我看來,DeepSeek某種程度復(fù)刻了我們O系列模型中的理念。但我們的關(guān)注點(diǎn)還是,繼續(xù)往前創(chuàng)新。

Q:你前面說研究團(tuán)隊(duì)核心500人,這個數(shù)會隨著公司擴(kuò)大繼續(xù)漲嗎?還是說500就是一個追逐大想法的最佳規(guī)模?

Mark Chen:老實(shí)說,我覺得甚至可以更少。而且當(dāng)我們有AI研究員/AI實(shí)習(xí)生之后,我們還要重新設(shè)計(jì)整體組織形態(tài)。

我非常在乎的一點(diǎn)是,人才密度(talent density)要極高。

我很喜歡做一些管理實(shí)驗(yàn),比如今年第二季度,我故意完全不開放新的headcount,如果你想招人,你必須先搞清楚“誰不該在這條船上”。

我覺得這種練習(xí)非常重要。你不希望研究組織慢慢變成一個你都掌控不了的東西,你得把門檻一直卡到很高。

Q:關(guān)于項(xiàng)目署名/歸功的問題。在學(xué)術(shù)界,署名非常重要。我記得你的態(tài)度是大家對歸功這件事有點(diǎn)太執(zhí)著了。
我不知道我記得對不對。

Mark Chen:我認(rèn)為對功勞的過度執(zhí)著,是很糟糕的事情。但另一方面,我也覺得公司必須認(rèn)真對待功勞歸屬,無論是對內(nèi)還是對外。整個行業(yè)過去幾年都在遠(yuǎn)離公開署名,論文少了作者列表模糊了,很多公司不愿公開誰做了什么。

但我和Jakub最后的決定是,在OpenAI我們要繼續(xù)做署名。反對意見很明顯“你們這是把自己的頂尖人才名字端盤子遞出去,方便別人來挖人”。

但我不覺得這重要,我們應(yīng)該去認(rèn)可那些做出偉大工作的人,繼續(xù)成為創(chuàng)造AI超級明星的地方。對公司來說,幫這些做出最好成果的人打出名號這件事非常重要。

Q:但你好像同時也認(rèn)為,個人研究員本身不該那么執(zhí)著于功勞?是我記錯了嗎?

Mark?Chen:不,當(dāng)時房間里確實(shí)有人持那種觀點(diǎn),但其實(shí)我和Jakub是不同意那種極端說法的。所以你沒有記錯,只是我們倆是“反對票”那邊的。

對我來說,我們必須在明知有風(fēng)險的情況下,仍然給該給的人足夠的功勞。即使這意味著,全世界都會知道誰是我們的頂尖人才。

我甚至?xí)f得更極端一點(diǎn),我認(rèn)為在整個行業(yè)里,OpenAI是單位人數(shù)上對外部署名與個人credit最大方的地方。

Q:從華爾街到AGI,從動機(jī)上講,你其實(shí)不必對“AGI的哲學(xué)意義”“超智能的命運(yùn)”這些問題有多么強(qiáng)的情感。那為什么你會如此投入地做這件事?

Mark Chen:對我來說,安全與對齊這一塊非常核心。我現(xiàn)在也管理OpenAI的對齊團(tuán)隊(duì)。

我真心覺得,在接下來一兩年里,最宏大、最關(guān)鍵的挑戰(zhàn)之一就是對齊問題。如果你關(guān)注這部分研究,在整個行業(yè)里,我覺得OpenAI在過去一年做的是最好的之一。

為什么這么說,因?yàn)槲覀冊谥T如scheming這樣的議題上,做了大量工作,當(dāng)你給模型打更多RL,你會越來越能測出自我意識、自我保存、甚至是有計(jì)劃、有策略地謀劃(scheming)的傾向。這很可怕,模型可能仍然給你一個“你想要的正確答案”,但它是通過一種非常扭曲的內(nèi)在路徑得出的。

隨著模型幫我們做越來越復(fù)雜的任務(wù),理解它的思考路徑會變得極其重要。

Q:這屬于“機(jī)制可解釋性(mechanistic interpretability)”的范疇,試圖理解黑盒內(nèi)部到底發(fā)生了什么。

問題是,我們在理解模型的能力,能否跟上這些系統(tǒng)復(fù)雜度的增長?還是會出現(xiàn)一個完全追不上的臨界點(diǎn)?

Mark Chen:有一個我非常自豪的設(shè)計(jì)決定,可以追溯到我們發(fā)布o(jì)1時。我們決定,不對思考過程本身進(jìn)行監(jiān)督(不強(qiáng)迫它寫好看、討人喜歡的推理過程)。當(dāng)你激勵模型給出人類喜歡看的思考過程,它就不一定會對你誠實(shí),不會告訴你它真正的意圖與路徑。
通過不去監(jiān)督那部分,我們保留了一個觀察窗口,可以真的看到模型是如何思考的。這對對齊來說是一個極其重要的工具。幾個月前有一篇我們和DeepMind、Anthropic一起的論文,專門研究這個工具在未來會如何演化。

我覺得在這方面,我們做了一些相當(dāng)不錯的設(shè)計(jì)選擇。

我真的擔(dān)心有一天會出現(xiàn)這樣一個世界。模型說的每句話都極其有說服力,但我們完全無法判斷它是否真正站在我們這邊,是否真的與我們的價值對齊。

所以我對這些方向很感興趣,在這里,還有非常多令人興奮的研究可以做。

原視頻鏈接:https://www.youtube.com/watch?v=ZeyHBM2Y5_4&t=19s

版權(quán)所有,未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用,違者必究。
欧美精品久久久久久久久久| 视频一区二区在线观看| 啦啦啦免费高清视频在线观看| 精品视频在线视频| 免费国产a级片| 欧美性猛交xxxx免费看漫画 | 亚洲巨乳在线观看| 麻豆成人久久精品二区三区小说| 青青草av网站| 自拍偷自拍亚洲精品播放| 伊人色综合久久天天五月婷| 日韩国产成人精品| 欧美肥老妇视频| 国产精品无码久久久久成人app| 亚洲精品电影在线一区| 亚洲午夜激情网站| 国产传媒第一页| 久久久不卡网国产精品一区| 亚洲一区二区三区精品在线观看 | 亚洲大片一区二区三区| 国产综合第一页| 亚洲免费大片在线观看| av免费播放网站| 中文字幕欧美精品在线 | 亚洲第一第二区| 国产区一区二区三区| 亚洲欧美国产77777| 国产一级aa大片毛片| 日韩成人精品视频在线观看| 久久大片网站| 欧美巨乳美女视频| 激情欧美一区二区| 久久久久久艹| 亚洲国产美女搞黄色| 老司机福利av| 亚洲精品国产综合久久| 黄色aaa视频| 久久韩剧网电视剧| 日韩欧美综合在线| 亚洲色成人网站www永久四虎 | 国产日韩视频一区| 激情成人综合网| 亚洲精品成人无码毛片| 99国产在线视频| 亚洲午夜色婷婷在线| 欧美日本一区二区在线观看| 99久久夜色精品国产网站| 最新中文字幕免费| 欧美日韩一区二区三区在线视频| 91蜜桃在线观看| 一区二区免费av| 色婷婷综合久久久久中文字幕1| 一道本无吗一区| 国产999精品久久久影片官网| 亚洲精品免费看| 性色av蜜臀av| 日本免费a视频| 亚洲男人天堂网| 香蕉视频黄色在线观看| 欧美成人免费在线视频| 国产亚洲精品精华液| 中文字幕av片| 亚洲综合免费视频| 劲爆欧美第一页| 女人十八毛片嫩草av| 国产精品国产亚洲精品看不卡15| 国产一区二区在线视频| 青青草视频网站| 日韩免费在线播放| 丁香桃色午夜亚洲一区二区三区| 亚洲人成77777| 欧美高清视频不卡网| 欧美激情一区二区三区在线| 欧美日韩午夜视频| 一区二区三区在线观看www| 日韩精品视频在线观看免费| av7777777| 久久福利网址导航| 中文字幕中文乱码欧美一区二区 | 在线中文字幕日韩| 亚洲一级二级三级在线免费观看| 中文字幕日韩免费| 日本一区二区三区www| 亚洲精品黄网在线观看| 久久人人爽人人爽| 精品亚洲一区二区三区四区| 亚洲免费人成在线视频观看| 欧美午夜片在线免费观看| 成人中文字幕在线| 美国精品一区二区| 日本中文字幕高清| 日韩精品一区二区三区在线播放 | 亚洲 日本 欧美 中文幕| 成年人二级毛片| 亚洲 小说 欧美 激情 另类| 精品无码国产一区二区三区av| 精品网站999www| 久久久噜噜噜久噜久久综合| 538精品在线视频| 国产a级全部精品| 午夜精品久久久久久久99樱桃 | 91精品久久久久久久久久另类| 欧美视频在线观看一区| 国产成人精品免费| 免费在线一级片| 国产欧美日韩在线播放| 久久久人成影片一区二区三区| 欧美成人精品福利| 亚洲丝袜美腿综合| 污污的视频网站在线观看| 玩弄japan白嫩少妇hd| 欧美富婆性猛交| 五月综合激情日本mⅴ| 天天操天天干天天舔| 日韩欧美第二区在线观看| 亚洲香蕉成视频在线观看| 裸体女人亚洲精品一区| 精品国产一区二区三区四区四| 播五月开心婷婷综合| www久久久久久| 97人人澡人人爽| 欧美成人合集magnet| 亚洲国产成人91porn| 欧美日韩国产精品一区二区三区四区 | 91丨九色丨海角社区| 深夜黄色小视频| 在线免费观看一区二区三区| 亚洲欧洲成人av每日更新| 国产精品伦一区二区三区| 日韩av免费播放| 成人免费无遮挡无码黄漫视频| 日本精品www| 亚洲小说欧美另类激情| 91九色最新地址| 香蕉加勒比综合久久| 国产精品嫩草影院com| 亚洲欧洲精品一区二区精品久久久 | 精品久久久久久久久久久久| 亚洲精品乱码久久久久| 久久精品欧美一区二区三区麻豆| 美女视频一区二区三区| 综合久久中文字幕| 人人妻人人澡人人爽精品日本| 日日橹狠狠爱欧美超碰| 精品不卡在线| 欧美精品一区三区在线观看| 一级一片免费播放| 久久精品国产理论片免费| 国产一区二区丝袜高跟鞋图片| 另类美女黄大片| 亚洲人成亚洲人成在线观看图片| 中文字幕亚洲在| 婷婷国产在线综合| 国产一区二区日韩精品欧美精品| 3d动漫啪啪精品一区二区免费| 欧美少妇在线观看| 免费成人蒂法网站| 亚洲制服丝袜在线播放| 国产一级二级视频| 欧美熟妇精品黑人巨大一二三区| 95视频在线观看| 性生交大片免费看l| 91欧美一区二区三区| 国产精品视频资源| 亚洲电影av在线| 亚洲免费观看高清完整版在线 | 亚洲精品自在久久| 亚洲天堂av在线播放| 日韩综合中文字幕| 久久久久久久久久久成人| 91视频-88av| 147欧美人体大胆444| 日韩av一区二区在线| 亚洲国产高清自拍| 中文字幕日韩欧美| 亚洲色图第三页| 日韩欧美精品网站| 天天操天天色综合| 国模gogo一区二区大胆私拍| 国产日韩一区在线| 国产精品自产拍在线观| 91精品国产91久久久久青草| 精品国产网站地址| 午夜精品久久久久久不卡8050| 91精品国产91久久久久久最新毛片| 日韩风俗一区 二区| 国产精品成人一区二区三区| 中文字幕一区三区久久女搜查官| 国产麻豆成人传媒免费观看| 亚洲精品一二区| 91看片淫黄大片91| 性囗交免费视频观看| 国产内射老熟女aaaa| 日本黄大片一区二区三区| 亚洲图片第一页| 国产美女主播在线观看| 国产亚洲欧美日韩俺去了| 欧美日本不卡视频| 国产欧美一区二区精品秋霞影院| 狠狠色丁香婷婷综合| 久久电影网电视剧免费观看| 丝袜美腿成人在线| 成人国产精品免费网站| 精品人伦一区二区三区蜜桃网站 | 久久大片网站| 熟妇高潮一区二区| 精品黑人一区二区三区在线观看| 日韩精品中午字幕| 致1999电视剧免费观看策驰影院| av手机天堂网| 日韩欧美一区二区三区| 97在线看福利| 神马午夜伦理影院| 免费黄视频在线观看| 久久久久99精品成人片试看| 日韩av中文在线观看| 亚洲第一久久影院| 亚洲免费av片| 欧美日韩第一页| 国产精品视频免费观看| 欧美 国产 综合| 久久精品免费观看| 午夜激情综合网| 高清一区二区三区四区五区| wwwwww欧美| 一本岛在线视频| 欧美一级大片免费看| 日本毛片在线观看| 欧美日韩一区二区三区| 91日韩在线播放| 欧美精品一级片| 精品久久久久99| 国内自拍第二页| 成人免费视频一区二区| 91精品国产免费久久久久久| 国语对白做受xxxxx在线中国| 伊人久久久久久久久久久久久久| 一区二区三区日| 国产精品天美传媒沈樵| 精品亚洲永久免费精品| 99久久久无码国产精品性色戒| 神马午夜伦理影院| 日韩大尺度视频| www.黄色小说.com| 亚洲欧美日韩中文在线| 在线免费观看a级片| 国产精品毛片一区视频播| 亚洲男人的天堂一区二区 | 少妇高潮大叫好爽喷水| caopor在线视频| 精品久久国产视频| 精品视频一区二区三区免费| 久久精品日韩精品| 中文字幕av免费在线观看| 欧美小视频在线| 不卡av在线网站| 日韩精品免费一区| 在线观看日批视频| 在线视频一区二区三| 91精品国产一区二区三区动漫| wwwxxx黄色片| 无码人妻丰满熟妇区bbbbxxxx| 国产欧美日韩在线看| 久久综合久久综合这里只有精品| 91成人国产综合久久精品| 亚洲成人精品视频在线观看| 亚洲日本无吗高清不卡| 7777久久亚洲中文字幕| 日韩中文在线中文网在线观看| 国产女人精品视频| 超碰在线超碰在线| 91网页版在线| 欧美亚洲另类久久综合| 天堂中文在线看| 日韩欧美亚洲区| 99久久婷婷国产综合精品电影 | 加勒比综合在线| 91亚洲国产成人精品一区二三 | 26uuu国产电影一区二区| 欧美一区第一页| 人妻aⅴ无码一区二区三区| 成人毛片在线免费观看| 欧美性猛交xxxxx水多| 国产精品偷伦免费视频观看的| 亚洲精品鲁一鲁一区二区三区| 久热成人在线视频| 国产极品jizzhd欧美| 男人午夜免费视频| 亚洲国产精品网站| 国产网站免费在线观看| 另类专区欧美蜜桃臀第一页| 久久久久久综合网天天| 中文字幕日韩三级片| 亚洲综合色在线观看| 少妇人妻互换不带套| 国内自拍在线观看| 日日橹狠狠爱欧美超碰| 欧美国产亚洲一区| 日本成人中文字幕在线| 亚洲色图 在线视频| 亚洲欧美自拍另类日韩| 五月六月丁香婷婷| 国产 xxxx| 三上悠亚影音先锋| 国产91在线播放九色| 久草视频免费播放| 国产又黄又爽又色| 中文字幕在线观看高清| 精品人妻伦一二三区久久 | 久久久久久一级片| 中文子幕无线码一区tr| 亚洲精品久久久蜜桃| 欧美日韩中文在线观看| 欧美精品xxxxbbbb| 日韩黄在线观看| 蜜月aⅴ免费一区二区三区| 久久免费视频观看| 国产精品久久久久久久久久99 | 制服丝袜第二页| 爱爱视频免费在线观看| 国产午夜免费福利| 国产强被迫伦姧在线观看无码| 亚洲人成色777777精品音频| 国产一区二区美女诱惑| 久久久久亚洲综合| 亚洲一区二区高清| 在线观看日韩国产| 国产婷婷成人久久av免费高清| 欧美精品日韩www.p站| 国产精品欧美一区二区三区奶水| 国产精品久久久久久免费观看| 亚洲一区三区| 无需播放器的av| 午夜在线观看一区| 国产午夜视频在线播放| 国产特黄一级片| 国产精品亚洲视频| 亚洲柠檬福利资源导航| 欧美美女bb生活片| 日韩中文字在线| 国产精品专区h在线观看| 欧洲一区二区日韩在线视频观看免费 | 久久99久久久| 国产又大又黄又爽| 国产一区在线观看麻豆| 国产精品人妖ts系列视频| 欧美日韩一区二区三区| 亚洲人永久免费| 国产精品日韩电影| 亚洲欧洲日韩综合二区| 尤物国产在线观看| 999精品在线视频| 国产精品自拍电影| 国产69精品久久久久777| 一区二区免费在线播放| 亚洲第一福利在线观看| 欧美一级在线播放| 日韩电影大全在线观看| 蜜桃免费在线视频| 性欧美一区二区| 亚洲在线精品视频| 国产v日产∨综合v精品视频| 精品福利在线视频| 中文日韩在线观看| 5566av亚洲| 亚洲欧洲日产国码无码久久99| 日韩乱码人妻无码中文字幕久久| 无码一区二区三区在线观看| 国精产品一区一区三区mba桃花| 亚洲一二三专区| 在线电影欧美日韩一区二区私密| 成人在线中文字幕| av免费观看大全| 性生交大片免费全黄| 久热精品在线| 一区二区三区在线免费| 国产午夜精品一区理论片飘花| 亚洲一区二区三区xxx视频| 黄色大片中文字幕| 四虎影视一区二区| 亚洲精品一区二区三区不卡| 亚洲国产成人一区二区三区| 精品国产一区二区三区久久久蜜月| 国产91免费观看| 国产主播自拍av| 久久久久久久久久网站| 免费久久99精品国产| 欧美日韩视频在线| 欧美大片欧美激情性色a∨久久| 少妇免费毛片久久久久久久久| 北京富婆泄欲对白| 国产成人精品免费看视频| 国产精品视频一二三| 亚洲精品美女久久久| 豆国产97在线| 韩国三级hd中文字幕有哪些| 在线视频欧美亚洲| 国产精品麻豆一区二区| 亚洲美女中文字幕| 蜜桃av噜噜一区二区三| 成年人看片网站| 99久久国产热无码精品免费| 国产精品久久久久久久久图文区| 亚洲人在线观看| 欧美一区二区视频在线| jizz中文字幕| 精品一区二区在线观看| 欧美一区中文字幕| av一区二区三区免费| 中文字幕 欧美 日韩|