字節(jié)技術(shù)大牛跑步進入AIGC創(chuàng)業(yè),聚焦視覺領(lǐng)域,搭建算法平臺
成立愛詩科技,殺入AIGC創(chuàng)業(yè)中間層
衡宇 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
3月最后一天,王長虎在龍湖集團的last day。
這位字節(jié)跳動前視覺技術(shù)負責(zé)人、AI Lab總監(jiān)辭職掛印,火速啟程下一站:AIGC創(chuàng)業(yè),成立新公司愛詩科技。
他拉團隊自起爐灶,要打造一個聚焦AIGC的視覺多模態(tài)算法平臺?,覆蓋視覺相關(guān)的各種垂直應(yīng)用場景。

當(dāng)此大熱的AIGC風(fēng)口,王長虎已經(jīng)是近期第N位勇闖創(chuàng)業(yè)潮的AI牛人。
聊起這事,王長虎說話間不自覺就提高了聲音,語速也更快。他提到,創(chuàng)業(yè)是受時代和內(nèi)心的雙重感召,而且在風(fēng)口和經(jīng)歷背書的雙重加持下,目前看來,早期的融資推進頗為順暢。
關(guān)于創(chuàng)業(yè)要干的事,他信心飽滿:
技術(shù)難點?一定有,但也是好事,它就是我們不斷形成競爭壁壘的機會,就是這時候需要我們?nèi)プ龅摹?/p>
而且我們真的是打過硬仗的,之前在字節(jié),那么難的事情都被我們扛過去了。所以在新的應(yīng)用場景里邊看到難點,蠻興奮,看到了,就去解決它。
(“那么難的事情”,指對字節(jié)系短視頻產(chǎn)品從0-1進行建設(shè))
支持AIGC全生命周期的視覺多模態(tài)算法平臺
在ChatGPT引爆的AIGC創(chuàng)業(yè)風(fēng)潮后,王長虎的切入點不是底層大模型或To C應(yīng)用層。
而是基于過去近20年的學(xué)術(shù)研究和技術(shù)應(yīng)用能力,殺入中間層,打造視覺多模態(tài)算法平臺,將焦點聚集在AIGC相關(guān)視覺領(lǐng)域的各個垂直應(yīng)用場景。
并且在初始階段,To B先落地踐行。
所包含的多模態(tài)具體樣式,根據(jù)視覺垂類領(lǐng)域應(yīng)用的需求,初步設(shè)定為文字、圖片、語音、視頻,以及用戶的個性化特征等,也是AIGC領(lǐng)域不斷涌現(xiàn)新能力和產(chǎn)品的載體。
根據(jù)王長虎的解釋,利用AI,可以完成從UGC到AIGC的內(nèi)容新升級。
“很多人關(guān)注AIGC,更多關(guān)注在內(nèi)容生成方面。”從王長虎視角看過去,內(nèi)容生成只是AIGC全生命周期的一個階段,“其余階段也有很多問題等待去解決。”
“很多問題”是哪些問題?
他結(jié)合此前經(jīng)歷,舉例了兩個UGC時代代表性場景來佐證他所說的內(nèi)容生成之外,AIGC時代生產(chǎn)鏈的其他環(huán)節(jié)很大可能會遇到相同難題。
一個是在日活6億,正負樣本極不均衡的抖音或TikTok平臺上,根據(jù)不同文化背景、具體要求等,必須要篩選出不合規(guī)的視頻進行攔截,且需精準快速。
AIGC時代,這樣確保安全的審核同樣重要,且審核需求量更大。視覺多模態(tài)算法平臺提供的算法,就包含了能夠幫助使用方提高篩選和攔截效率的那種,并且很有可能如當(dāng)初的字節(jié)一般,在王長虎提供的技術(shù)支持下代替成本高昂的人工審核,同時提升效率。
另一個場景是抄襲頻發(fā)。AIGC時代,創(chuàng)作門檻降低,作品數(shù)量爆發(fā),抄襲現(xiàn)象和版權(quán)糾紛大概率顯著上升。
UGC時代已經(jīng)驗證過,長此以往,不僅打擊原創(chuàng)者的創(chuàng)作意愿,對平臺生態(tài)不利;而內(nèi)容雷同或完全相同的視頻持續(xù)推薦,用戶體驗也會大打折扣。
針對這個場景,王長虎要做的平臺,就能為用戶側(cè)提供減少類似或雷同視頻分發(fā)的AI算法。
他還表示,這個聚焦AIGC的算法平臺搭建過程中,很大可能會利用AIGC技術(shù)提升效率。
上述所有都是王長虎的現(xiàn)階段思考,他才正式離職,剛剛開始籌備新公司事宜,新公司名為愛詩科技。
糧草先行,目前組建了10余人的初始團隊,也在招募核心技術(shù)和產(chǎn)品人才,為真正踩下出發(fā)的油門蓄力。
梳理他言語間透露出的規(guī)劃,能嗅到關(guān)于創(chuàng)業(yè)項目的信息點:
搭建這樣一個視覺多模態(tài)算法平臺,能夠支持AIGC新內(nèi)容,幫用戶解決內(nèi)容生成、安全、版權(quán)、分發(fā)、商業(yè)化等幾乎全生命周期的各項問題。

新的AI浪潮到來,王長虎身處其間,感知到變化,并打算在新事業(yè)從善如流地用上舊經(jīng)驗,包括但不限于GPU集群能力、服務(wù)調(diào)度能力、自動化模型訓(xùn)練能力,推斷能力等。
經(jīng)驗不會憑空出現(xiàn),既有功力的來源,主要可以定位回他在字節(jié)跳動任職期間。
2017年,王長虎加入字節(jié)跳動。那時候人們對字節(jié)的感知,通過今日頭條遠大于通過抖音。王長虎加入之初,就是在字節(jié)內(nèi)部創(chuàng)業(yè)般,從0到1深度參與建設(shè)短視頻類產(chǎn)品。
此次To B和To C層面可能遭遇的各種問題,如降本增效、版權(quán)厘清、用戶體驗等,王長虎都在那時以技術(shù)或?qū)崿F(xiàn)或改善或解決。
再一次“從0到1建設(shè)技術(shù)平臺和產(chǎn)品”,王長虎表示,上述經(jīng)驗都可以一以貫之應(yīng)用在此次AIGC創(chuàng)業(yè)。

與AIGC緣起20年前的本科研究
新公司還在襁褓,王長虎不愿過多詳談,他更愿意談?wù)摰氖谴饲暗募夹g(shù)經(jīng)驗,當(dāng)然也包括“技術(shù)底色上滋養(yǎng)出的AI情結(jié)”。
這要從王長虎還是中國科學(xué)技術(shù)大學(xué)6系(電子工程與信息科學(xué)系)大四學(xué)生時聊起。
那是2004年,他做了人生首個研究,即根據(jù)一張或多張人臉圖片,生成該人臉的3D模型。此研究后來發(fā)表到國際會議上。
他不無興奮地說:
回看20年前,我此生做的第一個研究,就和AIGC有關(guān)。
同年,王長虎進入MSRA實習(xí),中科大博士畢業(yè)后轉(zhuǎn)為正式員工,直到2017年離開。
13年間的工作內(nèi)容也與AIGC有千絲萬縷的聯(lián)系,他所在團隊研究的“神筆馬良”草圖搜索技術(shù),可以基于海量圖像數(shù)據(jù)建立搜索引擎。
當(dāng)然,那時候生成式技術(shù)沒有成熟,業(yè)界對大規(guī)模數(shù)據(jù)的訓(xùn)練和處理經(jīng)驗也遠不如今日豐富,所以整個過程是在海量數(shù)據(jù)庫中尋找和草圖最匹配的那一張。
回憶此處,王長虎的語氣中多少帶了些感慨,因為現(xiàn)在的范式也是基于海量數(shù)據(jù)去訓(xùn)練一個模型,然后根據(jù)用戶輸入的文字或圖像信息,生成一張最匹配prompt的圖片。

△草圖搜索技術(shù)示例
都說十年磨一劍,但在微軟實習(xí)和工作13年后,王長虎毅然奔赴字節(jié)跳動,選擇的還是當(dāng)時并非招牌的視頻類產(chǎn)品。
為什么去字節(jié)?畢竟王長虎自己也承認,在微軟可以做世界上最頂尖前沿的科學(xué)研究。
但在微軟,科研項目應(yīng)用到公司產(chǎn)品需要的周期特別長。
他舉例分享,自己二零零幾年做的工作,若干年后才真正應(yīng)用在必應(yīng)搜索引擎,新技術(shù)很難在第一時間影響用戶。
但這一點在字節(jié)可以實現(xiàn),再加上加入字節(jié)時,恰巧是短視頻類產(chǎn)品篳路藍縷打根基的時候——這也是字節(jié)AI Lab與其他大廠AI Lab的區(qū)別所在,即并非在產(chǎn)品成熟后才建立AI部門,也因此,王長虎有機會在產(chǎn)品0到1發(fā)展歷程中扮演核心角色。
公開資料顯示,字節(jié)跳動人工智能實驗室(AI Lab)的成立使命,就是推動機器智能的極限,致力于將AI理論研究快速應(yīng)用于產(chǎn)品部署。
現(xiàn)在翻看王長虎公開簡歷,字節(jié)任職期間,留下的足跡如下:
- 完整參與了抖音和TikTok等短視頻類產(chǎn)品從0到1的建設(shè)和發(fā)展;
- 建設(shè)了視覺技術(shù)和業(yè)務(wù)中臺,帶領(lǐng)團隊將相關(guān)技術(shù)廣泛應(yīng)用到字節(jié)跳動全線產(chǎn)品中;
- 為集團各產(chǎn)品提供AI技術(shù)支撐和業(yè)務(wù)解決方案,覆蓋了視覺相關(guān)產(chǎn)品內(nèi)容生產(chǎn)與消費的全流程。
期間,他搭建的數(shù)百人團隊,不僅有技術(shù)人員,還包含了產(chǎn)品同學(xué)。如果把微軟看成王長虎的技術(shù)練兵地,王長虎就把字節(jié)和龍湖的經(jīng)歷,看成是對他技術(shù)和產(chǎn)品兩方面認知的鍛煉。
△王長虎
和從字節(jié)去龍湖的原因一樣,選擇加入AI 2.0創(chuàng)業(yè)大潮,他的理由是“跳出舒適區(qū)”。
當(dāng)然,這一次的催動因素更復(fù)雜,譬如ChatGPT和Stable Diffusion的驚艷表現(xiàn),以及自己從DL熱潮走來,對又一次“翻天覆地變化”的不容錯過。
他說,這個機會更大,不像元宇宙、區(qū)塊鏈是被一部分人看到,AIGC是多數(shù)普通人能看到和感受到的。言語間,王長虎又傳遞出自己對“新技術(shù)快速影響用戶”的看重。
如今離職創(chuàng)業(yè),他又有機會身體力行地這樣做了。
參考鏈接:
[1]《草圖搜索的魅力與挑戰(zhàn)》https://blog.sina.com.cn/s/blog_4caedc7a0102en29.html
- 讀懂2025中國AI走向!公司×產(chǎn)品×人物×方案,最值得關(guān)注的都在這里了2025-12-10
- ToC智能體火得快,但更大的價值在企業(yè)丨中關(guān)村科金@MEET20262025-12-12
- 誤入人均10個頂級offer的技術(shù)天團活動,頂尖AI人才的選擇邏輯我悟了2025-12-04
- DeepSeek-V3.2系列開源,性能直接對標Gemini-3.0-Pro2025-12-01




