AIGC是日燒百萬的銷金窟,但有應用場景的公司不在乎
2022:AIGC元年,2023:?
夢晨 衡宇 發自 凹非寺
量子位 | 公眾號 QbitAI
沒想到,第一批AI繪畫產品已經開始倒閉了……
StockAI,成立僅4個月,在2022年底因用戶付費無法覆蓋成本,遺憾宣布關閉平臺、退款。
以3月的付費AI繪畫平臺Midjourney推出為標志,AI繪畫開始被職業畫師重視起來。到8月的Stable Diffusion開源,AI繪畫正式出圈并開啟一場全民狂歡,這一過程只用了不到半年。
AIGC(利用AI技術生成內容)這一概念也被徹底帶火,成為最熱門的風口之一,剛剛過去的2022年也被形容為AIGC元年。
Stable Diffusion背后的公司StabilityAI融資1.01億美元,AI文案生成公司Jasper融資1.25億美元。
這一波熱潮還沒完全過去,ChatGPT橫空出世,又把AIGC抬上了新高度。
人們開始認為它能搶走搜索引擎的生意,甚至谷歌自己都感受到了危機,在公司內部發布了“紅色警報”。
以ChatGPT的火爆程度,從0到100萬用戶只用了不到5天。
這是什么概念?作為對比,Twitter用了2年,Facebook用了300天,Instagram用了將近75天。
據馬里蘭大學副教授Tom Goldstein粗略估計,如果100萬用戶平均每天只進行10次對話,Open AI就需要為ChatGPT每天燒掉10萬美元(68萬人民幣)。
AIGC太燒錢該如何持續?OpenAI為什么能先后引領AI繪畫與對話系統兩波浪潮?成了行業熱議的話題。
量子位在這段時間里也和一些學者、從業者交流了這些問題,其中,京東集團副總裁、IEEE Fellow何曉冬博士的觀點很有啟發性:
利用AI拓展人類認知邊界和AI商業化落地,是兩個不同的邏輯
商業巨頭很難搞出ChatGPT這樣的項目
我們2017年就做了AI繪畫
在AI技術圈,何曉冬是公認的大牛。
他本科畢業于清華大學,碩士畢業于中國科學院,后赴美國密蘇里大學哥倫比亞分校獲得博士學位,在微軟全球八大研究院之首的雷德蒙研究院工作十余年,2018年回國加入京東,并于2019年當選IEEE Fellow。
他先后發表了200余篇學術論文, 谷歌學術統計引用數超4萬次,其中單篇論文最高被引用近5000次,h-index達到70。
早在2017年,何曉冬就在微軟研究過讓AI根據文字生成圖像的技術,當時的模型AttnGAN登上CVPR,生成的一張“一只紅羽毛白肚子的短咀小鳥”現在看來也不算過時,這也是早期AIGC和多模態智能領域重要的進展。
△AttnGAN 按照 “一只紅羽毛白肚子的短咀小鳥” 生成的圖像
語言模型方面,像ChatGPT一樣不再一味追求大參數、無監督學習的類似思路之前也不是沒人想到過,只是沒能做到極致。
那么其他人離做出DALL·E和ChatGPT這樣的產品還差些什么?
何曉冬認為,不差在思路,也不差在資源,而是差在決心。
兩大獨立AI研究機構,DeepMind和Open AI做的事,都是在拓展人類認知邊界,并不能直接帶來商業價值。
要下這樣的決心,和技術負責人的品味、組織的使命和生存模式都離不開關系。
像谷歌雖然手里也有LaMDA這樣的超強對話語言模型,卻遲遲不面向公眾大規模開放,甚至被內部員工吐槽是“起了個大早,趕了個晚集”。
△谷歌LaMDA概念圖
這其中的原因,有谷歌在AI倫理道德議題上不敢冒進,也有對自身現有商業模式顛覆的顧慮——廣告是谷歌的核心收入來源之一,當人們不再用搜索引擎而改用AI對話時,廣告是無處安放的。
要讓AIGC產生商業價值,就要遵從一套完全不同的邏輯。
AIGC如何產生商業價值?
在微軟開發的這個AI繪畫技術當年終究是沒能做成產品上線,但作為技術初心和拓展人類認知邊界的一個嘗試,AI畫出的這只鳥一直被何曉冬當作手機壁紙。
不過,另一項技術“AI看圖說話”就成功找到了自己的位置。
現在的Office里,插入一張圖片就能自動生成一段描述文本(alt text),可由系統語音讀出為視力障礙者提供方便。
技術結合場景,在產業真實落地,就能發揮更大的價值。
2018年,何曉冬離開工作了十余年的微軟雷蒙德研究院,選擇回國加盟京東,這之中也是有離場景更近方面的考量。
在京東,何曉冬帶領團隊打造了京東云言犀人工智能應用平臺,服務京東5.8億用戶和17.8萬商家,也將系列AI產品服務落地到了金融、政務、交通等各個領域。
僅在開放給第三方商家使用服務與導購產品的京小智上,就幫助商家帶來了上千億元GMV。
另一套商品文案生成系統,目前已覆蓋3000+品類,累計“種草”30億字,帶來超過3億的GMV。
光是線上購物這一個場景,就支持了這么多種技術落地的可能性,而更大的發揮空間在背后的設計、生產、倉儲、物流等供應鏈上下游場景。
這也是京東云產業AI的推進路線,一面保持對前沿技術的探索,一面依托自身的場景推進AI技術產業化、規模化落地。
經過反復迭代打磨后,再將技術以模塊化、組件化、產品化的方式,基于言犀人工智能應用平臺對外開放,成為產業上下游的超復雜協同的最佳“助手”,助力產業數智化升級。
相比于一些其他公司,京東的供應鏈場景豐富,更重要的是京東的“價值標準”,如同正品行貨、物流配送一樣,AI產品也必須滿足客戶的價格、產品、服務等方面的綜合體驗,又要滿足京東在技術商業化過程中自身的成本與效率。
深入產業AI,不可避免的會遇到更低頻、長尾的復雜場景和產業大規模協同的需求。
這些場景的數據樣本少、數據分布不均,研發成本更高,同時定制化程度高、難以復制。如此一來,就需要遷移成本低、基礎數據樣本豐富、靈活彈性、適用能力強的綜合性AI系統。
對于AIGC這一具體方向來說,同樣如此。
何曉冬拿智能客服場景來舉例,用于京東自營時模型是高度定制化的,直接開放給幾十萬第三方賣家使用很難滿足所有人需求,又很難靠人力去適配所有需求。
后來的解決辦法是定義好產品的邊界,預訓練大模型提供基礎能力,同時結合在京東沉淀的豐富領域知識圖譜,把知識接口開放給賣家,無論是賣食品還是化妝品都可以把產品知識填進去,讓AI能力方便的遷移到不同領域。
這個過程中模型免不了犧牲一些性能才能做到最終產品的標準化、開箱即用,因為產業AI到了這一步,很多用戶都不是技術專家。
把AI能力組合成產品對傳統行業客戶太有挑戰性了,直接提供開箱即用的AI產品和應用才能讓不懂技術的客戶也能快速組成解決方案,滿足自己的需求。
在這套體系下,京東云還進行了AIGC的多方向探索,如聯手中央美術學院的AI書法生成。
以及一鍵生成店鋪專屬數字人。在數字人領域,言犀平臺上推出了2D真人、3D卡通、3D超寫實等多種類型數字人,近期還上線了大姿態(側臉、轉頭等)數字人。目前言犀平臺已有100+形象,30+音色選擇,為電商直播、金融、政務等領域提供媲美真人的服務體驗。尤其是電商直播領域,百變的形象、專屬的音色,智能腳本實時撰寫,豐富的“知識體系”等同于一名金牌銷售,推出后已為客戶帶來顯著的GMV提升。
△京東云言犀數字人演示
甚至對實體倉庫、實體零售店做一個數字孿生。京東物流研發了京東物控 3D Scada 智能倉儲數字孿生平臺大大提升了倉庫作業的效能,相比于傳統人工作業的方式效率可以提高3~8倍;京東也在探索一種具有未來感的零售模式,構建柔性店鋪,讓店鋪的功能隨著消費者時間不同、需求不同而實時改變,革新線下零售的購物體驗。
要說AIGC如此多的方向中,最有商業價值潛力的是哪個?
何曉冬還是最看好數字人,加入了視覺形象、人物表情,交互更自然,使用體驗有很大提升。
而且他預測,2023年AIGC一個可能的技術突破方向也在這里。
AI繪畫最常用的技術是擴散模型,有天馬行空的創造力,但是容易失控。超寫實數字人常用的是神經輻射場,可以根據物理特性重構三維環境。
如果兩者能結合起來,可能把可控性和真實性再提高一個數量級,到時候應用場景也會進一步打開。
One More Thing
如何讓AIGC產生更大價值,是全行業都在關注的熱點,相關討論層出不窮。
比如在量子位舉辦的MEET2023智能未來大會上,小冰公司CEO李笛分享了他對數字人的思考。
如數字員工會使toB和toC的界限變得模糊,比如銀行的數字客戶經理可能會與客戶變成朋友。
未來數字人也將不再隸屬于某一平臺,人們在客服、手機、汽車場景上與同一個數字人交流,能獲得更加無縫、24小時、持續連貫的服務。
OpenAI的CEO Sam Altman最近則發表了他對ChatGPT進一步發展的想法。
ChatGPT這樣的技術,隨著時間推移一定會造成一些重大的破壞……但是不讓技術接觸現實世界是無法獲得改進辦法的。
探索人類認知邊界與產生商業價值,2023年你更期待AI在哪方面的進展?
- 看完最新國產AI寫的公眾號文章,我慌了!2025-12-08
- 給機器人打造動力底座,微悍動力發布三款高功率密度關節模組2025-12-08
- 云計算一哥10分鐘發了25個新品!Kimi和MiniMax首次上桌2025-12-03
- Ilya剛預言完,世界首個原生多模態架構NEO就來了:視覺和語言徹底被焊死2025-12-06




