郭一璞 發自 悠唐
量子位 報道 | 公眾號 QbitAI
2014年,曾經是YY CTO的趙斌在硅谷創立了聲網。
這家公司的主要業務,就是借助API的方式,讓全世界的開發者都能方便的在自家應用里接入實時音視頻服務,也就是語音通話、視頻聊天、互動直播等相關功能。
成立五年來,聲網已經融到了C輪,累計融資額超過1.2億美金,IDG、順為資本、紀源資本等知名投資機構都曾參與投資。如今他們在硅谷、上海、北京、廣州、深圳、班加羅爾、倫敦、東京、紐約等地都有辦公室。
在聲網的官網上,趙斌有一個標簽:“API信徒”。
網景創始人馬克·安德森曾經說:“軟件正在吃掉世界。”
趙斌深以為然,“說‘吃掉’有點夸張,如果用更平和或者客觀的話來說,就是軟件會滲透到所有行業、生活里面。”
但他對“軟件吃掉世界”有了更多一層自己的理解:“完全靠獨立的軟件吃掉這個世界已經差不多了,現在我們的生活都是在軟件上運行。但是如果要進一步吃掉這個世界,需要在很多業務上API化,API之間又可以集成,將來實現生活體驗、工作體驗無縫連接,然后整個把體驗包起來。”
世界是運行在API上的,這也是趙斌選擇API這個創業方向的原因。
基于AI的傳輸技術
在移動端實現超分辨率,是聲網不久前發布的一項技術。
可以將實時傳輸中的視頻在原有分辨率的基礎上實現兩個方向的2倍同步放大,并進行細節的增強。
聲網CEO趙斌介紹,在移動端計算,固然可以減少云端算力與傳輸壓力和運營成本問題,但這項技術的實現并不容易:
第一,要在移動端實現本地運算,會受到手機發熱和耗電量的影響,尤其是直播、上課這類應用,很多時候要超過1小時,要使手機在這么長的時間里不發熱、不降低性能,是非常有挑戰性的一項工作;
第二,由于超分辨率的轉換過程是實時的,無法預知下一幀的視頻,而畫面必須是連續不卡頓的;
第三,移動端落地平臺多種多樣,要在蘋果安卓不同系統、高端低端不同手機上實現落地,需要考慮的維度更多,對適配的要求更強。
除了移動端超分辨率之外,聲網原創的SD-RTN(Software Defined Real-time Network)也是這家公司引以為豪的一項產品。
SD-RTN部署在了全球超過200個國家和地區,趙斌介紹,聲網在每個地區都會有專門的當地供應商,根據用戶分布情況,選擇可靠、短延時的線路,另外通過算法優化全球互聯網的覆蓋和傳輸能力,因此,和公有云類產品提供的服務并不相同,更側重于解決延時和卡頓的問題。
“比如一家公司的數據中心機器在西雅圖,而你有很多客戶在埃及,難道數據要先到西雅圖、再從西雅圖到埃及嗎?在中東布一個就直接過去了。”聲網首席科學家鐘聲舉了這樣一個例子來說明。
中國人的國際化公司
雖然是創立者是中國人,但“國際化公司”一直刻印在聲網的骨子里。
聲網不僅有大量外籍員工,且平臺上國外的用戶流量也已經超過了國內。其中不少流量也得益于中國互聯網公司出海的舉動,比如當互動直播走向國外,就帶來了成體量的用戶規模。
目前,聲網平臺上有約15萬左右的應用在運行,其中也包括不少像陌陌這種用戶規模巨大的應用。而聲網整個公司大約有400名員工,其中研發、技術服務和支持等各類技術人員占比達到70%,研發團隊主要集中在國內,上海為多,北京廣州也有,另外也有以業務團隊為主的硅谷辦公室。
作為專業的技術服務商,大廠們的潛在競爭讓趙斌并不覺得有壓力。“可能有一些比較大的企業或者巨頭在做類似的東西,這個我覺得還好吧,主要是產品業務本來都是比較新的,到底做成什么樣、怎么服務得比較好,這里面的做法和產品體驗的差異是最重要的。”
在趙斌看來,大公司固然有向某個領域進軍的能力,但單單就音視頻服務來說,這對大廠們只是很小的一個方向,而對聲網則是核心的專業方向,投入全部的資源。“把實時音視頻做成簡單的API,去幫所有App接入,在相當長的時間里,我們是唯一的一家。”
傳輸的使命
在2019年底這個時間點上,5G是整個科技行業都在聚焦的議題。
而尤其是對于和視頻傳輸內容相關的公司來說,這更是令人激動、令人期待、令人驚喜的時刻。
虎牙CEO董榮杰就預測,當5G到來時,普通用戶的流量不再是限制看直播的因素,就像短視頻今日的火熱一樣,整個直播市場會有5~10倍的巨大增長空間。
而對于聲網這類面向開發者的視頻API服務公司來說,5G也是重大機遇。
趙斌說,“5G提供了更好的帶寬或者更廉價的帶寬,覆蓋更全的帶寬,賦能手機應用,更好的利用這個帶寬。利用帶寬干什么?視頻是最主要的。”
而在鐘聲這位首席科學家看來,站在RTC+AI+5G三個技術的交叉點上,這對聲網更是特別的機會。
除了音視頻,趙斌則將聲網的方向鎖定在了“實時場景構建”上,不僅包括視頻聲音,也有信息和消息。而在未來,鐘聲希望能借助技術將聲網的能力延伸到虛擬老師、活體認證、遠程診斷、治療等多個方面。




