都2023年了還有人創業做數據標注?還有VC和大廠看好??
成立僅1年,融資千萬
鄧思邈 發自 副駕寺
智能車參考 | 公眾號 AI4Auto
都2023年,還有人創業做數據標注,而且迅速獲得了一眾客戶和投資???
選的還是自動駕駛賽道。
數據標注,AI被深度學習復興以來新增的產業之一,一度“有多少人工就有多少智能”的調侃,指的就是數據標注在行業中的重要性。
但這都2023年,數據標注還能玩出什么新花樣嗎?
這家叫愷望的新創業公司,帶來了規模化人工+自動化產線的方法,并表示可以提供穩定又低價的服務。
穩定又低價,怎么實現的?
數據標注,本質就是給訓練數據集打標簽。標簽可以添加到任何類型的數據中,包括文本、圖像、視頻、音頻和3D點云。
有了標簽后,可以幫助機器學習模型未來遇到從未見過的數據時,也能準確識別數據中的內容。
但并非所有標注過后的數據,都能真正起作用。
其中涉及到不同客戶對數據標注顆粒度、維度的要求,于是通常的痛點,會伴隨著數據質量不佳、數量規模不足、標注成本高、數據生產流程不規范、甲乙方磨合周期長……
而為了解決上述問題,愷望提供的新思路是:規模化人力+自動化產線——可以實現成本降低超過20%。
一方面,“規模化人力”,主要是找“專業的人做專業的事”,用專門的在校學生,替換之前臨時或簡單培訓就上崗的社會人士。
具體方面,愷望通過與高職院校合作,搭建數據學院,以此培養數據產線上需要的人。
據說可以迅速上崗——前期對學生進行70%的通用培訓,然后再培訓操作和運營的流程。
目前愷望第一批300名學生,已在山東等地高職院校完成培訓,他們希望今年能夠培訓超過1000位學生。
另一邊,“自動化產線”,是指通過工具提效和管理優化,提升整體運作效率。
愷望將整個數據處理流程拆成了4個環節:需求、生產、管理、生態。
簡單解釋就是,當汽車傳感器采集到了數據后,就輸入到“工廠”里,后續他們的工作首先是解讀客戶需求規則、拆分數據任務。
然后將這些任務匹配給不同的人去做,例如有人專門負責標紅綠燈、車道線,有人則負責標道路交通牌。
在生產管理過程中,可以借助飛書把握不同學生的工作進度;還能利用亞馬遜AWS云服務完成數據傳輸,好處是原來要花上2天才能完成,現在則縮短為1.5小時。
所以愷望的不同之處,就在于把自己與不規范的手工作坊區分開來,構建一套現代化工廠的運營模式。
工作人員不能是臨時拼湊的,需要提前熟悉規則。工作流程必須是清晰有條理的,盡可能減少不必要的浪費,無論是時間還是成本。
有點像是數據標注行業里的富士康。
愷望是誰?
目前行業內的技術方案,大多關注的是“預標注”這個環節的效率。
即數據標注的自動化程度。
但愷望認為目前人工智能還不能完全替代人力,自動化數據標注會有一個發展過程,愷望CEO于旭就舉例說:
就像是自動駕駛最終會走向L4、L5,但中間會經歷L2、L3,但L2、L3的經驗,可以使最終形態的自動駕駛更準確更科學的實現,人工智能一定是需要一個基于數據進行積累和建模、最終全面自動化和智能化的過程。這個不會是一蹴而就,而是需要逐步實現。
而且愷望產品項目副總裁張鵬也表示,“目前,數據標注以人工標注為主,機器標注為輔。而從整個自動駕駛行業的普遍水平來看,可以說95%的數據標注還是以人工為主”。
不過他們也給自己定下了目標,希望用3年時間,實現通用項目90%的自動化(即預標注占的百分比)。
愷望于2022年成立,創辦1年就獲得了不少知名客戶,包括長安汽車、字節跳動、元戎啟行、輝羲智能、地平線、寒武紀、易控智駕、中科創達、中交興路、曠視、商湯等等。
創始團隊由4人構成,其中創始人兼CEO于旭,碩士畢業于法國昂熱大學,畢業后成了Uber中國的第4號員工,從0到1搭建起平臺運營體系。其后就職于Momenta,參與構建了自動駕駛全鏈路數據的運營體系。此外于旭曾在字節跳動負責管理多個大型標注基地、千人規模大型數據外包渠道以及數萬人的眾包平臺。
愷望合伙人團隊,還包括奔馳金融運營流程管理專家、Monenta前數據平臺技術負責人;同時還擁有覆蓋自動駕駛商業、AI產品策略及算法領域的顧問團隊。
融資方面,2022年9月,愷望完成了千萬級天使輪融資,投資方包括辰韜資本、三一集團和溪山天使匯。目前,愷望已與三一集團在自動駕駛領域開展數據合作。
之所以在這個時間點,瞄準自動駕駛賽道成立數據公司,愷望稱,主要是因為看到了龐大的市場需求。
擺在眼前的事實是——2022年12月,我國新能源汽車零售滲透率達到29.5%,較2021年12月22.6%的滲透率提升7個百分點。
而且在大多數情況下,談電動必談智能,兩個屬性往往如影隨形、相伴而生。
目前乘用車落地的自動駕駛大部分處于L2級水平,隨著激光雷達成本的降低、逐漸量產上車,將會加速L3+的落地。
而L3級別以上的自動駕駛系統,對于計算機視覺技術的需求依賴度較高,系統需要對傳感器采集的點云圖像數據進行實時處理,構建車輛行駛環境,為預測和決策做依據。
愷望認為,在完全自動駕駛真正實現之前,仍需要大規模數據作為支撐,而這至少還需要10-15年以上時間。
而現在,“規模化人力+自動化產線”,是必經路線。
- 摩爾線程新一代GPU架構10天后發布2025-12-09
- 優理奇機器人完成兩輪合計3億元天使++++輪及天使+++++輪融資,“算法-硬件-場景”加速落地2025-12-05
- 2025年的冬天,上海憑什么被稱為“世界具身智能第一戰場”?2025-12-05
- 免費國產Banana真香!我想把PS給卸載了2025-12-01



