谷歌都燒不動了!自動駕駛數據存儲之困:落地越多數據越大成本越高
自動駕駛最新落地挑戰曝光
鄧思邈 發自 副駕寺
智能車參考 | 公眾號 AI4Auto
自動駕駛最新的研發和落地挑戰曝光了:數據存儲成本高昂,自動駕駛公司正在想辦法“節食”。
這不,谷歌旗下Waymo攤牌了——
現階段更注重自動駕駛數據的質量,而不是數量。
必須篩選出有保存價值的數據,丟掉沒有價值的數據。
其實,這也是在Robotaxi相繼落地鳳凰城、舊金山后,不得已做出的選擇。
很顯然越往后發展,數據成本會越大…這對于自動駕駛是新的考驗。

更加注重數據質量
對于自動駕駛數據,Waymo定下了明確的要求。
根據最新消息,近日Waymo為負責計算基礎設施的團隊設置了嚴格的數據上限。
他們現在只保存新采集的數據,將老的數據刪掉,因為與當前的技術、實際情況和各項優先級相比,之前的數據已經過時了。

此外,Waymo公司從上到下都需要配合——各個團隊被分配了不同的數據存儲限額。
例如,有的團隊負責讓車輛識別周圍的環境(感知) ,有的團隊則基于以往的乘坐經歷來測試軟件更新(評估),這些小組都需要對數據進行取舍。
如果他們選擇保留車輛應急突發事件的數據,那么系統就會自動過濾掉其他無關的數據。

Waymo做出這一改變后效果如何?
軟件工程師查塔姆透露,他們的“新政”非常奏效,隨著Robotaxi車隊規模的擴大,他們必須盡快舍棄掉沒用的數據。而且他還說,對自動駕駛數據的存儲量進行節省,有時能激發創造力,并提供有價值的發現。

舉個例子,因為要節省存儲量,他們就會思考,下雨和下雪哪個天氣狀況下的數據,對于他們業務發展來說更重要?
最后他們得出的結果是下雪,一方面是他們現在采集的下雪數據量很有限,另一方面是他們的車輛應對下雨天氣處理得更好了,因此不需要再花費過多精力。
而且他們還發現與下雨有關的數據把停車時的數據也都采集來了,他們認為這很沒有必要。
事實上,Waymo對待數據的態度,并非一成不變。

最開始十多年前,自動駕駛還是谷歌內部的一個小項目時,要想存儲更多的數據并不容易。
在當時,沒有明確用途的數據會被他們刪掉,例如自動駕駛操作失敗的記錄。
到了2016年12月,從谷歌獨立出來后,Waymo對于數據存儲有了更多獨立性和自主權。
當時他們大幅增加了數據存儲容量,團隊對保存的自動駕駛數據也不那么挑剔了。
例如在2019年末,他們開始測試捷豹I-Pace這款Robotaxi時,由于配備了更先進的傳感器,生成的數據量也更大了,以至于當時測試車1個小時采集的數據量超過1100GB,足以填滿240張DVD光盤。
直到現在,又開始對數據進行節制了。這個從緊到松再到緊的變化過程,根本上反映了Waymo目前的經濟狀況。
今年年初面臨裁員、還收縮了自動駕駛卡車業務,如今隨著Robotaxi服務范圍的擴大,Waymo這時就需要從各方面來節流。
數據存儲就是一個重要切入口。簡單舉例,英特爾在2016年就估計,每臺無人車每天將產生4000GB的數據量,以亞馬遜目前的收費標準計算,存儲一年的成本約為35萬美元(折合人民幣約為244萬元)。

隨著自動駕駛技術的發展,如今的數據存儲成本已遠遠超過了這個數。
其他自動駕駛公司怎么樣?
對數據越來越挑剔的,不止谷歌Waymo一家。
通用旗下Cruise表示,在舊金山采集的數據中,只有不到1%的數據被團隊認為有用,所以他們現在也不會選擇在云端存儲所有的數據。
隨著車隊規模的不斷擴大,Cruise正致力于改進其數據存儲系統,目的是使自動駕駛落地變得更容易、成本更低。

現代汽車與安波福(Aptiv)合資組建的L4級自動駕駛公司——Motional也存在類似的情況。
據Motional副總裁Balajee Kannan表示,那些罕見的東西和不太尋常的場景會被刪除掉,比如道路上的障礙物或帶有沖浪板的自行車。更繁忙場景的數據最有可能被保留下來。
除了刪除掉沒有價值的數據,另外一個辦法是對數據進行分級存儲,對于那些訪問頻率較低的冷數據,可以存儲在性能合適、成本較低的基礎設施之上。

谷歌無人車開創者克里斯·厄姆森(Chris Urmson)創辦的Aurora,就用了這樣的辦法。
他們目前通過使用自動化系統對無人駕駛卡車產生的數據進行分類,而且工程師也會標記關鍵的數據,例如最近發生的危險事故等,以確保這些數據以常規的方式進行存儲。
而那些不常用的數據,每個月都會陸續被轉移到較冷的存儲區。直到三個月后,才會對大量的數據進行刪除。總體來說,只有大約15%的數據位于Aurora最容易訪問的存儲層。

另外,圖森也表示他們會在四年后,將大部分數據轉換為冷存儲。
總的來說,日后隨著自動駕駛技術的提高、傳感器數量的增多、車隊規模的擴大,數據存儲的成本會只增不減。
誠然,自動駕駛公司如果想要降本增效,就必須在節省流量費用、節省存儲資源及計算資源上下功夫。
這是新的挑戰,也是新的機遇。
文章參考鏈接:
https://www.wired.com/story/self-driving-cars-are-being-put-on-a-data-diet/
https://baijiahao.baidu.com/s?id=1761056932090741984&wfr=spider&for=pc
- 5天連更5次,可靈AI年末“狂飆式”升級2025-12-10
- 摩爾線程新一代GPU架構10天后發布2025-12-09
- 優理奇機器人完成兩輪合計3億元天使++++輪及天使+++++輪融資,“算法-硬件-場景”加速落地2025-12-05
- 2025年的冬天,上海憑什么被稱為“世界具身智能第一戰場”?2025-12-05



