DeepMind助力Waymo!提升自動駕駛AI準確率,還能加快模型訓練
強強聯合
魚羊 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
在自動駕駛領域,谷歌Waymo無疑是標桿一樣的存在。
現實世界中,Waymo已經行駛了1000多萬英里(約1600萬公里),而在模擬駕駛中,行駛里程更是達到100億英里。
作為第一家提供自動駕駛出租車服務的自動駕駛汽車公司,Waymo早在去年12月,就落地美國亞利桑那州鳳凰城。但歷經大半年,Waymo One仍未能開出鳳凰城,商業化進展遠不如公眾預期。
商業化道路走得艱難,與技術進展息息相關,現在,DeepMind也出手了。
強強聯手
能夠可靠引導無人駕駛汽車的AI模型需要無限次的測試和微調,對算力也有很高的要求。
為了提高AI算法訓練的有效性和效率,Waymo正在與DeepMind展開合作,DeepMind在博文中提到,這次,他們受到了達爾文進化論的啟發。
Waymo的工程師解釋,AI算法通過反復測試實現自我提升,這一過程就是不斷嘗試并根據反饋進行調整。這樣,模型的表現在很大程度上是取決于訓練方案的。
找到最佳方案通常需要依靠研究人員和工程師豐富的經驗。他們會精心挑選訓練中的AI模型,剔除表現最差的模型并釋放資源,從頭開始訓練新算法。
手動調整自然可以快速產生更好地結果,但這太過依靠人力了。
于是,DeepMind設計了一種基于進化競爭(Population Based Training)的自動優化超參數的方法。
基于進化競爭
基于進化競爭,簡稱PBT,結合了手動調整和隨機搜索的優點。該方法從隨機變量(超參數)開始,訓練多個機器學習模型。
模型會被定期評估,并以進化的方式相互競爭,表現不佳的模型就會被“后代”(變量發生些許變化的表現更好的成員的副本)取代。
PBT不需要從頭開始重新訓練,因為每個后代都會繼承其父網絡的狀態,并且在整個訓練過程中積極地更新超參數。
也就是說,PBT能將大部分資源用于訓練良好的超參數值。
但是,PBT也并不完美。它傾向于優化當前的結果而不考慮長期效應,這不利于后期發力的AI模型。
DeepMind的研究人員考慮到了這一點,他們為此訓練了更多群體,并創建了稱為利基(niches)的子群體,它們的算法僅允許它們進行內部競爭。最后,這個子群體通過提供更多獨特模型在競爭中獲得優勢,這就鼓勵了多樣性。
成效如何
DeepMind和Waymo將PBT應用于行人,自行車和摩托車駕駛員識別任務,目的是調查是否可以提高召回率(確定的障礙物在場景障礙物總數上的比例)和精度(檢測到的障礙物的一部分實際上是障礙而不是誤報)。
最終,他們試圖訓練單一的AI模型,以保持超過99%的召回率,同時減少誤報。
Waymo報告說,這些實驗為評估真實世界模型的魯棒性提供了一個“現實的”框架,這反過來又為PBT算法的選擇競爭提供了依據。
實驗表明,進化競爭需要快速評估的支持,PBT模型每15分鐘就要評估一次。Google數據中心的數百分布式機器的并行化使這一需求成為可能。
Waymo還說,PBT算法能夠實現更高的精度,并且減少24%的誤報,同時也能保持較高的召回率。
此外,PBT所需的訓練時間和計算資源僅為原來的一半。根據Waymo的說法, PBT已被直接納入Waymo的技術基礎架構。
傳送門
DeepMind博客:
https://deepmind.com/blog/how-evolutionary-selection-can-train-more-capable-self-driving-cars/
— 完 —
- 蘋果芯片主管也要跑路!庫克被曝出現健康問題2025-12-07
- 世界模型和具身大腦最新突破:90%生成數據,VLA性能暴漲300%|開源2025-12-02
- 谷歌新架構突破Transformer超長上下文瓶頸!Hinton靈魂拷問:后悔Open嗎?2025-12-05
- 90后華人副教授突破30年數學猜想!結論與生成式AI直接相關2025-11-26




