色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

深探無監督預訓練技術落地 火山語音“算法優化+工程革新”兩手抓

核心思想在于用量化模塊將輸入特征離散化

一直以來,火山語音團隊都為時下風靡的視頻平臺提供基于語音識別技術的智能視頻字幕解決方案,簡單來說就是可以自動將視頻中的語音和歌詞轉化成文字,來輔助視頻創作的功能。但伴隨平臺用戶的快速增長以及對語言種類更加豐富多樣的要求,傳統采用有監督學習技術來解決的辦法日漸遭遇瓶頸,這讓團隊著實犯了難。

眾所周知,傳統的有監督學習會對人工標注的有監督數據產生嚴重依賴,尤其在大語種的持續優化以及小語種的冷啟動方面。以中文普通話和英語這樣的大語種為例,盡管視頻平臺提供了充足的業務場景語音數據,但有監督數據達到一定規模之后,繼續標注的ROI將非常低,必然需要技術人員考慮如何有效利用百萬小時級別的無標注數據,來進一步改善大語種語音識別的效果。

相對小眾的語言或者方言,由于資源、人力等原因,數據的標注成本高昂。在標注數據極少的情況下(10小時量級),有監督訓練的效果非常差,甚至可能無法正常收斂;而采購的數據往往和目標場景不匹配,無法滿足業務的需要。

為此火山語音團隊迫切需要研究如何以盡可能低廉的標注成本充分利用大量的無標注數據,提升少量標注數據下的識別效果并落地到實際業務中,所以無監督預訓練技術成為視頻平臺ASR(Automatic Speech Recognition / 自動語音識別)能力向小語種推廣的關鍵。

盡管近年來學術界在語音無監督預訓練領域取得了許多重大進展,包括Wav2vec2.0 [1]、HuBERT [2]等,但在工業界卻鮮有落地案例可以參考借鑒。整體來看,火山語音團隊認為,以下三方面主要原因,阻礙了無監督預訓練技術的落地:

  • 1. 模型參數量大、推理開銷大。大量無標注數據需要用較大的模型做無監督預訓練,才能得到高質量的語音表征,但這樣的模型如果直接部署到線上,會帶來高昂的推理成本。
  • 2. 無監督預訓練只關注語音表征的學習,需要結合大量純文本訓練的語言模型聯合解碼才能達到理想效果,和端到端ASR推理引擎不兼容。
  • 3. 無監督預訓練開銷大、周期長且不穩定。以Wav2vec2.0為例,300M參數量的模型用64張V100 GPU預訓練60萬步,耗時長達半個月;此外由于數據分布的差異,在業務數據上訓練容易發散。

對此火山語音團隊在基于無監督預訓練的語音識別技術落地過程中,針對以上三大痛點進行了算法改進和工程優化,形成一套完整易推廣的落地方案。本文將針對方案,從落地流程、算法優化以及工程優化等環節展開詳盡介紹。

落地流程

下圖是基于無監督預訓練的低資源語種ASR的落地流程,大致可以劃分為數據收集、種子模型訓練和模型遷移三個階段。

圖1 基于無監督預訓練的ASR落地流程

具體來說,第一階段的數據收集,可以通過語種分流、采購等手段收集目標語言的無標注語音、標注語音和純文本數據。

第二階段的種子模型訓練,也就是經典的“無監督預訓練+有監督微調”過程。這一階段將得到一個聲學模型,通常基于連接時序分類(Connectionist Temporal Classification, CTC [3])損失函數微調。聲學模型結合純文本訓練的語言模型,構成一個完整的語音識別系統,可以取得不錯的識別效果。之所以稱之為種子模型,是因為這個模型并不適合直接上線到業務,我們更傾向于使用LAS(Listen, Attend and Spell [4])或RNN-T(Recurrent Neural Network Transducer [5])這類端到端模型進行線上部署。

歸其原因,主要是LAS/RNN-T具有出色的端到端建模能力,同時在近年來已經取得了優于傳統CTC模型的效果,并在工業界得到越來越多的應用。火山語音團隊針對端到端語音識別模型的推理和部署做了大量優化工作,已形成一套相對成熟的方案,并支持眾多業務。在維持效果無損的前提下,如果可以沿用端到端推理引擎,就能大幅降低引擎的運維成本。

基于此團隊設計了第三階段,即模型遷移階段。主要借鑒知識蒸餾的思想,用種子模型對無標注數據打偽標簽,然后提供一個參數量較小的LAS模型做訓練,同步實現了模型結構的遷移和推理計算量的壓縮。整個流程的有效性在粵語ASR上得到驗證,具體實驗結果如下表所示:

首先,團隊采購了1kh成品數據用于實驗對比,直接訓練LAS模型性能不佳,字錯率(Character Error Rate, CER)高達44.2%。經過分析,火山語音認為主要原因是采購數據(對話)和業務測試集(視頻)領域不匹配,在wav2vec2.0上的初步實驗也發現了類似的現象。

相比用采購數據做預訓練,采用和目標領域一致的數據做預訓練,在業務測試集上的CER可以從42.0%下降到29.4%,于是團隊將業務場景的無標注數據積累到50kh,模型參數量從100M增加到300M,CER進一步下降到23.1%。

最后團隊驗證了模型遷移的效果,結合粵語語言模型對50kh無標注數據解碼得到偽標簽,訓練LAS模型。可以看到,基于偽標簽訓練的LAS模型基本可以保持CTC種子模型的識別效果且模型參數量減少了三分之一,可以直接基于成熟的端到端推理引擎部署上線。

圖2 模型參數量和CER對比

最終在模型結構和參數量不變的前提下,團隊用50kh無標注業務數據和10h有標注業務數據取得了23.0%的CER,相對基線模型下降48%。解決了線上計算量和兼容性的問題之后,聚焦到整個流程中最為核心的無監督預訓練技術,針對wav2vec2.0,火山語音團隊分別從算法和工程兩個維度進行了優化。

算法優化

wav2vec2.0作為Meta AI在2020年提出來的自監督預訓練模型,開啟了語音無監督表征學習的新篇章。其核心思想在于用量化模塊將輸入特征離散化,并通過對比學習優化,模型主體與BERT類似,隨機mask部分輸入特征。

版權所有,未經授權不得以任何形式轉載及使用,違者必究。

相關閱讀

精品亚洲欧美日韩| 亚洲视频 欧美视频| 日韩电影在线观看一区二区| 成人一级片网址| 葵司免费一区二区三区四区五区| 国产精品视频一二三| 久久久国产91| 国产清纯白嫩初高中在线观看性色| 国产一区二区伦理片| 国产精品一区二区三区精品| 天堂在线资源网| 久久久久久久久久久人体| 久久久国产欧美| 性猛交╳xxx乱大交| 亚洲综合网av| 91精品国产欧美一区二区成人| 日韩欧美国产网站| 97在线视频国产| 99精品在线免费视频| 国产亚洲欧美精品久久久久久| 亚洲制服丝袜av| 91精品啪aⅴ在线观看国产| 亚洲天堂av一区二区| 日韩视频在线视频| 黄色av网址在线| 精品国精品国产尤物美女| 日韩一区免费观看| www精品国产| 另类天堂视频在线观看| 99热只有这里有精品| 亚洲欧美综合另类在线卡通| 欧美日韩国产影院| 在线观看av一区二区| 亚洲欧美日韩久久精品| 91手机视频在线观看| 麻豆国产尤物av尤物在线观看| 久久久精品影视| 夜夜夜夜夜夜操| 欧美少妇bbw| 制服丝袜亚洲色图| 日韩国产精品毛片| 国产又粗又猛又黄又爽| 欧美浪妇xxxx高跟鞋交| 亚洲www永久成人夜色| 欧美大片xxxx| 樱桃国产成人精品视频| 亚洲一区国产精品| 国产小视频在线看| 黄色成人在线免费| 国产精品污www一区二区三区| 亚洲色婷婷一区二区三区| 成人网在线播放| 欧美黑人一区二区三区| 男人添女人荫蒂国产| jlzzjlzz国产精品久久| 国产91精品视频在线观看| 亚洲一级片网站| 国产乱码一区二区三区| 欧美—级高清免费播放| 97人妻精品一区二区三区免| 国产午夜精品美女毛片视频| 91精品国产自产在线| 国产性xxxx| 久久精品一区二区免费播放| 午夜视频在线播放| 亚洲性夜色噜噜噜7777| 别急慢慢来1978如如2| 国产一区二区在线视频| 欧美一区二区三区免费视| 天天舔天天操天天干| 亚洲一区二区综合| 色吧亚洲视频| 日本网站免费在线观看| 国产又粗又猛又爽又黄av| 夜夜嗨av一区二区三区| 久久久一本精品99久久精品66| 午夜视频网站在线观看| 精品免费一区二区三区| 97精品视频在线| 色啦啦av综合| 国产日韩欧美高清| 精品国产一区二区三区免费| 国产精品久久久久久99| 精品国产乱码久久久久久浪潮 | 亚洲国产欧美不卡在线观看 | 成人免费网站黄| 香蕉加勒比综合久久| 一区二区三区av| 久久久久.com| 久久久国产一区二区三区| 中文字幕 自拍| 欧美性猛交xxxxxxxx| 北条麻妃在线一区| 国产精品69毛片高清亚洲| 91欧美激情另类亚洲| 在线观看免费观看在线| 色av吧综合网| 中文字幕在线看高清电影| 一本一道综合狠狠老| 黄色免费福利视频| 国产日本欧美一区二区| 国产精品电影久久久久电影网| av大全在线观看| 一区二区三区视频在线| 精品国产国产综合精品| 欧美不卡激情三级在线观看| 亚洲AV成人精品| 色域天天综合网| 制服丝袜中文字幕第一页| 亚洲综合激情小说| 99在线免费视频观看| 欧美激情一区在线观看| 91免费视频黄| 91麻豆国产精品久久| 亚洲一区三区视频在线观看| 成人av免费网站| 午夜精品电影在线观看| av中文一区二区三区| 欧美亚州在线观看| 成人美女视频在线看| 日本午夜精品电影| 成人动漫视频在线| 亚洲一区二区免费视频软件合集| 国产精品自拍网站| 亚洲精品高清国产一线久久| 99热99精品| 亚洲国产精品久久久久久女王| 日韩精品乱码免费| 粉嫩高清一区二区三区精品视频| 成人羞羞国产免费图片| 99精品国产高清在线观看| 美国av一区二区| 欧美精品二区三区四区免费看视频 | 不卡视频一区| 国产精品正在播放| 亚洲一区二区在线看| 99久久精品国产精品久久| 制服诱惑一区| 亚洲色图.com| 人妻巨大乳一二三区| 欧美一区二区三区在线电影| 人妻大战黑人白浆狂泄| 日韩成人中文字幕| 亚洲一区欧美在线| 91精品国产色综合| 亚洲精品一区二区三区蜜桃| av资源站久久亚洲| caoporm超碰国产精品| 欧美 丝袜 自拍 制服 另类| 天天综合网天天综合色| 黄色录像a级片| 欧美一区二区三区影视| 国产黄色片在线免费观看| 欧美国产日韩一区二区在线观看| 无码人妻丰满熟妇奶水区码| 国产精品久久久久久久久久久久| 久久爱另类一区二区小说| 精品午夜一区二区| 国产精品久久毛片a| 亚洲久久中文字幕| 精品国产一区二区三区久久影院| 日韩精品乱码久久久久久| 青青在线视频一区二区三区| 日韩国产欧美在线观看| 国产免费色视频| 亚洲午夜电影在线观看| 免费的av网站| 欧美激情aaaa| 麻豆精品一区二区av白丝在线| 一区二区三区国| 日韩欧美在线字幕| 国产黄片一区二区三区| 欧美精品久久久久久久免费观看| 亚洲经典一区二区三区| 免费99视频| 亚洲一二三专区| 青青操在线播放| 国产成人avxxxxx在线看 | www.成人三级视频| 久久免费精品国产久精品久久久久 | 粉嫩一区二区三区性色av| 成人综合视频在线| 日韩精品一区二区三区中文不卡| 姑娘第5集在线观看免费好剧| 国产一区在线观| 亚洲福利国产精品| 欧美黄色aaa| 日本成熟性欧美| 久久综合狠狠综合| 艳妇乳肉亭妇荡乳av| 欧美激情在线一区| 国产精品一二三区在线| 日韩精品视频久久| 亚洲欧美综合另类中字| 久久一区国产| 可以免费在线看黄的网站| 日韩精品欧美激情| 久久久久久穴| 狠狠热免费视频| 播播国产欧美激情| 日韩精品一卡二卡三卡四卡无卡| 成年人观看网站| 国产一区二区三区日韩欧美| 久久精品三级| 91视频最新入口| 中文字幕亚洲国产| 国产麻豆日韩欧美久久| 久久久久中文字幕亚洲精品| 性欧美xxxx视频在线观看| 国产自产高清不卡| 美女扒开腿免费视频| 欧美激情一区二区久久久| gogogo免费视频观看亚洲一| 日韩精品电影一区二区| 成人性教育视频在线观看| 亚洲一二三区视频在线观看| 午夜影院在线看| 亚洲国产一区二区三区在线播| 欧美剧情片在线观看| 欧性猛交ⅹxxx乱大交| 91在线视频观看免费| 久久中文字幕国产| 99久久国产综合色|国产精品| 亚洲性猛交xxxx乱大交| 好吊妞www.84com只有这里才有精品| 日本韩国精品在线| 国内精品偷拍视频| 手机在线成人免费视频| 2020久久国产精品| 一区二区三区色| 真实的国产乱xxxx在线91| 99在线精品免费视频| 中国人与牲禽动交精品| 99精品1区2区| 亚洲国产综合久久| 欧美日韩黄色一级片| 91精品国产91久久久久久| 精品日本美女福利在线观看| 天堂在线观看免费视频| 亚洲专区区免费| 日韩理论片在线观看| 色综久久综合桃花网| 日韩毛片一二三区| 国产精品怡红院| 中文字幕无人区二| 欧美自拍资源在线| 中文字幕日韩av电影| 中文字幕字幕中文在线中不卡视频| 亚洲字幕av一区二区三区四区| 久久国产精品国产精品| 亚洲影影院av| 亚洲激情视频在线观看| 国产精品色婷婷久久58| 国产极品久久久| 日本免费福利视频| 在线不卡视频一区二区| 欧美精品久久久久a| 在线免费观看日本一区| 国产成人鲁色资源国产91色综| 久一区二区三区| 日韩一区二区三区不卡视频| 国产精品久久国产精品| 在线观看久久久久久| 亚洲成a人片在线观看中文| 三级亚洲高清视频| 久久午夜鲁丝片午夜精品| 性欧美极品xxxx欧美一区二区| 91中文在线视频| 亚洲人av在线影院| 亚洲午夜日本在线观看| 国产乱人伦偷精品视频不卡 | √天堂中文官网8在线| 北条麻妃在线视频观看| 91免费观看| 波霸ol色综合久久| 欧美亚洲高清一区二区三区不卡| 成人三级伦理片| 精品国产亚洲AV| 久久精品在线观看视频| 五月天婷婷激情视频| 欧洲精品码一区二区三区免费看| 久久91亚洲人成电影网站| 欧美精三区欧美精三区| 国产精品久久久久永久免费观看| 艳母动漫在线看| 亚洲成人第一网站| 日韩av在线看免费观看| 苍井空浴缸大战猛男120分钟| 久久一区二区三区av| 4444欧美成人kkkk| 精品盗摄一区二区三区| 亚洲成a人片在线不卡一二三区 | 日本特黄a级片| 亚洲欧美成人一区| 国产精品91久久久久久| 在线看日韩欧美| 欧美日韩视频在线观看一区二区三区 | 视频一区视频二区视频| 国产精品成人播放| 中文字幕精品www乱入免费视频| 欧美在线影院一区二区| 中文av一区二区| 国产一区不卡精品| 蜜臀av中文字幕| 波多野结衣办公室双飞| 中国老女人av| 国产伦精品一区二区三区视频孕妇| 久久久噜噜噜久久久| 亚洲天堂男人天堂女人天堂| 欧美久久久影院| 色婷婷国产精品综合在线观看| 国产精品少妇自拍| 成人妖精视频yjsp地址| 亚洲精品自拍网| 欧美尺度大的性做爰视频| 精品福利一二区| 欧美中文字幕一区| 中文字幕一区二区免费| 亚洲天堂网一区二区| aaa一级黄色片| 黄色一级二级三级| 97视频在线免费| 中文字幕日韩一区二区三区| 日本黄网免费一区二区精品| 动漫一区二区在线| 国产精自产拍久久久久久| 欧美亚洲第一页| 国内精品久久久久久久久| 久久综合久久88| 日韩在线观看网址| 国产一区二区三区中文 | 国产精品美女在线播放| 精品视频高清无人区区二区三区| 91久久久久久久一区二区| 国产精品高清在线| 奇门遁甲1982国语版免费观看高清| 久久精品视频导航| 中文字幕综合在线| 在线视频国产日韩| 亚洲午夜激情免费视频| 亚洲日韩中文字幕| 亚洲国产欧美一区二区丝袜黑人 | 美国黄色一级毛片| 国产av一区二区三区传媒| 日本黄色的视频| 亚洲涩涩在线观看| 超碰人人草人人| 久久久久久国产精品日本| 欧美精品色视频| 欧美性生交xxxxx| av免费观看不卡| 精品黑人一区二区三区观看时间| av无码av天天av天天爽| www.自拍偷拍| 国产在视频线精品视频| 蜜臀久久99精品久久久久久| 公肉吊粗大爽色翁浪妇视频| 国产中文字幕久久| 欧美成人精品欧美一| 中国一级特黄毛片| 亚洲 日本 欧美 中文幕| 国产一区二区波多野结衣| 一级全黄裸体免费视频| 亚洲av无码国产精品永久一区 | 精品一区二区三区在线视频| 国产美女在线精品| 久久九九久精品国产免费直播| 国产女人18毛片水真多成人如厕 | 天天干天天干天天| 激情综合色综合久久| 成人在线免费网站| 波多野结衣影片| 国产亚洲欧美日韩一区二区| 老熟妇一区二区三区| 国产精品高清网站| 丰满肉嫩西川结衣av| 中文字幕日韩av电影| 日韩精品免费一区| 亚洲精品你懂的| 欧美久久在线观看| 国产精品一区免费视频| 97视频热人人精品| 麻豆精品新av中文字幕| 国产综合18久久久久久| 国产伦精品一区二区三区视频青涩| 亚洲欧美另类人妖| 992在线观看| 一区二区三区四区乱视频| 日产国产精品精品a∨| 久久99精品国产91久久来源 | 成人视屏免费看| 亚洲一卡二卡区| 中文在线一区二区| 91视频免费观看网站| 国产精品久久久久久久美男| 不卡av中文字幕| 成人女保姆的销魂服务| 久久综合五月| 欧美视频在线免费播放| 日韩一区和二区| 日本三级黄色大片| 精品人伦一区二区三区蜜桃网站| 8x8x最新地址| 欧美一区二区在线播放| 一区二区日韩在线观看| 精品一区二区三区日本| 日韩精品免费在线观看| 国产精品国产馆在线真实露脸 | 国产一区二区三区视频免费观看| 在线视频观看一区二区|