色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

一文看盡2019年NLP前沿突破

十三 發自 凹非寺
量子位 報道 | 公眾號 QbitAI

2019年,自然語言處理(NLP)都取得了哪些突破?

提到NLP,BERT可以說是家喻戶曉。

在情感分析、問答、句子相似度等多個 NLP 任務上都取得了優異的成績。

而且,無論是在類似于Kaggle這樣的競賽,或者媒體報道中,也總能看到它的身影。

它發表于2018年末,自那之后的一年,NLP和NLU(自然語言理解)領域有了較大的發展。

那么,以BERT的發布作為時間節點,本文便梳理了一下在此之前和之后,NLP領域的重要項目和模型。

BERT之前的一些主要 NLP 項目時間表

在提出BERT模型之前,NLP領域中的主要項目按時間排序,如下圖所示:

Word2Vec模型發布于2013年1月,至今也是非常流行。

在任何NLP任務中,研究人員可能嘗試的第一個模型就是它。

https://arxiv.org/abs/1301.3781

FastTextGloVe分別于2016年7月和2014年1月提出。

FastText是一個開源的、免費的、輕量級的庫,它允許用戶學習文本表示和文本分類器。

https://fasttext.cc/

GloVe是一種無監督的學習算法,用于獲取單詞的向量表示。

https://nlp.stanford.edu/projects/glove/

Transformer于2017年6月提出,是一種基于 encoder-decoder 結構的模型。

在機器翻譯任務上的表現超過了 RNN,CNN,只用 encoder-decoder 和 attention 機制就能達到很好的效果,最大的優點是可以高效地并行化。

https://ai.googleblog.com/2017/08/transformer-novel-neural-network.html

ELMo于2018年2月提出,利用預訓練好的雙向語言模型,然后根據具體輸入從該語言模型中可以得到上下文依賴的當前詞表示,再當成特征加入到具體的NLP有監督模型里。

https://allennlp.org/elmo

還有一個叫Ulmfit,是面向NLP任務的遷移學習模型,只需使用極少量的標記數據,文本分類精度就能和數千倍的標記數據訓練量達到同等水平。

https://arxiv.org/abs/1801.06146

值得注意的是,ELMo和Ulmfit出現在BERT之前,沒有采用基于Transformer的結構。

BERT

BERT模型于2018年10月提出。

全稱是Bidirectional Encoder Representation from Transformers,即雙向Transformer的Encoder(因為decoder不能獲取要預測的信息)。

△論文地址:https://arxiv.org/abs/1810.04805

模型的主要創新點都在pre-train方法上,即用了Masked LM和Next Sentence Prediction兩種方法分別捕捉詞語和句子級別的表示。

谷歌甚至開始使用BERT來改善搜索結果。

奉上一份較為詳細的BERT模型教程:
http://jalammar.github.io/illustrated-bert/

預訓練權重相關內容可以從官方 Github repo 下載:
https://github.com/google-research/bert

Bert 也可以作為 Tensorflow hub 模塊:
https://tfhub.dev/google/collections/bert/1

文末還會奉上各種非常實用的庫。

BERT之后的一些主要 NLP 項目時間表

在谷歌提出BERT之后,NLP領域也相繼出了其他較為突出的工作項目。

Transformer-XL

Transormer-XL是Transformer的升級版,在速度方面比Transformer快1800多倍。

這里的XL,指的是extra long,意思是超長,表示Transformer-XL在語言建模中長距離依賴問題上有非常好的表現。同時,也暗示著它就是為長距離依賴問題而生。

長距離依賴問題,是當前文本處理模型面臨的難題,也是RNN失敗的地方。

相比之下,Transformer-XL學習的依賴要比RNN長80%。比Vanilla Transformers快450%。

在短序列和長序列上,都有很好的性能表現。

https://arxiv.org/abs/1901.02860

GPT-2

GPT-2可以說是在BERT之后,媒體報道最為關注的一個NLP模型。

這是OpenAI發布的一個“逆天”的語言AI,整個模型包含15億個參數。

無需針對性訓練就能橫掃各種特定領域的語言建模任務,還具備閱讀理解、問答、生成文章摘要、翻譯等等能力。

而且,OpenAI最初還擔心項目過于強大,而選擇沒有開源。但在10個月之后,還是決定將其公布。

https://cdn.openai.com/better-language-models/language_models_are_unsupervised_multitask_learners.pdf

ERNIE

ERNIE是基于百度自己的深度學習框架飛槳(PaddlePaddle)搭建的,可以同時利用詞匯、句法和知識信息。

實驗結果顯示,在不同的知識驅動任務取得了顯著的改進,同時在其它常見任務上與現有的BERT模型具有可比性。

當前,ERNIE 2.0版本在GLUE排行榜上排名第一。
https://github.com/PaddlePaddle/ERNIE

XLNET

XLNet 是一個類似BERT的模型,是一種通用的自回歸預訓練方法。

它不使用傳統 AR 模型中固定的前向或后向因式分解順序,而是最大化所有可能因式分解順序的期望對數似然。

其次,作為一個泛化 AR 語言模型,XLNet不依賴殘缺數據。

此外,XLNet還改進了預訓練的架構設計。

https://arxiv.org/abs/1906.08237

RoBERTa

RoBERTa由Facebook提出。

它在模型層面沒有改變谷歌的BERT,改變的只是預訓練的方法。

在模型規模、算力和數據上,與BERT相比主要有以下幾點改進:

更大的模型參數量:模型使用 1024 塊 V100 GPU 訓練了 1 天的時間。

更大bacth size:RoBERTa在訓練過程中使用了更大的bacth size,嘗試過從 256 到 8000 不等的bacth size。

更多的訓練數據:包括CC-NEWS 等在內的160GB純文本。

https://arxiv.org/abs/1907.11692

Salesforce CTRL

CTRL全名是Conditional Transformer Language,包含16億個參數。

它具有強大且可控的人工文本生成功能,可以預測哪個訓練數據子集對生成的文本序列影響最大。

通過識別模型中最有影響力的訓練數據來源,為分析大量生成的文本提供了一種潛在的方法。

CTRL還可以通過微調特定任務或轉移模型已學習的表示形式來改進其他NLP應用程序。

https://blog.einstein.ai/introducing-a-conditional-transformer-language-model-for-controllable-generation/

ALBERT

ALBERT是谷歌發布的輕量級BERT模型。

比BERT模型參數小18倍,性能還超越了它,在SQuAD和RACE測試上創造了新的SOTA。

前不久,谷歌還對此進行了升級,發布了ALBERT 2和中文版本。

在這個版本中,“no dropout”、“additional training data”、“long training time”策略將應用到所有的模型。

從性能的比較來說,對于ALBERT-base、ALBERT-large和ALBERT-xlarge,v2版要比v1版好得多。

說明采用上述三個策略的重要性。

https://arxiv.org/abs/1909.11942

性能評測基準

評估這些語言模型的方法之一是Glue Benchmark

它包括評估模型的各種NLP任務,如分類、問答等。

在Glue Benchmark剛剛發布的時候,BERT模型的性能位居榜首。

但截至2020年1月2日,在僅僅1年時間內,BERT已經排名到了19位。

現在還有一個 SuperGlue 基準測試,它包含了更難理解的語言任務。

對于評估問題回答系統,SQuAD是較為常用的。

BERT和基于transformer模型在此處的性能是較好的。

其它與BERT相關項目

DistilBERT

DistilBERT是HuggingFace發布的小型NLP transformer模型,與BERT的架構類似,不過它僅使用了 6600 萬參數,但在 GLUE 基準上實現了BERT 95% 的性能。

https://arxiv.org/abs/1910.01108

Megatron-LM

Megatron-LM是英偉達發布的NLP模型。

英偉達用自己的硬件與并行計算軟件相結合,當時創下了三項紀錄:

訓練速度只需53分鐘;
推理速度只需2.2ms;
包含83億參數。

https://github.com/NVIDIA/Megatron-LM

BioBERT

BioBERT是用于生物醫學文本挖掘的預訓練生物醫學語言表示模型。

在生物醫學語料庫上進行預培訓時,它在各種生物醫學文本挖掘任務上的表現,在很大程度上超過了BERT和之前的先進模型。

https://github.com/dmis-lab/biobert

CamemBERT

CamemBERT是一種基于RoBERTa 結構的法語語言模型。

https://camembert-model.fr/

NLP庫

下面是作者認為需要了解的一些NLP庫。

Spacy

Spacy 是一個流行的、快速的NLP程序庫,可以處理各種自然語言處理任務,如標記、詞性等。它還提供了預先訓練的NER等模型。

https://spacy.io/

HuggingFace Transformers

它是首批提供 BERT Pytorch實現的庫之一,最初被稱為“ Pytorch-pretrained-BERT”。

后來,他們增加了更多的模型,如GPT-2,XLNET等。

在不到一年的時間里,它已經成為最流行的 NLP 庫之一,并且使得BERT和其他模型的使用變得更加容易。

https://github.com/huggingface/transformers

AllenNLP

AllenNLP是來自艾倫人工智能研究所(Allen Institute of AI)的NLP庫,基于PyTorch。

https://allennlp.org/

Flair

Flair也是一個帶有 NER、 POS 等模型的 NLP 庫,還支持 BERT、 ELMO、 XLNET 等嵌入。

https://github.com/flairNLP/flair

GluonNLP

GluonNLP是Apache MXNet 上的NLP工具包,是最早包含預先訓練的BERT嵌入式的庫之一。

https://gluon-nlp.mxnet.io/

那么,在2020年,NLP又會怎樣的突破呢?

傳送門

https://towardsdatascience.com/2019-year-of-bert-and-transformer-f200b53d05b9

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
欧美一级在线免费观看| 性金发美女69hd大尺寸| 日韩精品在线中文字幕| 免费看日韩毛片| 国产乱码精品一品二品| 成人激情免费电影网址| 欧美大片一区二区| 中文字幕第一页亚洲| 免费在线观看成年人视频| 69精品久久久| 免费成人av在线| 国产欧美视频在线观看| 日韩国产精品一区二区| 毛葺葺老太做受视频| 亚洲精品国产精品国自| 色婷婷中文字幕| 午夜欧美在线一二页| 欧美国产日韩一区| 女人十八毛片嫩草av| 国产精品久久综合| 国产91免费观看| 国产伦精品一区二区免费| 欧美视频在线免费| 精品国产一区二区三区麻豆免费观看完整版 | 精品日本一区二区三区| 可以在线看黄的网站| 国产情侣自拍av| 欧美国产一区在线| 色偷偷9999www| 日韩欧美视频网站| 精品国产av一区二区三区| 中文字幕免费观看一区| 亚洲福利在线观看| 色乱码一区二区三区熟女| 91久久线看在观草草青青| 女人又爽又黄免费女仆| 国产一区在线观看麻豆| 中文字幕亚洲综合| 黄色片视频在线免费观看| 精品区在线观看| 欧美在线影院一区二区| 日韩欧美一区二区三区四区| 欧美一区二区三区粗大| 国产免费成人在线视频| 国产超碰91| 国产黄色片免费观看| 久久精品亚洲国产| 国产呦小j女精品视频| 精品福利在线视频| 欧美久久在线观看| 日本午夜一区二区| 一区二区三区黄色| 亚洲成a人片在线www| 久久先锋影音av| 91超碰在线电影| 欧美亚洲另类小说| 欧美成人伊人久久综合网| 无码日韩人妻精品久久蜜桃| 国产98色在线|日韩| 国产精品美女久久| 中文天堂在线视频| 不卡日韩av| 国产麻豆精品久久一二三| 国产欧美一区二区在线播放| 国产在线一二区| 欧美性猛交99久久久久99按摩| 日韩精品国内| 精品毛片三在线观看| 成人黄色片在线观看| 奇米影视亚洲色图| 日韩一区二区高清视频| 亚洲一区二区三区色| 国产日韩在线精品av| 九九热这里只有在线精品视| 亚洲免费资源在线播放| 国产精品久久久久久久久毛片| 国产精品高清一区二区三区| 色综合天天综合色综合av| 中文字幕免费高清在线观看| www.男人天堂网| 国产亚洲精品91在线| 国产激情一区二区三区四区| 国产一级做a爱免费视频| 97视频资源在线观看| 婷婷av一区二区三区| 国产一区二区精品免费| 国产女同性恋一区二区| 久久中文免费视频| 国产性生交xxxxx免费| 91高清免费在线观看| 欧美日韩国产系列| 99九九99九九九视频精品| 成人性视频网站| 99久久精品免费观看| 日韩美女啊v在线免费观看| 中文字幕欧美日韩一区| 日韩精品五月天| 成人免费看片98| 欧美视频1区| 国产精品视频永久免费播放| 精品国产一区二区三区四区四 | 成人激情视频在线| 日韩欧美一二三四区| 久久久久久9| 欧日韩免费视频| 色噜噜偷拍精品综合在线| 久久精品视频8| 日本美女爱爱视频| 狠狠久久亚洲欧美| 一道本无吗一区| 免费在线看成人av| 国产一区二区三区免费看| 国产一区二区三区在线观看免费| 欧美成欧美va| 午夜肉伦伦影院| 99久久精品免费看国产一区二区三区 | 国产成人精品av在线观| koreanbj精品视频一区| 日韩一级在线观看| 香蕉国产在线视频| 日本a级片免费观看| 色青青草原桃花久久综合| 欧美一区二区在线免费播放| 亚洲激情校园春色| 性做久久久久久久| 欧美成人精品网站| 天天爱天天做天天爽| 级毛片内射视频| 久久久久久亚洲中文字幕无码| 天天综合天天添夜夜添狠狠添| 成人在线激情视频| 亚洲国产精品va在线看黑人动漫| 在线观看不卡一区| 亚洲欧美一区二区三| 在线免费观看视频黄| 成人在线视频电影| 99久久国产宗和精品1上映| 日韩在线综合网| 亚洲影院色在线观看免费| 5278欧美一区二区三区| 一区二区三区四区在线观看视频| 99久久精品国产成人一区二区| 在线观看国产黄| 国产一区二区三区在线免费| 9色porny| 7777在线视频| 制服丝袜第二页| 国产成人在线免费观看视频| 五月天久久久久久| 一区二区三区www污污污网站| 一卡二卡三卡四卡| 欧美日韩人妻精品一区在线| 亚洲一区二区偷拍| 欧美美女性视频| 国产精品中文字幕久久久| 88国产精品欧美一区二区三区| 任我爽在线视频精品一| 98国产高清一区| 国产热re99久久6国产精品| 国产99在线播放| 成人欧美在线观看| 麻豆国产精品va在线观看不卡| 国产极品精品在线观看| 国产精品亚发布| 无人码人妻一区二区三区免费| 国产精品伦一区二区三区| 欧美这里有精品| 国产精品女人网站| 色999日韩自偷自拍美女| 国产乱子伦精品视频| 日韩精品一区二区三区色偷偷| 尤物国产精品| 别急慢慢来1978如如2| 性生活在线视频| 青青草原亚洲| 色综合电影网| 国产女主播av| 日本一二三区视频| 中文区中文字幕免费看| 一级aaaa毛片| 精品一区二区三区在线观看| 久久视频一区| 丰满大乳国产精品| 亚洲黄色av一区| 日韩在线精品视频| 日韩av福利在线观看| 秋霞影院一区二区| 亚洲免费视频网站| 日韩 欧美 视频| 亚洲乱色熟女一区二区三区| 久久网这里都是精品| 在线免费精品视频| 日韩欧美中文字幕精品| 欧美激情手机在线视频| 亚洲影院污污.| 黑人玩弄人妻一区二区三区| 波多野结衣家庭教师在线| 一区二区三区入口| 美女伦理水蜜桃4| 国产成人无码www免费视频播放| 成人午夜伦理影院| 亚洲永久免费视频| 精品国产乱码久久| 国产美女扒开尿口久久久| 4p变态网欧美系列| 欧美不卡三区| 欧美偷拍一区二区三区| 日韩和欧美一区二区三区| 日韩精品一区二区三区视频| 一二三四视频社区在线| 久久精品盗摄| 日韩精品一二三四区| 国产精品h视频| 精品爆乳一区二区三区无码av| 欧美一区二区三区网站| 日本久久电影网| 欧美日韩精品免费在线观看视频| 欧美成人一区二区视频| 亚洲精品第一国产综合精品| 亚洲欧美另类动漫| 久久国产直播| 欧美色另类天堂2015| 欧美成人精品不卡视频在线观看| 国产自产在线视频一区| 中文字幕第三区| 国产同性人妖ts口直男| 欧美色精品天天在线观看视频| 精品成a人在线观看| 最好看的2019年中文视频| 欧美—级高清免费播放| 成人国产亚洲精品a区天堂华泰| 色狠狠久久av五月综合|| aaa黄色大片| 久久精品久久综合| 疯狂蹂躏欧美一区二区精品| 91精品啪在线观看麻豆免费| aaaaaa毛片| 亚洲人成网站色ww在线| 欧美性大战久久久久xxx| 亚洲第一在线播放| 精品久久久一区| 色一情一区二区三区四区| 日韩一区二区三区不卡| 国产视频精品一区二区三区| www.在线观看av| 日韩伦人妻无码| 亚洲免费av观看| 在线精品播放av| 欧美污视频久久久| 农村黄色一级片| 在线视频1卡二卡三卡| 亚洲蜜桃精久久久久久久| 日韩精品欧美在线| 浴室偷拍美女洗澡456在线| 区一区二在线观看| 欧美日韩国产精品成人| 久久久综合av| 国产97色在线 | 日韩| 日韩精品色哟哟| 伦伦影院午夜日韩欧美限制| www.夜夜爽| 国产在线精品免费av| 欧美黄色www| 婷婷激情四射网| 亚洲精品福利网站| 日韩精品在线看| 日韩欧美中文在线视频| 亚洲精品成人精品456| 天天天干夜夜夜操| 91久久一区二区| 三级黄色录像视频| 久久精品国产v日韩v亚洲 | 欧美xxxx黑人| 日本一区二区三区dvd视频在线| 免费av一区二区| eeuss中文字幕| 一区二区三区四区不卡在线| 欧美一区二区视频17c| 少妇高潮久久久| 欧美色综合网站| 欧洲精品久久| 高清乱码毛片入口| 国产综合18久久久久久| 精品人妻久久久久一区二区三区| 日韩精品一区二区视频| 人妻体内射精一区二区三区| 第一福利永久视频精品 | 高潮毛片无遮挡| 色狠狠色狠狠综合| а 天堂 在线| 亚洲国产精品女人久久久| 国产黄色片免费看| 99免费在线观看视频| 亚洲人精品午夜| www激情五月| 日韩欧美aaaaaa| 摸摸摸bbb毛毛毛片| 在线播放91灌醉迷j高跟美女 | 国产精品扒开腿做| 免费看毛片网站| 精品久久久国产精品999| 日韩精品免费一区| 91色视频在线| 91美女高潮出水| 91好色先生tv| 欧美精品情趣视频| 蜜桃传媒麻豆第一区在线观看| 欧美精品与人动性物交免费看| 亚洲欧美另类久久久精品| 色偷偷中文字幕| 色婷婷av一区二区三区软件| 一级做a爰片久久| 国产一区二区在线观看免费| 97人人干人人| 91在线观看地址| 99热这里只有精品2| 欧美日韩和欧美的一区二区| 福利视频999| 欧美日精品一区视频| 欧美成人乱码一二三四区免费| 久久久亚洲高清| 亚洲综合网中心| 成人综合在线网站| 玩弄中年熟妇正在播放| 综合久久给合久久狠狠狠97色| 国产在线一区二| 日批免费在线观看| 欧美影院久久久| 日韩黄色一级片| 日产中文字幕在线精品一区 | 色域天天综合网| 妺妺窝人体色www在线小说| 亚洲免费看黄网站| 成人黄色a级片| 最近2019中文字幕一页二页| 精品人妻少妇AV无码专区| 粗暴蹂躏中文一区二区三区| 国产女人高潮的av毛片| 亚洲乱码一区二区三区三上悠亚| 91免费在线视频观看| 一区二区在线观看免费视频| 国产亚洲精品美女久久久m| 欧美精品粉嫩高潮一区二区| 精品一区二区三区视频在线观看 | 69堂国产成人免费视频| 天天操夜夜操av| 久久久久久久999| 国产乱人伦偷精品视频免下载| 亚洲国产一区二区三区在线播 | 国产在线精品一区| 中文字幕免费不卡| 亚洲成人日韩在线| 国产ts一区二区| 中文字幕二三区不卡| 一卡二卡三卡视频| 欧美成人免费网站| 久久久精品毛片| 中文字幕一区二区三区精彩视频| 亚洲另类中文字| 欧美交换配乱吟粗大25p| 日韩二区三区在线| 久久精品女人天堂| 欧美一级欧美一级| 欧美一区二区三区人| 成人午夜免费影院| 久久这里有精品视频| 国产精品欧美综合| 亚洲精品不卡| 亚洲一区二区影院| 精品成人a区在线观看| 韩剧1988在线观看免费完整版| 久久精品人人做人人爽电影| www日韩在线观看| 青青草免费av| 日韩va亚洲va欧美va久久| 国产日韩影视精品| 精品久久久久久久一区二区蜜臀| 日本高清不卡在线| 激情六月天婷婷| 伊人影院综合网| 五月婷婷丁香六月| 亚洲一区在线视频观看| 中文字幕亚洲国产| 九九九九精品| 一区二区三区四区毛片| 成人免费视频国产免费| 99精品黄色片免费大全| 日韩一区和二区| 国产日韩av在线| 爱情岛论坛vip永久入口| 六月丁香在线视频| 成人免费观看av| 欧美一区二区三区喷汁尤物| 国产精品久久久久久亚洲调教| 日本中文字幕网址| 国产午夜精品无码| 国产成a人无v码亚洲福利| 欧美久久久久久久久久| 国产精品96久久久久久| 免费在线观看日韩视频| 国产专区第一页| 26uuu精品一区二区在线观看| 精品电影一区二区| 岛国一区二区三区高清视频| 亚洲国产日韩在线一区| 午夜精品一区二区三| 亚洲国产精品一区二区久久 | 中文字幕日产av| av成人老司机| 国产高清成人久久|