色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

一塊RTX3050搞定DLRM訓練!僅需1%Embedding參數,硬件成本降低至百分之一 | 開源

Colossal-AI又上新

深度推薦模型(DLRMs)已經成為深度學習在互聯網公司應用的最重要技術場景,如視頻推薦、購物搜索、廣告推送等流量變現業務,極大改善了用戶體驗和業務商業價值。

但海量的用戶和業務數據,頻繁地迭代更新需求,以及高昂的訓練成本,都對DLRM訓練提出了嚴峻挑戰。

在DLRM中,需要先在嵌入表(EmbeddingBags)中進行查表(lookup),再完成下游計算。

嵌入表常常貢獻DLRM中99%以上的內存需求,卻只貢獻1%的計算量。

借助于GPU片上高速內存(High Bandwidth Memory)和強大算力的幫助,GPU成為DLRM訓練的主流硬件。

但是,隨著推薦系統研究的深入,日益增長的嵌入表大小和有限的GPU顯存形成顯著矛盾。如何讓利用GPU高效訓練超大DLRM模型,同時突破GPU內存墻的限制,已成為DLRM領域亟待解決的關鍵問題。

Colossal-AI此前已成功利用異構策略將相同硬件上訓練NLP模型的參數容量提升上百倍,近期成功將其拓展到推薦系統中,通過軟件緩存(Cache)方法在CPU 和 GPU 內存中動態存儲嵌入表。

基于軟件Cache設計,Colossal-AI還添加流水預取,通過觀察未來即將輸入的訓練數據,降低軟件Cache檢索和數據移動開銷。

同時,它以同步更新方式在 GPU 上訓練整個 DLRM模型,結合廣泛使用的混合并行訓練方法,可以擴展到多個 GPU。

實驗表明,Colossal-AI僅需在 GPU 中保留 1% 的嵌入參數,仍能保持優秀的端到端訓練速度。

相比PyTorch其他方案,顯存需求降低一個數量級,單塊顯卡即可訓練TB級推薦模型。

成本優勢顯著,例如僅需5GB顯存即可訓練占據91GB空間 Embedding Bag的DLRM,訓練硬件成本從兩張約20萬元的A100,降低至百分之一僅需2000元左右的RTX 3050等入門級顯卡。

開源地址:
https://github.com/hpcaitech/ColossalAI

現有的嵌入表擴展技術

嵌入表將離散的整型特征映射成連續的浮點特征向量,下圖展示了DLRM中的嵌入表訓練過程。

首先,在嵌入表中對每個特征查找Embedding Table對應的行,然后通過規約操作,比如max,mean, sum操作,變成一個特征向量,傳遞給后續的稠密神經網絡。

可見,DLRM的嵌入表訓練過程主要是不規則的內存訪問操作,因此嚴重受限于硬件訪存速度。

而工業級DLRM的嵌入表可能達到數百GB甚至TB級別,遠超單GPU最高數十GB的顯存容量。

突破單GPU的內存墻來增大DLRM的嵌入表規模有很多方法。

根據下圖展示的GPU集群的內存層級圖為例,讓我們來分析幾種常見方案的優劣。

GPU模型并行:

將嵌入表切分后分布在多個GPU的內存中,訓練中通過GPU之間互聯網絡同步中間結果。

這種方式的缺點首先是嵌入表切分負載并不均勻,擴展性問題難以解決。

其次,增加GPU的前期硬件成本大,而且DLRM訓練時GPU的計算能力并沒有被充分利用,而是僅僅利用了它的HBM帶寬優勢,導致GPU使用率不高。

CPU部分訓練:

將嵌入表分割成兩部分,一部分在GPU上訓練,另一部分在CPU上訓練。

通過利用數據分布的長尾效應,我們可以讓CPU計算比例盡可能少,讓GPU計算比例盡可能大。但是,隨著batch size增大,讓mini-batch的數據全部命中CPU或者GPU很困難,如果同時命中CPU或GPU這種方法很難處理。

另外,由于DDR帶寬和HBM相差一個數據量級,即使10%的輸入數據在CPU上訓練,整個系統也會有至少一半速度下降。

此外,CPU和GPU需要傳輸中間結果,這也有不小的通信開銷,進一步拖慢訓練速度。

因此,研究人員設計了異步更新等方式來避免這些性能缺陷,但是異步方式會造成訓練結果的不確定性,在實踐中并不是算法工程師的首選方案。

軟件Cache:

保證訓練全部在GPU上進行,嵌入表存在CPU和GPU組成的異構空間中,每次通過軟件Cache方式,將需要的部分換入GPU。

這種方式可以廉價擴展存儲資源,滿足嵌入表不斷增大的需求。

而且,相比使用CPU來計算,這種方式的整個訓練過程完全在GPU上完成,充分利用HBM帶寬優勢。但Cache的查詢、數據移動會帶來額外性能損耗。

目前已經有一些針對嵌入表優秀的軟件Cache方案實現,但是它們往往使用定制的EmbeddingBags Kernel實現,比如fbgemm,或者借助第三方深度學習框架。

而Colossal-AI在原生PyTorch基礎上不做任何Kernel層次改動,提供了一套開箱用的軟件Cache EmbeddingBags實現,還進一步針對DLRM訓練流程進行優化,提出預取流水來進一步降低Cache開銷。

△Memory Hierarchy

Colossal-AI的嵌入表軟件Cache

Colossal-AI實現了一個軟件Cache并封裝成nn.Module提供給用戶在自己模型中使用。

DLRM的嵌入表,一般是由多個Embedding組成的EmbeddingBags,駐留在 CPU 內存中。

這部分內存空間被命名為CPU Weight。而EmbeddingBags一小部分數據存儲在 GPU內存中,它包括即將被訓練用到的數據。

這部分內存空間被命名為CUDA Cached Weight。

在 DLRM 訓練期間,首先需要確定本次迭代輸入mini-batch的數據所對應嵌入表的行,如果有的行不在GPU中,需要將它們從CPU Weight傳輸到 CUDA Cached Weight中。

如果GPU中沒有足夠的空間,它會使用LFU算法,根據訪問緩存的歷史頻率來淘汰被使用最少數據。

為了實現Cache的檢索,需要一些輔助數據結構幫忙:cached_idx_map是一維數組,存儲CPU Weight中行號和CUDA Cached Weight的行號對應關系,以及對應行在GPU被訪問的頻率信息。

CUDA Cached Weight 大小與 CPU Weight 大小的比值命名為 cache_ratio,默認為1.0%

Cache在每個迭代forward之前運行,以調整CUDA Weight中的數據,具體來說分三個步驟。

Step1:CPU索引

檢索CPU Weight中需要被Cache的行號。

它需要對輸入mini-batch的input_ids和cached_idx_map取交集,找到CPU Weight中需要從CPU移動到GPU的行號。

Step2:GPU索引

根據使用頻率找到CUDA Weight中可以被驅逐的行。

這需要我們根據頻率以從低到高順序,對cache_idx_map和input_ids取差集合之后的部分進行top-k(取最大值k個數)操作。

Step3:數據搬運:

將CUDA Cached Weight中的對應行移動到CPU Weight中,然后將CPU Weight中的對應行移動到CUDA Weight中。

數據傳輸模塊負責CUDA Cached Weight和CPU Weight之間的數據雙向傳輸。

不同于低效的逐行傳輸,它采用先緩存再集中傳輸方式來提升PCI-e的帶寬利用率。

分散在內存中的嵌入行在源設備的本地內存中集中為連續的數據塊,然后塊在 CPU 和 GPU 之間傳輸,并分散到目標內存的相應位置。以塊為單位移動數據可以提高 PCI-e 帶寬利用率,merge和scatter操作只涉及CPU和GPU的片上內存訪問,因此開銷并不是很大。

Colossal-AI用一個尺寸受限的緩沖區來傳輸CPU和GPU之間數據。

在最壞的情況下,所有輸入 id 都未命中緩存cache,那就需要需要傳輸大量元素。為了防止緩沖區占用過多內存,緩沖區大小被嚴格限制。如果傳輸的數據大于緩沖區,會分為多次完成傳輸。

△Cached EmbeddingBag Workflow

軟件Cache性能分析

上述Cache Step1和Step2的操作都是訪存密集的。

因此為了能利用GPU的HBM的帶寬,它們是在GPU上運行的,并使用深度學習框架封裝好的API來實現。盡管如此,與嵌入表在GPU上的訓練操作相比,Cache操作的開銷尤為突出。

比如在一次總計199秒訓練任務中,Cache操作的開銷為99秒,占比總計算時間接近50%

經過分析,Cache的主要開銷主要是Step1和Step2引起。下圖base位置展示了此時的Cache開銷時間分解,Cache的step1,2 紅色和橙色兩階段占Cache總開銷的70%。

△Cache操作的時間分解

而上述問題的原因,是因為傳統的Cache策略有些“短視”,只能根據當前mini-batch情況調整Cache,因此大部分時間浪費在查詢操作上。

Cache流水預取

為了縮減Cache的開銷,Colossal-AI設計了一套“高瞻遠矚”的Cache機制。與其只對前mini-batch進行Cache操作,Colossal-AI預取后續將會被使用的若干mini-batch,統一進行Cache查詢操作。

如下圖所示,Colossal-AI使用預取來合并多個mini-batch數據統一進行Cache操作,同時采用流水線方式來重疊數據讀取和計算的開銷。

例子中預取mini-batch數量是2。在開始訓練前,先從磁盤讀取mini-batch 0,1數據到GPU內存,隨后開始Cache操作,然后執行這兩個mini-batch的正、反向傳播和參數更新。

與此同時,可以和對mini-batch 2,3的開始數據讀取,這部分開銷可以和計算重疊。

和baseline Cache執行方式相比,圖【Cache操作的時間分解】對比了prefetch 8個mini-batch和baseline的Cache時間分解。

訓練總時間從201秒下降到120秒,圖中所示的Cache階段操作時間占比也顯著下降。可以看到和每個mini-batch獨立進行Cache操作相比,各部分時間都減少了,尤其是Cache的前兩步操作。

總結起來,Cache流水預取帶來兩個好處。

1、攤薄Cache索引開銷

預取最顯而易見的好處是減少了Step1和Step2的開銷,使這個兩步操作在總的訓練過程占比小于5%。如【Cache操作的時間分解】所示,通過預取8個mini-batch數據,和沒有預取的baseline相比,Cache查詢的開銷顯著降低。

2、增加CPU-GPU數據移動帶寬

通過集中更多數據,提升數據傳輸粒度,從而充分利用CPU-GPU傳輸帶寬。對于上面例子,CUDA->CPU帶寬從860MB/s提升到1477 MB/s,CPU->CUDA帶寬從1257 MB/s提升到 2415 MB/s,幾乎帶來了近一倍的性能增益。

便捷使用

和Pytorch EmbeddingBag用法一致,在構建推薦模型時,僅需如下數行代碼進行初始化,即可大幅提升嵌入表容納量,低成本實現TB級超大推薦模型訓練。

bash

from colossalai.nn.parallel.layers.cache_embedding import CachedEmbeddingBag
emb_module = CachedEmbeddingBag(
num_embeddings=num_embeddings,
embedding_dim=embedding_dim,
mode=”sum”
include_last_offset=True,
sparse=True,
_weight=torch.randn(num_embeddings, embedding_dim),
warmup_ratio=0.7,
cache_ratio = 0.01,
)

性能測試

NVIDIA A100 GPU (80GB)和AMD EPYC 7543 32-Core Processor (512GB)硬件平臺上,Colossal-AI以Meta的DLRM模型作為測試目標,用超大數據集Cretio 1TB和Meta的dlrm_datasets生成數據集作為測試模型。

實驗中采用將嵌入表全部存儲GPU上的PyTorch訓練速度作為baseline。

Cretio 1TB

Cretio 1TB嵌入表總共177944275行,設置embedding dim=128,其嵌入表內存需求91.10 GB

想把EmbeddingBags全部存儲在單個GPU內存中,即使是最高端的英偉達A100 80GB也無法滿足其內存需求。

但使用Colossal-AI仍然在單GPU上完成訓練,當cache ratio=0.05,顯存消耗僅為5.01 GB,直接降低約18倍,可進一步擴展到在單張GPU上實現TB級推薦系統模型的訓練。

在訓練速度上,如下圖所示,展示了不同batch size下訓練100M個樣本的延遲。

綠色Prefetch1是不使用預取,藍色Prefetch8是使用預取(prefetch mini-batch=8)的延遲,可見預取流水優化對整體性能提升發揮了重要作用。

圖中每個柱子深色部分為Cache開銷,使用預取后,Cache開銷控制在訓練總時間的15%范圍內。

多GPU擴展性

用8192作為全局batch size,在8張GPU卡上使用table-wise sharding作為EmbeddingBags并行方式訓練DLRM,訓練100M samples。

此時設置Prefetch大小為4,ColossalAI-mem-cr0.05是cache ratio=0.05,ColossalAI-mem-cr0.5=0.5。

下圖展示了不同GPU情況下的訓練延遲。除了1 GPU時PyTorch OOM無法訓練之外,其余情況PyTorch和Colossal-AI訓練時間類似。

可以觀察到使用4和8 GPU并沒有帶來明顯性能提升,這是因為:

  1. 同步結果需要通信開銷巨大。
  2. table-wise sharding會導致切分負載不均衡。也說明使用多GPU來擴展embedding table訓練擴展性并不是很好。

下圖展示了顯存使用,顯存使用在不同卡上并不相同,這里展示最大顯存數值。

在僅使用一張GPU時,只有Colossal-AI的軟件Cache方法可以訓練,多卡并行的占用內存也顯著減少數倍。

Meta Research的合成數據集dlrm_datasets模仿了工業界嵌入表的訓練訪問行為,因此常在研究中作為推薦系統相關的軟硬件設計的測試參考。

選取其中的5億行嵌入表項的作為子數據集,構造256GB和128GB大小的兩個EmbeddingBags用于測試。

PyTorch由于顯存內存不足無法在單卡A100上訓練。作為對比, Colossal-AI的軟件cache將顯著降低GPU內存需求,足以訓練大至256GB的嵌入表,并可進一步擴展至TB級別。

而且,流水預取也能體現出加速效果,當預取數為32時,相比沒有預取總時間下降60%,而且對GPU的存儲的需求卻沒有增大。

One More Thing

面向大模型時代的通用深度學習系統 Colossal-AI,通過多項自研領先技術如高效多維自動并行、異構內存管理、大規模優化庫、自適應任務調度等實現高效快速部署AI大模型訓練和推理,降低AI大模型應用成本。

Colossal-AI相關解決方案已成功在自動駕駛、云計算、零售、醫藥、芯片等行業知名廠商落地應用,廣受好評。

Colossal-AI注重開源社區建設,提供中文教程,開放用戶社群及論壇,對于用戶反饋進行高效交流與迭代更新,不斷添加PaLM、AlphaFold、OPT等前沿應用。

自然開源以來,Colossal-AI已經多次在GitHub及Papers With Code熱榜位列世界第一,與眾多已有數萬star的明星開源項目一起受到海內外關注!

項目開源地址:
https://github.com/hpcaitech/ColossalAI

參考鏈接:
https://ai.facebook.com/blog/dlrm-an-advanced-open-source-deep-learning-recommendation-model/

本文參考自:
https://medium.com/@yangyou_berkeley/embedding-training-with-1-gpu-memory-and-10-times-less-budget-an-open-source-solution-for-6b4c3aba07a8

觀點為作者所有。

版權所有,未經授權不得以任何形式轉載及使用,違者必究。

相關閱讀

国产成人精品在线观看| 91精品欧美福利在线观看| 日韩av大片免费看| 69xxx免费| 成人午夜在线视频| 国产欧美在线一区二区| 国产精品日日夜夜| 精品在线小视频| 无码少妇一区二区| 日韩电影免费观看中文字幕| 少妇一级淫免费放| 国产精品一区二区在线看| 91视频免费在线| 中文字幕黄色片| 色婷婷综合成人av| 欧美黑人一级片| 五月天亚洲精品| 麻豆精品视频| 久久精品一区| 91大神福利视频在线| 国产精品国产三级国产专区52| 日韩精品在线免费播放| 色欲人妻综合网| 亚洲第一精品夜夜躁人人爽| 污污内射在线观看一区二区少妇| 一区二区三区在线视频观看| 经典三级在线视频| 毛片av中文字幕一区二区| 欧美最猛性xxxx| 99在线精品视频免费观看软件| 中文字幕国产日韩| 天堂网avav| 亚洲午夜国产一区99re久久| 五月天亚洲综合情| 亚洲国产精品国自产拍av| 色一情一乱一乱一区91| 国产99久一区二区三区a片| 91精品国产九九九久久久亚洲| 久久老司机精品视频| 国产午夜精品免费一区二区三区 | 欧美大胆一级视频| 日韩欧美一区二区三区四区五区| 91视视频在线观看入口直接观看www| 亚洲国产成人不卡| 成人欧美一区二区三区白人| 三上悠亚在线一区| 亚洲精美色品网站| 日韩在线视频网址| 国产mv免费观看入口亚洲| 国产一区二区三区四| 亚洲欧美精品在线观看| 狠狠色丁香久久婷婷综| 美日韩丰满少妇在线观看| 国产色片在线观看| 国产免费观看久久黄| 国产在线播放一区| 天堂社区 天堂综合网 天堂资源最新版| 亚洲av成人精品毛片| 午夜精品国产精品大乳美女| 精品国产av鲁一鲁一区| 亚洲va久久久噜噜噜| 欧美激情一区二区在线| 国产成人精品无码播放| 日韩你懂的在线观看| 国产福利小视频| 日韩欧美手机在线| 精品欧美乱码久久久久久1区2区| 日本午夜视频在线观看| 精品蜜桃传媒| 亚洲制服欧美中文字幕中文字幕| 日韩一区二区a片免费观看| 97免费视频在线播放| 国产精品一区二区不卡| 天天色天天综合网| 久久精品国产欧美激情| 日本免费不卡视频| 69堂免费视频| 中文字幕欧美国内| 久久99日本精品| 无码人妻丰满熟妇区96| 国产一区二区三区三区在线观看 | 亚洲香蕉在线视频| 动漫av免费观看| 97久久久久久| 日本道色综合久久| 无码精品人妻一区二区三区影院| 麻豆免费在线观看视频| 日本久久中文字幕| 午夜精品久久久| www.蜜臀av.com| 91人妻一区二区| 国产精选一区二区| 日韩av在线看| 夫妻av一区二区| 紧身裙女教师波多野结衣| 国产成年人在线观看| www.亚洲男人天堂| 91片在线免费观看| 中文字幕一区二区三区手机版 | 亚洲国产日韩综合一区| 欧美国产日韩一区二区三区| 国产亚洲xxx| 色久综合一二码| 国产一区二区三区久久久 | av在线播放中文字幕| 五月天综合网| 亚洲性日韩精品一区二区| 丝袜a∨在线一区二区三区不卡| 97超碰免费在线观看| 98视频在线噜噜噜国产| 亚洲欧美激情插 | 国产一区二区91| 日本老熟俱乐部h0930| 午夜精品一区二区三区四区| 久久综合伊人77777蜜臀| 亚洲欧洲日韩综合一区二区| 亚洲无码久久久久久久| 亚洲天堂av一区二区三区| 国产乱码精品一区二区三区不卡| 国产一区二区三区在线观看视频| 亚洲人成7777| 视频一区二区三区入口| 欧美激情一区二区视频| 大肉大捧一进一出好爽动态图| 91av视频在线免费观看| 欧美福利视频导航| 国模娜娜一区二区三区| 伊人久久久久久久久久久久| 欧美日韩国产精品激情在线播放| 99久久精品免费看国产一区二区三区| 欧美午夜影院一区| 欧性猛交ⅹxxx乱大交| 人妻视频一区二区三区| 国产中文字幕久久| 国产美女视频免费看| 国语精品中文字幕| www欧美日韩| 欧美一级在线视频| 欧美性猛交丰臀xxxxx网站| 国产成人激情av| 欧美一区二不卡视频| 无码人妻aⅴ一区二区三区| 精品久久久久久亚洲| 国产成人91久久精品| 中文字幕亚洲欧美日韩2019| 日韩精品中文字幕一区二区三区| 精品久久久久国产| 亚洲女女做受ⅹxx高潮| 国产成人在线视频网址| 国产人妖一区二区| 国产一级片播放| 国产又黄又粗的视频| 成人欧美精品一区二区| 小明看看成人免费视频| 欧美韩国日本在线| av免费观看国产| 欧美 日韩 国产精品| 椎名由奈jux491在线播放 | 国产在线观看免费视频今夜| 亚洲高清在线不卡| 天天操天天爽天天射| 日本少妇高潮喷水视频| 无罩大乳的熟妇正在播放| 久草网视频在线观看| 亚洲v国产v欧美v久久久久久| 国产人妻人伦精品1国产丝袜| 日本在线一二三区| 日韩一级片播放| 欧美日韩二三区| 亚洲精品一二三四五区| 最新国产黄色网址| 亚洲性图一区二区| 男人揉女人奶房视频60分| 国产主播自拍av| 欧美重口乱码一区二区| 久久综合九色欧美狠狠| 国产专区在线视频| 青草网在线观看| www.欧美日本| 污污网站在线观看视频| 日韩精品在线播放视频| 中文字幕免费视频| 国产午夜福利片| 18国产免费视频| 99精品免费观看| 四虎永久在线观看| 麻豆精品视频在线观看| 9色porny自拍视频一区二区| 亚洲国产精品国自产拍av| 一区二区三区四区精品在线视频| 国产成人三级在线观看| 久久久久久免费毛片精品| 国产精品久久久久久久浪潮网站| 亚洲精品成人在线| 亚洲成av人影院在线观看| 亚洲久久久久久久久久| 伦理中文字幕亚洲| 国产suv精品一区二区| 高清视频在线观看一区| 看全色黄大色大片| 好男人香蕉影院| 国内免费精品视频| 欧美自拍第一页| zzijzzij亚洲日本少妇熟睡| 亚洲午夜电影网| 中文字幕在线国产精品| 91精品国产高清久久久久久91裸体| 亚洲欧美日韩不卡| 中文字幕天天干| 久久艹精品视频| 婷婷伊人综合中文字幕| 亚洲视频在线观看三级| 精品视频久久久久久久| 亚洲va码欧洲m码| 欧美 国产 综合| 日韩黄色中文字幕| 在线观看中文字幕av| 91网址在线看| 欧美性xxxx极品高清hd直播| 国产视频精品免费播放| 国产精品久久久久久亚洲调教| 国产专区在线视频| 不卡的免费av| 国产suv一区二区三区88区| 日韩欧美精品免费在线| 久久夜色精品亚洲噜噜国产mv| 欧美日韩国产精品一卡| 久久久久久久久久久久| 老司机精品久久| 在线免费观看日本一区| 国产精品美腿一区在线看| 手机在线国产视频| 久久久久99| 欧美精品九九99久久| 国产精品中文字幕久久久| 黄在线观看网站| 伊人久久综合视频| 国产精品污网站| 国产一区二区三区在线观看视频 | 中文在线免费看视频| 99精品欧美一区二区三区综合在线| 欧美日韩国产色站一区二区三区| 天堂v在线观看| 免费高清一区二区三区| 欧美亚洲日本黄色| 婷婷免费在线观看| 一级片在线免费播放| 亚洲一级二级在线| 国产精品一区av| 最新版天堂资源在线| 精东粉嫩av免费一区二区三区| 日韩午夜激情视频| 国产a级黄色大片| 奇米色一区二区| 午夜精品久久17c| 成年人视频在线免费| 中文字幕一区二区人妻电影| 欧美中文字幕一区二区三区亚洲| 中文字幕精品一区日韩| 国产精品久久久久久久成人午夜 | 亚洲性猛交xxxx乱大交| 亚洲一卡二卡三卡四卡五卡| 国产精品免费一区二区三区在线观看 | 成人毛片一区二区| 国产第一页浮力| 亚洲国产日韩精品| 国产精品久久久久久久天堂第1集| 国产污视频在线观看| 日韩欧美国产免费播放| 亚洲在线播放电影| 国产高清视频免费观看| 日韩在线中文字| 91网址在线观看精品| 中文字幕日韩一区| 国产欧美日韩视频一区二区三区| 欧美一区二区激情视频| 色狠狠av一区二区三区| 美女亚洲精品| 伊人网av在线| 精品日产卡一卡二卡麻豆| 欧美激情国内自拍| 国产视频一区二区在线观看| 成人久久久久爱| 无码人妻丰满熟妇奶水区码| 综合136福利视频在线| 三上悠亚影音先锋| 欧美日本一区二区在线观看| 国产精品久久久久久久99| 亚洲人吸女人奶水| 日本男女交配视频| 中国av一区二区三区| 免费国产在线精品一区二区三区| 天天干天天爽天天操| 一区二区国产欧美| 亚洲午夜激情av| 亚洲第一页在线视频| 丝袜诱惑制服诱惑色一区在线观看| www.日韩视频| 色哟哟精品观看| 精品国产电影一区二区| 日本55丰满熟妇厨房伦| 色综合天天狠狠| 亚洲成熟丰满熟妇高潮xxxxx| 亚洲欧美日韩综合aⅴ视频| 99热国产免费| 精品一区二区三区影院在线午夜| 91在线播放国产| 亚洲精品视频91| 国产日韩欧美在线看| 日韩电影在线看| 日韩av电影免费播放| 91啪亚洲精品| 成人在线观看黄| 在线观看视频一区二区| 欧美bbbbb性bbbbb视频| 一本久久综合亚洲鲁鲁| 亚洲大尺度在线观看| 欧美高跟鞋交xxxxxhd| 日韩毛片在线视频| 久久精品视频免费播放| 亚洲不卡的av| 中文字幕亚洲综合久久筱田步美| 男人在线观看视频| 亚洲人成网站在线播| 国产一区二区三区中文字幕| 97国产在线视频| 老鸭窝一区二区久久精品| 在线观看免费黄色片| 亚洲丝袜精品丝袜在线| 日本人妻一区二区三区| 亚洲精品一区中文字幕乱码| 1024在线看片| 最近2019年手机中文字幕| 国产叼嘿视频在线观看| 久久精品日产第一区二区三区精品版 | 亚洲一区二区三区四区五区| 久久蜜桃av一区精品变态类天堂| 日韩高清国产精品| 国产精品美女久久久久久久久久久| 亚洲免费黄色网| 欧美日韩高清一区| 国产精品久免费的黄网站| 欧美怡春院一区二区三区| 久久99国产乱子伦精品免费| 日韩欧美精品一区二区三区经典| 91丨porny丨首页| 日本一区二区免费视频| 日韩av在线一区二区| 性一交一乱一色一视频麻豆| 在线看视频不卡| 一本大道综合伊人精品热热| 天天操天天射天天爽| 97香蕉超级碰碰久久免费软件| 久久精品国产第一区二区三区| 国产日韩欧美精品在线观看| 亚洲欧美国产77777| 91精品国产自产| 久久久久久久久久久免费| 无码国产精品一区二区色情男同| 中文字幕欧美日韩一区二区| 欧美系列日韩一区| 日本少妇激情视频| 看高清中日韩色视频| 亚洲欧洲另类国产综合| 扒开jk护士狂揉免费| 久久久国产一区二区| 美国十次了思思久久精品导航| 妺妺窝人体色www看人体| 在线亚洲一区二区| caoporn国产| 欧美久久综合性欧美| 亚洲一区在线免费观看| 久久久久久福利| 精品国产乱码久久久久软件| 精品免费在线视频| 久久久精品免费看| 久久99国产精品99久久| 欧美性猛交xxxx乱大交| 69av视频在线| 精品欧美一区二区三区久久久 | 中文在线资源观看视频网站免费不卡 | 人人爽人人爽av| 久久久久999| 国产一本一道久久香蕉| 久久人妻少妇嫩草av蜜桃| 精品久久久av| 久久久精品tv| 玖玖爱免费视频| 激情视频一区二区| 欧美在线色视频| 四虎永久在线观看| 天天操天天爱天天爽| 久久久精品日本| 欧美国产成人在线| 国精产品视频一二二区| 成人欧美一区二区三区黑人免费| 欧美日韩国产一区在线| 91精品国自产| japan高清日本乱xxxxx| 97超级碰在线看视频免费在线看| 亚洲电影中文字幕在线观看| 精品人妻午夜一区二区三区四区 | 粉嫩绯色av一区二区在线观看 | 欧美日韩系列| 色与欲影视天天看综合网| 中文字幕一区二区三| 婷婷av一区二区三区| 国产成人在线网址| 天天久久综合网| 蜜桃视频在线观看成人|