從視頻追蹤到自動評論,五月GitHub最熱機器學(xué)習(xí)項目都在這里了
平均標星1000+
郭一璞 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
您的五月余額已不足,這個月最新最火的機器學(xué)習(xí)項目都看過了嗎?
Mybridge AI博客從將近250個機器學(xué)習(xí)開源項目中找到了標星數(shù)排名最靠前的Top 10項目,涵蓋視覺問答、對象檢測、自動生成評論等多個維度。
一起來看看吧~
第1名:Pythia
Pythia是Facebook人工智能實驗室出品的視覺和語言多模式研究的模塊化框架,2138星。
Pythia基于PyTorch,支持Model Zoo、多任務(wù),有各種內(nèi)置數(shù)據(jù)集比如VQA、VizWiz,支持基于DataParallel和DistributedDataParallel的分布式訓(xùn)練,還可以實現(xiàn)高度自定義。
另外,拿Pythia來做TextVQA和VQA的入門代碼庫也不錯。
鏈接:
https://github.com/facebookresearch/pythia
第2名:云注釋(Cloud Annotations)
自定義對象檢測和分類訓(xùn)練,2014星。
基于IBM云對象存儲,在TensorFlow上訓(xùn)練,需要先在線進行圖像標注,macOS,Windows和Linux都可以用。
鏈接:
https://github.com/cloud-annotations/training
第3名:PySOT
商湯出品,可以在視頻里追蹤單個對象,實現(xiàn)SiamRPN和SiamMask等算法,1703星。
PySOT實現(xiàn)了最先進的單一對象跟蹤算法,包括SiamRPN和SiamMask等,用Python編寫,在PyTorch上運行。
鏈接:
https://github.com/STVIR/pysot
第4名:PyTorch-BigGraph
大規(guī)模圖形結(jié)構(gòu)數(shù)據(jù)生成嵌入軟件,1417星,同樣也是Facebook出品,主要作者是巴黎的Luca Wehrstedt。
PyTorch-BigGraph是一個分布式系統(tǒng),可以搞定多達數(shù)十億實體和數(shù)萬億邊緣的大型網(wǎng)絡(luò)交互圖形。
用PyTorch-BigGraph的話需要Python 3.6或更高版本,最低PyTorch 1.0,不需要投喂GPU,但是比較費CPU。
鏈接:
https://github.com/facebookresearch/PyTorch-BigGraph
第5名:InterpretML – Alpha
微軟出品,用來訓(xùn)練可解釋的機器學(xué)習(xí)模型,1039星。
這里的“可解釋”指的是可以解釋模型調(diào)試中遇到的錯誤,模型有沒有搞歧視,如何讓人類理解這個模型,模型是否合法,在醫(yī)療、司法等高風(fēng)險的領(lǐng)域靠不靠譜。
鏈接:
https://github.com/microsoft/interpret
第6名:Weights & Biases
可視化和追蹤機器學(xué)習(xí)實驗工具,1098星。
分析機器學(xué)習(xí)實驗,比TensorBoard更輕量級。每次運行時,可以保存超參數(shù)和輸出指標,訓(xùn)練過程中能實現(xiàn)可視化模型,還能自動跟蹤代碼狀態(tài),系統(tǒng)指標和配置參數(shù)。
鏈接:
https://github.com/wandb/client
第7名:MLIR
“多級中間表示”編譯器基礎(chǔ)結(jié)構(gòu),832星。
TensorFlow的一部分。MLIR旨在成為一種混合IR(intermediate representation),可以支持統(tǒng)一基礎(chǔ)架構(gòu)中的多種不同要求,能夠表示所有TensorFlow圖,在TensorFlow圖上實現(xiàn)優(yōu)化和轉(zhuǎn)換,用TensorFlow圖或者TF Lite完成量化和圖變換。
鏈接:
https://github.com/tensorflow/mlir
第8名:MeshCNN
PyTorch中三維網(wǎng)格的卷積神經(jīng)網(wǎng)絡(luò),367星。
這是SIGGRAPH 2019上發(fā)表的一篇論文,可以用來做3D形狀分割,作者來自以色列特拉維夫大學(xué)和亞馬遜。
類似傳統(tǒng)CNN,MeshCNN結(jié)合了在網(wǎng)格邊緣上運行的專用卷積和池化層。卷積應(yīng)用于邊緣和它們的入射三角形的四個邊緣,池化層用邊緣折疊操作保留表面拓撲結(jié)構(gòu),給后面的層生成了網(wǎng)狀連接。
鏈接:
https://github.com/ranahanocka/MeshCNN
第9名:TensorWatch
微軟出品,用于深度學(xué)習(xí)和強化學(xué)習(xí)的調(diào)試,監(jiān)控和可視化,299星。
TensorWatch是一款專為深度學(xué)習(xí)和強化學(xué)習(xí)而設(shè)計的debug和可視化工具。它充分利用Jupyter Notebook顯示實時可視化,不需要一直翻日志就能實時查詢訓(xùn)練過程,還可以用來構(gòu)建自己的UI和儀表板。
此外,TensorWatch利用幾個優(yōu)秀的庫來可視化模型圖,審查模型統(tǒng)計,解釋預(yù)測等。
鏈接:
https://github.com/microsoft/tensorwatch
第10名:hncynic
一個獵奇項目,自動生成hacker news風(fēng)格的評論,完全無視文章本身,看一眼標題,剩下全靠編,240星。
來源靠的是hacker news評論數(shù)據(jù),借此訓(xùn)練Transformer編碼器-解碼器模型,中途還順手用了一下維基百科的數(shù)據(jù)。
生成的評論大多腦洞清奇。
比如這個新聞標題《用TensorFlow檢測魚》,生成的評論是醬嬸的:
這篇文章太辣雞了。
1.為什么代碼看起來像一堆黑盒子標簽?我沒有看到它。
2.為什么你的模型不利用這些理論?為什么不是黑盒子分類器?
如果模型沒有取出紅盒子,它開始看到紅盒子,看起來像一個沒有明確顏色的黑盒子(看起來它知道藍色是什么)——它怎么能看到紅盒子,甚至能看出是黑盒子?
在一個不了解我們?nèi)绾问褂谩昂谙蛔印焙汀八{盒子”來檢測真實環(huán)境中的魚類并使用黑匣子代替白紙盒的世界中,我們都知道這一點。
看起來好像很有道理的樣子,然而完全不知道在說啥,而且是滿滿的杠精畫風(fēng)啊!
鏈接:
https://github.com/leod/hncynic
傳送門
原文鏈接:
https://medium.mybridge.co/machine-learning-open-source-for-the-past-month-v-may-2019-bf4ff9b80b1b



