乾明 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
2019年,做數據分析和機器學習,大家都喜歡什么樣的工具?
著名的數據分析社區KDnuggets發布調查,給出了最新結果:
Python持續領跑;2019年有近半用戶使用過深度學習工具;PyTorch增長速度是Tensorflow的13倍……
近20年來,KDnuggets每年都會進行一次調查,來研究數據分析和機器學習領域各個工具的使用情況,已然成為觀測這一行業變化與趨勢的重要參考依據。
Python依舊最熱,R語言持續下降
首先,他們給出的是總榜。將數據分析和機器學習領域所有的工具,包括編程語言、框架等放在一起比較:
Python使用比例為65.8%,與2018和2017年相比持續增長。
排名第二的是名為RapidMiner數據分析軟件平臺,使用比例為51.2%,與2018年相比,略有下降。
R語言再次下降,回落到46.6%。但與2018年相比,下降速度已經有所放緩。
被Salesforce花費157億美元重金收購的Tableau,排名第十,使用比例為22.1%。
在這個總榜中,深度學習框架Tensorflow(31.7%)和Keras(26.6%)等也都現身,不過增速與2018年相比,都有放緩。
雖然Pytorch沒有出現在這個榜單中,但增速已不容小覷。
Pytorch勢頭兇猛
哪種工具增速最快?調查給出的結果是BigML,同比增長了199%;其次是Julia,增長150%。
對于機器學習領域來說,最值得注意的是PyTorch,增長達到76%。
這一增長速度是什么概念呢?比較一下便知道。
調查顯示,2019年,有近一半(49.8%)被調查者都用過深度學習工具。
最熱的是Tensorflow,但其增長速度僅為5.8%,PyTorch排在第三,占比11.3%,但增速是達到了75.5%,是Tensorflow的13倍。
相比之下,如DeepLearning4J(-25.6%)、Caffe(-58.3%)等工具,都出現了大幅度下降。
Spark是大數據工具王者
在大數據分析領域,Apache Spark(21.0%)最熱,但與2018年相比,還是出現了下降(-2.3%)。
而Hadoop: Open Source Tools(12.1%)雖然位于第二,但其依舊保持著10%以上的增速(10.2%)。
編程語言,排名前五只有Python在漲
最后,只看數據分析和機器學習領域中使用到的編程語言的話,排名前五的編程語言中,除了Python有0.2%的增長,其他的幾種語言,比如R語言(-4.0%)、SQL語言(-17.2%)、Java(-17.7%)、Unix shell/awk(-13.4%)等都在下降。
相比之下,Julia(150.4%)、Perl(25.2%)、Lisp(46.1%)等語言都在快速增長。
關于這項調查
這項調查中,普通的參與者平均選擇了6.1種不同的工具。
其中,有180名參與者只選擇了一種工具。這種情況下,KDnuggets判定其不能代表在數據分析/機器學習領域工作的人們,因此將這些選擇刪除了。
調查鏈接:
https://www.kdnuggets.com/2019/05/poll-top-data-science-machine-learning-platforms.html
— 完 —
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
?’?’ ? 追蹤AI技術和產品新動態



