0代碼就能做Python數據分析,這個Jupyter插件,用起來就像Excel一樣簡單
自動生成Python代碼
蕭簫 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
加載一個Jupyter插件后,無需寫代碼就能做數據分析,還幫你生成相應代碼?
沒錯,只需要加載這個名為Mito的小工具包,用Python做數據分析,變得和用Excel一樣簡單:
運行速度比Excel更快,也不需要到處搜各種Python教程了。
好用如Excel,更快更全面
Mito是Jupyter notebook的一個可編輯電子表格插件,在編輯.csv表格(帶格式轉換功能)時,就能生成相關Python代碼。
△Mito,線粒體Mitochondria的縮寫
具體來說,Mito的出現,像是將Python的強大功能、和Excel的易用性進行了結合。
只需要掌握Excel的用法,就能使用Python的數據分析功能,還能將寫出來的代碼“打包帶走”。
它彌補了Excel在數據分析上的幾個缺陷:
- Excel無法做大數據分析(大型數據集處理得不好)
- Excel運行緩慢
- Excel無法輕松創建可重復流程
同時,又比SQL和Python更簡單、直觀。畢竟這些專業工具對于0基礎初學者來說,需要至少幾年時間,才能完全上手。
據Mito內測用戶表示,這款插件讓他們用Python做數據分析的效率提升了10倍,因為用戶可以直接在Mito里編寫Excel公式,如=SUM(A1, 100)。
那么,Mito是怎么做到將Excel邏輯轉換成Python代碼的呢?
作者們編寫了一種名為Transpiler的程序,有點類似于編譯器的功能,采用抽象語法樹(AST),解析Excel源代碼,并轉換成Python的源代碼。
相比于采用專業軟件如Alteryx(需要5000美元/月)進行數據分析,Mito所生成的Python代碼可以根據需要自行修改,靈活性更高一點。
目前,Mito采用亞馬遜云平臺?(AWS)保存用戶的相關數據,每個用戶擁有一個獨立賬戶。
當然,用戶也可以選擇將數據保存在本地。
自動生成Python代碼
以分析美國各州的“家庭平均收入”和“允許托運的火車站數量”這兩個數據的關系為例。
首先,上傳“家庭平均收入”和“允許托運的火車站數量”兩份數據。
數據處理的格式是.csv,當然也可以輸入Excel文件,并用Mito轉成兩份.csv文件。
然后,將這兩份數據集合并在一起,只需要用鼠標勾選對應功能、選中相關數據列就行。
啪!代碼就生成好了。
然后,是做數據透視表,在完成分組后,采用聚合(aggregate)功能來切換聚合方法。
還包括數據過濾功能,同樣立刻就能生成相關代碼。
包含升降序排序功能,快速簡潔。
然后就是相關數據統計、分析出結果了,流程直觀。
保存分析文件的方法也很簡單,文件是以Python編寫的,而不是用比較難懂的VBA。
要想重復上面的步驟的話,也非常容易,Mito自帶“重復已保存分析步驟”功能,一鍵就能用同樣的方法分析其他數據。
確實要比一行行編寫代碼簡單多了。
關于Mito
那么,Mito的作者們,為什么要搞這個軟件?
因為他們發現,所謂的“幾天上手Python數據分析”,其實根本沒有那么容易……
初學者要想用Python搞數據分析,就得不停地查看各種文檔、和求助于StackOverflow。
要想真正快速用Python分析數據,最后還得自己編寫軟件。
三位作者Aaron Diamond-Reivich、Jake Diamond-Reivich和Nate Rush都來自賓大,在學校期間,他們學習了計算機科學、統計學和商業分析相關的課程。
也正是在搞數據分析的時候,他們萌生了想要制作Mito的想法。
作者表示,軟件目前還沒有開源,因為他們還在思考,如何支持維護這個項目,并轉到開源路徑上來。
不過,它現在已經可以使用了。
感興趣的小伙伴們,可以上手試試了~
項目主頁:
https://trymito.io/launch
- 首個GPT-4驅動的人形機器人!無需編程+零樣本學習,還可根據口頭反饋調整行為2023-12-13
- IDC霍錦潔:AI PC將顛覆性變革PC產業2023-12-08
- AI視覺字謎爆火!夢露轉180°秒變愛因斯坦,英偉達高級AI科學家:近期最酷的擴散模型2023-12-03
- 蘋果大模型最大動作:開源M芯專用ML框架,能跑70億大模型2023-12-07



