平頭哥首款AI芯片一換,阿里云服務器算力5倍GPU方案
左手第七代高主頻ECS,右手含光800云服務器
不算久等!阿里云基礎設施算力又升級了!
本次被“翻牌”的是第七代高主頻ECS企業級實例、含光800云服務器商用以及新一代容器(神龍)服務。
還記得去年杭州云棲,搭載自研第二代神龍云服務器架構的六代ECS已是眾望所歸;如今搭載第三代神龍云服務器架構的高主頻七代,在整機算力上卻是前輩的2.6倍。

究竟2.6倍之多源于何處?
很關鍵的一點,就是搭載了最新一代英特爾?至強?可擴展處理器,據說這波技術嘗試就連英特爾自己都還沒來得及發布。
?此外,由于得到集大成的第三代神龍架構助力,七代高主頻實例在性能與穩定性上都有了顯著提升。
大到底層存儲、網絡,虛擬化技術升級;小到搭載的云盤性能、每秒鐘操作的IO次數以及吞吐能力等均是可圈可點。
別的不說,單從支持vCPU數量就高達192個。
配套的內存的頻率也達到了3200兆赫茲。
七代首次支持50Gx2網絡架構,每秒鐘PPS高達2400萬,果斷支持大幀傳輸之外,實例帶寬最高提升5倍之多,物盡其用。
整機存儲吞吐從每秒2GB上升到4GB,轉發提升到60萬IOPS,寫延時最多下降20%以上,性能逼近裸盤,值得期待。
出于安全性和穩定性,阿里云還通過進一步完善no QEMU極致優化來降低七代實例抖動。
再配合Aliyun Linux 2 LTS,大力將啟動速度最高提升60%;就算是正在運行時,也可多達30%。
強勢引入硬件級別QOS能力,保障關鍵業務。
如此看來果然是又快又好的節奏。
據悉由于算力與穩定性并存的優勢,高主頻七代ECS尤其適用半導體仿真設計、工業仿真、 游戲、高性能數據庫和渲染等對計算力要求較高的場景。
截至發稿前,量子位獲悉第七代ECS企業級高主頻實例以及新一代彈性裸金屬云服務器,目前都已啟動邀測。
從六到七,技術嘗試助力成本降低是關鍵
從六到七,算力與穩定性等確實都上了好幾層臺階。
但阿里云彈性計算首席架構師蔡俊杰卻透露,其實除了市場需求與使用性能等硬性催化劑之外,成本考量也毋庸置疑成了關鍵所在。
簡單說,這款七代高主頻實例更省錢了!
當然,這種成本節省是對標六代高主頻來說的,而不是銷路甚好的第六代增強實例。

成本降低有門道,先從更好地定制CPU說起。
據悉,阿里云這次在七代的芯片選型上做了大量工作。
通過洞察幾百萬客戶實際使用云服務器的情況,從內存帶寬、緩存以及頻率要求,包括用戶應用的性能甜點角度做了大量的數據分析。
“通常情況下,價格高則性能強,但如果需要用戶提升百分之一的性能卻需要cover百分之二十的成本增幅來換的話,實在不劃算,當然這還是在迫切需要提升的前提下。”
阿里云彈性計算方面最后定制的這一款CPU,在保障符合用戶需求的高性能的同時,綜合成本上降低了不少。
更重要的一點,為了低成本的需要,技術研發在服務器設計上竟然還展開了新路線的探索。
或許大家可能知曉,主流的云服務器過去通常采用的是二路服務器,即一個服務器中攜帶兩顆CPU。
如今的七代創新性選擇了更加高密度部署的四路服務器制式,也就是同時攜帶四顆CPU。
不但是單體計算性能得到顯著提升,從整機的性能角度上也有很大飛躍。
很明顯,四路服務器帶來的好處,每顆均攤到整體基礎設施的成本,相比之前確實下降不少。
但蔡俊杰透露,盡管成本下降的背后,是運維和穩定性難度的急劇上升。
由于服務器上的器件增多,散熱就成為亟待攻克的關鍵一環。
同時,如何保障所有器件能夠正常工作并在性能穩定的基礎上達成目標,是個挑戰。畢竟由于CPU和內存增加了一倍,故障概率也就同時增加了一倍。
無論何種新品的研發都不希望通過犧牲穩定性來降低成本,所以為了保障實例的穩定性,阿里云做了很多工作。
得益于阿里云成熟的主動運維體系,包括極高的故障探測和預測能力、世界領先的熱遷移技術等,七代ECS將繼續承諾全球第一的穩定性SLA,單實例達到99.975%。
七代高主頻ECS企業級實例在成本上的精益求精,在某種程度上也應承了更多用戶在云服務器的使用上越發關注成本優化的現實。
2020年的疫情突襲,帶來源于全球經濟環境的諸多挑戰。
越來越多的云服務器使用者會在選型以及使用方式上表現出更加精細化的態度,畢竟大家都希望在有限的成本投入中得到最大程度的資源利用。
這一點,作為云服務器未來發展的可預測趨勢之一,得到更廣泛的關注也是無可厚非的。
如何更好理解“新一代容器服務”?
談及新一代容器服務,“基于神龍架構,阿里云還升級了容器服務的算力,同等條件下,新一代容器服務可為客戶縮減50%的計算成本。”的論斷或許你也聽說過。

基于此,蔡俊杰還異國連線算了筆賬。
其實這樣的判斷并不僅僅基于被廣泛提及的神龍架構,而是使用裸金屬服務器的形態來支持容器場景帶來的整體成本的大幅降低。
以第七代高主頻ECS為例,原本四路服務器為整機算力帶來極大提升,作用在容器層面,有什么額外好處?
直接說就是做到將原本分散在各個小機器中的容器實例高效聚集起來,節省算力成本的同時更好利用容器服務。
試想一下,對于具備32個vCPU算力的小型服務器來說,假設每臺上運行的操作系統需要耗費1個vCPU和500兆內存,那么6臺就要耗費6個vCPU和3G內存。
如果換成第七代高主頻ECS支持192個vCPU的情況,光操作系統的消耗就只有原來的六分之一。
更重要的一點,在此種部署環境中容器服務的超賣比優點得到顯現,即越來越多的應用可以達成錯峰,帶來部署密度的增加,數量上的保障。
性能方面,現實表明,神龍裸金屬服務器與容器相結合在阿里經濟體內部各種場景的多重測試中,已經可達到整體性能20%的提升。
哪怕在用戶群體中驗證,由于底層IO與存儲的軟硬一體化加速機制,帶來30%的性能優勢也是可以期待的。
如果具備足夠的技術前瞻性的話,或許會發現,云服務器的另一個未來觸發點,如此說來竟是云原生無疑。
可能這也是阿里云率先在業界推出彈性裸金屬這樣的創新產品形態的關鍵所在。
云原生是未來,與容器結合是必然。
天生屬性即適合與K8S容器編排引擎打配合,以求實現服務serveless的彈性計算,可以做到讓更多用戶聚精會神關心應用怎么跑,而不是底層架構怎么做,彈性容器實例ECI就是為serverless而生的新生代“云服務器”。
當然,花開兩朵各表一枝。
如何做到部署更輕量、啟動更迅速、并發能力更強悍等,也對云服務器的整體生產鏈路提出了更高要求。
蔡俊杰認為,在極短的時間內準備好計算、網絡以及存儲等資源,通過整鏈路的優化升級達到極致服務的狀態,來高安全性滿足復雜的云原生場景,一個字“難”。
如此看來,安全穩定地提供符合云原生使用體驗的基礎設施能力,想必也是各大云計算入局者競相探討的要務之一。
含光800云服務器因何而來?
阿里云官方數據表明,去年,一顆含光800芯片相當于10個GPU的算力。
今年,一臺阿里云含光800云服務器趕超GPU性能5倍之多。
日前,阿里云正式官宣推出搭載含光800推理芯片的云服務器,標志著自研含光芯片正式大規模商業化的beginning。
從芯片進化到云服務器,本質上,阿里云鉚足勁頭讓更多已經上云或正在上云路上的小伙伴們嘗鮮含光800的超強算力。
助力云上AI推理,這波操作相當別致。
量子位獲悉,由于配備了阿里平頭哥自研神經網絡加速芯片含光800,該款云服務器提供了全球最高單芯片AI推理性能,有著同類處理器的數十倍性能之高。
另外還針對業務場景達成了深度優化,例如廣泛適用于圖像搜索、場景識別、視頻內容識別、自然語言處理等業務。
一句話,算力表現出挑且推理能力高性價。
好的產品都要從自身用起,例如阿里云城市大腦交通信號機系統。
自從使用了含光800服務器處理車輛檢測、品牌識別、車牌識別等算法模型,單張含光800全鏈路竟能夠支持100路實時視頻的分析和特征結構化數據的提取。
結果呢?相比搭載GPU,性能提升超過5倍。
多方了解到,含光云服務器還是基于阿里云自研的神龍云服務器架構,目前為用戶提供彈性裸金屬加速實例。

其中開發工具采用阿里平頭哥HGAI自動化開發工具,支持主流深度學習框架TensorFlow、Caffe、MXNet和ONNX。
?就在今年3月,阿里云飛天AI加速引擎AIACC與含光800的組合,擊敗Google不說,還拿下了斯坦福大學DAWNBench?ImageNet推理成本的世界第一。
據了解其能效比達500IPS/W,是第二名的3.3倍,且被作為阿里云軟硬件一體化極致性能優化的典型案例津津樂道。
談及軟硬件一體化的能力所帶來的效果,無論是國外的云計算巨頭AWS,還是我們身邊的阿里云,具體產品的性能飛躍,甚至一年翻一番的速率是有目共睹的。
如果從技術角度,這種軟硬一體的自研能力很大可能是未來3-5年,各家都十分重視的路線之一并被爭相效仿,云服務器自然不例外。
此外含光800云服務器的商用也正是兼顧軟硬一體能力的同時,將解決云場景下的機器學習問題作為重點。
由此推斷,將云與數據以及人工智能緊密結合,用云的視角服務更多不同的技術場景化,或許將成為云服務器場景進化的必然路徑。
如今,云服務器作為云計算基礎設施的大底盤,阿里云經濟體“全面上云”的號角業已達成。
作為阿里云自身的技術基礎,關于云服務器能力構建,更多被認為是關乎云服務商產品能力的命脈。
隨著云計算自身形態的多樣化,實踐部署的親民性與無處不在,包括國內對自研國產化核心競爭力的重視日益提升等,可以判斷未來很長一段時間,該領域不會出現重要性層面的顛覆式變化。
可以肯定,云服務器仍是兵家必爭之地,無疑。
附:采訪嘉賓簡介

- 騰訊清遠云計算數據中心正式開服,為華南地區最大新基建項目2020-07-03
- 率先拿下可信物聯網云平臺認證,騰訊云物聯網獲權威認可2020-07-03
- 平頭哥首款AI芯片一換,阿里云服務器算力5倍GPU方案2020-06-13
- 阿里云蔣江偉:我們致力于為世界提供70%的算力2020-06-12




