Alaya NeW智算操作系統(以下簡稱:Alaya NeW),由九章云極DataCanvas 自主研發,可有效管理、調度各種算力資源,提供智算服務,落地各類智算應用。作為智算中心的“中樞神經”,Alaya NeW突破異構算力適配、異構算力調度等關鍵技術,實現了包括算力統籌與智能調度的底層硬件異構性兼容;簡單易用且以集群為優先的策略,原生適合AI高性能計算,原生支持AI大模型+小模型的低門檻構建、訓練和推理;并支持與通用大模型、行業大模型及各類大模型應用組合疊加,實現一體化、開放化、標準化的AI模型服務。
隨著人工智能技術的高速發展,智能化正以前所未有的速度重塑各行各業。以AIGC為代表的人工智能應用、大模型訓練等新應用、新需求快速崛起都對算力提出更高要求。經中國信息通信研究院測算,預計到2025年全球計算設備算力總規模將超過3 ZFlops,至2030年將超過20 ZFlops。
算力作為新質生產力,已成為挖掘數據要素價值,推動數字經濟發展的重要驅動力,智算中心的戰略性地位愈發凸顯。同時,智算中心在運營和管理過程中面臨的異構算力資源納管困難、算力調度能力不足、利用率低等難題,將嚴重制約智算中心的應用與發展。因此,一個能夠全面服務于智算中心的中樞神經——智算操作系統,將是直擊這些難題的最佳方案。
1、異構算力資源納管困難
智算中心逐漸引入多種不同品牌的加速硬件,往往存在異構算力不兼容、模型框架與底層芯片適配不充分等情況,導致算力調度困難、難以有效形成規模化算力。
2、算力調度能力不足、利用率低
在大規模數據處理和大模型訓練等任務中,算力調度能力不足,使得算力分配不均衡,導致算力資源浪費和利用率下降,不能充分滿足不同類型AI任務的調度需求,影響AIDC服務的整體性能。
3、AI加速優化能力不足
一般針對AI大模型數據加載、訓練、微調、推理環節,并沒有實施優化或者只做了局部加速優化。因此經常受到存儲訪問慢,算力利用率、內存利用率、通信效率低的困擾,影響AI任務的完成。
4、AI大模型訓練微調門檻高
數據科學家往往不能掌握使用智算硬件基礎設施的技能,而企業內IT人員缺乏對訓練大模型所需的集群管理能力,缺乏一個彈性易用的集群環境以及在其之上的AI大模型訓練微調工具鏈。
主要能力
1、告別“裸金屬”
通過構建多層次、全方位的算力需求滿足機制,包含超級智算集群、彈性容器集群、GPU云服務器、AI容器實例等系列產品,為精準匹配和高效滿足多樣化規模及復雜度的算力求提供保障。
2、為AI而生
專注于人工智能核心任務,包括大模型的訓練、微調、部署和推理等服務。提供集“算力、數據、算法、調度”為一體的融合服務,旨在推動人工智能產業化的創新發展。
3、全局加速優化
采用通信加速、內存優化、算法加速、數據三級緩存、內核優化、編譯優化、并行加速、模型壓縮等方案,釋放硬件效能。集群訓練效率提升100%,單卡利用率提升50%;模型推理速度提高4倍,Token吞吐量增加5倍。
4、異構算力納管與調度
提供包含國內外多種算力資源的適配、納管、調度和優化。通過實時監控和管理各智算中心的智算設備,以及創新的調度算法,成功實現跨智算中心的海量算力智能調度,大幅提升算力資源的利用率。
5、1度算力
Alaya NeW首次提出了統一的算力服務計量單位“度”(DCU),并用其實現標準化的算力計量計費,旨在為用戶實現“買到即用到”的算力服務,為未來算力資源互聯互通打下良性商業基礎。
應用落地情況
該產品無論在產品理念還是功能設計上都處于同行業領先水平。在未來一定周期內,將引領“智算操作系統”發展趨勢,該產品提供的智算基礎服務,將成為智算中心提供服務的標準范本之一。截止目前,該產品已經在九章云極DataCanvas參與共建的國內多個智算中心進行部署。
Alaya New 智算操作系統在智算中心產業生態中處于中間位置,在底層硬件芯片和上層大模型之間建立了高效的鏈接,通過AI基礎軟件的創新,實現算力資源的最大化利用。也首次提出了統一的算力服務計量單位“度”(DCU),以推進標準化的算力計量計費,為未來算力資源實現互聯互通打下良性商業基礎。九章云極DataCanvas 攜手智算產業核心生態伙伴,服務政府和企業共建智算中心,為行業提供高質量新質生產力以及全方位的AI Foundation Service,共同推動我國人工智能產業快速發展。
機器人底盤 Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動機器人底盤 商用機器人 智能垃圾站 智能服務機器人 大屏機器人 霧化消毒機器人 紫外線消毒機器人 消毒機器人價格 展廳機器人 服務機器人底盤 核酸采樣機器人 機器人代工廠 智能配送機器人 噴霧消毒機器人 圖書館機器人 導引機器人 移動消毒機器人 導診機器人 迎賓接待機器人 導覽機器人 |