一文總覽阿里云存儲產品年度升級!
近日,在“回顧·向新:AI浪潮下的數據存儲進化”年度回顧上,阿里云總結了過去一年存儲產品在AI領域的研究成果,并分享了在“AI領域”和“高可用底層架構”方面的雙管齊下策略。同時,會上分享的 CPFS智算版針對模型訓練場景進行了全鏈路性能升級 ,提供20TB級別的吞吐和3億IOPS最大性能,將成為AI時代大模型訓練任務最具性價比的存儲選擇。
云存儲讀寫性能再突破,CPFS 支持更快大模型訓練
在大型模型訓練中,尤其是面對10萬GPU的海量計算需求時,存儲系統的性能和穩定性至關重要。 阿里云的CPFS作為高性能文件存儲解決方案,為GPU提供了20TB級別的吞吐和3億IOPS最大性能, 從而顯著提升了訓練效率。
此外,借助400Gb/s網卡以及RDMA通信的能力,CPFS單客戶端吞吐提升至 25GB/s,支持更大及更加頻繁的Checkpoint讀寫;提供burst I/O穩定有效吞吐/低延時,單機提供15GB/s可線性擴展的分布式讀緩存能力;支持100GB/s高帶寬和OSS的數據流動。CPFS對全鏈路進行了性能提升,為LLM訓練提速。
CPFS 能力全面升級,助力企業加速 AI 發展
OSS 端到端鏈路升級,支持云上構建兩萬+數據湖
目前已有超過2萬個數據湖基于OSS構建,其中大部分為AI數據湖。會上, 阿里云對象存儲OSS針對AI領域進行了多項能力更新。 本年度,OSS推出OSS Connector for AI/ML,相比傳統掛載方式,加載25.6萬張圖片數據時性能提升14倍。
OSSFS 1.91.3版本針對推理模型文件加載優化,9.3GB大文件加載速度提升 3.6倍,10萬個文件list性能提升6倍。在服務端,OSS發布資源池QoS能力,支持多個Bucket共享池化性能,并可針對單Bucket和請求者RAM賬號進行QoS 設置,實現削峰填谷,提升資源利用率。同時,OSS加速器產品能力優化,起步容量降低99%,吞吐密度提升50%,最大性能提升2.5倍,達到100GBps。
安全是存儲根基,高可用再升級
在安全方面, CPFS持續增強穩定安全和數據保護能力 ,包括通過Cloud Backup進行備份,應對單AZ故障和數據誤刪、勒索病毒等事故;新增日志審計,安全訪問可追溯;提供目錄級配額,簡化數據管理;確保安全掛載和IO鑒權,實現端到端的數據隔離;通過Access Point簡化數據訪問權限管理。
此外,為了協助客戶搭建和管理業務高可用架構, 阿里云存儲針對企業云上資源提供了一系列數據災備方案 ,包括企業災備管理服務數據災備中心?BDRC,SAAS 化災備服務云備份以及豐富的 IAAS 層數據災備的能力,滿足從開發者到跨國企業的多樣化數據管理需求。
助力千行百業,領跑?AI 時代
過去一年AI滲透進各行各業,企業為了構建高效的AI系統,采集、處理和存儲了海量的多模態數據,來加速模型的訓練和推理應用,這背后離不開阿里云的助力。
·? 月之暗面 :在基礎大模型領域,CPFS為月暗提供數Tbps級別的吞吐和毫秒級別的讀寫延時,滿足模型checkpoint、多模態數據集和訓練日志等場景下極致性能的需求,幫助月暗高效處理和分析大量請求和數據,提升模型的訓練效率;
·? 小鵬 汽車 :在小鵬汽車智算模型訓練場景,存儲產品結合“扶搖”智算集群的優化,使得其自動駕駛模型訓練效率提升了170倍,存儲吞吐效率提升了40倍,極大地加速了技術研發進程;
·? 小紅書 :對于擁有3.2億月活躍用戶的小紅書而言,阿里云的對象存儲服務OSS為其提供了超過20Tbps的吞吐能力,保障了海量用戶生成內容的處理速度,并通過多存儲類型組合方案實現了成本與性能的最佳平衡。
更多阿里云存儲產品能力
OSS?快速檢測違規內容
OSS?惡意文件檢測
Tablestore?多樣應用場景
彈性臨時盤?同時支持?x86或?ARM?架構
云備份?備份點病毒檢測
歸檔快照?新增直讀模式
阿里云智能資深產品專家彭亞雄表示:2025年, 阿里云依然會緊密圍繞AI智算賽道,聚焦穩定、安全、性能、成本、體驗等主要方向,持續產品的創新和進化 。讓每一家公司,都順利的從數字化轉型,過渡到智能化創新的Data+AI公司,加速業務發展和創新。