亞馬遜云科技獲評IDC 2025年全球公有云基礎(chǔ)設(shè)施即服務(wù)“領(lǐng)導(dǎo)者” | 速途網(wǎng)
大模型之家訊 日前,在全球市場分析機構(gòu)國際數(shù)據(jù)公司(IDC)發(fā)布的《2025年IDC MarketScape:全球公有云基礎(chǔ)設(shè)施即服務(wù)(IaaS)報告》中,亞馬遜云科技被評為“領(lǐng)導(dǎo)者”,在能力和戰(zhàn)略的雙維度上均為“領(lǐng)導(dǎo)者”。IDC在該報告中表示,全球公有云IaaS繼續(xù)快速增長,預(yù)計2025年的整體規(guī)模將達(dá)到1880億美元。
IDC分析師、報告作者Dave McCarthy表示:“亞馬遜云科技通過廣泛的服務(wù)組合和持續(xù)的創(chuàng)新,在公有云IaaS市場中處于領(lǐng)導(dǎo)地位。廣泛的全球基礎(chǔ)設(shè)施,結(jié)合Amazon Graviton等定制芯片計劃以及在AI領(lǐng)域的重大投資,使其在滿足企業(yè)需求方面獨具優(yōu)勢。其在可擴展性方面的卓越表現(xiàn)、成熟的開發(fā)者社區(qū)以及對AI基礎(chǔ)設(shè)施的積極投入,使其成為需要先進云能力的企業(yè)的首選?!?/p>
作為全球云計算的開創(chuàng)者和引領(lǐng)者,亞馬遜云科技是率先進入自研芯片領(lǐng)域的云供應(yīng)商。革命性的Nitro虛擬化平臺全面加速了亞馬遜云科技在自研芯片領(lǐng)域的創(chuàng)新速度。迄今為止,亞馬遜云科技已推出了多個系列的自研芯片,包括Amazon Nitro系統(tǒng)、通用處理器芯片Amazon Graviton、機器學(xué)習(xí)訓(xùn)練芯片Amazon Trainium和推理芯片Amazon Inferentia,同時保持穩(wěn)定的更新頻率,且每次更新均提供兩位數(shù)以上的百分比的性價比提升。在2024年的re:Invent上,亞馬遜云科技推出全面升級的Amazon Trainium2芯片,以及基于該芯片的Amazon EC2 Trn2實例和超級服務(wù)器。Amazon EC2 Trn2實例與當(dāng)前基于GPU的EC2 P5e和P5en實例相比,Amazon EC2 Trn2實例的性價比提升30-40%。單實例配備16個Trainium2芯片,可提供高達(dá)20.8 Petaflops浮點算力的性能,非常適合訓(xùn)練和推理高達(dá)數(shù)十億參數(shù)的大型語言模型。
Amazon EC2 Trn2 UltraServers服務(wù)器是亞馬遜云科技在縱向擴展領(lǐng)域的又一次突破,用以滿足大規(guī)模生成式AI訓(xùn)練和實時推理的性能需求。該服務(wù)器配備64個相互連接的Trainium2芯片,采用NeuronLink超速互連技術(shù),可提供高達(dá)83.2 Petaflops浮點算力,其計算、內(nèi)存和網(wǎng)絡(luò)能力是單一實例的四倍,能夠支持訓(xùn)練和部署超大規(guī)模的模型。訓(xùn)練方面,Amazon EC2 Trn2 UltraServers使客戶能夠突破單個Trn2實例的限制進行擴展,從而減少訓(xùn)練時間,加快投放市場的速度,實現(xiàn)快速迭代以提高模型準(zhǔn)確性。推理工作負(fù)載方面,客戶可以使用Trn2 UltraServers提升生產(chǎn)環(huán)境中萬億參數(shù)模型的實時推理性能。亞馬遜云科技攜手Anthropic正打造名為Project Rainier的EC2 UltraCluster,其包含數(shù)十萬顆Trainium2 芯片,所達(dá)到的超級算力比他們當(dāng)前一代領(lǐng)先AI模型訓(xùn)練所需算力高出5倍以上。
此外,亞馬遜云科技發(fā)布了新一代AI訓(xùn)練芯片Amazon Trainium3。Trainium3是亞馬遜云科技首款采用3納米工藝制造的芯片。搭載Trainium3的UltraServers性能預(yù)計將是Trn2 UltraServers的4倍。首批基于Trainium3的實例預(yù)計將在2025年末上線。
芯片創(chuàng)新重塑計算,而在基礎(chǔ)設(shè)施的另一個重頭場景——網(wǎng)絡(luò)中,亞馬遜云科技在2024年re:Invent上推出了第二代UltraCluster網(wǎng)絡(luò)架構(gòu),也稱為”10p10u”網(wǎng)絡(luò),支持超過20,000個GPU協(xié)同工作,帶寬達(dá)10Pb/s,延遲低于10μs(微秒),這一突破性的性能躍遷將模型訓(xùn)練時間縮短至少15%。同時還推出了兼具中央控制和優(yōu)化及分布式的速度和彈性的SIDR(Scalable, Intent Driven Routing)全新網(wǎng)絡(luò)路由協(xié)議。相比傳統(tǒng)的BGP、OSPF等協(xié)議,SIDR在亞馬遜云科技的10p10u網(wǎng)絡(luò)中能在不到1秒內(nèi)恢復(fù)網(wǎng)絡(luò),速度比傳統(tǒng)方法快10倍,顯著提升了分布式AI訓(xùn)練中的可靠性和實時性,確保網(wǎng)絡(luò)在故障發(fā)生時也能保持高效運行。10p10u是亞馬遜云科技有史以來擴展最快的網(wǎng)絡(luò),在2024年,安裝了超過300萬條鏈路。