財經中心/廖珪如報導
輝達Blackwell發威,效能顯著,加之輝達協力團隊為輝達築成護城河,讓輝達概念股持續爆發。(圖/翻攝自YT @NVIDIA)這輪AI基礎建設大建置當中,NVIDIA Blackwell突破擴展效能,NVIDIA 13日發出新聞稿指出,近期對其效能做出測試,憑藉逾5,000顆Blackwell GPU的高效協同運作,在Llama 3.1 405B測試中創下了僅需10分鐘訓練時間的全新紀錄。這項成績較上一輪基於Blackwell的最佳成績高出2.7倍,歸功於GPU數量增加至原先2倍以上的高效擴展,以及採用NVFP4精度大幅提升每顆Blackwell GPU的有效效能。
為說明每顆GPU的效能提升幅度,NVIDIA本輪提交採用2,560顆Blackwell GPU的測試結果,訓練耗時縮短至18.79分鐘,較上一輪採用2,496顆GPU的提交方案快上45%。
全新基準測試
NVIDIA在本輪新增的兩項基準測試中同樣創下效能紀錄,包括Llama 3.1 8B與FLUX.1。Llama 3.1 8B 是一款精巧卻功能強大的大型語言模型,取代了長期運行的BERT-large模型,為基準測試套件增添更現代化、更小的大型語言模型。NVIDIA使用多達512顆Blackwell Ultra GPU提交了測試結果,創下僅需 5.2分鐘即可完成訓練的紀錄。
全新效能紀錄
此外,FLUX.1是一款先進的圖像生成模型,取代了Stable Diffusion v2,且只有NVIDIA平台提交了該基準測試的結果。NVIDIA使用1,152個Blackwell GPU提交的測試結果,創下將訓練時間縮短至12.5分鐘的新紀錄。
廣泛夥伴生態系
NVIDIA生態系在本輪測試中展現積極參與度,共計15個機構提交了令人矚目的成果,其中包括華碩、戴爾科技集團、技鋼科技、HPE、Krai、Lambda、聯想集團、Nebius、雲達科技、Supermicro、佛羅里達大學、Verda(原DataCrunch)和緯穎。NVIDIA以一年為週期持續創新,在預訓練、後訓練及推論階段推動顯著且快速的效能提升,為邁向全新層級的智慧鋪路,加速AI普及化。