燧原科技發布第二代人工智能訓練產品 -- “邃思2.0”芯片、基于邃思2.0的“云燧T20”訓練加速卡和“云燧T21”訓練OAM模組,全面升級的“馭算TopsRider”軟件平臺以及全新的“云燧集群”,成為國內首家發布第二代人工智能訓練產品組合的公司。
經過全新升級迭代后,邃思2.0的計算能力、存儲和帶寬、互聯能力較第一代訓練產品有巨大提升,對超大規模的模型支持能力獲得顯著增強。而同步升級的馭算TopsRider軟件平臺,成為燧原科技構建原始創新軟件生態的基石。完全自研的軟硬件架構,助力燧原科技在知識產權和產品升級迭代上可以自主掌控方向和節奏。
架構升級實現算力飛躍:邃思2.0進行了大規模的架構升級,新一代全自研的GCU-CARA全域計算架構,針對人工智能計算的特性進行深度優化,夯實了支持通用異構計算的基礎;支持全面的計算精度,涵蓋從FP32、TF32、FP16、BF16到INT8,并成為中國首款支持單精度張量TF32數據精度的人工智能芯片。單精度FP32峰值算力達到40 TFLOPS,單精度張量TF32峰值算力達到160 TFLOPS,均為國內第一。
HBM2E存儲帶來海量吞吐:邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64 GB內存,帶寬達1.8 TB/s,是中國第一個支持世界最先進存儲HBM2E和單芯片64 GB內存的產品。
高速互聯支撐算力擴展:GCU-LARE全域互聯技術是燧原專為人工智能訓練集群研發的互聯技術,提供雙向300 GB/s互聯帶寬,支持數千張云燧CloudBlazer加速卡互聯,實現優異的線性加速比。
全新軟件駕馭澎湃算力:馭算TopsRider是燧原科技自主知識產權的計算及編程平臺,通過軟硬件協同架構設計,充分發揮邃思2.0的性能;基于算子泛化技術及圖優化策略,支持主流深度學習框架下的各類模型訓練;利用Horovod分布式訓練框架與GCU-LARE互聯技術相互配合,為超大規模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優化提供了自定義的開發能力。
(美通社,2021年7月7日上海)