存儲優(yōu)先架構(gòu) (Storage First Architecture)
針對AI計算“高差異、高并發(fā)、高耦合”特性
以存儲驅(qū)動計算,打破存儲墻
在同等條件下:數(shù)據(jù)訪問可降低10-100倍
28nm工藝條件下,系統(tǒng)能效比超過4T OPS/W
計算資源利用率超過80%,DDR帶寬占用率降低5倍
(注:以上數(shù)據(jù)源自探境實驗室實測)
通用性AI芯片架構(gòu)
支持所有已知神經(jīng)網(wǎng)絡(luò),等同于GPU兼容性
對神經(jīng)網(wǎng)絡(luò)的參數(shù)沒有限制,對數(shù)據(jù)類型沒有限制
支持(INT4/INT8/INT16/FP16/自定義浮點)
自適應(yīng)稀梳數(shù)據(jù)處理
易用性強
提供零基礎(chǔ)可用的工具鏈
無需用戶網(wǎng)絡(luò)重訓即可使用,網(wǎng)絡(luò)精度損失低
學習成本低,模型移植簡單
端云一體
同時支持推理和訓練加速
支持終端推理芯片、終端推理+訓練芯片
支持云端訓練芯片、云端推理芯片
符合大規(guī)模商業(yè)化需求
采用成熟設(shè)計方案,無需對底層器件進行修改設(shè)計
符合現(xiàn)代工藝,支持多種算法和應(yīng)用場景