上海2020年12月21日 /美通社/ -- 燧原科技今日發(fā)布首款人工智能推理產品 “云燧?i10”。這是一款面向云端數據中心的高性能推理卡。云燧i10是單槽位標準卡,支持PCIe 4.0,F(xiàn)P32算力達到17.6TFLOPS,BF16/FP16算力70.4TFLOPS。同時,燧原科技發(fā)布了推理引擎“鑒算TopsInference”,可以為深度學習應用提供低延遲、高吞吐率的推理性能,并降低數據中心的部署成本。云燧i10將于明年第一季度上市。
燧原科技發(fā)布首款人工智能推理產品 -- “云燧i10”
根據權威市場機構預測,云數據中心對于人工智能推理芯片的需求將從2022年開始超越對于訓練芯片的需求,整個推理市場蓄勢待發(fā)。云端推理解決方案更注重綜合指標,包括算力、時延、成本等,也更為關注用戶體驗的優(yōu)化。
“云燧i10”擁有卓越的算力、出色的通用性以及優(yōu)異的價值特性:
高算力、多精度:FP32算力17.6TFLOPS,BF16/FP16算力70.4TFLOPS;采用自主指令集,支持從FP32到INT8等多種精度,而最大功耗僅為150W;
高能效、高可靠性:采用動態(tài)調頻調壓(DVFS)技術,根據負載加速應用性能,支持RAS、ECC;
設備虛擬化:實現(xiàn)多用戶支持,最大可支持4個設備實例,具備計算與存儲資源的獨享性,多用戶間安全隔離;單顆芯片上可同時部署不同的業(yè)務與負載,實現(xiàn)多任務并行,有效提高利用率;支持KVM、Xen等系統(tǒng)虛擬化平臺;
易編程、生態(tài)開放:開放C++和Python編程接口,支持CNN及NLP典型模型,支持主流機器學習框架,并通過SDK提供深度定制。
燧原科技同時推出針對推理產品的高性能神經網絡模型推理引擎“鑒算TopsInference”,通過計算圖優(yōu)化、算子融合、模型壓縮、量化等優(yōu)化技術,可以為深度學習應用提供低延遲、高吞吐率的推理性能。通過TopsInference的推理加速,配合i10 的高算力及虛擬化技術,數據中心可以高性價比地部署計算密集型深度學習工作負載。
此外TopsInference除TensorFlow、PyTorch模型格式外,還支持ONNX通用模型格式,借助燧原GCU-CARA架構的可編程性,可以應對未來深度神經網絡日益多樣化、復雜的增長趨勢。
燧原科技創(chuàng)始人兼CEO趙立東表示燧原科技要堅持雙輪驅動,爭做行業(yè)領導者
“繼去年12月發(fā)布了首款面向數據中心的人工智能訓練加速卡“云燧T10”,今天我們又推出針對云端推理市場的第一款人工智能推理加速卡“云燧i10”,以滿足由于AI應用和落地場景迅速擴大,市場和客戶對更高性價比以及國產化和差異化云端推理產品的需求。燧原科技也因此成為國內唯一一家同時擁有云端訓練和推理加速產品的初創(chuàng)公司,形成業(yè)務閉環(huán)。”
燧原科技CEO趙立東表示,“當前全球科技產業(yè)特別是集成電路產業(yè)正在發(fā)生深刻變革,燧原科技會繼續(xù)加速技術創(chuàng)新和產品迭代,拉近與世界先進水平的距離,構筑自主創(chuàng)新技術的護城河。與此同時,與上下游伙伴合作,加速業(yè)務落地,擴大市場規(guī)模。針對互聯(lián)網數據中心、垂直行業(yè)(金融、保險、教育、醫(yī)療及運營商等)、新基建三大業(yè)務方向的應用場景,完善訓練和推理軟件棧、工具鏈和解決方案。通過產學研協(xié)作,共建國產化產業(yè)生態(tài),助力中國人工智能和集成電路產業(yè)的發(fā)展?!?/p>
燧原科技創(chuàng)始人兼COO張亞林介紹“云燧i10”推理系統(tǒng)
燧原科技COO張亞林介紹道:“云燧i10在多項基準測試中,性能領先,并已完成與浪潮、新華三及Supermicro等服務器廠商推理服務器的適配。可適用于視頻圖像、語音、自然語言處理、知識圖譜等多種應用場景,并針對內容理解、推薦、識別等高精度場景做了優(yōu)化。
與此同時,面向多元的開發(fā)需求,我們提供不同層次的開發(fā)模式,針對客戶定制化算法模型聯(lián)合開發(fā),從而實現(xiàn)與客戶的雙贏。此外,云燧i10與云燧T10以及“馭算TopsRider”軟件平臺搭配,可實現(xiàn)算法模型在數據中心訓推一體化的快速生產部署?!?/p>
責任編輯:xj
-
AI
+關注
關注
88文章
37012瀏覽量
289979 -
人工智能
+關注
關注
1811文章
49497瀏覽量
258155 -
燧原科技
+關注
關注
0文章
147瀏覽量
9437
發(fā)布評論請先 登錄
Allegro發(fā)布2026財年第一季度財報

富士通2025年第一季度營收7498億日元
卡特彼勒公布2025年第一季度業(yè)績

NVIDIA 發(fā)布 2026 財年第一季度財務報告
多家機器人企業(yè)2025年第一季度扭虧為盈
軟通動力發(fā)布2025年第一季度報告
安森美2025年第一季度業(yè)績 收入14.457億美元 自由現(xiàn)金流持續(xù)增長

評論