chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

芯來科技正式發(fā)布首款專用處理器產品線Nuclei Intelligence系列

芯來科技 ? 來源:芯來科技 ? 2024-02-26 10:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本土RISC-V CPU IP領軍企業(yè)——芯來科技正式發(fā)布首款針對人工智能應用的專用處理器產品線Nuclei Intelligence(NI)系列,以及NI系列的第一款AI專用RISC-V處理器CPU IP——NI900系列內核。

隨著Chatgpt的橫空出世,全球掀起一股AI的浪潮,從云端數(shù)據(jù)中心到邊緣側對AI的需求進一步提升。AI應用主要分布在訓練和推理,需要大量的并行計算和NPU來完成,更離不開高性能CPU的算力加持。CPU有著廣泛的普及性、兼容性、可擴展性和可靠性,并通過多核多節(jié)點進行串行計算、混合計算和安全防護等復雜任務;除此之外,CPU的通用矢量(Vector)指令集也可以提供強大且通用的并行計算能力,在AI領域進行高效的并行計算、前處理、后處理、激活函數(shù)等工作,更加靈活地處理GPU和NPU相對難以處理的復雜計算任務。

近期OpenAI發(fā)布的Sora模型將AI能夠理解和生成的內容模態(tài)從文字和圖片拓展到視頻,進一步證明基礎模型能力上限不斷被突破,想象空間被打開,對算力基礎設施的需求也遠沒有停止。芯來科技此次推出的NI900重點布局AI應用場景,助力本土芯片設計公司快速完成AI產品的設計。

NI900基于900系列處理器,針對“AI應用”進行了多項特性優(yōu)化

基礎標量處理器:

可以配置為900系列的RV32或RV64的任何一款N900、U900、NX900、UX900。

RVV1.0 VPU: 可配置基于RISC-V V Extension(RVV1.0 Vector指令集)的VPU單元,VPU的VLEN可配置為512-bit或者1024-bit。在INT8數(shù)據(jù)類型下對性能帶來的提升達數(shù)百倍;在INT32與FP32數(shù)據(jù)類型下對性能帶來的提升達數(shù)十倍。 NPU加速器:

可通過NI900的IOCP(IO Coherent Port)與處理器緊耦合,實現(xiàn)對CPU內部Cache的一致性。

用戶自定義指令擴展接口: 用戶可以使用Nuclei的NICE硬件擴展接口,增加自己自定義的指令,包括Scalar或Vector指令。

100a9910-d445-11ee-a297-92fbcf53809c.png

NI900支持RISC-VVector1.0標準

矢量擴展被稱之為RV指令集標準最重要的一組擴展,2015年發(fā)起,2021年正式生成標準。

RVV 1.0支持的數(shù)據(jù)類型廣泛,運算類型豐富且可動態(tài)擴展,同一套指令可無修改適配各種微架構實現(xiàn)。

RISC-V GCC從10.2版本已經(jīng)支持RVV1.0指令,目前GCC13對應的intrinsic API接口已經(jīng)升級到最新v0.12版本,且已部分支持自動向量化;預計GCC14正式發(fā)布,GCC的自動向量化會更加完備。RISC-V CLANG17版本也已支持最新v0.12版本intrinsic APl, 支持自動向量化。

RISC-V Linux 5.18 版本開始支持RVV,其它各種計算庫及應用中間件都快速支持了RVV1.0。

有了RVV1.0標準和軟件生態(tài)的完備,為應對AI算力的需求,需要RISC-V CPU 在微架構設計上做更多有針對性的設計。

NI900擁有強大的并行計算能力

RVV參數(shù)描述:

VLEN:一個向量寄存器的總bit數(shù)(寬度)

DLEN:內部運算單元能夠并行處理的一個向量元素的最大bit數(shù)

ELEN:并行處理的數(shù)據(jù)類型的最大寬度,如果ELEN=32,則最大的處理數(shù)據(jù)類型是INT32和FP32

可配選項 參數(shù)值
VLEN_512 VLEN=512,DLEN=512,ELEN=32/64
VLEN_1024 VLEN=1024,DLEN=1024,ELEN=32/64

VPU支持的數(shù)據(jù)類型和計算能力:

1024-bit的VPU支持多種數(shù)據(jù)類型的計算,包括:INT8 / 16 / 32 / 64, BFP16 / FP16 / FP32 / FP64。

1024-bit的VPU支持每個時鐘完成128x8-bit / 64x16-bit / 32x32-bit / 16x64-bit的數(shù)據(jù)計算

NI900擁有強大的Memory讀寫能力

10487c08-d445-11ee-a297-92fbcf53809c.png ?

VPU和CoreLSU共享MMU資源

VPU并非獨立的協(xié)處理器,而是與主Core的內存空間實現(xiàn)完全的Coherent

Vector指令與普通Scalar一樣,支持虛擬地址訪問,使得NI900的Vector指令可以無縫運行于大型操作系統(tǒng)之上

VPU和CoreLSU共享Memory資源與通道

VPU擁有最高512-bit位寬直接訪問DCache

VPU擁有最高1024-bit位寬直接訪問DLM

DLM具備1024-bit的SlavePort供SoC訪問

可單獨配置VLMport以進一步增加性能

VLMport可以直接連接到外部加速器或者內存

VLMport位寬=VLEN(目前支持最多1024-bit)

ScalarCore也可以通過LoadStore訪問到VLM區(qū)間

NI900的VPU帶來極大的性能提升

通過強大的運算能力與強勁的Memory讀寫通道,NI900能帶來極大的并行計算性能提升。

如圖所示,VLEN=1024-bit的VPU在INT8數(shù)據(jù)類型下對性能帶來的提升達數(shù)百倍

105ec1b6-d445-11ee-a297-92fbcf53809c.png

106eb986-d445-11ee-a297-92fbcf53809c.png ? 107f51a6-d445-11ee-a297-92fbcf53809c.png

如圖所示,VLEN=1024-bit的VPU在INT32數(shù)據(jù)類型下對性能帶來的提升達數(shù)十倍

1091366e-d445-11ee-a297-92fbcf53809c.png

10a53948-d445-11ee-a297-92fbcf53809c.png

10b91e40-d445-11ee-a297-92fbcf53809c.png

如圖所示,VLEN=512-bit的VPU在FP32數(shù)據(jù)類型下對性能帶來的提升達數(shù)十倍

10d03b0c-d445-11ee-a297-92fbcf53809c.png

10db1720-d445-11ee-a297-92fbcf53809c.png

10e18da8-d445-11ee-a297-92fbcf53809c.png

10f8bf14-d445-11ee-a297-92fbcf53809c.png

NI900支持NPU等AI加速器與處理器緊耦合,實現(xiàn)對CPU內部Cache的一致性

NI900支持整合外部AI加速器、NPU、PCIe、DMA,通過900系列的IOCP(IO Coherent Port)與900系列處理器緊耦合,實現(xiàn)對CPU內部Cache的一致性。

110b0d86-d445-11ee-a297-92fbcf53809c.png

NI900的Scalar/VectorNICE自定義指令接口提供更多特定場景的優(yōu)化可能性 NICE(Nuclei Instruction Co-unit Extension)是芯來CPU IP的一種用戶可擴展指令接口機制,允許用戶基于芯片的標準通用CPU內核定義自己的擴展指令集。

NI900提供用于Scalar指令擴展的NICE接口,可支持單周期,多周期,流水線等不同指令類型

NI900提供用于Vector指令擴展的NICE接口,可支持單周期,多周期,流水線等不同指令類型

NI900的NICE擴展單元不僅可以進行運算型的自定義指令擴展,還可以通過專用總線訪問Core的存儲資源(DCache等)實現(xiàn)與主Core的內存一致性,總線位寬可以達到VLEN(最高1024-bit)

用戶可以結合自己的應用擴展自定義指令,將NI900處理器內核擴展成為面向AI領域進一步強化的專用處理器。

RISC-V生態(tài)日益成熟,芯來NI900賦能AI時代

CPU是算力結構中必不可少的一個環(huán)節(jié),在已經(jīng)到來的人工智能算力時代,通用和專用芯片結合而成的異構計算是未來AI算力基礎設施的主流。芯來致力于提供標量、矢量、以及自定義指令結合的計算架構,以滿足端側云側數(shù)據(jù)中心的多元化的算力需求。

目前NI900已經(jīng)獲得多家下游客戶的認可并投入產品設計中,未來芯來將推出更多NI系列處理器內核IP,賦能AI時代的算力基礎設施建設。




審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19896

    瀏覽量

    235345
  • 人工智能
    +關注

    關注

    1807

    文章

    49029

    瀏覽量

    249646
  • RISC-V
    +關注

    關注

    46

    文章

    2574

    瀏覽量

    48855
  • AI加速器
    +關注

    關注

    1

    文章

    70

    瀏覽量

    9097
  • 芯來科技
    +關注

    關注

    0

    文章

    76

    瀏覽量

    3481

原文標題:芯來科技發(fā)布最新NI系列內核,NI900矢量寬度可達512/1024位

文章出處:【微信號:nucleisys,微信公眾號:芯來科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    方寸之間構筑系統(tǒng)級可靠性,納發(fā)布國產高性能 2 制霍爾開關 MT72xx系列

    發(fā)布國內2制霍爾開關MT72xx系列,具有卓越EMC性能、豐富極性選擇和高集成設計,
    的頭像 發(fā)表于 06-27 16:56 ?180次閱讀

    科技新一代RISC-V高性能處理器IP UX1030H 全面支持RVA23

    2025年6月24日,上海 —— 在RISC-V生態(tài)持續(xù)推進標準化、高性能發(fā)展的背景下,國內對具備虛擬化能力、安全隔離機制及高并發(fā)處理能力的處理器需求顯著增長。今日,科技(
    的頭像 發(fā)表于 06-24 09:20 ?1345次閱讀
    <b class='flag-5'>芯</b><b class='flag-5'>來</b>科技新一代RISC-V高性能<b class='flag-5'>處理器</b>IP UX1030H  全面支持RVA23

    處理器近期互認證產品匯總

    近期,兆聯(lián)合多家產業(yè)合作伙伴,重點圍繞開先KX-7000系列處理器、開勝KH-40000服務處理器平臺持續(xù)加強應用生態(tài)建設,分別完成包括
    的頭像 發(fā)表于 06-12 17:14 ?799次閱讀

    馳科技升級智能座艙與智能車控芯片產品線

    近日,馳科技在2025年上海國際汽車展覽會上舉辦發(fā)布會,同步升級智能座艙與智能車控雙產品線。理想汽車CTO謝炎、北汽研究總院院長王磊、斑馬智行聯(lián)席CEO郝飛等產業(yè)鏈領袖共同見證此次發(fā)布
    的頭像 發(fā)表于 04-25 11:17 ?470次閱讀

    微芯片全景與選型推薦

    。公司以SoC設計為核心,布局音視頻編解碼、視覺影像處理、軟硬件協(xié)同開發(fā)等技術方向,產品覆蓋智能應用處理器芯片、電源管理芯片及周邊配套芯片,并提供全棧式解決方案。 二、芯片產品線全景分
    的頭像 發(fā)表于 04-18 10:19 ?1459次閱讀
    瑞<b class='flag-5'>芯</b>微芯片全景與選型推薦

    處理器開先KX-U6980S處理器榮獲工業(yè)“新質”獎

    +數(shù)字化“新質獎”之工業(yè)“新質”獎,贏得了行業(yè)專家和用戶的積極肯定。 開先KX-U6980S處理器 國內工藝 生態(tài)繁榮 護航產業(yè)發(fā)展 開先KX-U6980S處理器是兆采用國內制造工
    的頭像 發(fā)表于 03-25 16:46 ?1005次閱讀
    兆<b class='flag-5'>芯</b><b class='flag-5'>處理器</b>開先KX-U6980S<b class='flag-5'>處理器</b>榮獲工業(yè)<b class='flag-5'>芯</b>“新質”獎

    科技發(fā)布Nuclei Studio 2025.02版本

    Studio 2025.02版本發(fā)布了以下功能特性: 集成Nuclei RISC-V Toolchain /OpenOCD /QEMU /Xlmodel 2025.02版本。
    的頭像 發(fā)表于 03-05 17:43 ?1118次閱讀
    <b class='flag-5'>芯</b><b class='flag-5'>來</b>科技<b class='flag-5'>發(fā)布</b><b class='flag-5'>Nuclei</b> Studio 2025.02版本

    NXP搭載MPU的FRDM產品怎么樣?FRDM i.MX93開發(fā)板開箱速覽

    近期,NXP將i.MX 93系列處理器引入了FRDM系列產品線,推出了FRDM i.MX 93開發(fā)板,作為首配備i.MX MPU的FRDM板,它提供了模塊化硬件、全面的軟件和工具,以
    的頭像 發(fā)表于 02-26 14:56 ?1222次閱讀
    NXP<b class='flag-5'>首</b><b class='flag-5'>款</b>搭載MPU的FRDM<b class='flag-5'>產品</b>怎么樣?FRDM i.MX93開發(fā)板開箱速覽

    開先KX-7000處理器賦能升騰D410 2桌面終端產品

    基于開先KX-7000系列處理器,升騰可謂是“多路出擊”,在推出P410 2桌面終端、W410 2桌面一體機兩新品的同時,針對云終端產品線也快速響應,帶來了全新升級的D410 2桌面
    的頭像 發(fā)表于 01-21 16:28 ?848次閱讀

    恩智浦i.MX 94應用處理器如何變革工業(yè)和汽車連接

    恩智浦半導體發(fā)布i.MX 94系列用處理器,為工業(yè)和汽車連接設定了新的標準。作為i.MX 9系列用處理器的最新成員,i.MX 94旨在提
    的頭像 發(fā)表于 01-17 10:51 ?941次閱讀

    恩智浦發(fā)布i.MX 94系列用處理器

    恩智浦半導體發(fā)布i.MX 9系列用處理器的新成員i.MX 94系列。該系列旨在用于工業(yè)控制、可編程邏輯控制
    的頭像 發(fā)表于 11-26 17:48 ?1479次閱讀

    極海電機產品線再添新品,APM32M3514系列電機控制專用SoC正式發(fā)布!

    極海高集成、高性價比、高能效的電機控制專用SoC——APM32M3514系列,現(xiàn)已正式推出,為客戶電機系統(tǒng)應用設計提供高性價比的系統(tǒng)集成,更豐富的
    發(fā)表于 10-09 11:09 ?1545次閱讀
    極海電機<b class='flag-5'>產品線</b>再添新品,APM32M3514<b class='flag-5'>系列</b>電機控制<b class='flag-5'>專用</b>SoC正式<b class='flag-5'>發(fā)布</b>!

    OMAP5912應用處理器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《OMAP5912應用處理器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-07 09:16 ?0次下載
    OMAP5912應<b class='flag-5'>用處理器</b>數(shù)據(jù)表

    格見發(fā)布基于N300系列處理器內核的通用型實時工業(yè)控制DSP產品

    。GS32F003X系列內置的RISC-V內核基于科技N300系列RISC-V處理器內核深度定制,支持500+條RV32基礎/擴展指令和
    的頭像 發(fā)表于 08-06 15:56 ?1950次閱讀
    格見<b class='flag-5'>發(fā)布</b>基于<b class='flag-5'>芯</b><b class='flag-5'>來</b>N300<b class='flag-5'>系列</b><b class='flag-5'>處理器</b>內核的通用型實時工業(yè)控制DSP<b class='flag-5'>產品</b>

    6nm異構多核!國內Arm架構AI PC處理器P1發(fā)布

    計算平臺因此得到了廣泛的關注?,F(xiàn)在,國內公司也完成了Arm架構AI PC處理器“破冰”,開始揚帆啟航。 ? 7月30日,在以“從此出發(fā)”為主題的此科技AI PC戰(zhàn)略暨
    的頭像 發(fā)表于 08-01 01:21 ?4981次閱讀
    6nm異構多核!國內<b class='flag-5'>首</b><b class='flag-5'>款</b>Arm架構AI PC<b class='flag-5'>處理器</b>此<b class='flag-5'>芯</b>P1<b class='flag-5'>發(fā)布</b>