chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

升騰910和含光800性能對比 昇騰910和含光800性能對比

工程師鄧生 ? 2023-08-31 17:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

有網(wǎng)友關(guān)注升騰910和含光800性能對比;升騰910一般認為就是華為的昇騰910;而含光800則是阿里巴巴發(fā)布的含光800AI芯片。

2019年9月25日,阿里巴巴發(fā)布含光800AI芯片;含光800是高性能的AI推理芯片。該芯片推理性能達到78563 IPS,能效比500 IPS/W。

含光800AI芯片基于RISC-V和阿里自有算法,含光800芯片性能的突破得益于軟硬件的協(xié)同創(chuàng)新:硬件層面采用自研芯片架構(gòu),通過推理加速等技術(shù)有效解決芯片性能瓶頸問題;軟件層面集成了達摩院先進算法,針對CNN及視覺類算法深度優(yōu)化計算、存儲密度,可實現(xiàn)大網(wǎng)絡(luò)模型在一顆NPU上完成計算。

含光800AI芯片相比傳統(tǒng)GPU算力,性價比提升100%。根據(jù)云棲大會的現(xiàn)場演示結(jié)果顯示,比如拍立淘商品庫每天新增10億商品圖片,使用傳統(tǒng)GPU算力識別需要1小時,使用含光800后可縮減至5分鐘。

據(jù)阿里介紹含光NPU采用TSMC 12nm工藝制程,可提供全球最高單芯片AI推理性能。 在HGAI模型的推理應(yīng)用中,含光NPU每秒鐘可處理高達78000 IPS的圖片,是同類處理器的數(shù)十倍性能。

目前含光800目前已被應(yīng)用到阿里巴巴旗下的的多個業(yè)務(wù)場景,比如圖像視頻分析、城市大腦、搜索優(yōu)化等等。

2019年8月23日,華為發(fā)布AI芯片Ascend 910(昇騰910)。

據(jù)華為官方介紹,昇騰910AI處理器,基于自研華為達芬奇架構(gòu)3D Cube技術(shù),實現(xiàn)業(yè)界最佳AI性能與能效,架構(gòu)靈活伸縮,支持云邊端全棧全場景應(yīng)用。

除了基于達芬奇架構(gòu)的AI核外,昇騰910還集成了多個CPU、DVPP和任務(wù)調(diào)度器(Task Scheduler),因而具有自我管理能力,可以充分發(fā)揮其高算力的優(yōu)勢。

昇騰910集成了HCCS、PCIe 4.0和RoCE v2接口,為構(gòu)建橫向擴展(Scale Out)和縱向擴展(Scale Up)系統(tǒng)提供了靈活高效的方法。HCCS是華為自研的高速互聯(lián)接口,片內(nèi)RoCE可用于節(jié)點間直接互聯(lián)。最新的PCIe 4.0的吞吐量比上一代提升一倍。

昇騰910算力是國際頂尖AI芯片的2倍,相當50個當前最新最強的CPU;其訓練速度,也比當前最新最強的芯片提升了50%-100%。同時華為還發(fā)布了配套的新一代AI開源計算框架MindSpore。兩者搭配性能最大化利用芯片算力。

新一代的AI開源計算框架MindSpore創(chuàng)新編程范式,使得工程師更容易使用;該計算框架可滿足終端、邊緣計算、云全場景需求,能更好保護數(shù)據(jù)隱私;可開源,形成廣闊應(yīng)用生態(tài)。

昇騰910半精度(FP16)算力達256 TFLOPS。(還有一個說法是昇騰910的半精度(FP16)算力達到320 TFLOPS);而整數(shù)精度(INT8)算力達到 640 TOPS,(還有一個說法是整數(shù)精度(INT8)算力達到512 Tera-OPS;小編認為一個數(shù)值可能是設(shè)計參數(shù)值,一個可能是極值)功耗 310W,采用 7nm 先進工藝。此外,昇騰 910 集成了 HCCS、PCIe 4.0 和 RoCE v2 接口,為構(gòu)建橫向擴展 (Scale Out)和縱向擴展(Scale Up)系統(tǒng)提供了靈活高效的方法。

比如華為的Atlas 900 AI訓練集群,算力達到了256 PFLOPS。要實現(xiàn)這樣的算力,如果采用通用CPU需要6195個機柜,用GPU需要208個機柜,而NPU如昇騰只要128個機柜,這歸功于昇騰架構(gòu)對深度學習業(yè)務(wù)的優(yōu)化。而且最終,華為只用了16個機柜來實現(xiàn)。

此外,昇騰910為國產(chǎn)AI芯片助力,華為盤古大模型從算力(昇騰算力,昇騰的底層架構(gòu)也是華為自創(chuàng)的)、芯片使能、AI框架(MindSpore AI計算框架)到AI平臺(AI開發(fā)生產(chǎn)線ModelArts)實現(xiàn)了全棧自主創(chuàng)新。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20069

    瀏覽量

    242782
  • RISC-V
    +關(guān)注

    關(guān)注

    47

    文章

    2698

    瀏覽量

    50847
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2031

    瀏覽量

    36374
  • 昇騰910
    +關(guān)注

    關(guān)注

    0

    文章

    14

    瀏覽量

    7119
  • 含光800
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    1783
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    DLP? LightCrafter? DLPC910評估模塊技術(shù)解析與應(yīng)用指南

    Texas Instruments DLPLCRC910EVM評估模塊基于 DLP? LightCrafter? DLPC910控制器。DLPLCRC910EVM參考設(shè)計可幫助使用DLPC91
    的頭像 發(fā)表于 08-20 11:31 ?635次閱讀
    DLP? LightCrafter? DLPC<b class='flag-5'>910</b>評估模塊技術(shù)解析與應(yīng)用指南

    睿海光電800G模塊助力全球AI基建升級

    在全球數(shù)字化轉(zhuǎn)型加速的背景下,超高速模塊作為數(shù)據(jù)中心與AI算力網(wǎng)絡(luò)的核心部件,正經(jīng)歷從400G向800G、1.6T的迭代浪潮。在這一賽道中,深圳市睿海光電科技有限公司(以下簡稱“睿海光電”)憑借
    發(fā)表于 08-13 19:05

    投入式水位計與傳統(tǒng)浮子式儀器性能對比分析

    在水位監(jiān)測領(lǐng)域,投入式水位計與浮子式儀器是兩類主流設(shè)備。南京峟思將從工程實用性角度出發(fā),對兩者進行五大核心性能對比,為巖土工程、水利安全監(jiān)測領(lǐng)域的采購及技術(shù)人員提供客觀參考。一、測量原理與精度投入式
    的頭像 發(fā)表于 07-28 13:44 ?217次閱讀
    投入式水位計與傳統(tǒng)浮子式儀器<b class='flag-5'>性能對比</b>分析

    800KVA伏儲能并網(wǎng)變壓器性能全解析

    800KVA伏儲能并網(wǎng)變壓器知識科普:技術(shù)、性能、選配與容量配置——卓爾凡電力科技的卓越之選 一、引言 在全球?qū)η鍧嵞茉吹男枨笕找嬖鲩L的今天,13650169149卓爾凡伏儲能并網(wǎng)
    的頭像 發(fā)表于 04-11 10:57 ?723次閱讀
    <b class='flag-5'>800</b>KVA<b class='flag-5'>光</b>伏儲能并網(wǎng)變壓器<b class='flag-5'>性能</b>全解析

    DeepSeek推動AI算力需求:800G模塊的關(guān)鍵作用

    : 飛速(FS)模塊支持最新的標準協(xié)議,確保與多種現(xiàn)有設(shè)備和網(wǎng)絡(luò)架構(gòu)的兼容性,并支持驗證告警、DDM數(shù)據(jù)及模塊識別的準確性,保障系統(tǒng)正常運行。這一特性使得飛速(FS)800G模塊品質(zhì)可靠,
    發(fā)表于 03-25 12:00

    厚聲電阻與旺詮合金電阻的性能對比

    厚聲電阻與旺詮合金電阻在性能上各有千秋,以下是對兩者的詳細對比: 一、厚聲電阻性能特點 1、尺寸與阻值范圍廣泛: 厚聲電阻提供了多種尺寸選擇,如01005、0201、0402、0603等,以滿足
    的頭像 發(fā)表于 02-27 14:40 ?570次閱讀
    厚聲電阻與旺詮合金電阻的<b class='flag-5'>性能對比</b>

    DLPC910忽然無法正常啟動,怎么解決?

    1、DLPC910忽然無法正常啟動,分析可能是DLPR910的問題。這里想問一下DLPR910內(nèi)的程序是可以被覆蓋的嗎? 2、如果真的是誤操作導(dǎo)致DLPR910的配置程序丟失,請問有
    發(fā)表于 02-26 08:43

    改性EVA膠膜在伏封裝中的抗PID性能對比研究

    伏組件的抗PID性能影響組件的發(fā)電效率和使用壽命,被伏行業(yè)廣泛關(guān)注。EVA膠膜是伏組件的主要封裝材料之一,其具有優(yōu)異的性價比,但隨著
    的頭像 發(fā)表于 01-22 09:02 ?1191次閱讀
    改性EVA膠膜在<b class='flag-5'>光</b>伏封裝中的抗PID<b class='flag-5'>性能對比</b>研究

    為什么400G模塊和800G模塊如此火爆?

    算力中心作為承載大量計算任務(wù)的核心設(shè)施,需要快速、穩(wěn)定的網(wǎng)絡(luò)環(huán)境,400G和800G模塊應(yīng)運而生,尤其是800G模塊的需求尤為旺盛。800
    的頭像 發(fā)表于 12-23 14:41 ?908次閱讀

    單片機Debug工具性能對比 單片機調(diào)試常用命令

    。以下是對單片機調(diào)試工具性能的簡要對比以及一些常用的調(diào)試命令。 單片機Debug工具性能對比 Keil uVision 性能 :Keil uVision 是一款功能強大的集成開發(fā)環(huán)境(
    的頭像 發(fā)表于 12-19 09:56 ?1918次閱讀

    TNC連接器對比分析:與其他射頻連接器的性能對

    德索工程師說道在射頻連接器領(lǐng)域,TNC連接器以其卓越的性能和廣泛的應(yīng)用而著稱。以下是TNC連接器與其他射頻連接器的性能對比分析: TNC連接器vs SMA連接器 頻率范圍:TNC連接器的工作頻率
    的頭像 發(fā)表于 12-17 10:58 ?1348次閱讀
    TNC連接器<b class='flag-5'>對比</b>分析:與其他射頻連接器的<b class='flag-5'>性能對</b>決

    800G模塊:高速通信的關(guān)鍵力量

    隨著信息技術(shù)的飛速發(fā)展,數(shù)據(jù)流量呈爆炸式增長,對高速、大容量的數(shù)據(jù)傳輸設(shè)備需求日益迫切,800G模塊應(yīng)運而生。800G模塊作為新一代的光通信模塊,在數(shù)據(jù)中心、5G網(wǎng)絡(luò)等眾多領(lǐng)域發(fā)揮
    的頭像 發(fā)表于 12-09 12:19 ?1243次閱讀

    DDR3、DDR4、DDR5的性能對比

    DDR3、DDR4、DDR5是計算機內(nèi)存類型的不同階段,分別代表第三代、第四代和第五代雙倍數(shù)據(jù)速率同步動態(tài)隨機存取存儲器(SDRAM)。以下是它們之間的性能對比: 一、速度與帶寬 DDR3 :速度
    的頭像 發(fā)表于 11-29 15:08 ?1.6w次閱讀

    NPU與GPU的性能對比

    NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元)與GPU(Graphics Processing Unit,圖形處理單元)在性能上各有千秋,它們各自的設(shè)計初衷和優(yōu)化方向決定了
    的頭像 發(fā)表于 11-14 15:19 ?5484次閱讀

    華迅光通AI計算加速800G模塊部署

    ,對人工智能服務(wù)器集群的需求也急劇上升。隨著數(shù)據(jù)中心基礎(chǔ)設(shè)施的不斷擴大,模塊的使用量呈指數(shù)級增長。目前,200G和400G模塊已經(jīng)大規(guī)模部署,800G模塊已經(jīng)開始進入量產(chǎn)和引進階
    發(fā)表于 11-13 10:16