chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國(guó)內(nèi)公司自主研發(fā)GPU+:兼容CUDA、性能及能效超競(jìng)品

硬件世界 ? 來(lái)源:硬件世界 ? 2023-07-17 16:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,自稱為國(guó)內(nèi)自主創(chuàng)新的通用GPU領(lǐng)軍企業(yè)的登臨科技獲得中國(guó)互聯(lián)網(wǎng)投資基金(簡(jiǎn)稱“中網(wǎng)投”)獨(dú)家投資。

公司稱,這將為登臨新一代Goldwasser(高凜)規(guī)模化量產(chǎn)及商業(yè)化落地提供重要保障。

高凜是一款AI加速卡,首款產(chǎn)品2021年量產(chǎn)投入市場(chǎng),2022年銷售過(guò)萬(wàn)片。

第二代產(chǎn)品2022年流片,2023年實(shí)現(xiàn)量產(chǎn)。根據(jù)現(xiàn)有客戶測(cè)試結(jié)果,二代產(chǎn)品針對(duì)基于transformer類型的模型提供3-5倍的性能提升,大幅降低類ChatGPT及生成式AI應(yīng)用的硬件成本。

在官網(wǎng),登臨介紹自己是國(guó)內(nèi)首家完全憑借自主創(chuàng)新,實(shí)現(xiàn)規(guī)?;虡I(yè)落地的通用GPU企業(yè),登臨科技核心IP完全自主研發(fā),其自主創(chuàng)新的GPU+(基于GPGPU的軟件定義的片內(nèi)異構(gòu)計(jì)算架構(gòu)),在兼容 CUDA/OpenCL 在內(nèi)的編程模型和軟件生態(tài)的基礎(chǔ)上,通過(guò)架構(gòu)創(chuàng)新,解決了客戶核心關(guān)注的通用性和高效率的雙重難題。

其表示,經(jīng)過(guò)大量客戶產(chǎn)品化驗(yàn)證,針對(duì)AI計(jì)算,GPU+相比現(xiàn)有主流GPU在性能及能效上有顯著提升。

ba101482-23ef-11ee-962d-dac502259ad0.jpg

在AI市場(chǎng)上,NVIDIA現(xiàn)在是沒有對(duì)手的階段,AI顯卡份額估計(jì)在90%以上,AMD都很難競(jìng)爭(zhēng),現(xiàn)在Intel也加入這個(gè)市場(chǎng)了,而且找到了NVIDIA的一個(gè)痛點(diǎn),那就是性價(jià)比。

NVIDIA目前受追捧的AI顯卡主要是A100、H100,國(guó)內(nèi)有特供的閹割版A800、H800,性能比原版弱20%左右,但即便如此依然供不應(yīng)求,A800一周時(shí)間就從9萬(wàn)元漲到11萬(wàn)元以上,H100價(jià)格在25萬(wàn)元以上,H800也要20萬(wàn)出頭,而且不同經(jīng)銷商的價(jià)格差異很大。

Intel自然也不會(huì)放過(guò)這個(gè)市場(chǎng),日前在國(guó)內(nèi)舉行發(fā)布會(huì),也推出了AI顯卡Habana Gaudi2,這是去年底發(fā)布的AI推理加速芯片,從第一代的16nm工藝升級(jí)到7nm工藝,Tensor 處理器核心數(shù)量增至 24 個(gè),同時(shí)集成了多媒體處理引擎,內(nèi)存升級(jí)至 96GB HBM2E。

國(guó)內(nèi)版的Gaudi2主要是閹割了部分網(wǎng)絡(luò)接口,但也集成了21路100Gbps網(wǎng)絡(luò)接口,總體來(lái)說(shuō)性能依然很可觀。

ba385da2-23ef-11ee-962d-dac502259ad0.jpg

Intel還公布了Gaudi2跟H100的AI性能對(duì)比,面對(duì)要求極為苛刻的、1750億參數(shù)的GPT-3模型,384個(gè)Gaudi2加速器上的訓(xùn)練時(shí)間僅為311.9分鐘,而且從256個(gè)加速器到384個(gè)加速器,性能擴(kuò)展幅度達(dá)95%。

NVIDIA這邊在512塊 H100 GPU上的訓(xùn)練時(shí)間則為64分鐘,論單卡性能的話是Gaudi2的3.6倍多,但是Intel不會(huì)跟H100拼極限性能,而是強(qiáng)調(diào)性價(jià)比。

Habana Labs 首席運(yùn)營(yíng)官 Eitan Medina 表示,性價(jià)比是影響H100和Gaudi2相對(duì)價(jià)值的重要考量因素,Gaudi2 服務(wù)器的成本要比H100低得多。

更重要的是,目前Gaudi2還沒有支持AI常用的FP8運(yùn)算格式,這種情況下Gaudi2 在性價(jià)比上也勝過(guò)了H100,今年3季度會(huì)升級(jí)支持FP8運(yùn)算,Gaudi2的性能將有明顯飛躍,性價(jià)比要比H100更高了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5050

    瀏覽量

    134009
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37210

    瀏覽量

    291705
  • ChatGPT
    +關(guān)注

    關(guān)注

    30

    文章

    1595

    瀏覽量

    9926

原文標(biāo)題:國(guó)內(nèi)公司自主研發(fā)GPU+:兼容CUDA、性能及能效超競(jìng)品

文章出處:【微信號(hào):hdworld16,微信公眾號(hào):硬件世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級(jí)

    租戶環(huán)境提供推理服務(wù),需實(shí)現(xiàn)性能隔離與穩(wěn)定擴(kuò)展。面對(duì)這一技術(shù)浪潮,深圳市睿海光電科技有限公司(簡(jiǎn)稱“睿海光電”)憑借其創(chuàng)新的800G光模塊解決方案,以交付速度比同行快2-3天的硬核實(shí)力、廣泛兼容性及全球
    發(fā)表于 08-13 19:01

    淘寶API實(shí)時(shí)競(jìng)監(jiān)控,市場(chǎng)策略快人一步!

    淘寶API構(gòu)建高效的競(jìng)監(jiān)控系統(tǒng),讓您的決策“快人一步”。 1. 為什么需要實(shí)時(shí)競(jìng)監(jiān)控? 電商市場(chǎng)瞬息萬(wàn)變,競(jìng)
    的頭像 發(fā)表于 08-06 14:38 ?432次閱讀

    aicube的n卡gpu索引該如何添加?

    請(qǐng)問(wèn)有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認(rèn)的gpu0,顯示不了
    發(fā)表于 07-25 08:18

    CSS6404L 在物聯(lián)網(wǎng)設(shè)備中的應(yīng)用優(yōu)勢(shì):低功耗高可靠的存儲(chǔ)革新與競(jìng)對(duì)比

    CSS6404L 通過(guò) “高集成度 + 低功耗 + 寬適應(yīng)” 的組合特性,在容量、功耗、性能及場(chǎng)景兼容性上全面超越同類競(jìng),尤其在需要兼顧長(zhǎng)續(xù)航、高速傳輸與緊湊設(shè)計(jì)的物聯(lián)網(wǎng)場(chǎng)景中,成為
    的頭像 發(fā)表于 06-06 15:35 ?406次閱讀
    CSS6404L 在物聯(lián)網(wǎng)設(shè)備中的應(yīng)用優(yōu)勢(shì):低功耗高可靠的存儲(chǔ)革新與<b class='flag-5'>競(jìng)</b><b class='flag-5'>品</b>對(duì)比

    破解藥企管理困局:安科瑞為南通某藥企提供微電網(wǎng)管理解決方案

    該項(xiàng)目位于南通市啟東經(jīng)濟(jì)開發(fā)區(qū),是一家以組合化學(xué)和現(xiàn)代藥物化學(xué)技術(shù)為核心的新藥研發(fā)企業(yè),是國(guó)內(nèi)某醫(yī)藥集團(tuán)公司的子公司。該項(xiàng)目計(jì)劃建設(shè)一個(gè)微電網(wǎng)
    的頭像 發(fā)表于 03-24 09:49 ?422次閱讀
    破解藥企<b class='flag-5'>能</b><b class='flag-5'>效</b>管理困局:安科瑞為南通某藥企提供微電網(wǎng)<b class='flag-5'>能</b><b class='flag-5'>效</b>管理解決方案

    TNC 連接器競(jìng)大對(duì)決,質(zhì)量誰(shuí)更勝一籌?

    綜合來(lái)看,在與競(jìng)的質(zhì)量對(duì)決中,TNC 連接器在電氣性能、機(jī)械性能和環(huán)境適應(yīng)性等方面展現(xiàn)出了明顯的優(yōu)勢(shì),能夠?yàn)楦黝愲娮釉O(shè)備提供更為可靠、穩(wěn)定的連接解決方案,是追求高質(zhì)量連接器用戶的理想
    的頭像 發(fā)表于 03-06 08:43 ?665次閱讀
    TNC 連接器<b class='flag-5'>競(jìng)</b><b class='flag-5'>品</b>大對(duì)決,質(zhì)量誰(shuí)更勝一籌?

    迅為3A6000開發(fā)板/龍芯3A6000與龍芯3A5000等龍架構(gòu)處理器軟件兼容

    龍芯 3A6000 處理器完全自主設(shè)計(jì)、性能優(yōu)異,代表了我國(guó)自主桌面 CPU 設(shè)計(jì)領(lǐng)域的最新里程碑成果。龍芯 3A6000 處理器的推出,說(shuō)明國(guó)產(chǎn) CPU 在自主可控程度和產(chǎn)品
    發(fā)表于 02-12 15:06

    天璣8400 搭載G720 GPU性能雙飆,打造驚艷越級(jí)游戲體驗(yàn)

    一貫的強(qiáng)項(xiàng)方面,天璣8400更是帶來(lái)越級(jí)旗艦的體驗(yàn),尤其是游戲場(chǎng)景,直接越級(jí)競(jìng)8系芯片,功耗更低、溫控更出色,這顆冰封之芯太強(qiáng)了。除了碾壓同級(jí)的全大核CPU,
    的頭像 發(fā)表于 12-24 13:55 ?1254次閱讀
    天璣8400 搭載G720 <b class='flag-5'>GPU</b><b class='flag-5'>性能</b><b class='flag-5'>能</b><b class='flag-5'>效</b>雙飆,打造驚艷越級(jí)游戲體驗(yàn)

    安科瑞管理監(jiān)測(cè)云平臺(tái)

    管理監(jiān)測(cè)云平臺(tái)的主要內(nèi)容包括以下幾個(gè)方面: 制定科學(xué)的管理制度和標(biāo)準(zhǔn); 建立完善的能源監(jiān)測(cè)系統(tǒng)和數(shù)據(jù)分析平臺(tái); 推進(jìn)節(jié)能技術(shù)和設(shè)備的研發(fā)
    的頭像 發(fā)表于 12-18 14:52 ?651次閱讀
    安科瑞<b class='flag-5'>能</b><b class='flag-5'>效</b>管理監(jiān)測(cè)云平臺(tái)

    IO模塊助力PLC,全面提升中水處理設(shè)備

    隨著我國(guó)環(huán)保事業(yè)的不斷發(fā)展,中水處理技術(shù)在工業(yè)、生活等領(lǐng)域發(fā)揮著越來(lái)越重要的作用。如何提高中水處理設(shè)備的,成為行業(yè)關(guān)注的焦點(diǎn)。本文將為您介紹明達(dá)技術(shù)高效解決方案——利用自主研發(fā)的分
    的頭像 發(fā)表于 12-16 14:57 ?595次閱讀
    IO模塊助力PLC,全面提升中水處理設(shè)備<b class='flag-5'>能</b><b class='flag-5'>效</b>

    訓(xùn)練AI大模型需要什么樣的gpu

    訓(xùn)練AI大模型需要選擇具有強(qiáng)大計(jì)算能力、足夠顯存、高效帶寬、良好散熱和比以及良好兼容性和擴(kuò)展性的GPU。在選擇時(shí),需要根據(jù)具體需求進(jìn)行權(quán)衡和選擇。
    的頭像 發(fā)表于 12-03 10:10 ?910次閱讀

    迅為3A6000_7A2000開發(fā)板龍芯全國(guó)產(chǎn)處理器與龍芯 3A5000完全兼容

    龍芯 3A6000 處理器完全自主設(shè)計(jì)、性能優(yōu)異,代表了我國(guó)自主桌面 CPU 設(shè)計(jì)領(lǐng)域的最新里程碑成果。龍芯 3A6000 處理器的推出,說(shuō)明國(guó)產(chǎn) CPU 在自主可控程度和產(chǎn)品
    發(fā)表于 11-19 11:15

    上海貝嶺小封裝物聯(lián)網(wǎng)監(jiān)測(cè)芯片BL0971介紹

    為實(shí)現(xiàn)這些監(jiān)測(cè)及應(yīng)用需求,上海貝嶺在之前的物聯(lián)網(wǎng)監(jiān)測(cè)芯片BL0972的基礎(chǔ)上,針對(duì)直流充電樁的應(yīng)用需求,推出了小封裝的BL0971交直流
    的頭像 發(fā)表于 11-15 11:27 ?1729次閱讀
    上海貝嶺<b class='flag-5'>超</b>小封裝物聯(lián)網(wǎng)<b class='flag-5'>能</b><b class='flag-5'>效</b>監(jiān)測(cè)芯片BL0971介紹

    天璣9400技術(shù)詳解:如何蟬聯(lián)GPU性能、雙冠軍

    全新高度,引發(fā)了廣泛好評(píng)。 天璣9400搭載全新頂級(jí)12核GPU G925,相較上代擁有超過(guò)41%的峰值性能飛躍,在保持與上一代相同的峰值性能下功耗節(jié)省接近一半。在媒體測(cè)評(píng)中,無(wú)論是極限性能
    的頭像 發(fā)表于 11-07 14:00 ?1145次閱讀
    天璣9400技術(shù)詳解:如何蟬聯(lián)<b class='flag-5'>GPU</b><b class='flag-5'>性能</b>、<b class='flag-5'>能</b><b class='flag-5'>效</b>雙冠軍

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    每個(gè)CUDA單元在 OpenCL 編程框架中都有對(duì)應(yīng)的單元。 倒金字塔結(jié)構(gòu)GPU存儲(chǔ)體系 共享內(nèi)存是開發(fā)者可配置的編程資源,使用門檻較高,編程上需要更多的人工顯式處理。 在并行計(jì)算架構(gòu)中,線程
    發(fā)表于 11-03 12:55