chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

沐曦付軒:蹄急而步穩(wěn),GPU助力ChatGPT快、準、穩(wěn)全面發(fā)展

沐曦MetaX ? 來源:沐曦MetaX ? 2023-06-20 10:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2023年6月17日,由紹興市人民政府主辦的 2023 中國(紹興)集成電路產(chǎn)業(yè)峰會隆重舉行,“ChatGPT風(fēng)向下的集成電路新趨勢”論壇及集成電路項目路演也同期舉行,為百余位產(chǎn)業(yè)從業(yè)者提供深入了解行業(yè)發(fā)展動態(tài)和交流合作的機會。沐曦首席解決方案架構(gòu)師付軒受邀參會并發(fā)表演講。

付軒在“ChatGPT風(fēng)向下的集成電路新趨勢”論壇中發(fā)表主題為《蹄急而步穩(wěn):ChatGPT與高性能GPU戰(zhàn)略概覽》的主題演講,分析了ChatGPT的應(yīng)用特點及軟硬件需求,指出以ChatGPT為代表的大模型發(fā)展需要大的通用算力與矩陣算力作為支撐,并且作為基于GPU生態(tài)發(fā)展起來的模型,對GPU顯存、GPU間互聯(lián)通信、通用GPU編程框架及軟件生態(tài)等多方面均有很高的要求。因此,作為算力底座的GPU不僅需要算得快,還要算得準、算得穩(wěn),不僅要提供高效計算,還要保證結(jié)果準確,并且靈活可靠。

對此,可以采取以下策略:首先,針對ChatGPT大模型訓(xùn)練,大集群3D并行是一種有效方式,能夠集張量并行、流水并行和數(shù)據(jù)并行為一體,與只有數(shù)據(jù)并行的小模型相比,是一種完全不同的復(fù)雜并行結(jié)構(gòu)。在大模型推理方面,推理精度要求高,延遲容忍度高,帶來越來越多的云端高算力推理需求,更適合在數(shù)據(jù)中心中運行,也符合“東數(shù)西算”的戰(zhàn)略規(guī)劃。同時,基于高性能GPU生態(tài)的算法創(chuàng)新實現(xiàn)算子提速并極大減少顯存消耗,通用算力與矩陣算力的高效協(xié)作實現(xiàn)算子融合加速,穩(wěn)定可靠的千卡大集群、GPU軟硬件結(jié)合、“訓(xùn)推一體”優(yōu)化保障訓(xùn)練和推理的精度,均是能夠使大模型計算實現(xiàn)快、準、穩(wěn)的可行性措施。

沐曦作為一家提供全棧GPU芯片及解決方案的企業(yè),其旗艦產(chǎn)品曦云C500系列通用GPU采用沐曦自研IP,能夠提供強大的多精度混合算力,同時配以大容量存儲和新一代高速IO接口及多卡互聯(lián)技術(shù),不論在矩陣算力、通用算力還是顯存規(guī)格方面均可全面支持大模型推理和訓(xùn)練,并廣泛應(yīng)用于人工智能、數(shù)據(jù)中心以及教育和科研等多種場景。同時,沐曦自主研發(fā)的MXMACA軟件棧能夠全面兼容主流GPU生態(tài),為客戶提供軟硬件一體的應(yīng)用解決方案。目前,曦云MXC500芯片已于2023年6月13日成功回片點亮,預(yù)計將于今年年底實現(xiàn)量產(chǎn)。

總的來說,ChatGPT對于硬件和軟件均有需求,我們要更好地利用現(xiàn)有的GPU生態(tài),發(fā)揮通用算力與矩陣算力的全面優(yōu)勢,做好算子的算法創(chuàng)新和加速。同時,在做千卡大集群時,單節(jié)點內(nèi)的多GPU互聯(lián)也是必須的。此外,當(dāng)前各種大模型創(chuàng)新層出不窮,我們要把各種各樣的大模型遷移到曦云C500上來,因此生態(tài)兼容也至關(guān)重要。做到以上幾點,大模型就能夠更好地在國內(nèi)實現(xiàn)高效迭代與應(yīng)用落地。

關(guān)于沐曦

沐曦致力于為異構(gòu)計算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產(chǎn)品,推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI訓(xùn)練及通用計算,以及MXG系列GPU(曦彩)用于圖形渲染,滿足數(shù)據(jù)中心對“高能效”及“高通用性”的算力需求。沐曦產(chǎn)品均采用完全自主研發(fā)的GPU IP,擁有完全自主的指令集和架構(gòu),配以兼容主流GPU生態(tài)的完整軟件棧(MXMACA),具備高能效和高通用性的天然優(yōu)勢,能夠為客戶構(gòu)建軟硬件一體的全面生態(tài)解決方案,是“雙碳”背景下推動數(shù)據(jù)中心建設(shè)和產(chǎn)業(yè)數(shù)字化、智能化轉(zhuǎn)型升級的算力基石。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 集成電路
    +關(guān)注

    關(guān)注

    5446

    文章

    12465

    瀏覽量

    372681
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5099

    瀏覽量

    134455
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1596

    瀏覽量

    10072

原文標題:沐曦付軒:蹄急而步穩(wěn),GPU助力ChatGPT快、準、穩(wěn)全面發(fā)展

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    股份GPU加速技術(shù)助力藥物研發(fā)降本增效

    股份科學(xué)計算團隊近期取得突破性進展,成功將主流分子動力學(xué)模擬引擎GROMACS中的FEP計算全流程部署于GPU執(zhí)行,并實現(xiàn)2.5倍性能提升,相關(guān)成果獲得GROMACS官方團隊的高度認可,該
    的頭像 發(fā)表于 12-02 15:58 ?224次閱讀

    瀚海量子與股份達成戰(zhàn)略合作 量子計算軟件領(lǐng)軍者+高性能GPU芯片領(lǐng)軍者

    當(dāng)量子計算軟件領(lǐng)軍者遇上高性能GPU芯片領(lǐng)軍者,國產(chǎn)算力領(lǐng)域迎來一項重磅合作。 近日, 合肥瀚海量子科技有限公司(簡稱“瀚海量子”)與集成電路(上海)股份有限公司(簡稱“
    的頭像 發(fā)表于 11-24 19:02 ?1995次閱讀

    股份與上海電信完成首期GPU生態(tài)專家認證培訓(xùn)

    近期,集成電路(上海)股份有限公司(以下簡稱“股份”)攜手上海電信天翼云能力運營中心(以下簡稱“云能力運營中心”)順利完成了首期GPU
    的頭像 發(fā)表于 10-31 10:33 ?252次閱讀

    首款全國產(chǎn)通用GPU芯片發(fā)布 集成推出云C600

    集成電路(南京)有限公司近日正式發(fā)布了首款全國產(chǎn)通用GPU——云C600,這標志著國產(chǎn)高性能GPU實現(xiàn)歷史性突破。 據(jù)新華日報報道顯示
    的頭像 發(fā)表于 10-19 20:04 ?4.5w次閱讀

    GPU與龍蜥操作系統(tǒng)完成適配

    集成電路(上海)股份有限公司(以下簡稱"")于 2020 年 9 月成立于上海,其擁有技術(shù)完備、設(shè)計和產(chǎn)業(yè)化經(jīng)驗豐富的團隊,曾主導(dǎo)過十多款世界主流高性能
    的頭像 發(fā)表于 10-17 15:06 ?810次閱讀

    云C系列產(chǎn)品已支持TileLang

    近日,DeepSeek宣布在其新版本中擁抱國產(chǎn)GPU語言TileLang,引發(fā)業(yè)界廣泛關(guān)注。作為國產(chǎn)高性能GPU的代表,云C系列產(chǎn)品已
    的頭像 發(fā)表于 10-14 09:25 ?636次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C系列產(chǎn)品已支持TileLang

    書生大模型實戰(zhàn)營魔樂專場MeetUP精彩回顧

    近日,由書生大模型社區(qū)、、魔樂社區(qū)、算豐和 DaoCloud 道客等聯(lián)合打造的「書生大模型實戰(zhàn)營魔樂專場 MeetUP 暨頒獎儀式」在上海漕河涇國際孵化中心圓滿落幕。
    的頭像 發(fā)表于 08-20 11:33 ?902次閱讀

    亮相2025世界人工智能大會

    近日,2025世界人工智能大會(WAIC)核心分論壇在上海世博中心盛大啟幕。集成電路(上海)股份有限公司(以下簡稱“”)以“芯聚算力開芯局,源引AI共未來”為主題,聯(lián)合中國電
    的頭像 發(fā)表于 07-28 18:08 ?4464次閱讀

    硅基流動攜手首發(fā)基于云的Kimi K2推理服務(wù)

    天網(wǎng)絡(luò)”)運營的云C550 三千卡通用 GPU 國產(chǎn)集群。此次合作標志著硅基流動正式將該國產(chǎn)集群納入算力網(wǎng)絡(luò),進一為大模型產(chǎn)業(yè)落地提
    的頭像 發(fā)表于 07-23 17:33 ?1561次閱讀

    PaddleScience完成與AI芯片適配

    當(dāng)前,PaddleScience已與展開深度合作,涵蓋智能仿真、高性能計算、科學(xué)建模等多個方向。這一趨勢正加速形成面向"Al for Science"的國產(chǎn)智算生態(tài)新格局。
    的頭像 發(fā)表于 05-06 14:49 ?1337次閱讀

    云C500通用計算GPU與百度飛槳完成Ⅱ級兼容性測試

    近日,云C500通用計算GPU與百度飛槳已完成Ⅱ級兼容性測試。測試結(jié)果顯示,雙方兼容性表現(xiàn)良好,整體運行穩(wěn)定。這是
    的頭像 發(fā)表于 03-31 14:22 ?1481次閱讀

    加速DeepSeek滿血版單卡C500異構(gòu)推理

    近日,基于開源KTransformers架構(gòu)的 CPU/GPU 異構(gòu)推理能力,云C500單卡GPU上成功實現(xiàn)DeepSeek-R1-
    的頭像 發(fā)表于 03-20 15:52 ?1888次閱讀

    Gitee AI 聯(lián)合首發(fā)全套 DeepSeek R1 千問蒸餾模型,全免費體驗!

    、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四個較小尺寸的 DeepSeek 模型。值得關(guān)注的是, 本次上線的四個模型均部署在國產(chǎn)
    的頭像 發(fā)表于 02-10 09:56 ?1099次閱讀
    Gitee AI 聯(lián)合<b class='flag-5'>沐</b><b class='flag-5'>曦</b>首發(fā)全套 DeepSeek R1 千問蒸餾模型,全免費體驗!

    澎峰科技與完成聯(lián)合測試,實現(xiàn)全面兼容

    實現(xiàn)了全面兼容,為用戶提供了更為高效、穩(wěn)定的解決方案。 在測試過程中,澎峰科技與科技的技術(shù)團隊緊密協(xié)作,對PerfXLM和PerfXCloud在云系列
    的頭像 發(fā)表于 01-21 15:20 ?966次閱讀

    澎峰科技計算軟件棧與GPU完成適配和互認證

    ?近期,澎峰科技與完成了對PerfXLM(推理引擎)、PerfXCloud(大模型服務(wù)平臺)與云系列通用計算
    的頭像 發(fā)表于 01-21 09:51 ?1186次閱讀