chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

沐曦付軒:蹄急而步穩(wěn),GPU助力ChatGPT快、準、穩(wěn)全面發(fā)展

沐曦MetaX ? 來源:沐曦MetaX ? 2023-06-20 10:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2023年6月17日,由紹興市人民政府主辦的 2023 中國(紹興)集成電路產業(yè)峰會隆重舉行,“ChatGPT風向下的集成電路新趨勢”論壇及集成電路項目路演也同期舉行,為百余位產業(yè)從業(yè)者提供深入了解行業(yè)發(fā)展動態(tài)和交流合作的機會。沐曦首席解決方案架構師付軒受邀參會并發(fā)表演講。

付軒在“ChatGPT風向下的集成電路新趨勢”論壇中發(fā)表主題為《蹄急而步穩(wěn):ChatGPT與高性能GPU戰(zhàn)略概覽》的主題演講,分析了ChatGPT的應用特點及軟硬件需求,指出以ChatGPT為代表的大模型發(fā)展需要大的通用算力與矩陣算力作為支撐,并且作為基于GPU生態(tài)發(fā)展起來的模型,對GPU顯存、GPU間互聯(lián)通信、通用GPU編程框架及軟件生態(tài)等多方面均有很高的要求。因此,作為算力底座的GPU不僅需要算得快,還要算得準、算得穩(wěn),不僅要提供高效計算,還要保證結果準確,并且靈活可靠。

對此,可以采取以下策略:首先,針對ChatGPT大模型訓練,大集群3D并行是一種有效方式,能夠集張量并行、流水并行和數(shù)據(jù)并行為一體,與只有數(shù)據(jù)并行的小模型相比,是一種完全不同的復雜并行結構。在大模型推理方面,推理精度要求高,延遲容忍度高,帶來越來越多的云端高算力推理需求,更適合在數(shù)據(jù)中心中運行,也符合“東數(shù)西算”的戰(zhàn)略規(guī)劃。同時,基于高性能GPU生態(tài)的算法創(chuàng)新實現(xiàn)算子提速并極大減少顯存消耗,通用算力與矩陣算力的高效協(xié)作實現(xiàn)算子融合加速,穩(wěn)定可靠的千卡大集群、GPU軟硬件結合、“訓推一體”優(yōu)化保障訓練和推理的精度,均是能夠使大模型計算實現(xiàn)快、準、穩(wěn)的可行性措施。

沐曦作為一家提供全棧GPU芯片及解決方案的企業(yè),其旗艦產品曦云C500系列通用GPU采用沐曦自研IP,能夠提供強大的多精度混合算力,同時配以大容量存儲和新一代高速IO接口及多卡互聯(lián)技術,不論在矩陣算力、通用算力還是顯存規(guī)格方面均可全面支持大模型推理和訓練,并廣泛應用于人工智能、數(shù)據(jù)中心以及教育和科研等多種場景。同時,沐曦自主研發(fā)的MXMACA軟件棧能夠全面兼容主流GPU生態(tài),為客戶提供軟硬件一體的應用解決方案。目前,曦云MXC500芯片已于2023年6月13日成功回片點亮,預計將于今年年底實現(xiàn)量產。

總的來說,ChatGPT對于硬件和軟件均有需求,我們要更好地利用現(xiàn)有的GPU生態(tài),發(fā)揮通用算力與矩陣算力的全面優(yōu)勢,做好算子的算法創(chuàng)新和加速。同時,在做千卡大集群時,單節(jié)點內的多GPU互聯(lián)也是必須的。此外,當前各種大模型創(chuàng)新層出不窮,我們要把各種各樣的大模型遷移到曦云C500上來,因此生態(tài)兼容也至關重要。做到以上幾點,大模型就能夠更好地在國內實現(xiàn)高效迭代與應用落地。

關于沐曦

沐曦致力于為異構計算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產品,推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI訓練及通用計算,以及MXG系列GPU(曦彩)用于圖形渲染,滿足數(shù)據(jù)中心對“高能效”及“高通用性”的算力需求。沐曦產品均采用完全自主研發(fā)的GPU IP,擁有完全自主的指令集和架構,配以兼容主流GPU生態(tài)的完整軟件棧(MXMACA),具備高能效和高通用性的天然優(yōu)勢,能夠為客戶構建軟硬件一體的全面生態(tài)解決方案,是“雙碳”背景下推動數(shù)據(jù)中心建設和產業(yè)數(shù)字化、智能化轉型升級的算力基石。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 集成電路
    +關注

    關注

    5441

    文章

    12334

    瀏覽量

    371467
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5047

    瀏覽量

    133967
  • ChatGPT
    +關注

    關注

    29

    文章

    1595

    瀏覽量

    9900

原文標題:沐曦付軒:蹄急而步穩(wěn),GPU助力ChatGPT快、準、穩(wěn)全面發(fā)展

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    首款全國產通用GPU芯片發(fā)布 集成推出云C600

    集成電路(南京)有限公司近日正式發(fā)布了首款全國產通用GPU——云C600,這標志著國產高性能GPU實現(xiàn)歷史性突破。 據(jù)新華日報報道顯示
    的頭像 發(fā)表于 10-19 20:04 ?6581次閱讀

    GPU與龍蜥操作系統(tǒng)完成適配

    集成電路(上海)股份有限公司(以下簡稱"")于 2020 年 9 月成立于上海,其擁有技術完備、設計和產業(yè)化經(jīng)驗豐富的團隊,曾主導過十多款世界主流高性能
    的頭像 發(fā)表于 10-17 15:06 ?455次閱讀

    云C系列產品已支持TileLang

    近日,DeepSeek宣布在其新版本中擁抱國產GPU語言TileLang,引發(fā)業(yè)界廣泛關注。作為國產高性能GPU的代表,云C系列產品已
    的頭像 發(fā)表于 10-14 09:25 ?243次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C系列產品已支持TileLang

    AOI 檢測、機床運行穩(wěn)?杰和 AR707 撐起工控 “精準 + 高效”

    在智能制造升級浪潮中,企業(yè)生產線不僅要快,更要穩(wěn),并最終落地到“降本、提效、保質量、抗風險”四大核心需求上。工業(yè)計算機AR707憑借強算力、豐富接口和視覺處理能力,為生產線智能化設備帶來更快響應、更穩(wěn)性能,助力企業(yè)打造競爭力工廠。
    的頭像 發(fā)表于 09-08 08:46 ?395次閱讀
    AOI 檢測<b class='flag-5'>準</b>、機床運行<b class='flag-5'>穩(wěn)</b>?杰和 AR707 撐起工控 “精準 + 高效”

    書生大模型實戰(zhàn)營魔樂專場MeetUP精彩回顧

    近日,由書生大模型社區(qū)、、魔樂社區(qū)、算豐和 DaoCloud 道客等聯(lián)合打造的「書生大模型實戰(zhàn)營魔樂專場 MeetUP 暨頒獎儀式」在上海漕河涇國際孵化中心圓滿落幕。
    的頭像 發(fā)表于 08-20 11:33 ?695次閱讀

    液冷算力新標桿!科華數(shù)據(jù)聯(lián)合股份在世界人工智能大會首發(fā)高密度液冷算力POD

    ,科華數(shù)據(jù)與股份聯(lián)合推出的高密度液冷算力POD首次亮相,吸引了大量參會者駐足交流。該產品是科華數(shù)據(jù)專為高性能GPU服務器集群自主研發(fā)
    的頭像 發(fā)表于 07-29 15:57 ?540次閱讀
    液冷算力新標桿!科華數(shù)據(jù)聯(lián)合<b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份在世界人工智能大會首發(fā)高密度液冷算力POD

    亮相2025世界人工智能大會

    近日,2025世界人工智能大會(WAIC)核心分論壇在上海世博中心盛大啟幕。集成電路(上海)股份有限公司(以下簡稱“”)以“芯聚算力開芯局,源引AI共未來”為主題,聯(lián)合中國電
    的頭像 發(fā)表于 07-28 18:08 ?4250次閱讀

    硅基流動攜手首發(fā)基于云的Kimi K2推理服務

    天網(wǎng)絡”)運營的云C550 三千卡通用 GPU 國產集群。此次合作標志著硅基流動正式將該國產集群納入算力網(wǎng)絡,進一為大模型產業(yè)落地提
    的頭像 發(fā)表于 07-23 17:33 ?1403次閱讀

    GPU新星獲10億元融資!“燒錢”升級,高端芯片單項目投入近20億

    ,摩爾線程和股份也已正式提交上市申請。就在近期,壁仞和望也宣布完成新一輪融資,進一推動行業(yè)熱度攀升。 ? 然而,GPU作為典型的“燒
    的頭像 發(fā)表于 07-19 00:04 ?7810次閱讀
    <b class='flag-5'>GPU</b>新星獲10億元融資!“燒錢”升級,高端芯片單項目投入近20億

    PaddleScience完成與AI芯片適配

    當前,PaddleScience已與展開深度合作,涵蓋智能仿真、高性能計算、科學建模等多個方向。這一趨勢正加速形成面向"Al for Science"的國產智算生態(tài)新格局。
    的頭像 發(fā)表于 05-06 14:49 ?1132次閱讀

    云C500通用計算GPU與百度飛槳完成Ⅱ級兼容性測試

    近日,云C500通用計算GPU與百度飛槳已完成Ⅱ級兼容性測試。測試結果顯示,雙方兼容性表現(xiàn)良好,整體運行穩(wěn)定。這是
    的頭像 發(fā)表于 03-31 14:22 ?1262次閱讀

    加速DeepSeek滿血版單卡C500異構推理

    近日,基于開源KTransformers架構的 CPU/GPU 異構推理能力,云C500單卡GPU上成功實現(xiàn)DeepSeek-R1-
    的頭像 發(fā)表于 03-20 15:52 ?1704次閱讀

    Gitee AI 聯(lián)合首發(fā)全套 DeepSeek R1 千問蒸餾模型,全免費體驗!

    、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四個較小尺寸的 DeepSeek 模型。值得關注的是, 本次上線的四個模型均部署在國產
    的頭像 發(fā)表于 02-10 09:56 ?999次閱讀
    Gitee AI 聯(lián)合<b class='flag-5'>沐</b><b class='flag-5'>曦</b>首發(fā)全套 DeepSeek R1 千問蒸餾模型,全免費體驗!

    澎峰科技與完成聯(lián)合測試,實現(xiàn)全面兼容

    實現(xiàn)了全面兼容,為用戶提供了更為高效、穩(wěn)定的解決方案。 在測試過程中,澎峰科技與科技的技術團隊緊密協(xié)作,對PerfXLM和PerfXCloud在云系列
    的頭像 發(fā)表于 01-21 15:20 ?882次閱讀

    澎峰科技計算軟件棧與GPU完成適配和互認證

    ?近期,澎峰科技與完成了對PerfXLM(推理引擎)、PerfXCloud(大模型服務平臺)與云系列通用計算
    的頭像 發(fā)表于 01-21 09:51 ?1008次閱讀