chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云天勵(lì)飛DeepEdge10適配DeepSeek開(kāi)源周“首個(gè)大招”:FlashMLA

AI機(jī)械姬 ? 來(lái)源:AI機(jī)械姬 ? 作者:AI機(jī)械姬 ? 2025-02-27 11:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2 月 24 日,DeepSeek"開(kāi)源周"正式啟動(dòng),并發(fā)布首個(gè)代碼庫(kù)FlashMLA,引發(fā)全球關(guān)注。

FlashMLA是針對(duì)英偉達(dá)Hopper GPU優(yōu)化的高效MLA解碼內(nèi)核,專(zhuān)為可變長(zhǎng)度序列優(yōu)化設(shè)計(jì),是DeepSeek高效使用算力的核心程序模塊。FlashMLA通過(guò)MLA解碼優(yōu)化與分頁(yè)KV緩存技術(shù),顯著提升硬件利用率,加速大語(yǔ)言模型解碼過(guò)程,有效提高響應(yīng)速度與吞吐量,適用于各種實(shí)時(shí)對(duì)話生成場(chǎng)景。

云天勵(lì)飛芯片團(tuán)隊(duì)在FlashMLA開(kāi)源后,迅速完成了DeepEdge10 平臺(tái)與FlashMLA的適配工作。在適配過(guò)程中,云天勵(lì)飛采用了Op fusion tiling、Online softmax、Double buffer、細(xì)粒度存算并行等先進(jìn)技術(shù),并基于自研的Triton-like編程語(yǔ)言快速開(kāi)發(fā)驗(yàn)證了高效的FlashMLA算子。通過(guò)一系列優(yōu)化,不僅顯著提升了計(jì)算效率,還大幅降低了顯存占用,充分展現(xiàn)了DeepEdge10 平臺(tái)“算力積木”芯片架構(gòu)的卓越優(yōu)勢(shì),以及其與DeepSeek生態(tài)的高度契合性。

今日,云天勵(lì)飛已將相關(guān)代碼提交至開(kāi)源平臺(tái)Gitee,為開(kāi)源AI貢獻(xiàn)了重要的技術(shù)力量。

算子的源碼地址為:

https://gitee.com/Intellifusion_2025/tyllm/blob/master/python/tylang/flash_mla.py

DeepEdge10 系列芯片是專(zhuān)門(mén)針對(duì)大模型時(shí)代打造的芯片,支持包括 Transformer 模型、BEV 模型、CV 大模型、LLM 大模型等各類(lèi)不同架構(gòu)的主流模型;基于自主可控的先進(jìn)國(guó)產(chǎn)工藝打造,采用獨(dú)特的“算力積木”架構(gòu),可靈活滿足智慧城市、智慧交通、智能制造、智慧倉(cāng)儲(chǔ)、機(jī)器人、邊緣智算中心等不同場(chǎng)景對(duì)算力的需求,為大模型推理提供強(qiáng)大動(dòng)力。

wKgZPGe_1piAUBg0AAd-aDFnMzU838.png

目前,DeepEdge10 芯片平臺(tái)已成功適配DeepSeek R1 系列模型及國(guó)產(chǎn)鴻蒙操作系統(tǒng)。未來(lái),云天勵(lì)飛將持續(xù)加大研發(fā)力度,推動(dòng)芯片在國(guó)產(chǎn)化領(lǐng)域取得更大突破,為國(guó)產(chǎn)AI生態(tài)建設(shè)貢獻(xiàn)更多力量。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 云天勵(lì)飛
    +關(guān)注

    關(guān)注

    0

    文章

    179

    瀏覽量

    12597
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    830

    瀏覽量

    3088
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    云天勵(lì)與金蝶達(dá)成戰(zhàn)略合作

    11月4日,在2025金蝶全球創(chuàng)見(jiàn)者大會(huì)上,云天勵(lì)與金蝶簽署戰(zhàn)略合作協(xié)議。
    的頭像 發(fā)表于 11-05 18:09 ?1587次閱讀

    云天勵(lì)攜手合作伙伴共探AI產(chǎn)業(yè)新拐點(diǎn)

    10月17日,云天勵(lì)攜手深圳市人工智能產(chǎn)業(yè)協(xié)會(huì)舉辦“智見(jiàn)未來(lái)·Agent時(shí)代的產(chǎn)業(yè)機(jī)遇”主題沙龍,邀請(qǐng)來(lái)自全國(guó)50余家企業(yè)高管齊聚深圳,共同探討AI時(shí)代的新趨勢(shì)、新挑戰(zhàn)與新機(jī)遇。
    的頭像 發(fā)表于 10-27 10:12 ?704次閱讀

    云天勵(lì)正式加入OISA生態(tài)

    近日,云天勵(lì)正式加入 OISA 生態(tài),攜手產(chǎn)業(yè)伙伴共同推動(dòng)國(guó)產(chǎn) AI 芯片互聯(lián)體系建設(shè),為中國(guó)算力生態(tài)注入新的動(dòng)力。
    的頭像 發(fā)表于 10-11 13:59 ?553次閱讀

    云天勵(lì)亮相2025全球AI芯片峰會(huì)

    9 月 17 日,全球 AI 芯片峰會(huì)在上海舉行,云天勵(lì)董事長(zhǎng)兼 CEO 陳寧出席并發(fā)表演講。
    的頭像 發(fā)表于 09-17 17:56 ?1236次閱讀

    湛江市與云天勵(lì)飛達(dá)成深度合作

    近日,湛江市與云天勵(lì)飛達(dá)成深度合作,正式啟動(dòng)基于DeepSeek底座的天書(shū)大模型服務(wù)平臺(tái)本地化部署工作。
    的頭像 發(fā)表于 03-05 09:41 ?877次閱讀

    摩爾線程全面支持DeepSeek開(kāi)源成果

    DeepSeek開(kāi)源周正式收官,作為國(guó)內(nèi)率先原生支持FP8計(jì)算精度的國(guó)產(chǎn)GPU企業(yè),摩爾線程迅速響應(yīng),并在短時(shí)間內(nèi),成功實(shí)現(xiàn)對(duì)DeepSeek各個(gè)開(kāi)源項(xiàng)目的全面支持,涵蓋
    的頭像 發(fā)表于 03-04 10:06 ?940次閱讀

    摩爾線程完成DeepSeek開(kāi)源庫(kù)FlashMLA和DeepGEMM適配

    DeepSeek啟動(dòng)“開(kāi)源”以來(lái),已陸續(xù)開(kāi)源三個(gè)代碼庫(kù)。摩爾線程基于全新MUSA Compute Capability 3.1計(jì)算架構(gòu),可提供原生FP8計(jì)算能力,同時(shí)升級(jí)了高性能線
    的頭像 發(fā)表于 02-27 14:40 ?1335次閱讀

    DeepSeek扔的第二枚開(kāi)源王炸是什么

    。 DeepSeek在其開(kāi)源活動(dòng)中連續(xù)扔出了兩枚震撼業(yè)界的“開(kāi)源王炸”--FlashMLA與DeepEP。 ? 在25日,也就是
    的頭像 發(fā)表于 02-26 11:05 ?1368次閱讀
    <b class='flag-5'>DeepSeek</b>扔的第二枚<b class='flag-5'>開(kāi)源</b>王炸是什么

    沐曦GPU跑通DeepSeek開(kāi)源代碼庫(kù)FlashMLA

    今日,DeepSeek正式啟動(dòng)"開(kāi)源"計(jì)劃,首發(fā)代碼庫(kù)FlashMLA一經(jīng)開(kāi)源即引發(fā)全網(wǎng)關(guān)注。截至發(fā)稿,該項(xiàng)目已在GitHub斬獲超7.2
    的頭像 發(fā)表于 02-25 16:25 ?1442次閱讀

    云天勵(lì)DeepEdge200芯片和智能拍攝AI眼鏡 亮相國(guó)家博物館“網(wǎng)絡(luò)發(fā)展新圖景成就展”

    篇章,通過(guò)實(shí)物展品、影像資料及場(chǎng)景還原,呈現(xiàn)網(wǎng)絡(luò)技術(shù)賦能千行百業(yè)的生動(dòng)實(shí)踐。 云天勵(lì)作為國(guó)內(nèi)邊緣AI領(lǐng)軍企業(yè)參與了此次成就展。在“融合賦能”展區(qū),云天
    的頭像 發(fā)表于 02-24 18:35 ?3916次閱讀

    云天勵(lì)AI技術(shù)為智慧教育注入新動(dòng)能

    2月20日-21日,云天勵(lì)受邀參加“科學(xué)教育?社會(huì)協(xié)同”資源對(duì)接交流活動(dòng)。在會(huì)上,云天勵(lì)全面
    的頭像 發(fā)表于 02-21 14:13 ?1128次閱讀

    云天天書(shū)大模型訓(xùn)推一體機(jī)成功適配DeepSeek

    近日,云天天書(shū)大模型訓(xùn)推一體機(jī)成功適配DeepSeek。該一體機(jī)由云天勵(lì)與華為聯(lián)合推出,可以部
    的頭像 發(fā)表于 02-14 11:02 ?1390次閱讀

    云天勵(lì)飛上線DeepSeek R1系列模型

    春節(jié)期間,云天勵(lì)芯片團(tuán)隊(duì)完成 DeepEdge10 “算力積木”芯片平臺(tái)與DeepSeek-R1-Distill-Qwen-1.5B、
    的頭像 發(fā)表于 02-06 10:39 ?1190次閱讀
    <b class='flag-5'>云天</b><b class='flag-5'>勵(lì)</b>飛上線<b class='flag-5'>DeepSeek</b> R1系列模型

    DeepEdge10芯片成功適配國(guó)產(chǎn)鴻蒙操作系統(tǒng)

    日前,DeepEdge10芯片已成功完成與國(guó)產(chǎn)鴻蒙操作系統(tǒng)的適配工作,標(biāo)志著該芯片在邊緣場(chǎng)景應(yīng)用領(lǐng)域?qū)崿F(xiàn)了供應(yīng)鏈及操作系統(tǒng)層面的全面國(guó)產(chǎn)化安全。 為實(shí)現(xiàn)這一適配,技術(shù)團(tuán)隊(duì)已構(gòu)建起針對(duì)鴻蒙操作系統(tǒng)
    的頭像 發(fā)表于 01-24 15:31 ?1448次閱讀

    云天勵(lì)DeepEdge10芯片與國(guó)產(chǎn)鴻蒙操作系統(tǒng)完成適配

    日前,DeepEdge10芯片已完成國(guó)產(chǎn)鴻蒙操作系統(tǒng)的適配。目前已構(gòu)建適配鴻蒙的芯片編譯平臺(tái)框架,完成圖形等子系統(tǒng)的適配?;?b class='flag-5'>DeepEdge10
    的頭像 發(fā)表于 01-24 10:14 ?1904次閱讀