DeepGEMM 是一個專為簡潔高效的 FP8 通用矩陣乘法(GEMM)設(shè)計的庫,具有細粒度縮放功能,在Deepseek開源周的第三天Deepseek正式宣布開源DeepGEMM。
據(jù)悉GEMMs同時支持普通的和專家混合(MoE)分組的GEMM運算。而且代碼庫非常簡潔,只有一個核心內(nèi)核函數(shù),代碼量約為300行。DeepGEMM采用CUDA編寫,這使得DeepGEMM在安裝過程中無需編譯,通過在運行時使用輕量級即時編譯模塊來編譯所有內(nèi)核。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
DeepSeek
+關(guān)注
關(guān)注
2文章
830瀏覽量
3088
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】--全書概覽
DeepSeek對人工智能技術(shù)格局的一個影響
第六章 DeepSeek開源技術(shù)剖析
第七章 大模型發(fā)展未來展望
全書圖文并茂,對專業(yè)技術(shù)屬于進行了講解,也有對流程、框架、參數(shù)的展示,結(jié)合案例與應(yīng)用方面的代入,是非常好的對
發(fā)表于 07-21 00:04
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】書籍介紹+第一章讀后心得
進行了深入的分析。通過對 FlashMLA、DeepEP、DeepGEMM、DualPipe 與 EPLB、3FS 等項目的介紹,展示了 DeepSeek 在開源領(lǐng)域的積極探索,體現(xiàn)了其推動大模型技術(shù)
發(fā)表于 07-17 11:59
【書籍評測活動NO.62】一本書讀懂 DeepSeek 全家桶核心技術(shù):DeepSeek 核心技術(shù)揭秘
進行了深入的分析。通過對 FlashMLA、DeepEP、DeepGEMM、DualPipe 與 EPLB、3FS 等項目的介紹,展示了 DeepSeek 在開源領(lǐng)域的積極探索,體現(xiàn)了其推動大模型技術(shù)
發(fā)表于 06-09 14:38
摩爾線程全面支持DeepSeek開源周成果
DeepSeek開源周正式收官,作為國內(nèi)率先原生支持FP8計算精度的國產(chǎn)GPU企業(yè),摩爾線程迅速響應(yīng),并在短時間內(nèi),成功實現(xiàn)對DeepSeek各個開源項目的全面支持,涵蓋FlashML
摩爾線程支持DeepSeek開源通信庫DeepEP和并行算法DualPipe
DeepSeek開源周第四日,摩爾線程宣布已成功支持DeepSeek開源通信庫DeepEP和并行算法DualPipe,并發(fā)布相關(guān)
摩爾線程完成DeepSeek開源庫FlashMLA和DeepGEMM適配
自DeepSeek啟動“開源周”以來,已陸續(xù)開源三個代碼庫。摩爾線程基于全新MUSA Compute Capability 3.1計算架構(gòu),可提供原生FP8計算能力,同時升級了高性能線性代數(shù)模板庫
DeepSeek扔的第二枚開源王炸是什么
在DeepSeek啟動的“開源周”上(Open Source Week)DeepSeek將陸續(xù)開源5個代碼庫,大家關(guān)心的DeepSeek扔的
沐曦GPU跑通DeepSeek開源代碼庫FlashMLA
今日,DeepSeek正式啟動"開源周"計劃,首發(fā)代碼庫FlashMLA一經(jīng)開源即引發(fā)全網(wǎng)關(guān)注。截至發(fā)稿,該項目已在GitHub斬獲超7.2K Star!
鴻蒙原生應(yīng)用開發(fā)也可以使用DeepSeek了
近期DeepSeek火爆全球,那一樣很火的開發(fā)鴻蒙原生應(yīng)用的DevEco Studio如果把它接入,會發(fā)生什么“化學(xué)反應(yīng)”呢?下面我們將詳細分享如何在DevEco Studio中利用CodeGPT
發(fā)表于 02-20 18:06
Banana Pi開源社區(qū)基于瑞芯微RK3588開發(fā)板,DeepSeek開發(fā)利器
Banana Pi開源社區(qū)基于瑞芯微RK3588開發(fā)板,DeepSeek開發(fā)利器
開源大模型DeepSeek的開放內(nèi)容詳析
當(dāng)大家討論為什么 DeepSeek 能夠形成全球刷屏之勢,讓所有廠商、平臺都集成之時,「開源」成為了最大的關(guān)鍵詞之一,圖靈獎得主 Yann LeCun 稱其是「開源的勝利」。模型開源一
了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應(yīng)用選擇
DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的兩個不同定位的大模型,其核心差異主要體現(xiàn)在目標(biāo)場景、能力側(cè)重和技術(shù)優(yōu)化方向上。以下是二者的實質(zhì)性
發(fā)表于 02-14 02:08
deepseek國產(chǎn)芯片加速 DeepSeek的國產(chǎn)AI芯片天團
,從而紛紛繼續(xù)“卷”起來,效仿DeepSeek的“開源”模式。 對于DeepSeek本身,人們關(guān)注其如何在有限算力實現(xiàn)強大性能,更關(guān)注其在重重條令圍城之下的未來之路。而在最近,全世界的芯片廠商集體出動,紛紛
摩爾線程宣布成功部署DeepSeek蒸餾模型推理服務(wù)
近日,摩爾線程智能科技(北京)有限責(zé)任公司在其官方渠道發(fā)布了一則重要消息,宣布公司已經(jīng)成功實現(xiàn)了對DeepSeek蒸餾模型推理服務(wù)的部署。這一技術(shù)突破,標(biāo)志著摩爾線程在人工智能領(lǐng)域邁出了堅實的一步
深度解析deepseek開源是什么意思
Deepseek開源是指Deepseek項目的源代碼被公開,允許任何人免費查看、使用、修改和分發(fā)。
DeepSeek宣布開源DeepGEMM
評論