一区二区三区啪偷拍视频,秋霞视频76

近日，摩爾線程宣布開(kāi)源高性能線性代數(shù)模板庫(kù)MUTLASS，以便開(kāi)發(fā)者能夠更高效針對(duì)摩爾線程全功能GPU的MUSA Core及Tensor Core等單元進(jìn)行編程，加速基于國(guó)產(chǎn)GPU的算子開(kāi)發(fā)以及算法創(chuàng)新。

在數(shù)值計(jì)算和深度學(xué)習(xí)領(lǐng)域，矩陣乘法（GEMM）及其變種(如FlashAttention、Convolution）是構(gòu)建復(fù)雜上層應(yīng)用的基石。然而，為了追求更高的算子融合效率或者更創(chuàng)新的算法，開(kāi)發(fā)者們往往需要超越標(biāo)準(zhǔn)化計(jì)算接口的限制，如標(biāo)準(zhǔn)BLAS接口以及芯片廠商的計(jì)算庫(kù)接口，以實(shí)現(xiàn)高性能的定制化算子。

MUTLASS（MUSA Templates for Linear Algebra Subroutines）正是為滿足這一需求而設(shè)計(jì)。作為摩爾線程專為MUSA架構(gòu)優(yōu)化的高性能計(jì)算庫(kù)，MUTLASS是基于開(kāi)源模板庫(kù)CUTLASS進(jìn)行的MUSA適配和定制化開(kāi)發(fā)、優(yōu)化，針對(duì)矩陣乘法及相關(guān)變種，MUTLASS提供了一系列高性能的C++模板組件，并采用了與muDNN庫(kù)類似的分層分解及數(shù)據(jù)搬運(yùn)策略，以確保性能的充分發(fā)揮。

在本次開(kāi)源的版本中，摩爾線程適配了CuTe后端庫(kù)，為其增加了第三代MUSA架構(gòu)的MMA計(jì)算原語(yǔ)，支持TF32/FP16/BF16/INT8等多種數(shù)據(jù)精度，并以此為基礎(chǔ)，初步實(shí)現(xiàn)了矩陣乘法、默認(rèn)實(shí)例庫(kù)、性能測(cè)試器及相關(guān)工具包的支持。

借助MUTLASS，開(kāi)發(fā)者們既可以靈活復(fù)用不同層級(jí)的模板組件，也可以按需修改各種模板組件的實(shí)現(xiàn)細(xì)節(jié)，以較低的開(kāi)發(fā)成本實(shí)現(xiàn)定制化的高性能算子，從而在摩爾線程全功能GPU上充分釋放性能，并嘗試更多的算法創(chuàng)新。

摩爾線程將持續(xù)優(yōu)化MUTLASS的性能，并不斷引入新的功能。我們誠(chéng)邀廣大開(kāi)發(fā)者體驗(yàn)MUTLASS，并提供寶貴的反饋意見(jiàn)，共同促進(jìn)MUTLASS在性能和功能上的持續(xù)完善，攜手推動(dòng)基于國(guó)產(chǎn)GPU的生態(tài)建設(shè)。

關(guān)于摩爾線程

摩爾線程成立于2020年10月，以全功能GPU為核心，致力于向全球提供加速計(jì)算的基礎(chǔ)設(shè)施和一站式解決方案，為各行各業(yè)的數(shù)智化轉(zhuǎn)型提供強(qiáng)大的AI計(jì)算支持。

我們的目標(biāo)是成為具備國(guó)際競(jìng)爭(zhēng)力的GPU領(lǐng)軍企業(yè)，為融合人工智能和數(shù)字孿生的數(shù)智世界打造先進(jìn)的加速計(jì)算平臺(tái)。我們的愿景是為美好世界加速。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

gpu

gpu

+關(guān)注

關(guān)注
28

文章
5091

瀏覽量
134392
開(kāi)源

開(kāi)源

+關(guān)注

關(guān)注
3

文章
4018

瀏覽量
45537
摩爾線程

摩爾線程

+關(guān)注

關(guān)注
2

文章
252

瀏覽量
6179

原文標(biāo)題：開(kāi)源MUTLASS｜摩爾線程加速基于國(guó)產(chǎn)GPU的算子開(kāi)發(fā)以及算法創(chuàng)新

文章出處：【微信號(hào)：moorethreads，微信公眾號(hào)：摩爾線程】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

摩爾線程開(kāi)源高性能線性代數(shù)模板庫(kù)MUTLASS

評(píng)論