chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

摩爾線程率先完成對“悟道·天鷹”大模型的推理兼容適配

摩爾線程 ? 來源:摩爾線程 ? 2023-06-12 14:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

6月,智源研究院在北京智源大會上重磅發(fā)布了全面開源的“悟道3.0”系列大模型,包括“悟道·天鷹”(Aquila)語言大模型等領(lǐng)先成果。目前,摩爾線程已率先完成對“悟道·天鷹”(Aquila)大模型的推理兼容適配,整個適配過程僅花費不到6小時時間,便實現(xiàn)與摩爾線程自研MUSAChat應(yīng)用的無縫集成。此前,摩爾線程曾在ChatGLM發(fā)布后24小時內(nèi)實現(xiàn)適配,并在數(shù)小時內(nèi)適配LLaMA模型,摩爾線程CUDA兼容的技術(shù)能力一再被驗證。

這充分得益于摩爾線程強大的代碼移植工具"MUSIFY"。該工具可快速將現(xiàn)有的CUDA程序遷移至摩爾線程MUSA,零成本完成CUDA代碼自動移植,之后用戶短時間內(nèi)即可完成熱點分析和針對性優(yōu)化,大大縮短遷移優(yōu)化的周期,從而使得大模型適配形成了標(biāo)準(zhǔn)“流水線作業(yè)”,讓開發(fā)者可以省時、省力、省事、省心。

目前,基于摩爾線程打造的AI云計算平臺,已經(jīng)可以運行ChatGLM、Stable Diffusion、LLaMA、“悟道3.0”等開源大模型,以及摩爾線程自研的MUSAChat和MUSABert等模型的部分訓(xùn)練和推理應(yīng)用。借助摩爾線程元計算統(tǒng)一系統(tǒng)架構(gòu)MUSA,用戶可以復(fù)用PyTorch開源社區(qū)的大量模型算子,降低開發(fā)成本。與此同時,摩爾線程開源的MT Pytorch可以支持多種模型的推理,覆蓋CV、NLP、語音等多個領(lǐng)域,能夠運行典型的大模型分布式多卡推理,也可以支持單機多卡與多機多卡的分布式訓(xùn)練。利用數(shù)據(jù)并行、模型并行以及ZERO等分布式訓(xùn)練技術(shù),MT PyTorch還可以完成簡單基礎(chǔ)模型以及典型Transformer結(jié)構(gòu)的NLP語言模型的訓(xùn)練。

據(jù)悉,智源此次發(fā)布的“悟道3.0”系列開源模型涵蓋語言、視覺、多模態(tài)等基礎(chǔ)大模型,其中,“悟道·天鷹”(Aquila)語言大模型是首個具備中英雙語知識、支持商用許可協(xié)議、國內(nèi)數(shù)據(jù)合規(guī)需求的開源語言大模型。其在中英文高質(zhì)量語料基礎(chǔ)上從0開始訓(xùn)練,通過數(shù)據(jù)質(zhì)量的控制、多種訓(xùn)練的優(yōu)化方法,實現(xiàn)在更小的數(shù)據(jù)集、更短的訓(xùn)練時間內(nèi),獲得比其他開源模型更優(yōu)的性能。

“悟道?天鷹(Aquila)”語言大模型開源商用許可無疑將會成為自主大語言模型產(chǎn)業(yè)生態(tài)的一個里程碑事件。摩爾線程也愿與眾多優(yōu)秀的基礎(chǔ)模型供應(yīng)商深度合作,攜手從硬件、算子、算法多個方面進行深度優(yōu)化,從硬件、軟件、模型、業(yè)務(wù)多個維度賦能應(yīng)用開發(fā)商,致力于讓大模型更好賦能千行百業(yè)。
責(zé)任編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7314

    瀏覽量

    93919
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3645

    瀏覽量

    51685
  • 摩爾線程
    +關(guān)注

    關(guān)注

    2

    文章

    252

    瀏覽量

    6179

原文標(biāo)題:“悟道·天鷹”(Aquila)發(fā)布24小時后,摩爾線程率先實現(xiàn)兼容適配

文章出處:【微信號:moorethreads,微信公眾號:摩爾線程】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    摩爾線程發(fā)布大模型訓(xùn)練仿真工具SimuMax v1.0

    近日,摩爾線程正式發(fā)布并開源大模型分布式訓(xùn)練仿真工具SimuMax 1.0版本。該版本在顯存和性能仿真精度上實現(xiàn)突破性提升,同時引入多項關(guān)鍵功能,進一步增強了模型
    的頭像 發(fā)表于 09-11 18:19 ?3309次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>發(fā)布大<b class='flag-5'>模型</b>訓(xùn)練仿真工具SimuMax v1.0

    澎峰科技完成OpenAI最新開源推理模型適配

    澎峰科技現(xiàn)已完成 OpenAI 最新開源推理模型 gpt-oss-20b 在 DeepFusion 大模型一體機上的原生適配與優(yōu)化,用戶可一鍵啟用這顆“小而強悍”的新引擎,在本地享受企
    的頭像 發(fā)表于 08-14 11:34 ?1129次閱讀

    摩爾線程“AI工廠”:五大核心技術(shù)支撐,打造大模型訓(xùn)練超級工廠

    演講中表示,為應(yīng)對生成式AI爆發(fā)式增長下的大模型訓(xùn)練效率瓶頸,摩爾線程將通過系統(tǒng)級工程創(chuàng)新,構(gòu)建新一代AI訓(xùn)練基礎(chǔ)設(shè)施,致力于為AGI時代打造生產(chǎn)先進模型的“超級工廠”。 ? “AI工
    的頭像 發(fā)表于 07-28 11:28 ?3920次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>“AI工廠”:五大核心技術(shù)支撐,打造大<b class='flag-5'>模型</b>訓(xùn)練超級工廠

    摩爾線程率先支持騰訊混元-A13B模型

    近日,騰訊正式開源基于專家混合(MoE)架構(gòu)的大語言模型混元-A13B。同日,摩爾線程團隊?wèi){借技術(shù)前瞻性,率先完成
    的頭像 發(fā)表于 07-04 14:10 ?665次閱讀

    Say Hi to ERNIE!Imagination GPU率先完成文心大模型的端側(cè)部署

    ImaginationTechnologies宣布率先完成百度文心大模型(ERNIE4.5開源版)在其GPU硬件上的端側(cè)部署。適配完成后,開
    的頭像 發(fā)表于 07-01 08:17 ?755次閱讀
    Say Hi to ERNIE!Imagination GPU<b class='flag-5'>率先</b><b class='flag-5'>完成</b>文心大<b class='flag-5'>模型</b>的端側(cè)部署

    壁仞科技完成Qwen3旗艦模型適配

    近日,在高效適配Qwen3系列模型推理后,壁仞科技宣布完成旗艦版Qwen3-235B-A22B模型的訓(xùn)練
    的頭像 發(fā)表于 05-16 16:23 ?766次閱讀

    摩爾線程GPU率先支持Qwen3全系列模型

    近日,阿里云正式發(fā)布Qwen3系列的8款開源混合推理模型。摩爾線程團隊在模型發(fā)布當(dāng)天,率先完成
    的頭像 發(fā)表于 05-07 15:24 ?834次閱讀

    摩爾線程GPU成功適配Deepseek-V3-0324大模型

    架構(gòu)和全功能GPU的強大技術(shù)實力,摩爾線程迅速響應(yīng)并完成了對DeepSeek-V3的無縫升級,實現(xiàn)了零報錯、零兼容性問題的光速部署,充分展現(xiàn)了摩爾
    的頭像 發(fā)表于 03-31 11:34 ?1090次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>GPU成功<b class='flag-5'>適配</b>Deepseek-V3-0324大<b class='flag-5'>模型</b>

    摩爾線程與當(dāng)虹科技達成深度合作

    近日,摩爾線程與當(dāng)虹科技達成深度合作,基于國產(chǎn)GPU成功完成了與BlackEye多模態(tài)視聽大模型的深度融合。雙方聯(lián)手打造專業(yè)級視聽“引擎”,并在超高清GPU算力場景中成功落地。
    的頭像 發(fā)表于 03-20 15:22 ?1252次閱讀

    摩爾線程GPU原生FP8計算助力AI訓(xùn)練

    并行訓(xùn)練和推理,顯著提升了訓(xùn)練效率與穩(wěn)定性。摩爾線程是國內(nèi)率先原生支持FP8計算精度的國產(chǎn)GPU企業(yè),此次開源不僅為AI訓(xùn)練和推理提供了全新
    的頭像 發(fā)表于 03-17 17:05 ?1185次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>GPU原生FP8計算助力AI訓(xùn)練

    摩爾線程支持阿里云通義千問QwQ-32B開源模型

    近日,阿里云團隊正式開源全新推理模型——通義千問QwQ-32B。摩爾線程在該模型發(fā)布后2小時內(nèi),迅速且高效完成了對千問QwQ-32B的支持。
    的頭像 發(fā)表于 03-07 17:48 ?1092次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>支持阿里云通義千問QwQ-32B開源<b class='flag-5'>模型</b>

    摩爾線程全面支持DeepSeek開源周成果

    DeepSeek開源周正式收官,作為國內(nèi)率先原生支持FP8計算精度的國產(chǎn)GPU企業(yè),摩爾線程迅速響應(yīng),并在短時間內(nèi),成功實現(xiàn)對DeepSeek各個開源項目的全面支持,涵蓋FlashMLA
    的頭像 發(fā)表于 03-04 10:06 ?825次閱讀

    摩爾線程完成DeepSeek開源庫FlashMLA和DeepGEMM適配

    MUTLASS,快速支持了FlashMLA。不僅如此,摩爾線程還基于MUTLASS在全新GPU架構(gòu)上優(yōu)化實現(xiàn)了FP8矩陣乘法,支持DeepGEMM的相應(yīng)功能,充分展示了摩爾線程MUSA
    的頭像 發(fā)表于 02-27 14:40 ?1061次閱讀

    昆侖芯率先完成Deepseek訓(xùn)練推理全版本適配

    本文是昆侖芯適配DeepSeek系列推文第一篇,將于近期分別推出在昆侖芯P800上進行DeepSeek-V3/R1推理、訓(xùn)練的深度文章,干貨滿滿、持續(xù)關(guān)注!
    的頭像 發(fā)表于 02-06 15:13 ?2241次閱讀
    昆侖芯<b class='flag-5'>率先</b><b class='flag-5'>完成</b>Deepseek訓(xùn)練<b class='flag-5'>推理</b>全版本<b class='flag-5'>適配</b>

    摩爾線程宣布成功部署DeepSeek蒸餾模型推理服務(wù)

    近日,摩爾線程智能科技(北京)有限責(zé)任公司在其官方渠道發(fā)布了一則重要消息,宣布公司已經(jīng)成功實現(xiàn)了對DeepSeek蒸餾模型推理服務(wù)的部署。這一技術(shù)突破,標(biāo)志著
    的頭像 發(fā)表于 02-06 13:49 ?1176次閱讀