chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepSeek在昇騰上的模型部署的常見問題及解決方案

OSC開源社區(qū) ? 來源: OSC開源社區(qū) ? 2025-03-25 16:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2024年12月26日,DeepSeek-V3橫空出世,以其卓越性能備受矚目。該模型發(fā)布即支持昇騰,用戶可在昇騰硬件和MindIE推理引擎上實(shí)現(xiàn)高效推理,但在實(shí)際操作中,部署流程與常見問題困擾著不少開發(fā)者。

本文將為你詳細(xì)闡述昇騰DeepSeek模型部署的優(yōu)秀實(shí)踐。

昇騰DeepSeek模型部署的常見問題及解決方案見:
DeepSeek在昇騰上的模型部署 - 常見問題及解決方案
https://modelers.cn/updates/zh/modelers/20250226-deepseek-bestpractice-acend-deploy-part2/

01 硬件要求及組網(wǎng)

推薦參考配置如下,部署DeepSeek-V3/R1量化模型至少需要多節(jié)點(diǎn)Atlas 800I A2(8*64G)服務(wù)器。

本方案以DeepSeek-R1為主進(jìn)行介紹,DeepSeek-V3與R1的模型結(jié)構(gòu)和參數(shù)量一致,部署方式與R1相同。

b4125938-0952-11f0-9310-92fbcf53809c.jpg

02 運(yùn)行環(huán)境準(zhǔn)備

推薦使用鏡像部署

1、鏡像部署

昇騰官方在Ascend hub提供環(huán)境示例鏡像,含推理部署配套軟件以及模型運(yùn)行腳本,用戶可參考構(gòu)建運(yùn)行環(huán)境鏡像進(jìn)行部署。

鏡像部署及啟動(dòng)參照ModelZoo指南中“加載鏡像”章節(jié),該指南中還包含“容器啟動(dòng)”等指引:
https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/MindIE/LLM/DeepSeek/DeepSeek-R1#加載鏡像

鏡像申請(qǐng)/下載(含于上述指南):
https://www.hiascend.com/developer/ascendhub/detail/af85b724a7e5469ebd7ea13c3439d48f

b42efc50-0952-11f0-9310-92fbcf53809c.jpg

2、裸機(jī)部署

根據(jù)MindIE安裝指南安裝軟件包和運(yùn)行依賴軟件。

安裝指南:

根據(jù)指南安裝全部軟件包和環(huán)境
https://www.hiascend.com/document/detail/zh/mindie/100/envdeployment/instg/mindie_instg_0001.html

模型獲取:
https://modelers.cn/models/MindIE/DeepSeek-R1

03 權(quán)重文件準(zhǔn)備

BF16權(quán)重下載:https://modelers.cn/models/State_Cloud/DeepSeek-V3-BF16

INT8量化后權(quán)重下載:https://modelers.cn/models/State_Cloud/DeepSeek-R1-W8A8/tree/main

如已下載BF16模型,也可采用以下步驟進(jìn)行模型量化,權(quán)重BF16->INT8轉(zhuǎn)換預(yù)計(jì)7~8小時(shí)。

Step1:安裝ModelSlim

git clone https://gitee.com/ascend/msit.git

cd msit/msmodelslim

bash install.sh

Step2: 運(yùn)行量化命令

cd msit/msmodelslim/example/DeepSeek/

python3 quant_deepseek_w8a8.py

--model_path {浮點(diǎn)權(quán)重路徑}

--save_path {W8A8量化權(quán)重路徑}

更多詳細(xì)量化教程請(qǐng)參考 DeepSeek量化文檔 https://gitee.com/ascend/msit/tree/br_noncom_MindStudio_8.0.0_POC_20251231/msmodelslim/example/DeepSeek

Msmodelslim代碼倉 https://gitee.com/ascend/msit/tree/br_noncom_MindStudio_8.0.0_POC_20251231/msmodelslim

04 運(yùn)行前檢查

服務(wù)器檢查:https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/MindIE/LLM/DeepSeek/DeepSeek-R1#前置準(zhǔn)備 軟件版本配套檢查,含:HDK、CANN、PTA、MindIE、MindStudio 1、檢查組網(wǎng)鏈接狀態(tài) a)檢查物理鏈接for i in {0..7}; do hccn_tool -i $i -lldp -g | grep Ifname; done b)檢查鏈接情況for i in {0..7}; do hccn_tool -i $i -link -g ; done c)檢查網(wǎng)絡(luò)健康情況for i in {0..7}; do hccn_tool -i $i -net_health -g ; done d)查看偵測(cè)ip的配置是否正確for i in {0..7}; do hccn_tool -i $i -netdetect -g ; done e)查看網(wǎng)關(guān)是否配置正確for i in {0..7}; do hccn_tool -i $i -gateway -g ; done f)檢查NPU底層tls校驗(yàn)行為一致性,建議全0for i in {0..7}; do hccn_tool -i $i -tls -g ; done | grep switch g)# NPU底層tls校驗(yàn)行為置0操作for i in {0..7};do hccn_tool -i $i -tls -s enable 0;done

2、根據(jù)組網(wǎng)設(shè)置準(zhǔn)備rank_table_file.json

使用多節(jié)點(diǎn)推理時(shí),需要將包含設(shè)備ip,服務(wù)器ip等信息的json文件地址傳遞給底層通信算子。參考如下格式,配置rank_table_file.json:

b43fd6b0-0952-11f0-9310-92fbcf53809c.jpg

05 模型部署與配置

獨(dú)立模型: https://modelers.cn/models/MindIE/DeepSeek-R1

服務(wù)化部署:

1、運(yùn)行指南 https://modelers.cn/models/MindIE/DeepSeek-R1/blob/main/README.md(服務(wù)化測(cè)試)

2、服務(wù)啟動(dòng) https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0004.html

3、接口指引 https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0062.html

?

06 模型運(yùn)行

??

?

1、純模型測(cè)試

模型腳本已預(yù)制在鏡像中,參照以下鏈接即可拉起精度測(cè)試及模型測(cè)試https://modelers.cn/models/MindIE/DeepSeek-R1/blob/main/README.md (純模型測(cè)試部分)

b45b45d0-0952-11f0-9310-92fbcf53809c.jpg

2、服務(wù)化測(cè)試

1. 運(yùn)行指南 https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/MindIE/LLM/DeepSeek/DeepSeek-R1#服務(wù)化測(cè)試

2. 服務(wù)啟動(dòng) https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0004.html

3. 常用接口指引 https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0062.html

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 昇騰
    +關(guān)注

    關(guān)注

    1

    文章

    181

    瀏覽量

    7414
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    835

    瀏覽量

    3249

原文標(biāo)題:DeepSeek在昇騰上的模型部署-優(yōu)秀實(shí)踐

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    漫話之《一體機(jī)請(qǐng)就位》

    為什么DeepSeek部署「最優(yōu)解」?
    的頭像 發(fā)表于 03-07 00:12 ?2083次閱讀
    漫話<b class='flag-5'>昇</b><b class='flag-5'>騰</b>之《一體機(jī)請(qǐng)就位》

    Deepseek進(jìn)入業(yè)務(wù)深水區(qū),為什么需要大EP?

    行業(yè)智能化的高鐵,由大EP+DeepSeek的雙軌鋪成
    的頭像 發(fā)表于 03-17 15:09 ?1890次閱讀
    <b class='flag-5'>Deepseek</b>進(jìn)入業(yè)務(wù)深水區(qū),為什么需要<b class='flag-5'>昇</b><b class='flag-5'>騰</b>大EP?

    添越智創(chuàng)基于 RK3588 開發(fā)板部署測(cè)試 DeepSeek 模型全攻略

    DeepSeek 模型部署與測(cè)試,開啟這場(chǎng)充滿挑戰(zhàn)與驚喜的技術(shù)探索之旅。 RK3588 開發(fā)板:AI 性能擔(dān)當(dāng) RK3588 開發(fā)板基于先進(jìn)的 8nm LP 制程工藝精心打造,其硬件配置堪稱豪華,
    發(fā)表于 02-14 17:42

    香橙派系列開發(fā)板如何部署OpenClaw

    香橙派系列開發(fā)板解鎖專業(yè)級(jí)智能體,OpenClaw擁抱高算力未來 兩篇文章我們給出了香橙派此芯及RK系列產(chǎn)品部署OpenClaw的教程,接下來我們將這只智能小龍蝦接入到
    發(fā)表于 02-25 10:13

    OpenHarmony集成 AI

    OpenHarmony集成 AI:目前,沒有提供OpenHarmony系統(tǒng)可用的驅(qū)動(dòng)。如果OpenHarmony要用
    發(fā)表于 02-17 11:57

    思原生,助力智譜打造自主創(chuàng)新大模型體系!

    自從全面啟動(dòng)原生開發(fā),越來越多的生態(tài)伙伴選擇,大模型生態(tài)從“應(yīng)用遷移”走向“原生開發(fā)”,充分依托
    的頭像 發(fā)表于 08-20 18:29 ?1115次閱讀
    <b class='flag-5'>昇</b><b class='flag-5'>騰</b>與<b class='flag-5'>昇</b>思原生,助力智譜打造自主創(chuàng)新大<b class='flag-5'>模型</b>體系!

    中軟國(guó)際科創(chuàng)中心上線DeepSeek模型

    近日,中軟國(guó)際科創(chuàng)中心以“DeepSeek+”為引擎,緊跟行業(yè)趨勢(shì),將DeepSeek全參模型滿血版
    的頭像 發(fā)表于 02-08 18:02 ?1942次閱讀

    研華邊緣AI Box MIC-ATL3S部署Deepseek R1模型

    隨著深度求索(DeepSeek)大模型的發(fā)布引發(fā)行業(yè)熱議,研華科技基于Atlas平臺(tái)邊緣AI Box MIC-ATL3S正式發(fā)布與Deepsee
    的頭像 發(fā)表于 02-14 16:08 ?2985次閱讀
    研華邊緣AI Box MIC-ATL3S<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> R1<b class='flag-5'>模型</b>

    華為推出DeepSeek模型一體機(jī)

    DeepSeek模型的橫空出世,讓AI正以前所未有的速度重塑各行各業(yè)的發(fā)展格局。DeepSeek一體機(jī)深度融合
    的頭像 發(fā)表于 02-18 09:56 ?2803次閱讀

    云軸科技ZStack智塔攜手AI實(shí)現(xiàn)DeepSeek模型部署

    DeepSeek為人工智能AI產(chǎn)業(yè)帶來一場(chǎng)革命,為企業(yè)級(jí)AI應(yīng)用私有化部署場(chǎng)景(Private AI)注入強(qiáng)勁動(dòng)力。作為企業(yè)級(jí)私有化AI Infra平臺(tái),云軸科技ZStack智塔攜手
    的頭像 發(fā)表于 02-18 09:59 ?1433次閱讀
    云軸科技ZStack智塔攜手<b class='flag-5'>昇</b><b class='flag-5'>騰</b>AI實(shí)現(xiàn)<b class='flag-5'>DeepSeek</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    研華發(fā)布AI Box及Deepseek R1模型部署流程

    。這一舉措標(biāo)志著研華AI邊緣計(jì)算領(lǐng)域邁出了重要一步。 研華邊緣AI Box MIC-ATL3S依托芯片的強(qiáng)大異構(gòu)計(jì)算能力,結(jié)合研華邊緣計(jì)算領(lǐng)域的高可靠特點(diǎn),為用戶提供了高效、穩(wěn)
    的頭像 發(fā)表于 02-19 10:41 ?1281次閱讀

    推理服務(wù)器+DeepSeek模型 技術(shù)培訓(xùn)圖為科技成功舉辦

    DeepSeek模型的全面融合應(yīng)用即將邁入實(shí)質(zhì)性落地的新階段。 加持DeepSeek模型
    的頭像 發(fā)表于 02-26 17:38 ?1256次閱讀
    <b class='flag-5'>昇</b><b class='flag-5'>騰</b>推理服務(wù)器+<b class='flag-5'>DeepSeek</b>大<b class='flag-5'>模型</b> 技術(shù)培訓(xùn)<b class='flag-5'>在</b>圖為科技成功舉辦

    中軟國(guó)際發(fā)布基于計(jì)算架構(gòu)的“DeepSeek社?;鸨O(jiān)管大模型一體機(jī)”解決方案

    ? ? ? 為了提升社保基金監(jiān)管效能,推動(dòng)社?;鸸芾淼闹悄芑?、科學(xué)化、精準(zhǔn)化,中軟國(guó)際正式推出“DeepSeek社?;鸨O(jiān)管大模型一體機(jī)”解決方案。該方案基于
    的頭像 發(fā)表于 03-06 19:19 ?1852次閱讀
    中軟國(guó)際發(fā)布基于<b class='flag-5'>昇</b><b class='flag-5'>騰</b>計(jì)算架構(gòu)的“<b class='flag-5'>DeepSeek</b>社?;鸨O(jiān)管大<b class='flag-5'>模型</b>一體機(jī)”<b class='flag-5'>解決方案</b>

    潤(rùn)和軟件將持續(xù)深化“+DeepSeek”技術(shù)路線

    近日,“+DeepSeek 智算引擎創(chuàng)新行”江蘇省首站活動(dòng)南京成功舉辦,本次活動(dòng)由南京江北新區(qū)產(chǎn)業(yè)技術(shù)研創(chuàng)園指導(dǎo),江蘇省人工智能學(xué)會(huì)、江蘇鯤鵬·
    的頭像 發(fā)表于 03-08 09:39 ?1410次閱讀

    中軟國(guó)際推出金融AI解決方案和一體機(jī)v1.0

    近日,中軟國(guó)際重磅推出金融AI解決方案和一體機(jī)v1.0,該方案基于AI基礎(chǔ)軟硬件平臺(tái),完
    的頭像 發(fā)表于 03-28 17:05 ?1299次閱讀