前言:
在RK3588上部署Deepseek有兩種方法,分別是使用Ollama工具部署和使用瑞芯微官方的 RKLLM量化部署。Ollama 是一個(gè)開源的大模型服務(wù)工具,調(diào)用的是CPU進(jìn)行的運(yùn)算,如果要將RK3588強(qiáng)悍的NPU性能發(fā)揮出來,可以重點(diǎn)了解一下RKLLM量化部署。
一、RKLLM介紹
為了使用RK NPU,用戶需要先在計(jì)算機(jī)上安裝RKLLM-Toolkit工具。RKLLM-Toolkit 是為用戶提供在計(jì)算機(jī)上進(jìn)行大語言模型的量化、轉(zhuǎn)換的開發(fā)套件。通過該 工具提供的接口可以便捷地完成模型轉(zhuǎn)換和模型量化。

RKLLM的整體開發(fā)步驟主要分為:模型轉(zhuǎn)換和板端部署運(yùn)行。
模型轉(zhuǎn)換是使用RKLLM-Toolkit將預(yù)訓(xùn)練的大語言模型轉(zhuǎn)換為RKLLM格式。
板端部署運(yùn)行是調(diào)用RKLLM Runtime庫加載RKLLM模型到Rockchip NPU平臺(tái),然后進(jìn)行推理等操作。
二、DeepSeek-R1介紹
`DeepSeek-R1是深度求索(DeepSeek)公司推出的開源多模態(tài)大語言模型,專為長上下文理解和多模態(tài)交互優(yōu)化。DeepSeek-R1基于開源模型進(jìn)行了微調(diào),提供了1.5B、7B等參數(shù)版本的DeepSeek-R1-Distill模型,適合部署到邊緣設(shè)備。

三、部署過程
3.1獲取模型
從 deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B 獲取模型文件;
# 獲取DeepSeek-R1-Distill-Qwen-1.5Bgitclonehttps://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
3.2安裝轉(zhuǎn)換工具
在Ubuntu虛擬機(jī)安裝RKLLM-Toolkit,以便將DeepSeek-R1大語言模型轉(zhuǎn)換為RKLLM模型格式和編譯板端推理的可執(zhí)行程序,具體RKLLM-Toolkit環(huán)境安裝步驟不在此詳述;
3.3安裝轉(zhuǎn)換工具
使用RKLLM-Toolkit對(duì)模型進(jìn)行轉(zhuǎn)換。運(yùn)行模型轉(zhuǎn)換腳本;
cd rknn-llm/examples/rkllm_api_demo/bash build-linux.sh
生成的可執(zhí)行文件在:
build/build_linux_aarch64_Release/llm_demo
3.4板端部署
將轉(zhuǎn)換成功后的 DeepSeek-R1-Distill-Qwen-1.5B.rkllm 模型與編譯后的二進(jìn)制文件 llm_demo 復(fù)制到板端,并導(dǎo)入環(huán)境變量
exportLD_LIBRARY_PATH=$LD_LIBRARY_PATH:rknn-llm/rkllm-runtime/Linux/librkllm_api/aarch64
3.5運(yùn)行測試
運(yùn)行 llm_demo
./demo_Linux_aarch64/llm_demo./Deepseek-R1-Disti11-Qwen-1.5B.rkllm1000010000

四、測試效果
4.1環(huán)境說明

使用眺望電子EVM-RK3588開發(fā)套件,搭載8GB內(nèi)存配置,板載運(yùn)行Ubuntu20.04系統(tǒng)。通過SSH登入主板運(yùn)行模型,Debug調(diào)試口用于監(jiān)測運(yùn)行器件資源消耗。


4.2推理過程
Connecting to 192.168.0.37:22...Connection established.To escape to local shell, press 'Ctrl+Alt+]'.WARNING! The remote SSH server rejected X11 forwarding request._____ _ |_ _| __ _ | | ___ __ __ ___| | / _` | | | / _ \ \ \ /\ / / / _ \| | | (_| | | | | (_) | \ V V / | __/|_| \__,_| |_| \___/ \_/\_/ \___|
Welcome to Ubuntu 20.04.6 LTS (GNU/Linux 6.1.84 aarch64)* Documentation: https://help.ubuntu.com* Management: https://landscape.canonical.com* Support: https://ubuntu.com/proLast login: Tue Feb 11 1425 2025-bash: /opt/ros/noetic/setup.bash: No such file or directory-bash: /opt/ros/noetic/setup.bash: No such file or directoryroot@talowe-rk3588:~#root@talowe-rk3588:~# lsDeepseek-R1-Disti11-Qwen-1.5B.rkllm demo_Linux_aarch64root@talowe-rk3588:~# ./demo_Linux_aarch64/llm_demo ./Deepseek-R1-Disti11-Qwen-1.5B.rkllm 10000 10000rkllm init startI rkllm: rkllm-runtime version: 1.1.4, rknpu driver version: 0.9.8, platform: RK3588rkllm init success**********************可輸入以下問題對(duì)應(yīng)序號(hào)獲取回答/或自定義輸入********************[0] 現(xiàn)有一籠子,里面有雞和兔子若干只,數(shù)一數(shù),共有頭14個(gè),腿38條,求雞和兔子各有多少只?[1] 有28位小朋友排成一行,從左邊開始數(shù)第10位是學(xué)豆,從右邊開始數(shù)他是第幾位?*************************************************************************user: 0現(xiàn)有一籠子,里面有雞和兔子若干只,數(shù)一數(shù),共有頭14個(gè),腿38條,求雞和兔子各有多少只?robot:
4.3資源消耗
DeepSeek-R1模型輸出的回答結(jié)果清晰流暢,內(nèi)存資源占用797MB,NPU負(fù)載約為64%,在無風(fēng)扇環(huán)境下,溫升約10℃。

總而言之,DeepSeek-R1模型的強(qiáng)力有目共睹,同時(shí)也驗(yàn)證了眺望電子對(duì)RK3588系列處理器的深度優(yōu)化與強(qiáng)大可靠。如果您對(duì)部署過程感興趣,歡迎隨時(shí)與我們聯(lián)系,我們可以為您提供專業(yè)的技術(shù)支持,期待與您合作!
-
RK3588
+關(guān)注
關(guān)注
8文章
489瀏覽量
7033 -
LLM
+關(guān)注
關(guān)注
1文章
340瀏覽量
1256 -
DeepSeek
+關(guān)注
關(guān)注
2文章
822瀏覽量
2790
發(fā)布評(píng)論請(qǐng)先 登錄
從DeepSeek到Qwen,AI大模型的移植與交互實(shí)戰(zhàn)指南-飛凌嵌入式
【幸狐Omni3576邊緣計(jì)算套件試用體驗(yàn)】DeepSeek 部署及測試
實(shí)戰(zhàn)案例 | 299元國產(chǎn)工業(yè)級(jí)AI核心板部署DeepSeek-R1
RK3588開發(fā)板上部署DeepSeek-R1大模型的完整指南
米爾RK3576開發(fā)板評(píng)測】+ RKLLM-Toolkit 環(huán)境安裝
案例分享 ▏【瑞芯微RK3588】HZHY-AI300G智能盒部署DeepSeek-R1模型實(shí)戰(zhàn)指南
飛凌RK3588開發(fā)板上部署DeepSeek-R1大模型的完整指南(一)
Banana Pi開源社區(qū)基于瑞芯微RK3588開發(fā)板,DeepSeek開發(fā)利器
香橙派發(fā)布OrangePi 5Plus本地部署Deepseek-R1蒸餾模型指南
添越智創(chuàng)基于 RK3588 開發(fā)板部署測試 DeepSeek 模型全攻略
ATK-DLRK3588開發(fā)板deepseek-r1-1.5b/7b部署指南
了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇
在RK3588開發(fā)板上部署并測試DeepSeek模型

實(shí)戰(zhàn)案例 | 眺望RK3588 RKLLM部署DeepSeek-R1全流程
評(píng)論