這是RISC-V跑大模型系列的第二篇文章,主要教大家如何將LLaMA移植到RISC-V環(huán)境里。
1. 環(huán)境準(zhǔn)備
1)最新版Python
2)確保機(jī)器有足夠的內(nèi)存加載完整模型(7B模型需要13~15G)
3)下載原版LLaMA模型和擴(kuò)展了的中文模型
2. 模型下載
從LLaMA原版模型地址上下載下述文件(我們使用的是7B):
最后文件下載完成后的結(jié)果如下:
3. 加載并啟動
1)這一步需要下載llama.cpp,
python3 convert-pth-to-ggml.py models/7B/ 03)將.pth模型權(quán)重轉(zhuǎn)換為ggml的FP32格式,生成文件路徑為models/7B/ggml-model-f32.bin。

4)運(yùn)行./main二進(jìn)制文件,-m命令指定Q4量化模型(也可加載ggml-FP16的模型)。以下是解碼參數(shù)及示例:
./main models/7B/ggml-model-f32.bin --color -f prompts/alpaca.txt -ins -c 256 --temp 0.2 -n 128 --repeat_penalty 1.3
參數(shù)解釋:
| -ins | 啟動類ChatGPT對話交流的運(yùn)行模式 |
| -f | 指定prompt模板,alpaca模型請加載prompts/alpaca.txt |
| -c | 控制上下文的長度,值越大越能參考更長的對話歷史(默認(rèn):512) |
| -n | 控制回復(fù)生成的最大長度(默認(rèn):128) |
| -t | 控制batch size(默認(rèn):8),可適當(dāng)增加 |
| --repeat_penalty | 控制線程數(shù)量(默認(rèn):4),可適當(dāng)增加 |
| --temp | 溫度系數(shù),值越低回復(fù)的隨機(jī)性越小,反之越大 |
| --top_p, top_k | 控制解碼采樣的相關(guān)參數(shù) |
審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
解碼器
+關(guān)注
關(guān)注
9文章
1225瀏覽量
43759 -
python
+關(guān)注
關(guān)注
58文章
4884瀏覽量
90298 -
RISC-V
+關(guān)注
關(guān)注
49文章
2944瀏覽量
53529 -
澎峰科技
+關(guān)注
關(guān)注
0文章
83瀏覽量
3756 -
ChatGPT
+關(guān)注
關(guān)注
31文章
1600瀏覽量
10391
原文標(biāo)題:RISC-V 跑大模型(二):LLaMA零基礎(chǔ)移植教程
文章出處:【微信號:perfxlab,微信公眾號:perfxlab】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
RISC-V 跑大模型(三):LLaMA中文擴(kuò)展
這是RISC-V跑大模型系列的第三篇文章,前面我們?yōu)榇蠹医榻B了如何在RISC-V下運(yùn)行LLaMA,本篇我們將會介紹如何為
開發(fā)板上玩GTA,RISC-V多項移植項目成功運(yùn)作中
開發(fā)板上玩GTA ,RISC-V 多項移植項目成功運(yùn)作中 ? RISC-V近期再度掀起了不小的熱度,蘋果招募RISC-V程序員負(fù)責(zé)其操作系統(tǒng)的嵌入式子系統(tǒng),用于機(jī)器學(xué)習(xí)、視覺算法和信號
安卓上RISC-V,移植成最大阻礙
安卓上RISC-V ,移植成最大阻礙 ? RISC-V作為一個開源架構(gòu),目前已經(jīng)被諸多主流開源軟件、系統(tǒng)所支持,不少RISC-V廠商都以支持Linux為宣傳點。照理說同為開源的安卓系統(tǒng)
每日推薦 | HarmonyOS 從入門到大神資料,從零開始寫RISC-V處理器經(jīng)驗連載
各位開發(fā)者們豐富的學(xué)習(xí)資源。為了方便大家獲取資料,現(xiàn)在只需掃描下面海報二維碼并回復(fù)關(guān)鍵字 “教程” 即可獲取大神資料,趕快掃碼領(lǐng)取吧!2、從零開始寫RISC-V處理器之四 實踐篇推薦理由:這里只介紹
發(fā)表于 08-23 10:08
目前國內(nèi)RISC-V架構(gòu)的MCU從程序從arm移植到RISC-V難度大嗎?
目前國內(nèi)RISC-V架構(gòu)的MCU從程序從arm移植到RISC-V難度大嗎?
發(fā)表于 03-09 10:00
RISC-V規(guī)范的演進(jìn) RISC-V何時爆發(fā)?
的規(guī)范會有怎樣的演進(jìn)?生態(tài)建設(shè)又會有什么大動作? RISC-V規(guī)范的演進(jìn) RISC-V基金會CTO Mark I.Himelstein在本周舉行的第二屆RISC-V國際開源論壇上分享了
?開發(fā)板上玩GTA RISC-V多項移植項目成功運(yùn)作中
也宣布將以RISC-V架構(gòu)再度進(jìn)入CPU市場。 這么多大廠紛紛在RISC-V上展開動作,但RISC-V的軟件生態(tài)尚未正式進(jìn)入爆發(fā)期。不過近期RISC-V軟件社區(qū)出現(xiàn)了多個
從零開始寫RISC-V處理器
RISC-V是這兩年才開始迅速發(fā)展的,因此關(guān)于RISC-V的學(xué)習(xí)參考資料目前還很少,特別是適合入門的資料,因此學(xué)習(xí)起來進(jìn)度很緩慢,于是萌生了自己從零開始寫RISC-V處理器核的想法。
發(fā)表于 03-17 09:46
?117次下載
基于RISC-V內(nèi)核單片機(jī)移植RTOS實時操作系統(tǒng)(一)
ARM上移植實時操作系統(tǒng)大家可能比較熟悉,且例程較多,對于RISC-V內(nèi)核的單片機(jī),可能相對比較陌生。下面結(jié)合WCH沁恒微電子的赤菟V103(CH32V103)和赤菟
解鎖RISC-V技術(shù)力量丨曹英杰:RISC-V與大模型探索
4月12日,第二期“大家來談芯|解鎖RISC-V技術(shù)力量”在上海臨港新片區(qū)頂科永久會址舉辦,本期沙龍聚焦RISC-V技術(shù),圍繞AI時代的RISC-V市場機(jī)會、
RISC-V跑大模型(二):LLaMA零基礎(chǔ)移植教程
評論