chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

小身板大能量:樹莓派玩轉(zhuǎn) Phi-2、Mistral 和 LLaVA 等AI大模型~

上海晶珩電子科技有限公司 ? 2025-03-25 09:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

076e736c-0919-11f0-9434-92fbcf53809c.jpg

你是否想過(guò)在自己的設(shè)備上運(yùn)行自己的大型語(yǔ)言模型(LLMs)或視覺(jué)語(yǔ)言模型(VLMs)?你可能有過(guò)這樣的想法,但是一想到要從頭開始設(shè)置、管理環(huán)境、下載正確的模型權(quán)重,以及你的設(shè)備是否能處理這些模型的不確定性,你可能就猶豫了。

讓我們更進(jìn)一步。想象一下,在自己的信用卡大小的設(shè)備上——比如Raspberry Pi ——運(yùn)行自己的LLM或VLM。不可能嗎?完全不是。畢竟,我正在寫這篇帖子,所以這肯定是可能的。

確實(shí)可能,但為什么要這么做呢?

目前,在邊緣設(shè)備上運(yùn)行LLM似乎有些牽強(qiáng)。但這個(gè)特定的利基用例應(yīng)該會(huì)隨著時(shí)間的推移而成熟,我們肯定會(huì)看到一些很酷的邊緣解決方案,這些解決方案采用完全本地的生成式AI解決方案,在邊緣設(shè)備上運(yùn)行。

這也是為了探索可能性的極限。如果能在計(jì)算規(guī)模的這一極端實(shí)現(xiàn),那么在Raspberry Pi 和大型強(qiáng)大服務(wù)器GPU之間的任何級(jí)別上都可以實(shí)現(xiàn)。

傳統(tǒng)上,邊緣AI與計(jì)算機(jī)視覺(jué)緊密相連。探索在邊緣部署LLMs和VLMs為這個(gè)新興領(lǐng)域增添了一個(gè)令人興奮的維度。

最重要的是,我只是想用我最近購(gòu)買的Raspberry Pi 5做一些有趣的事情。

那么,我們?nèi)绾卧赗aspberry Pi 上實(shí)現(xiàn)這一切呢?使用Ollama!

什么是Ollama?

Ollama已經(jīng)成為在個(gè)人電腦上運(yùn)行本地LLMs的最佳解決方案之一,而無(wú)需處理從頭開始設(shè)置的麻煩。只需幾條命令,就可以毫無(wú)問(wèn)題地設(shè)置好一切。在我的經(jīng)驗(yàn)中,它完全自給自足,并且在多個(gè)設(shè)備和模型上都能完美運(yùn)行。它甚至提供了一個(gè)用于模型推理的REST API,因此你可以讓它在Raspberry Pi 上運(yùn)行,并從你的其他應(yīng)用程序和設(shè)備中調(diào)用它(如果你愿意的話)。

還有Ollama Web UI,這是一個(gè)與Ollama無(wú)縫運(yùn)行的漂亮的人工智能用戶界面(UI)/用戶體驗(yàn)(UX),適合那些對(duì)命令行界面感到不安的人。如果你愿意的話,它基本上是一個(gè)本地的ChatGPT界面。

Ollama和Ollama Web UI還支持VLM,如LLaVA,這為邊緣生成式AI用例打開了更多的大門。

技術(shù)要求

你只需要以下設(shè)備:

Raspberry Pi 5(或速度較慢的Raspberry Pi 4)——選擇8GB RAM版本以容納7B模型。

SD卡——至少16GB,容量越大,可容納的模型越多。預(yù)先加載有合適的操作系統(tǒng),如Raspbian Bookworm或Ubuntu。

互聯(lián)網(wǎng)連接

就像我之前提到的,在Raspberry Pi 上運(yùn)行Ollama已經(jīng)接近硬件譜系的極端。理論上,任何比Raspberry Pi 更強(qiáng)大的設(shè)備(只要它運(yùn)行Linux發(fā)行版并具有類似的內(nèi)存容量),都應(yīng)該能夠運(yùn)行Ollama和本文中討論的模型。

1. 安裝Ollama

為了在Raspberry Pi 上安裝Ollama,我們將避免使用Docker以節(jié)省資源。

在終端中運(yùn)行

curl https://ollama.ai/install.sh | sh

運(yùn)行上述命令后,你應(yīng)該會(huì)看到與下面類似的圖像。

07aa9018-0919-11f0-9434-92fbcf53809c.png

就像輸出所說(shuō)的那樣,轉(zhuǎn)到0.0.0.0:11434以驗(yàn)證Ollama是否正在運(yùn)行。由于我們使用的是Raspberry Pi ,所以看到“WARNING: No NVIDIA GPU detected. Ollama will run in CPU-only mode.”(警告:未檢測(cè)到NVIDIA GPU。Ollama將以僅CPU模式運(yùn)行。)是正常的。但是,如果你在這些說(shuō)明中看到的是應(yīng)該具有NVIDIA GPU的設(shè)備,那么可能出現(xiàn)了問(wèn)題。

2. 通過(guò)命令行運(yùn)行LLMs

查看官方the official Ollama model library,了解可以使用Ollama運(yùn)行的模型列表。在8GB的Raspberry Pi 上,大于7B的模型將無(wú)法容納。讓我們使用Phi-2,一個(gè)來(lái)自微軟推出的2.7B LLM,現(xiàn)在在MIT許可下。

在終端中運(yùn)行

ollama run phi

一旦你看到與下面類似的輸出,你就已經(jīng)在Raspberry Pi 上運(yùn)行了一個(gè)LLM!就是這么簡(jiǎn)單。

07c68d18-0919-11f0-9434-92fbcf53809c.png

以下是與Phi-2 2.7B的交互。顯然,你不會(huì)得到相同的輸出,但你應(yīng)該明白了

07e7b07e-0919-11f0-9434-92fbcf53809c.png

你可以嘗試其他模型,如Mistral、Llama-2等,只需確保SD卡上有足夠的空間存儲(chǔ)模型權(quán)重。

當(dāng)然,模型越大,輸出速度就越慢。在Phi-2 2.7B上,我可以獲得大約每秒4個(gè)令牌的速度。但是,使用Mistral 7B,生成速度下降到大約每秒2個(gè)令牌。一個(gè)令牌大致相當(dāng)于一個(gè)單詞。

以下是與Mistral 7B的交互

07feb92c-0919-11f0-9434-92fbcf53809c.png

現(xiàn)在我們已經(jīng)在Raspberry Pi 上運(yùn)行了LLMs,但還沒(méi)有結(jié)束。終端并不適合所有人。讓我們也讓Ollama Web UI運(yùn)行起來(lái)!

3. 安裝和運(yùn)行Ollama Web UI

我們將遵循Ollama Web UI GitHub存儲(chǔ)庫(kù)official Ollama Web UI GitHub Repository(https://github.com/open-webui/open-webui)上的說(shuō)明,在不使用Docker的情況下進(jìn)行安裝。它建議Node.js版本至少為20.10,因此我們將遵循這一建議。它還建議Python版本至少為3.11,但Raspbian OS已經(jīng)為我們安裝了該版本。

我們必須先安裝Node.js。在終端中運(yùn)行

curl -fsSL https://deb.nodesource.com/setup_20.x | sudo -E bash - &&\sudo apt-get install -y nodejs

對(duì)于未來(lái)的讀者,如果需要,可以將20.x更改為更合適的版本。

然后運(yùn)行下面的代碼塊。

git clone https://github.com/ollama-webui/ollama-webui.gitcd ollama-webui/
# Copying required .env filecp -RPp example.env .env
# Building Frontend Using Nodenpm inpm run build
# Serving Frontend with the Backendcd ./backendpip install -r requirements.txt --break-system-packages sh start.sh

這是對(duì)GitHub上提供的內(nèi)容的輕微修改。請(qǐng)注意,為了簡(jiǎn)潔和方便,我們沒(méi)有遵循最佳實(shí)踐,比如使用虛擬環(huán)境,并且我們使用了--break-system-packages標(biāo)志。如果遇到找不到uvicorn之類的錯(cuò)誤,請(qǐng)重新啟動(dòng)終端會(huì)話。

如果一切順利,你應(yīng)該能夠通過(guò)Raspberry Pi 上的http://0.0.0.0:8080或同一網(wǎng)絡(luò)上的另一臺(tái)設(shè)備通過(guò)http://:8080/訪問(wèn)Ollama Web UI。

081ed07c-0919-11f0-9434-92fbcf53809c.png

創(chuàng)建賬戶并登錄后,你應(yīng)該會(huì)看到與下面類似的圖像。

0838c9aa-0919-11f0-9434-92fbcf53809c.png

如果你之前下載了一些模型權(quán)重,你應(yīng)該會(huì)在下面的下拉菜單中看到它們。如果沒(méi)有,你可以轉(zhuǎn)到設(shè)置以下載模型??赡艿哪P蜁?huì)出現(xiàn)在這里

085d6d50-0919-11f0-9434-92fbcf53809c.png

如果你想要下載新的模型,去Settings > Models to pull models

087b42a8-0919-11f0-9434-92fbcf53809c.png

整個(gè)界面非常簡(jiǎn)潔直觀,因此我不會(huì)過(guò)多解釋。這確實(shí)是一個(gè)非常出色的開源項(xiàng)目。

以下是通過(guò)Ollama Web UI與Mistral 7B的交互示例

08976c62-0919-11f0-9434-92fbcf53809c.png

4. 通過(guò)Ollama Web UI運(yùn)行視覺(jué)語(yǔ)言模型(VLMs)

就像我在本文開頭提到的那樣,我們還可以運(yùn)行VLMs。讓我們運(yùn)行一個(gè)流行的開源VLM——LLaVA,它恰好也被Ollama支持。為此,請(qǐng)通過(guò)界面拉取“l(fā)lava”以下載其權(quán)重。

不幸的是,與大型語(yǔ)言模型(LLMs)不同,Raspberry Pi 上的設(shè)置需要相當(dāng)長(zhǎng)的時(shí)間來(lái)解釋圖像。下面的示例大約需要6分鐘來(lái)處理。大部分時(shí)間可能是因?yàn)閳D像方面的處理尚未得到適當(dāng)優(yōu)化,但這種情況在未來(lái)肯定會(huì)改變。令牌生成速度約為每秒2個(gè)令牌。

總結(jié)

至此,我們已經(jīng)基本完成了本文的目標(biāo)?;仡櫼幌?,我們已經(jīng)成功使用Ollama和Ollama Web UI在Raspberry Pi 上運(yùn)行了Phi-2、Mistral和LLaVA等LLMs和VLMs。

我完全可以想象出幾個(gè)在Raspberry Pi (或其他小型邊緣設(shè)備)上托管本地LLMs的用例,特別是如果我們使用Phi-2等大小的模型,每秒4個(gè)令牌的速度對(duì)于某些用例中的流式傳輸來(lái)說(shuō)似乎是可接受的速度。

“小型”LLMs和VLMs領(lǐng)域(考慮到其“大型”的指定,這一名稱有些自相矛盾)是一個(gè)活躍的研究領(lǐng)域,最近發(fā)布了相當(dāng)多的模型。希望這一新興趨勢(shì)能夠繼續(xù)下去,并發(fā)布更多高效且緊湊的模型!在未來(lái)幾個(gè)月里,這無(wú)疑是值得關(guān)注的。

免責(zé)聲明:作者與Ollama或Ollama Web UI沒(méi)有關(guān)聯(lián)。所有觀點(diǎn)均為作者個(gè)人的看法,不代表任何組織。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    38004

    瀏覽量

    295971
  • 樹莓派
    +關(guān)注

    關(guān)注

    122

    文章

    2069

    瀏覽量

    109570
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3435

    瀏覽量

    4958
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于樹莓(RaspberryPi)構(gòu)建高效實(shí)時(shí)監(jiān)控系統(tǒng)

    由于樹莓體積小、可開發(fā)性強(qiáng)特性,常被用于視頻監(jiān)控場(chǎng)景中,結(jié)合 ZeroNews,可實(shí)現(xiàn)用戶在任意位置都能實(shí)時(shí)安全得訪問(wèn)視頻監(jiān)控系統(tǒng)。 先決條件:樹莓
    的頭像 發(fā)表于 09-22 15:14 ?839次閱讀
    基于<b class='flag-5'>樹莓</b><b class='flag-5'>派</b>(RaspberryPi)構(gòu)建高效實(shí)時(shí)監(jiān)控系統(tǒng)

    如何使用樹莓與OpenCV實(shí)現(xiàn)面部和運(yùn)動(dòng)追蹤的云臺(tái)系統(tǒng)?

    大家好,這是一個(gè)樹莓和OpenCV的連載專題。使用樹莓與OpenCV實(shí)現(xiàn)姿態(tài)估計(jì)和面部特征點(diǎn)追蹤使用樹莓
    的頭像 發(fā)表于 08-14 17:45 ?935次閱讀
    如何使用<b class='flag-5'>樹莓</b><b class='flag-5'>派</b>與OpenCV實(shí)現(xiàn)面部和運(yùn)動(dòng)追蹤的云臺(tái)系統(tǒng)?

    樹莓操作系統(tǒng):版本、特性及設(shè)置完整指南!

    樹莓操作系統(tǒng)是什么?樹莓操作系統(tǒng)是由樹莓基金會(huì)專為樹莓
    的頭像 發(fā)表于 07-28 18:26 ?802次閱讀
    <b class='flag-5'>樹莓</b><b class='flag-5'>派</b>操作系統(tǒng):版本、特性及設(shè)置完整指南!

    Arm方案 基于Arm架構(gòu)的邊緣側(cè)設(shè)備(樹莓或 NVIDIA Jetson Nano)上部署PyTorch模型

    本文將為你展示如何在樹莓或 NVIDIA Jetson Nano 基于 Arm 架構(gòu)的邊緣側(cè)設(shè)備上部署 PyTorch 模型。
    的頭像 發(fā)表于 07-28 11:50 ?2463次閱讀

    如何在樹莓 AI HAT+上進(jìn)行YOLO目標(biāo)檢測(cè)?

    大家好,接下來(lái)會(huì)為大家開一個(gè)樹莓5和YOLO的連載專題。內(nèi)容包括四個(gè)部分:在樹莓5上使用YOLO進(jìn)行物體和動(dòng)物識(shí)別-入門指南在樹莓
    的頭像 發(fā)表于 07-19 08:34 ?1163次閱讀
    如何在<b class='flag-5'>樹莓</b><b class='flag-5'>派</b> <b class='flag-5'>AI</b> HAT+上進(jìn)行YOLO目標(biāo)檢測(cè)?

    新品上線|Maix4-HAT 大模型 AI 加速套件 ,一鍵解鎖樹莓多模態(tài) AI 力量!

    還在為邊緣端的大模型運(yùn)行發(fā)愁?還在為算力不夠、模型太大束手無(wú)策?Maix4-HAT,一款專為端側(cè)大模型而生的高性能AI加速模塊,現(xiàn)已正式上線淘寶!淘寶:https://item.tao
    的頭像 發(fā)表于 07-18 18:35 ?1148次閱讀
    新品上線|Maix4-HAT 大<b class='flag-5'>模型</b> <b class='flag-5'>AI</b> 加速套件 ,一鍵解鎖<b class='flag-5'>樹莓</b><b class='flag-5'>派</b>多模態(tài) <b class='flag-5'>AI</b> 力量!

    樹莓6 傳聞:發(fā)布日期與規(guī)格!

    每當(dāng)我想再為我的收藏增添一款樹莓時(shí),總會(huì)在是立即購(gòu)買還是等待硬件更強(qiáng)大的下一代之間猶豫不決。但新樹莓型號(hào)的發(fā)布往往容易被錯(cuò)過(guò),尤其是在你的信息流被病毒式傳播的貓咪視頻占據(jù)時(shí)。因此,
    的頭像 發(fā)表于 07-11 16:21 ?1295次閱讀
    <b class='flag-5'>樹莓</b><b class='flag-5'>派</b>6 傳聞:發(fā)布日期與規(guī)格!

    樹莓小技巧:無(wú)需鍵盤或顯示器,如何通過(guò)WiFi設(shè)置樹莓

    樹莓是一款小巧便攜的USB供電計(jì)算機(jī),可以隱藏起來(lái)用于小型項(xiàng)目,如網(wǎng)絡(luò)服務(wù)器或家庭自動(dòng)化。通常,設(shè)置樹莓需要鍵盤和顯示器來(lái)編輯和查看樹莓
    的頭像 發(fā)表于 06-26 15:41 ?1033次閱讀
    <b class='flag-5'>樹莓</b><b class='flag-5'>派</b>小技巧:無(wú)需鍵盤或顯示器,如何通過(guò)WiFi設(shè)置<b class='flag-5'>樹莓</b><b class='flag-5'>派</b>?

    樹莓分類器:用樹莓識(shí)別不同型號(hào)的樹莓!

    在本教程系列的第一部分中,您將學(xué)習(xí)如何使用樹莓AI攝像頭來(lái)檢測(cè)不同的樹莓型號(hào)。本系列由DavidPlowman創(chuàng)建,他是
    的頭像 發(fā)表于 06-13 16:39 ?968次閱讀
    <b class='flag-5'>樹莓</b><b class='flag-5'>派</b>分類器:用<b class='flag-5'>樹莓</b><b class='flag-5'>派</b>識(shí)別不同型號(hào)的<b class='flag-5'>樹莓</b><b class='flag-5'>派</b>!

    樹莓“揪出”家里的耗電怪獸!

    在本應(yīng)用中,我們將使用樹莓設(shè)置一個(gè)CE電流監(jiān)測(cè)器,并通過(guò)網(wǎng)頁(yè)界面顯示電路的電流讀數(shù)。本項(xiàng)目使用的組件硬件組件樹莓2ModelBx112通
    的頭像 發(fā)表于 06-04 15:33 ?1131次閱讀
    用<b class='flag-5'>樹莓</b><b class='flag-5'>派</b>“揪出”家里的耗電怪獸!

    樹莓“吉尼斯世界記錄”:將樹莓的性能發(fā)揮到極致的項(xiàng)目!

    完成的許多酷炫項(xiàng)目。這就引出了一個(gè)問(wèn)題——你該如何將樹莓的性能推向極限呢?歷經(jīng)13年的項(xiàng)目實(shí)踐和樹莓各型號(hào)的發(fā)展,你會(huì)驚訝地發(fā)現(xiàn),樹莓
    的頭像 發(fā)表于 05-22 16:53 ?1179次閱讀
    <b class='flag-5'>樹莓</b><b class='flag-5'>派</b>“吉尼斯世界記錄”:將<b class='flag-5'>樹莓</b><b class='flag-5'>派</b>的性能發(fā)揮到極致的項(xiàng)目!

    樹莓 Zero 打造的智能漫游車!

    使用PXFMini和樹莓Zero打造您自己的自主漫游車。本項(xiàng)目所用組件硬件組件ErleRoboticsPXFmini×1樹莓Zero×1樹莓
    的頭像 發(fā)表于 05-13 16:39 ?858次閱讀
    用 <b class='flag-5'>樹莓</b><b class='flag-5'>派</b> Zero 打造的智能漫游車!

    4臺(tái)樹莓5跑動(dòng)大模型!DeepSeek R1分布式實(shí)戰(zhàn)!

    導(dǎo)語(yǔ)“用4臺(tái)樹莓5組網(wǎng),輕松運(yùn)行大模型——這可能是2025年最顛覆認(rèn)知的開源AI項(xiàng)目!”GitHub明星項(xiàng)目distributed-llama最新實(shí)戰(zhàn)案例曝光:通過(guò)獨(dú)創(chuàng)的動(dòng)態(tài)
    的頭像 發(fā)表于 03-24 14:50 ?1050次閱讀
    4臺(tái)<b class='flag-5'>樹莓</b><b class='flag-5'>派</b>5跑動(dòng)大<b class='flag-5'>模型</b>!DeepSeek R1分布式實(shí)戰(zhàn)!

    法國(guó)AI初創(chuàng)企業(yè)Mistral AI計(jì)劃IPO

    法國(guó)AI領(lǐng)域的初創(chuàng)企業(yè)Mistral AI近日宣布了其未來(lái)的發(fā)展藍(lán)圖。公司創(chuàng)始人兼首席執(zhí)行官Arthur Mensch明確表示,Mistral AI
    的頭像 發(fā)表于 01-24 13:58 ?819次閱讀

    樹莓傳感器使用方法 樹莓 Raspberry Pi 4優(yōu)缺點(diǎn)

    開發(fā)和物聯(lián)網(wǎng)應(yīng)用。以下是一些基本的樹莓傳感器使用方法: 1. 連接傳感器 GPIO引腳 :樹莓的GPIO(通用輸入/輸出)引腳允許直接連接傳感器。這些引腳可以用于讀取數(shù)字信號(hào)(如按
    的頭像 發(fā)表于 12-06 10:35 ?2773次閱讀