chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

100%在樹莓派上執(zhí)行的LLM項目

jf_cVC5iyAO ? 來源:易心Microbit編程 ? 2024-02-29 16:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ChatGPT的人性口語化回復(fù)相信許多人已體驗(yàn)過,也因此掀起一波大型語言模型(Large Language Model, LLM)熱潮,LLM即ChatGPT背后的主運(yùn)作技術(shù),但LLM運(yùn)作需要龐大運(yùn)算力,因此目前多是在云端(Cloud)上執(zhí)行。

然而在云端執(zhí)行也有若干缺點(diǎn),一是Internet斷線時無法使用;二是或多或少會泄漏個資隱私;三是上傳的話語內(nèi)容會被審查,但審查標(biāo)準(zhǔn)難以捉摸,且已有諸多矯枉過正的案例;四是因?yàn)槟P鸵逊旁谠贫伺c人共享,也可能已被他人誤導(dǎo),俗稱模型被教壞了。

所以有些人也希望LLM能在本地端(Local)、本機(jī)端執(zhí)行,如此就不怕斷線、泄漏隱私、內(nèi)容審查、誤導(dǎo)等缺點(diǎn)。但要能在本地端執(zhí)行,其LLM就不能太大,目前已經(jīng)有諸多信息技術(shù)專家提出各種嘗試,期望能將云端的LLM輕量化、減肥減肥,以便能在運(yùn)算力有限的本機(jī)端執(zhí)行。

全世界最簡單的類GPT語音助理

對此已有創(chuàng)客發(fā)起項目,項目名就叫World’s Easiest GPT-like Voice Assistant,即世界上最簡單的類GPT語音助理,以此實(shí)現(xiàn)完全在本機(jī)端執(zhí)行的GPT語音服務(wù),不需要任何Internet聯(lián)機(jī)。

至于具體技術(shù)作法,首先是找一片樹莓派單板計算機(jī),例如RPi 4,然后裝上麥克風(fēng)與喇叭,成為語音互動對話的輸入輸出,而后安裝Whisper這套軟件,可以將麥克風(fēng)接收到的語音轉(zhuǎn)成文字,文字喂給LLM。

LLM接收輸入后進(jìn)行推論處理,處理后的結(jié)果以文字輸出,輸出的文字則透過另一個安裝軟件進(jìn)行轉(zhuǎn)化,即eSpeak,把文字轉(zhuǎn)成語音后,再透過喇叭發(fā)聲回復(fù)。

TinyLlama-1.1B模型來實(shí)現(xiàn)類GPT語音助理項目

麥克風(fēng)與喇叭只是末梢,重點(diǎn)是在LLM,哪來的輕量型、本機(jī)端執(zhí)行的LLM?答案是llamafile項目,這個項目將LLM打包成單一個檔案,如此可方便地分發(fā)(分發(fā)distribute,通俗而言指可以輕易地下載文件、傳遞分享檔案)與執(zhí)行,項目發(fā)起者運(yùn)用llamafile項目中的TinyLlama-1.1B模型來實(shí)現(xiàn)類GPT語音助理。

b27941ae-d6db-11ee-a297-92fbcf53809c.png

圖3 llamafile項目官網(wǎng)畫面(圖片來源:GitHub)

TinyLlama-1.1B確實(shí)是一個嬌小的LLM,以GPT-3而言就有175B,B即Billion指的是10億,LLM的大小通常以參數(shù)數(shù)目為準(zhǔn),1,750億個參數(shù)的LLM已相當(dāng)龐大,需要對應(yīng)強(qiáng)大的運(yùn)算力才能順暢執(zhí)行。

其他龐大的LLM還有MT-NLG,有5,300億個參數(shù),或5,400億個的PaLM等,都難以下放到本機(jī)端執(zhí)行,本機(jī)端很難有對應(yīng)強(qiáng)大的運(yùn)算力來跑模型。而TinyLlama-1.1B顧名思義只有11億個參數(shù),參數(shù)大大減少下,本機(jī)端是有足夠運(yùn)算力執(zhí)行該模型。

b29b6400-d6db-11ee-a297-92fbcf53809c.png

圖4 llamafile項目提供多種預(yù)訓(xùn)練模型,目前以TinyLlama-1.1B最小,僅760MB(圖片來源:GitHub)

當(dāng)然,上述所言均是預(yù)訓(xùn)練模型(Pre-Train Model),或近期常稱為基礎(chǔ)模型(Foundation Model, FM),后續(xù)還是可以依據(jù)個人需要再行訓(xùn)練與調(diào)整,以便有更精準(zhǔn)、更切合需求的推論結(jié)果。

這個類GPT語音助理項目完成上述后,實(shí)際測試的結(jié)果是,多數(shù)的發(fā)話詢問后需要15秒左右的時間才能回復(fù),復(fù)雜的詢問則要更久的時間。有人可以等或覺得這時間還可以,若覺得太慢或許可以改用運(yùn)算力更強(qiáng)的RPi 5單板計算機(jī),可能可以快一點(diǎn)。

值得注意的是,這個項目不是用語音關(guān)鍵詞(如Hey! Siri或OK! Google)來喚醒助理,而是設(shè)置一個按鈕,按下去后才讓樹莓派開始接收語音詢問。

另外,這整個項目用的都是開放源代碼及免授權(quán)費(fèi)的軟件與模型,所以實(shí)現(xiàn)成本大概只有單板計算機(jī)、喇叭、麥克風(fēng)、按鈕等硬件而已。

其他技術(shù)細(xì)節(jié)包含llamafile與Raspberry Pi OS不兼容,所以在樹莓派上是改安裝Ubuntu Linux,更具體而言是64位的Ubuntu Server 22.04.3 LTS。另外,當(dāng)然也要安裝Python才能操控樹莓派的GPIO接腳,從而能讀取按鈕狀態(tài)(是否被按下)。

小結(jié)

最后,這肯定不是第一個也不是最后一個LLM本地端化的嘗試,各種嘗試正前仆后繼地進(jìn)行著,有的是提供壓縮工具將原本肥大的LLM加以縮小,有的干脆是原生訓(xùn)練出輕量的LLM,現(xiàn)階段可謂是百家爭鳴。

而筆者個人的看法,1.1B的LLM已經(jīng)很小,或許未來可以更小,但現(xiàn)階段可能改用更強(qiáng)的硬件會更務(wù)實(shí),例如使用有GPU的桌面計算機(jī),或給樹莓派加裝AI硬件加速器等,以便讓類GPT語音助理更快速響應(yīng)。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • GPIO
    +關(guān)注

    關(guān)注

    16

    文章

    1333

    瀏覽量

    56432
  • 硬件加速器
    +關(guān)注

    關(guān)注

    0

    文章

    43

    瀏覽量

    13548
  • 樹莓派
    +關(guān)注

    關(guān)注

    122

    文章

    2082

    瀏覽量

    110753
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    350

    瀏覽量

    1394

原文標(biāo)題:不怕脫機(jī)!100%在樹莓派上執(zhí)行的LLM項目

文章出處:【微信號:易心Microbit編程,微信公眾號:易心Microbit編程】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于樹莓派5+LLM8850 Card的高性能AI加速解決方案

    推廣的過程中,樹莓派生態(tài)客戶反饋希望能提供一種兼容原裝Raspberry PI HAT的M.2 2242的AI Card版本。經(jīng)過國內(nèi)優(yōu)秀的AIOT硬件設(shè)計公司M5Stack長達(dá)幾個月的反復(fù)設(shè)計,終于本周正式上架了
    的頭像 發(fā)表于 10-14 11:25 ?2756次閱讀
    基于<b class='flag-5'>樹莓</b>派5+<b class='flag-5'>LLM</b>8850 Card的高性能AI加速解決方案

    基于樹莓派(RaspberryPi)構(gòu)建高效實(shí)時監(jiān)控系統(tǒng)

    及安裝 ZeroNews Agent 樹莓派(Raspberry Pi)上下載并運(yùn)行 ZeroNews。 第 2 步:樹莓派上安裝 Motion 監(jiān)控 先在
    的頭像 發(fā)表于 09-22 15:14 ?1604次閱讀
    基于<b class='flag-5'>樹莓</b>派(RaspberryPi)構(gòu)建高效實(shí)時監(jiān)控系統(tǒng)

    如何在樹莓派上安裝Ubuntu MATE ?

    ,而非GNOME。本文中,我將介紹如何輕松地樹莓派上安裝它。UbuntuMATE官方支持樹莓派,因此每發(fā)布一個新版本,都會為
    的頭像 發(fā)表于 08-12 18:56 ?3448次閱讀
    如何在<b class='flag-5'>樹莓</b><b class='flag-5'>派上</b>安裝Ubuntu MATE ?

    樹莓派上開啟業(yè)余無線電之旅~

    樹莓派和RTL-SDR或HackRF等硬件,你可以接收信號、追蹤飛行器和船只、解碼傳輸內(nèi)容,甚至配備適當(dāng)硬件并獲得許可的情況下進(jìn)行發(fā)射。本指南將指導(dǎo)你如何為業(yè)余
    的頭像 發(fā)表于 08-12 18:56 ?2180次閱讀
    <b class='flag-5'>在</b><b class='flag-5'>樹莓</b><b class='flag-5'>派上</b>開啟業(yè)余無線電之旅~

    技能+1!如何在樹莓派上使用C++控制GPIO?

    和PiGPIO等庫,C++可用于編程控制樹莓派的GPIO引腳。它提供了更好的性能和控制能力,非常適合對速度和精度要求較高的硬件項目。樹莓派社區(qū)中,關(guān)于“Python
    的頭像 發(fā)表于 08-06 15:33 ?4484次閱讀
    技能+1!如何在<b class='flag-5'>樹莓</b><b class='flag-5'>派上</b>使用C++控制GPIO?

    這個套件讓樹莓派5運(yùn)行幾乎所有YOLO模型!Conda 與 Ultralytics!

    如何在樹莓派上設(shè)置YOLO計算機(jī)視覺?Conda與Ultralytics本指南中,我們將學(xué)習(xí)如何使用Conda樹莓
    的頭像 發(fā)表于 07-31 11:51 ?5854次閱讀
    這個套件讓<b class='flag-5'>樹莓</b>派5運(yùn)行幾乎所有YOLO模型!Conda 與 Ultralytics!

    初學(xué)者指南:樹莓派上搭建虛擬環(huán)境!

    在這篇簡明扼要的指南中,我們將探討如何在樹莓派上設(shè)置和使用虛擬環(huán)境(或稱為Venv)——包括終端和Thonny集成開發(fā)環(huán)境中。使用Bookworm操作系統(tǒng)或更高版本時,或在嘗試安裝Python
    的頭像 發(fā)表于 07-27 13:24 ?1173次閱讀
    初學(xué)者指南:<b class='flag-5'>樹莓</b><b class='flag-5'>派上</b>搭建虛擬環(huán)境!

    如何在樹莓派上設(shè)置并使用VNC?遠(yuǎn)程訪問完整指南!

    為什么要在樹莓派上使用VNC?使用VNC與樹莓派的主要優(yōu)勢在于其提供的靈活性。我們可以“無頭模式”(無物理顯示器)下運(yùn)行樹莓派,同時仍能完
    的頭像 發(fā)表于 07-26 20:42 ?6150次閱讀
    如何在<b class='flag-5'>樹莓</b><b class='flag-5'>派上</b>設(shè)置并使用VNC?遠(yuǎn)程訪問完整指南!

    C++ 與 Python:樹莓派上哪種語言更優(yōu)?

    Python是樹莓派上的首選編程語言,我們的大部分教程都使用它。然而,C++物聯(lián)網(wǎng)項目中同樣廣受歡迎且功能強(qiáng)大。那么,
    的頭像 發(fā)表于 07-24 15:32 ?1103次閱讀
    C++ 與 Python:<b class='flag-5'>樹莓</b><b class='flag-5'>派上</b>哪種語言更優(yōu)?

    樹莓派挖掘5種頂級加密貨幣!

    加密貨幣是用于在線交易的數(shù)字貨幣。挖掘這些貨幣通常需要專門的硬件,如ASIC礦機(jī)或高性能GPU。然而,有些加密貨幣仍可用樹莓派來挖掘。本文中,我將為您介紹可在樹莓派上挖掘的最佳加密貨
    的頭像 發(fā)表于 07-21 16:34 ?1793次閱讀
    用<b class='flag-5'>樹莓</b>派挖掘5種頂級加密貨幣!

    釋放潛力:樹莓派上運(yùn)行安卓系統(tǒng)實(shí)現(xiàn)多樣化應(yīng)用!

    為什么要在樹莓派上運(yùn)行安卓系統(tǒng)?安卓系統(tǒng)以其龐大的應(yīng)用生態(tài)系統(tǒng)和用戶友好的界面而聞名,它能夠?qū)?b class='flag-5'>樹莓派轉(zhuǎn)變?yōu)楣δ軓?qiáng)大的設(shè)備,能夠處理從媒體消費(fèi)到輕量級計算和物聯(lián)網(wǎng)應(yīng)用等各種任務(wù)。優(yōu)勢高度定制化:
    的頭像 發(fā)表于 07-05 08:33 ?1661次閱讀
    釋放潛力:<b class='flag-5'>在</b><b class='flag-5'>樹莓</b><b class='flag-5'>派上</b>運(yùn)行安卓系統(tǒng)實(shí)現(xiàn)多樣化應(yīng)用!

    如何在樹莓派上安裝并運(yùn)行 Arduino 集成開發(fā)環(huán)境!

    使用樹莓派單板計算機(jī),你可以運(yùn)行各種應(yīng)用程序,包括廣受歡迎的Arduino集成開發(fā)環(huán)境(IDE)。這意味著你可以用它輕松地為通過USB連接到樹莓派計算機(jī)的微控制器編程,以創(chuàng)建交互式電子項目。下面
    的頭像 發(fā)表于 07-01 17:41 ?4557次閱讀
    如何在<b class='flag-5'>樹莓</b><b class='flag-5'>派上</b>安裝并運(yùn)行 Arduino 集成開發(fā)環(huán)境!

    樹莓派“吉尼斯世界記錄”:將樹莓派的性能發(fā)揮到極致的項目

    完成的許多酷炫項目。這就引出了一個問題——你該如何將樹莓派的性能推向極限呢?歷經(jīng)13年的項目實(shí)踐和樹莓派各型號的發(fā)展,你會驚訝地發(fā)現(xiàn),樹莓
    的頭像 發(fā)表于 05-22 16:53 ?1713次閱讀
    <b class='flag-5'>樹莓</b>派“吉尼斯世界記錄”:將<b class='flag-5'>樹莓</b>派的性能發(fā)揮到極致的<b class='flag-5'>項目</b>!

    從初學(xué)到進(jìn)階:樹莓派上最適合你的代碼編輯器推薦!

    安裝樹莓派操作系統(tǒng)后,你就可以使用Python、Scratch、Java、C/C++等受Linux支持的多種編程語言進(jìn)行編程了。其中,Python是樹莓派上最受歡迎的編程語言。
    的頭像 發(fā)表于 05-15 16:20 ?1388次閱讀
    從初學(xué)到進(jìn)階:<b class='flag-5'>樹莓</b><b class='flag-5'>派上</b>最適合你的代碼編輯器推薦!

    用意念控制燈光亮度?這個樹莓項目有點(diǎn)意思...

    摘要該樹莓項目借助腦電波掃描儀操控硬件設(shè)備,通過監(jiān)測腦電波來執(zhí)行特定動作。CivitasUniverse推出的NeuroPhotonicR5FlowCyberdeck裝置,采用了樹莓
    的頭像 發(fā)表于 04-30 18:42 ?649次閱讀
    用意念控制燈光亮度?這個<b class='flag-5'>樹莓</b>派<b class='flag-5'>項目</b>有點(diǎn)意思...