chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何為Orca-2-13B創(chuàng)建一個(gè)與OpenAI兼容的API服務(wù)呢?

jf_wN0SrCdH ? 來(lái)源:Second State ? 2023-11-27 10:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Orca-2-13B[1] 是微軟最新發(fā)布的 Orca 2 系列中的一款模型,Orca 2 另外還提供 7B 版本。Orca 2系列模型是由 LLAMA 2 基礎(chǔ)模型中微調(diào)而來(lái)。Orca 2系列模型擅長(zhǎng)推理、文本總結(jié)、數(shù)學(xué)問(wèn)題解決和理解任務(wù),是在原始 13B Orca 模型的基礎(chǔ)上進(jìn)一步發(fā)展而來(lái),模仿更強(qiáng)大的 AI 系統(tǒng)推理過(guò)程從而提高小型模型在復(fù)雜任務(wù)中的能力。

本文將以 Orca-2-13B 為例,將介紹:

如何在你自己的設(shè)備上運(yùn)行 Orca-2-13B

如何為 Orca-2-13B 創(chuàng)建一個(gè)與 OpenAI 兼容的 API 服務(wù)

你也可以使用同樣的方式運(yùn)行 Orca-2-7B 模型,只需要替換 Orca-2-7B模型的 GGUF 格式的下載鏈接。

我們將用 Rust + Wasm 技術(shù)棧來(lái)開(kāi)發(fā)和部署這個(gè)模型的應(yīng)用程序。無(wú)需安裝復(fù)雜的 Python 包或 C++ 工具鏈!了解我們?yōu)槭裁催x擇 Rust+Wasm 技術(shù)棧[2]。

在自己的設(shè)備上運(yùn)行 Orca-2-13B

步驟 1:通過(guò)以下命令行安裝 WasmEdge[3]。

curl-sSfhttps://raw.githubusercontent.com/WasmEdge/WasmEdge/master/utils/install.sh|bash-s----pluginwasi_nn-ggml

步驟 2:下載模型 GGUF 文件[4]。由于模型文件有幾 GB,所以可能需要很長(zhǎng)時(shí)間。

curl-LOhttps://huggingface.co/second-state/Orca-2-13B-GGUF/resolve/main/Orca-2-13b-ggml-model-q4_0.gguf

步驟 3:下載一個(gè)跨平臺(tái)的可移植 Wasm 文件,用于聊天應(yīng)用。該應(yīng)用能讓你用命令行與模型進(jìn)行交流。戳這里[5]查看該應(yīng)用的 Rust 源代碼。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/chat/llama-chat.wasm

就這樣。接下來(lái),可以通過(guò)輸入以下命令在終端與模型進(jìn)行聊天。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13b-ggml-model-q4_0.ggufllama-chat.wasm-pchatml-s'YouareOrca,anAIlanguagemodelcreatedbyMicrosoft.Youareacautiousassistant.Youcarefullyfollowinstructions.Youarehelpfulandharmlessandyoufollowethicalguidelinesandpromotepositivebehavior.'--stream-stdout

這個(gè)可移植的 Wasm 應(yīng)用會(huì)自動(dòng)利用你設(shè)備上的硬件加速器(如 GPU)。

在我的 Mac M1 32G 內(nèi)存設(shè)備上,它的速度約為每秒 9.15 個(gè)token。

[USER]:What isanOrca?

[ASSISTANT]:
Anorca,orkillerwhale,isalargetoothedpredatorbelongingtotheoceanicdolphinfamily.Theyarehighlyintelligentandsocialanimals,knownfortheircuriosityandplayfulness.

[USER]:

為 Orca-2-13B 創(chuàng)建一個(gè)與 OpenAI 兼容的 API 服務(wù)

一個(gè)與 OpenAI 兼容的網(wǎng)絡(luò) API 能讓 Orca-2-13B 與大量的 LLM 工具和代理框架(如 flows.network、LangChain 和 LlamaIndex)一起工作。

首先,先下載一個(gè) API 服務(wù)器應(yīng)用。它也是一個(gè)可以在許多 CPU 和 GPU 設(shè)備上運(yùn)行的跨平臺(tái)可移植 Wasm 應(yīng)用。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/api-server/llama-api-server.wasm

然后,使用以下命令行啟動(dòng)模型的 API 服務(wù)器。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13B.Q5_K_M.ggufllama-api-server.wasm-pchatml

從另一個(gè)終端,你可以使用 curl 與 API 服務(wù)器進(jìn)行交互。

curl-XPOSThttp://0.0.0.0:8080/v1/chat/completions-H'accept:application/json'-H'Content-Type:application/json'-d'{"messages":[{"role":"system","content":"YouareahelpfulAIassistant"},{"role":"user","content":"WhatisthecapitalofFrance?"}],"model":"Orca-2-13B"}'

就這樣。WasmEdge 是運(yùn)行 Orca-2-13B 大模型應(yīng)用程序最簡(jiǎn)單、最快、最安全的方式[6]。試試看吧!





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • C++語(yǔ)言
    +關(guān)注

    關(guān)注

    0

    文章

    147

    瀏覽量

    7578
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4856

    瀏覽量

    89519
  • 硬件加速器
    +關(guān)注

    關(guān)注

    0

    文章

    43

    瀏覽量

    13328
  • Rust
    +關(guān)注

    關(guān)注

    1

    文章

    240

    瀏覽量

    7464
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1238

    瀏覽量

    9793

原文標(biāo)題:跨設(shè)備運(yùn)行微軟最新大語(yǔ)言模型 Orca-2-13B,只需4個(gè)命令行

文章出處:【微信號(hào):Rust語(yǔ)言中文社區(qū),微信公眾號(hào):Rust語(yǔ)言中文社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    OpenAI發(fā)布2款開(kāi)源模型

    OpenAI開(kāi)源了兩款高性能權(quán)重語(yǔ)言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 發(fā)布了!我們做了
    的頭像 發(fā)表于 08-06 14:25 ?868次閱讀

    具有載波聚合的 RX 分集 FEM(B26、B8、B12/13、B2/25、B4 和 B7) skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()具有載波聚合的 RX 分集 FEM(B26、B8、B12/13、B2/25、B
    發(fā)表于 06-19 18:35
    具有載波聚合的 RX 分集 FEM(<b class='flag-5'>B</b>26、<b class='flag-5'>B</b>8、<b class='flag-5'>B</b>12/<b class='flag-5'>13</b>、<b class='flag-5'>B2</b>/25、<b class='flag-5'>B</b>4 和 <b class='flag-5'>B</b>7) skyworksinc

    安卓原生兼容服務(wù)

    安卓原生兼容服務(wù)器的定義 安卓原生兼容服務(wù)器?指基于Android系統(tǒng)內(nèi)核和服務(wù)框架構(gòu)建的服務(wù)
    的頭像 發(fā)表于 06-19 17:32 ?436次閱讀

    如何獲取 OpenAI API Key?API 獲取與代碼調(diào)用示例 (詳解教程)

    OpenAI API Key 獲取與使用詳解:從入門到精通 OpenAI 正以其 GPT 和 DALL-E 等先進(jìn)模型引領(lǐng)全球人工智能創(chuàng)新。其 API 為開(kāi)發(fā)者和企業(yè)提供了強(qiáng)大的 AI
    的頭像 發(fā)表于 05-04 11:42 ?1.1w次閱讀
    如何獲取 <b class='flag-5'>OpenAI</b> <b class='flag-5'>API</b> Key?<b class='flag-5'>API</b> 獲取與代碼調(diào)用示例 (詳解教程)

    濱松光子的相機(jī)研發(fā)史:ORCA系列與qCMOS的誕生(下)

    往前走。從ORCA?系列的誕生,到C7190-20的突破,再到ImagEM?和ORCA?-Flash的升級(jí),以及最新的qCMOS? ORCA? -QUEST2 C15550-22UP,
    的頭像 發(fā)表于 03-17 06:23 ?615次閱讀
    濱松光子的相機(jī)研發(fā)史:<b class='flag-5'>ORCA</b>系列與qCMOS的誕生(下)

    HarmonyOS NEXT開(kāi)發(fā)實(shí)戰(zhàn):DevEco Studio中DeepSeek的使用

    。安裝完成后,打開(kāi)DevEco Studio,創(chuàng)建個(gè)新的鴻蒙應(yīng)用項(xiàng)目,選擇適合的模板(如Empty Ability)。 第二步:安裝CodeGPT插件 在DevEco Studio上安裝插件:打開(kāi)
    發(fā)表于 03-07 14:56

    openai api key獲取的三種方案(有種可以白嫖到 api key)

    OpenAI API Key 全攻略:官方獲取、費(fèi)用詳解與“白嫖”實(shí)戰(zhàn) 引言: 想要體驗(yàn) OpenAI 強(qiáng)大的 GPT 模型,卻苦于沒(méi)有 API Key?別擔(dān)心,本文將為你提供
    的頭像 發(fā)表于 02-24 22:16 ?1.3w次閱讀
    <b class='flag-5'>openai</b> <b class='flag-5'>api</b> key獲取的三種方案(有<b class='flag-5'>一</b>種可以白嫖到 <b class='flag-5'>api</b> key)

    鴻蒙原生應(yīng)用開(kāi)發(fā)也可以使用DeepSeek了

    ,請(qǐng)?jiān)L問(wèn)華為開(kāi)發(fā)者官網(wǎng)下載并安裝最新版本5.0.7.210。安裝完成后,打開(kāi)DevEco Studio,創(chuàng)建個(gè)新的鴻蒙應(yīng)用項(xiàng)目,選擇適合的模板(如Empty Ability)。 第二步:安裝
    發(fā)表于 02-20 18:06

    OpenAI API Key 獲取全攻略:入門、精通與詳解教程(國(guó)內(nèi)開(kāi)發(fā)者優(yōu)化版)

    引言: 想象下:只需幾行代碼,你的應(yīng)用就能像 ChatGPT 樣智能對(duì)話;輸入幾個(gè)關(guān)鍵詞,瞬間生成引人入勝的文案;上傳張圖片,AI 就能理解并分析…… 這不是科幻,而是 OpenAI
    的頭像 發(fā)表于 02-15 17:26 ?5347次閱讀
    <b class='flag-5'>OpenAI</b> <b class='flag-5'>API</b> Key 獲取全攻略:入門、精通與詳解教程(國(guó)內(nèi)開(kāi)發(fā)者優(yōu)化版)

    DeepSeek上調(diào)API服務(wù)價(jià)格

    近日,備受用戶關(guān)注的DeepSeek-V3 API服務(wù)價(jià)格有所調(diào)整。據(jù)了解,此前DeepSeek為吸引用戶體驗(yàn)其服務(wù),推出了45天的優(yōu)惠價(jià)格體驗(yàn)期。然而,該優(yōu)惠期已于2月9日正式結(jié)束
    的頭像 發(fā)表于 02-10 10:41 ?1327次閱讀

    OpenAI攻克Sora視頻創(chuàng)建錯(cuò)誤率高難題

    了更加穩(wěn)定、高效的視頻創(chuàng)建體驗(yàn)。 Sora作為款先進(jìn)的視頻處理工具,旨在為用戶提供便捷的視頻創(chuàng)作服務(wù)。然而,在過(guò)去的使用過(guò)程中,不少用戶反饋視頻創(chuàng)建錯(cuò)誤率較高,影響了整體的使用體驗(yàn)。
    的頭像 發(fā)表于 12-31 10:37 ?821次閱讀

    OpenAI宣布API恢復(fù)運(yùn)行,ChatGPT正在逐步回歸

    近日,OpenAI官方發(fā)布了則重要更新說(shuō)明,宣布其API系統(tǒng)現(xiàn)已全面恢復(fù)運(yùn)行,同時(shí)確認(rèn)ChatGPT服務(wù)正在逐步恢復(fù)中。這消息對(duì)于眾多依
    的頭像 發(fā)表于 12-28 14:41 ?1103次閱讀

    OpenAI 發(fā)了個(gè)支持 ESP32 的 Realtime API SDK

    “ ?昨晚 OpenAI 正式發(fā)布了 o3 模型,AI 圈片沸騰。作為電子工程師的我撓了撓頭,好像和我沒(méi)什么直接的關(guān)系??倒是 OpenAI 的另一個(gè)小發(fā)布,讓我很感興趣:
    的頭像 發(fā)表于 12-21 11:36 ?7084次閱讀
    <b class='flag-5'>OpenAI</b> 發(fā)了<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>支持 ESP32 的 Realtime <b class='flag-5'>API</b> SDK

    OpenAI暫不推出Sora視頻生成模型API

    OpenAI近日宣布,目前暫無(wú)推出其視頻生成模型Sora的應(yīng)用程序接口(API)的計(jì)劃。Sora模型能夠基于文本和圖像生成視頻,引發(fā)了廣泛關(guān)注。然而,由于訪問(wèn)量遠(yuǎn)超預(yù)期,OpenAI此前不得不緊急
    的頭像 發(fā)表于 12-20 14:23 ?950次閱讀

    OpenAI發(fā)布o(jì)1模型API,成本大幅下降60%

    下降。 據(jù)OpenAI介紹,o1模型API的思考成本相較于預(yù)覽版本降低了60%,同時(shí)附帶了高級(jí)視覺(jué)功能,為用戶提供了更加豐富和多樣化的使用體驗(yàn)。此外,GPT-4o的音頻成本也實(shí)現(xiàn)了60%的降低,而mini版本的價(jià)格更是暴降了10倍,這對(duì)于廣大用戶來(lái)說(shuō)無(wú)疑是
    的頭像 發(fā)表于 12-19 10:31 ?907次閱讀