chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾集成顯卡+ChatGLM3大語言模型的企業(yè)本地AI知識庫部署

英特爾物聯(lián)網(wǎng) ? 來源:英特爾物聯(lián)網(wǎng) ? 2024-03-29 11:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

在當(dāng)今的企業(yè)環(huán)境中,信息的快速獲取和處理對于企業(yè)的成功至關(guān)重要。為了滿足這一需求,我們可以將RAG技術(shù)與企業(yè)本地知識庫相結(jié)合,以提供實時的、自動生成的信息處理和決策支持。這將有助于企業(yè)更好地應(yīng)對快速變化的市場環(huán)境,提高企業(yè)的競爭力和創(chuàng)新能力。

企業(yè)本地知識庫是一個集中存儲和管理企業(yè)內(nèi)部知識的系統(tǒng)。它包含了企業(yè)的歷史數(shù)據(jù)、經(jīng)驗教訓(xùn)、最佳實踐、流程文檔、產(chǎn)品信息等。企業(yè)本地知識庫是企業(yè)智慧的結(jié)晶,對于企業(yè)的運營和發(fā)展具有重要意義。

將RAG技術(shù)與企業(yè)本地知識庫相結(jié)合,可以為企業(yè)帶來以下幾個方面的優(yōu)勢:

1

實時性

RAG技術(shù)可以實時地從企業(yè)本地知識庫中提取相關(guān)信息,并生成用戶所需的內(nèi)容。這意味著用戶可以快速地獲取到最新的知識和信息,而不需要花費大量時間去查找和整理。

2

自動化

RAG技術(shù)可以自動地處理和生成內(nèi)容,減少了人工干預(yù)的需求。這不僅可以提高企業(yè)的效率,還可以減少人為錯誤的發(fā)生。

3

個性化和定制化

RAG技術(shù)可以根據(jù)用戶的需求和偏好,生成個性化的內(nèi)容。通過與企業(yè)本地知識庫的結(jié)合,可以提供更加精準(zhǔn)和有針對性的信息,滿足不同用戶的需求。

4

知識共享和傳承

企業(yè)本地知識庫是一個集中存儲和共享知識的平臺。通過與RAG技術(shù)的結(jié)合,可以將這些知識快速地傳遞給需要的用戶,促進知識的共享和傳承。

1

RAG簡介

RAG - Retrieval-Augmented Generation(檢索增強生成)是一種先進的自然語言處理(NLP)技術(shù),它結(jié)合了信息檢索(Retrieval)和神經(jīng)網(wǎng)絡(luò)生成(Generation)兩種方法,以提升模型在生成文本時的準(zhǔn)確性和相關(guān)性。在傳統(tǒng)的生成模型中,模型依據(jù)自身學(xué)習(xí)到的知識庫生成文本。然而,這種方法受限于模型訓(xùn)練時所接觸到的數(shù)據(jù)范圍,特別是在處理未見的、需要實時查找新信息的場景時,可能無法生成最新或最準(zhǔn)確的內(nèi)容。

RAG模型通過引入一個檢索組件,在接收到輸入問題或任務(wù)后,首先從大規(guī)模預(yù)定義的知識庫(如網(wǎng)頁、文檔集合或其他結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù)源)中檢索與任務(wù)相關(guān)的信息片段。然后,檢索到的信息作為額外的上下文輸入,與原始輸入一起傳遞給生成模型。生成模型在此基礎(chǔ)上,利用檢索到的信息以及自身的語言模型能力,生成更為精確、詳盡且與現(xiàn)實世界信息保持同步的回答或文本內(nèi)容。

簡單來說,RAG模型就是在傳統(tǒng)生成模型的基礎(chǔ)上增加了一個動態(tài)獲取外部知識的能力,這樣既保留了大模型生成連貫文本的優(yōu)點,又解決了由于模型記憶限制導(dǎo)致的知識更新和準(zhǔn)確性不足的問題,尤其適用于問答系統(tǒng)、對話系統(tǒng)及需要實時更新信息的自然語言處理任務(wù)。

504d318a-ece7-11ee-a297-92fbcf53809c.png

2

OpenVINO Notebook簡介

OpenVINO Notebooks是一套以Jupyter Notebook為載體的開源交互式編程教程和示例代碼合集,由英特爾公司開發(fā)和維護。這套資源專為使用 OpenVINO 工具套件的開發(fā)者設(shè)計,旨在幫助他們更快地理解和掌握如何利用 OpenVINO 進行深度學(xué)習(xí)模型的優(yōu)化與推理及實際部署AI在各式業(yè)務(wù)應(yīng)用場景里面。

50752faa-ece7-11ee-a297-92fbcf53809c.png

3

部署平臺簡介

算力魔方是一款可以DIY的迷你主機,采用了抽屜式設(shè)計,后續(xù)組裝、升級、維護只需要拔插模塊。通過選擇計算模塊的版本,再搭配不同額 IO 模塊可以組成豐富的配置,適應(yīng)不同場景。性能不夠時,可以升級計算模塊提升算力, 如需要顯卡可加上顯卡, IO 接口不匹配時,可以更換 IO 模塊調(diào)整功能,而無需重構(gòu)整個系統(tǒng)。本文在帶有英特爾12代酷睿i7-1265U芯片組里的銳炬 Xe集成顯卡+RAM 32GB的算力魔方上完成驗證。

4

在集成顯卡上部署RAG

4.1

搭建OpenVINO Notebooks開發(fā)環(huán)境

第一步:請使用下面的命令克隆存儲庫創(chuàng)建并激活名為“openvino_env”的虛擬環(huán)境

git clone https://github.com/openvinotoolkit/openvino_notebooks.git
cd openvino_notebooks
conda create -n openvino_env python=3.9

50b015a2-ece7-11ee-a297-92fbcf53809c.png

第二步:請使用下面的命令激活虛擬環(huán)境并安裝依賴包,并啟動Jupyter Notebooks

conda activate openvino_env
pip install -r requirements.txt

511c6d4c-ece7-11ee-a297-92fbcf53809c.png

jupyter lab notebooks

5143f5f6-ece7-11ee-a297-92fbcf53809c.png

4.2

下載模型到本地

請使用命令將ChatGLM3 6B和text2vec模型下載到本地

git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

51638e98-ece7-11ee-a297-92fbcf53809c.png

git clone https://www.modelscope.cn/Jerry0/text2vec-large-chinese.git

5179773a-ece7-11ee-a297-92fbcf53809c.png

4.3

運行254-rag-chatbot程序

請運行Notebooks里面的代碼模塊, 注意!! 國內(nèi)用戶請勿運行模塊1,從模塊2開始一步步運行代碼到NNCF模塊,模型壓縮選擇int4并按照下圖一及二圖修改notebooks 254里的代碼引導(dǎo)程序指定對應(yīng)的模型路徑完成ChatGLM3-6b模型int 4量化及部署

519b22c2-ece7-11ee-a297-92fbcf53809c.png

圖一

51b0f96c-ece7-11ee-a297-92fbcf53809c.png

圖二

text2vec-large-chinese 模型部署

51d88414-ece7-11ee-a297-92fbcf53809c.png

運行結(jié)果,如下所示:本地知識庫已成功加入ChatGLM 6B模型里并精確回答問題

51f27da6-ece7-11ee-a297-92fbcf53809c.png

運行視頻.avi

5

總結(jié)

將RAG技術(shù)與企業(yè)本地知識庫相結(jié)合,可以為企業(yè)提供實時、自動化、個性化和定制化的信息處理和決策支持。這將有助于企業(yè)更好地應(yīng)對快速變化的市場環(huán)境,提高企業(yè)的競爭力和創(chuàng)新能力。

利用OpenVINO 工具套件簡單易用,僅需三步即可在算力魔方完成開發(fā)環(huán)境搭建及模型的INT4量化且在英特爾集成顯卡上的部署實現(xiàn)RAG企業(yè)本地知識庫部署。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10245

    瀏覽量

    178146
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5586

    瀏覽量

    123645
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3349

    瀏覽量

    4720
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    116

    瀏覽量

    650

原文標(biāo)題:英特爾集成顯卡+ChatGLM3大語言模型的企業(yè)本地AI知識庫部署 | 開發(fā)者實戰(zhàn)

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    硬件與應(yīng)用同頻共振,英特爾Day 0適配騰訊開源混元大模型

    今日,騰訊正式發(fā)布新一代混元開源大語言模型。英特爾憑借在人工智能領(lǐng)域的全棧技術(shù)布局,現(xiàn)已在英特爾? 酷睿? Ultra 平臺上完成針對該模型
    的頭像 發(fā)表于 08-07 14:42 ?972次閱讀
    硬件與應(yīng)用同頻共振,<b class='flag-5'>英特爾</b>Day 0適配騰訊開源混元大<b class='flag-5'>模型</b>

    部署成本顯著降低!英特爾助陣高效AI算力一體機方案

    3月27日,英特爾舉辦了名為“‘至’繪未來,銳炫來襲”的創(chuàng)新解決方案研討會,與生態(tài)伙伴共同分享最新AI算力一體機方案。該方案基于英特爾?至強? W處理器和多個
    的頭像 發(fā)表于 03-29 16:29 ?1556次閱讀
    <b class='flag-5'>部署</b>成本顯著降低!<b class='flag-5'>英特爾</b>助陣高效<b class='flag-5'>AI</b>算力一體機方案

    AI知識庫的搭建與應(yīng)用:企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵步驟

    隨著數(shù)字化轉(zhuǎn)型的加速,AI技術(shù)已經(jīng)成為提升企業(yè)運營效率、優(yōu)化客戶體驗、推動業(yè)務(wù)創(chuàng)新的重要工具。而AI知識庫作為企業(yè)智能化的基礎(chǔ),發(fā)揮著至關(guān)重
    的頭像 發(fā)表于 03-27 15:18 ?881次閱讀

    AI Agent 應(yīng)用與項目實戰(zhàn)》閱讀心得3——RAG架構(gòu)與部署本地知識庫

    實踐RAG技術(shù)的開發(fā)者來說是非常有價值的參考。 本人由于時間關(guān)系暫時騰不出太多時間投入實際部署本地知識庫,并且考慮到這本書成書是在去年,書中提到的例子是利用Llama3,而當(dāng)下可以考慮
    發(fā)表于 03-07 19:49

    請問OpenVINO?工具套件英特爾?Distribution是否與Windows? 10物聯(lián)網(wǎng)企業(yè)版兼容?

    無法在基于 Windows? 10 物聯(lián)網(wǎng)企業(yè)版的目標(biāo)系統(tǒng)上使用 英特爾? Distribution OpenVINO? 2021* 版本推斷模型。
    發(fā)表于 03-05 08:32

    英特爾?獨立顯卡與OpenVINO?工具套件結(jié)合使用時,無法運行推理怎么解決?

    使用英特爾?獨立顯卡與OpenVINO?工具套件時無法運行推理
    發(fā)表于 03-05 06:56

    如何從零開始搭建企業(yè)AI知識庫?

    在數(shù)字化轉(zhuǎn)型的浪潮中,企業(yè)逐漸意識到數(shù)據(jù)不僅是資源,更是驅(qū)動業(yè)務(wù)增長的“燃料”。然而,分散在郵件、文檔系統(tǒng)、本地硬盤甚至員工腦海中的知識,往往如同孤島般難以串聯(lián)。AI
    的頭像 發(fā)表于 02-28 14:35 ?1425次閱讀

    英特爾賦能DeepSeek本地運行,助力汽車升級“最強大腦”

    提升GPU內(nèi)存的利用率。這一突破為DeepSeek技術(shù)在汽車領(lǐng)域的應(yīng)用開辟了新路徑。 隨著第二代英特爾銳炫?B系列車載獨立顯卡的發(fā)布,所支持的DeepSeek模型參數(shù)更是躍升至32B,進一步增強了車載系統(tǒng)的處理能力。
    的頭像 發(fā)表于 02-17 09:37 ?858次閱讀

    英特爾與扣子云平臺合作推出AI PC Bot專區(qū)和端側(cè)插件商店

    通過創(chuàng)新的端云協(xié)同技術(shù),為開發(fā)者提供更為便捷、高效的智能應(yīng)用開發(fā)環(huán)境。 通過扣子的“端插件”機制,英特爾AI PC的PC操控、本地知識庫、本地
    的頭像 發(fā)表于 12-31 10:24 ?1320次閱讀

    英特爾與扣子云平臺共推AI PC Bot專區(qū)和端側(cè)插件商店

    ,將英特爾AI PC的PC操控、本地知識庫、本地推理及本地生成等核心功能無縫嵌入扣子大
    的頭像 發(fā)表于 12-30 10:09 ?971次閱讀

    英特爾與扣子云平臺合作推出AI PC Bot專區(qū)與端側(cè)插件商店

    。 Coze-AIPC是扣子云平臺與英特爾聯(lián)合發(fā)布的增強版智能體開發(fā)平臺,它深度整合了英特爾AI PC的端側(cè)能力與扣子云平臺的優(yōu)勢。通過扣子云平臺創(chuàng)新的“端插件”機制,英特爾
    的頭像 發(fā)表于 12-27 14:11 ?1289次閱讀

    使用英特爾AI PC為YOLO模型訓(xùn)練加速

    之后,情況有了新的變化,PyTorch2.5正式開始支持英特爾顯卡,也就是說,此后我們能夠借助英特爾 銳炫 顯卡來進行模型訓(xùn)練了。
    的頭像 發(fā)表于 12-09 16:14 ?1929次閱讀
    使用<b class='flag-5'>英特爾</b><b class='flag-5'>AI</b> PC為YOLO<b class='flag-5'>模型</b>訓(xùn)練加速

    英特爾推出全新英特爾銳炫B系列顯卡

    英特爾銳炫B580和B570 GPU以卓越價值為時新游戲帶來超凡表現(xiàn)。 ? > 今日,英特爾發(fā)布全新英特爾銳炫 B系列顯卡(代號Battlemage)。
    的頭像 發(fā)表于 12-07 10:16 ?1739次閱讀
    <b class='flag-5'>英特爾</b>推出全新<b class='flag-5'>英特爾</b>銳炫B系列<b class='flag-5'>顯卡</b>

    使用PyTorch在英特爾獨立顯卡上訓(xùn)練模型

    《PyTorch 2.5重磅更新:性能優(yōu)化+新特性》中的一個新特性就是:正式支持在英特爾獨立顯卡上訓(xùn)練模型!
    的頭像 發(fā)表于 11-01 14:21 ?2650次閱讀
    使用PyTorch在<b class='flag-5'>英特爾</b>獨立<b class='flag-5'>顯卡</b>上訓(xùn)練<b class='flag-5'>模型</b>

    英特爾聚焦AI座艙

    英特爾推出首款銳炫車載獨立顯卡(dGPU)和第一代英特爾軟件定義車載SoC系列,滿足當(dāng)前消費者對汽車內(nèi)部配備更多屏幕、獲得更高清晰度等AI座艙體驗需求。
    的頭像 發(fā)表于 10-30 16:26 ?562次閱讀