chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

LangChain:為你定制一個專屬的GPT

阿爾法工場研究院 ? 來源:阿爾法工場研究院 ? 2023-04-24 11:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)語:用戶可以利用LangChain的模塊來改善大語言模型的使用,通過輸入自己的知識庫來“定制化”自己的大語言模型。

LLM(大語言模型) 是一項(xiàng)變革性的技術(shù),它將人類的各類知識和邏輯能力打包進(jìn)入了一個體積龐大的模型當(dāng)中。

但是通常來說,包括當(dāng)前公認(rèn)效果最好的LLM GPT-4都會有一個問題——事實(shí)問題錯誤,也常被稱之為幻覺。幻覺(Hallucination),或者說人工智能幻覺是人工智能的自信反應(yīng)。

當(dāng)模型輸出欺騙性數(shù)據(jù)的傾向時,其使用的的訓(xùn)練數(shù)據(jù)并不能證明輸出的合理性。人工智能幻覺的危險(xiǎn)之處之一是模型的輸出看起來是正確的,其實(shí)它本質(zhì)上是錯誤的。

基于這種前提條件下,若是直接將LLM利用于生產(chǎn)環(huán)境中(例如客服答疑,新形式文檔等)時,那么事實(shí)幻覺就可能會造成極其嚴(yán)重的影響。

但是通過LangChain,我們可以通過將其它計(jì)算資源和自有的知識庫結(jié)合。依托于當(dāng)前的各類產(chǎn)品,在整合了當(dāng)前的語料資源庫后,各類LLM都會進(jìn)入到一個新的實(shí)用化發(fā)展階段。

LangChain介紹

LangChain是一個用于開發(fā)基于語言模型的應(yīng)用程序開發(fā)框架??偟膩碚f,LangChain是一個鏈接面向用戶程序和LLM之間的一個中間層。

它在 2023 年 3 月獲得了 Benchmark Capital 的 1000 萬美元種子輪融資,在近期又拿到了紅杉2000-2500萬美金的融資,估值已經(jīng)提升到了2億美金左右。

LangChain 可以輕松管理與語言模型的交互,將多個組件鏈接在一起,并集成額外的資源,例如 API 和數(shù)據(jù)庫。其組件包括了模型(各類LLM),提示模板(Prompts),索引,代理(Agent),記憶等等。

當(dāng)前GitHub上的熱門項(xiàng)目Auto-GPT和Babyagi所使用的鏈?zhǔn)剿伎寄芰Χ际怯蒐angChain啟發(fā)而來。

0bb89c10-df25-11ed-bfe3-dac502259ad0.png

LangChain項(xiàng)目主頁圖

LangChain工作流程

本次重點(diǎn)介紹LangChain搭配自有的知識庫讓LLM發(fā)揮更大功能的流程。

在缺少了上下文的情況下,即使是目前公認(rèn)最頂級的LLM GPT-4也無法回答部分需要特定領(lǐng)域的知識。

而要是想僅用自有知識庫來訓(xùn)練出LLMs又是不可能的,這個時候最好的方法就是利用LangChain的模塊來改善LLM的使用,通過輸入自己的知識庫來“定制化”自己的LLM。

Question Answering over specific documents是一個寫在LangChain主頁的主推功能。翻譯過來就是 基于特定文檔的問答 。

1.準(zhǔn)備自定義數(shù)據(jù)

準(zhǔn)備好需要LLM學(xué)習(xí)的內(nèi)容,它可以是一個純文本文件或者其他類型的文本(不同類型的文本需要不同的文檔加載器)。

2.拆分文檔

一般來講,每個文檔都是由復(fù)雜長短句、多種語法結(jié)合寫作而成的。在進(jìn)行輸入之前,就必須對這些文字進(jìn)行解構(gòu)處理。

對于英文LangChain一般會使用RecursiveCharacterTextSplitter處理。由于中文的復(fù)雜性,會使用到j(luò)ieba等處理工具預(yù)處理中文語句。

3.文本嵌入(Embeddings)

處理完文本之后,就可以對文本進(jìn)行嵌入(Embeddings)了。通過調(diào)用OpenAI的Embeddings API將文本向量化。在這步處理之后,文本就已經(jīng)不再是文字,而是以向量化存儲的信息。

再使用一個開源的Embeddings數(shù)據(jù)庫ChromaDB保存Embeddings數(shù)據(jù),就可以達(dá)到使用數(shù)據(jù)長期存儲和快速調(diào)用。

0be7ed76-df25-11ed-bfe3-dac502259ad0.jpg

圖:將原文本嵌入

4.使用鏈(Chain)對矢量數(shù)據(jù)庫進(jìn)行問答

在擁有了嵌入數(shù)據(jù)之后,我們就可以利用LangChain的強(qiáng)大鏈功能來執(zhí)行我們的問答。這時就可以通過自然語言對于文檔內(nèi)容進(jìn)行提問了。

0bfcdeb6-df25-11ed-bfe3-dac502259ad0.jpg

通過LangChain回答問題/完成任務(wù)

LangChain可能的應(yīng)用場景

當(dāng)前的AI熱潮吸引了很多人,而除了ChatGPT這類問答還有New Bing這種搜索服務(wù)外,并沒有什么可以將LLM商業(yè)化的案例。甚至可以說只有New Bing才是目前唯一一個成功的商業(yè)化案例。

LangChain為所有人提供了一個新的商業(yè)化方案。此前有將LLM導(dǎo)入客服軟件中應(yīng)用的方案,但是由于LLM容易出現(xiàn)事實(shí)幻覺而無法實(shí)施。

同時,將所需內(nèi)容通過Prompt導(dǎo)入LLM的想法也由于LLM的對話(Context)輸入限制而不可能實(shí)施。LangChain則通過將數(shù)據(jù)向量化避免了使用輸入限制,從而將所需內(nèi)容導(dǎo)入LLM進(jìn)行問答。

當(dāng)下的人工成本逐漸提升,例如淘寶客服等人工密集型產(chǎn)業(yè)的成本逐步提升。當(dāng)前的智能問答距離可用仍有較遠(yuǎn)的距離。

通過已經(jīng)預(yù)訓(xùn)練好的LLM是一個快速降本增效的方案?;诿總€產(chǎn)品的數(shù)據(jù),可以將數(shù)據(jù)引入LLM中,讓LLM接替客服工作,準(zhǔn)確、快速的回答客戶的定制化問題,同時語氣貼合自然口吻,避免了情緒化工作。

基于文檔的工作還可以在各類公司培訓(xùn)和智能化文檔方面提供作用。很多產(chǎn)品文檔隨著時間的積累變得越來越復(fù)雜,多層跳轉(zhuǎn)也會讓人學(xué)習(xí)起來效率低下且不適。

此時基于LangChain就可以將文檔重新梳理,輸出為大綱類,在使用的時候可以隨時通過問答的形式將內(nèi)容輸出。類似于新員工培訓(xùn)和產(chǎn)品說明書等等場景都可以有所應(yīng)用。這就極大的拓寬了文字類LLM的使用場景。

0c24a89c-df25-11ed-bfe3-dac502259ad0.png

基于LangChain的問答

除了直接與人交互的方面外,還可以導(dǎo)入特定領(lǐng)域的知識庫,實(shí)時更新LLM的內(nèi)容,讓LLM的知識時刻處于最新的狀態(tài)。依賴于此,LangChain除了可以完成自然語言文檔搜索外,還可以基于及時的資源進(jìn)行快速開發(fā)。

0c482632-df25-11ed-bfe3-dac502259ad0.jpg

導(dǎo)入資源后LangChain開發(fā)出的網(wǎng)頁

當(dāng)前LangChain的局限性

目前,由于整個AI生態(tài)還處于一種快速發(fā)展期,各類工具和平臺還沒有完全成熟,因此LangChain的各類鏈和模塊的定制性和功能都還不夠強(qiáng)大。對于有高性能場景需求和定制化任務(wù)的可能需要自己重新修改。

事實(shí)合法性也是未來需要解決的一個痛點(diǎn)。LLM的各類越獄層出不窮。雖然在引入了嵌入之后LLM只會對文檔內(nèi)容進(jìn)行問答,但是仍然需要有一套額外的監(jiān)督系統(tǒng)防止出現(xiàn)任何非法的回答。

同時當(dāng)前LangChain還有使用難度較高等問題。目前的各類AI工具都面臨著普通用戶無法輕松駕馭等等的問題,而LangChain的問題更盛。

普通產(chǎn)品或者開發(fā)者的上手學(xué)習(xí)成本較高,使用起來難度很大。這一切都需要社區(qū)和商業(yè)資本的共同投入才有可能解決。

結(jié)語

LangChain是當(dāng)前眾多的AGI實(shí)驗(yàn)性工具的基石項(xiàng)目?;阪湥–hain)的LLM調(diào)用思維勢必會貫穿未來LLM的發(fā)展生態(tài)。

提前關(guān)注AI發(fā)展動向,關(guān)注LangChain的開發(fā)進(jìn)度,會對未來的AI應(yīng)用落地有極大的幫助。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37037

    瀏覽量

    290087
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3979

    瀏覽量

    67429
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    16597

原文標(biāo)題:LangChain:為你定制一個專屬的GPT

文章出處:【微信號:alpworks,微信公眾號:阿爾法工場研究院】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    【RA4M2-SENSOR】3、使用GPT定時器-PWM輸出

    的信息 */ R_GPT_InfoGet(&g_timer2_ctrl, &info); /* 獲得計(jì)時器周期需要的計(jì)數(shù)次數(shù) */ uint32_t
    發(fā)表于 09-01 15:20

    杰和N150處理器體機(jī)主板,企業(yè)定制專屬出口方案

    行業(yè)背景:“不出海,就出局”,對于投身體機(jī)電腦海外業(yè)務(wù)的企業(yè)而言,精準(zhǔn)把握市場特性,提供契合需求的產(chǎn)品解決方案,是搶占市場份額的關(guān)鍵所在。杰和科技依托深厚的技術(shù)積淀與豐富的行業(yè)經(jīng)驗(yàn),合作伙伴定制
    的頭像 發(fā)表于 07-31 13:44 ?1309次閱讀
    杰和N150處理器<b class='flag-5'>一</b>體機(jī)主板,<b class='flag-5'>為</b>企業(yè)<b class='flag-5'>定制</b><b class='flag-5'>專屬</b>出口方案

    【重磅】企業(yè)版華秋DFM&amp;華秋CAM正式發(fā)布!離線審查+定制開發(fā)+專屬護(hù)航

    深度工藝審查規(guī)則 ,且更多工藝審查規(guī)則和企業(yè)版專屬高階功能持續(xù)新增中 3、企業(yè)級專屬服務(wù) ◆ 輕量 定制開發(fā) (最快3天交付企業(yè)專用規(guī)則庫) ◆ 代建元件庫服務(wù):元件庫600萬+,支持代建服務(wù)
    發(fā)表于 06-11 16:02

    樹莓派鏡像的制作、燒錄及運(yùn)行

    是否想過自己動手打造專屬的操作系統(tǒng)鏡像?無論是極客項(xiàng)目定制開發(fā)環(huán)境,還是讓老舊設(shè)備煥發(fā)新
    的頭像 發(fā)表于 03-27 16:00 ?1776次閱讀

    Rk3576開發(fā)板技術(shù)解析 Weston配置步驟與技巧 定制專屬桌面體驗(yàn)

    ? Weston 是輕量級的 Wayland 合成器,支持通過簡單的配置文件調(diào)整桌面狀態(tài)欄、快捷啟動程序等。下面我們起來看看在迅RK3576開發(fā)板上如何進(jìn)行這些操作吧! ? ?
    的頭像 發(fā)表于 03-06 16:03 ?1395次閱讀
    迅<b class='flag-5'>為</b>Rk3576開發(fā)板技術(shù)解析 Weston配置步驟與技巧 <b class='flag-5'>定制</b><b class='flag-5'>專屬</b>桌面體驗(yàn)

    慧視圖像處理板+VizSDK 拓展豐富的應(yīng)用場景

    成都慧視能夠深度定制RV1126、RK3399Pro、RK3588系列圖像處理板,其中很重要的特點(diǎn)就是支持二次開發(fā),使用者能夠根據(jù)我司自研的SDK結(jié)合應(yīng)用場景打造專屬的功能以更好地
    的頭像 發(fā)表于 03-04 17:45 ?637次閱讀
    慧視圖像處理板+VizSDK   <b class='flag-5'>為</b><b class='flag-5'>你</b>拓展豐富的應(yīng)用場景

    OpenAI即將發(fā)布GPT-4.5與GPT-5

    ,OpenAI還將推出更為先進(jìn)的GPT-5。Sam Altman在社交平臺上明確表示,GPT-5的發(fā)布時間已經(jīng)確定在幾個月內(nèi)。這
    的頭像 發(fā)表于 02-13 13:43 ?880次閱讀

    OpenAI即將推出GPT-5模型

    OpenAI首席執(zhí)行官奧爾特曼近日宣布了項(xiàng)重要消息:OpenAI將在今年未來幾個月內(nèi)推出全新的GPT-5模型。這消息引起了業(yè)界的廣泛關(guān)注和期待。 據(jù)了解,GPT-5模型將整合Ope
    的頭像 發(fā)表于 02-13 11:21 ?799次閱讀

    OpenAI CEO預(yù)告GPT-4.5及GPT-5未來規(guī)劃

    近日,OpenAI的首席執(zhí)行官薩姆·奧爾特曼(Sam Altman)放出了則令人矚目的更新預(yù)告,透露了GPT-4.5和GPT-5的未來規(guī)劃。 據(jù)奧爾特曼透露,OpenAI將在接下來的幾個月內(nèi)推出
    的頭像 發(fā)表于 02-13 10:02 ?624次閱讀

    ARM主板定制:打造專屬智能硬件

    在競爭激烈的市場環(huán)境中,標(biāo)準(zhǔn)化產(chǎn)品已無法滿足企業(yè)日益增長的個性化需求。ARM主板定制服務(wù)應(yīng)運(yùn)而生,企業(yè)提供量身定制的硬件解決方案,助力企業(yè)打造差異化競爭優(yōu)勢,引領(lǐng)行業(yè)未來。為何選擇ARM主板
    的頭像 發(fā)表于 02-05 14:14 ?634次閱讀
    ARM主板<b class='flag-5'>定制</b>:打造<b class='flag-5'>專屬</b>智能硬件

    探秘鋰電池固定盒可定制加工廠,解鎖專屬定制新體驗(yàn)

    如果正在尋找家可靠的鋰電池固定盒可定制加工廠,不妨考慮這家。相信它的專業(yè)和用心,定能為提供滿意的產(chǎn)品和服務(wù)??靵黹_啟
    的頭像 發(fā)表于 01-24 17:20 ?720次閱讀
    探秘鋰電池固定盒可<b class='flag-5'>定制</b>加工廠,解鎖<b class='flag-5'>專屬</b><b class='flag-5'>定制</b>新體驗(yàn)

    探秘定制鋰電池實(shí)體店:開啟專屬電力新體驗(yàn)

    定制鋰電池實(shí)體店我們提供了種全新的電池選擇方式,讓我們能夠擺脫傳統(tǒng)鋰電池的束縛,擁有款真正符合自己需求的專屬電力解決方案。如果
    的頭像 發(fā)表于 01-15 17:06 ?721次閱讀
    探秘<b class='flag-5'>定制</b>鋰電池實(shí)體店:開啟<b class='flag-5'>專屬</b>電力新體驗(yàn)

    OpenAI GPT-5開發(fā)滯后:訓(xùn)練成本高昂

    近日,據(jù)最新消息,OpenAI在推進(jìn)其備受期待的下代旗艦?zāi)P?b class='flag-5'>GPT-5的開發(fā)進(jìn)程上遇到了困難。由于計(jì)算成本高昂且高質(zhì)量訓(xùn)練數(shù)據(jù)稀缺,GPT-5的開發(fā)已經(jīng)落后于原定計(jì)劃半年之久。 據(jù)悉,OpenAI
    的頭像 發(fā)表于 12-23 11:04 ?1282次閱讀

    GPT誕生兩周年,AIPC連接器帶來什么新變化?

    GPT即將迎來誕生2周年,AIPC帶動PC市場逐步回暖,連接器行業(yè)帶來了什么樣的新變化?
    的頭像 發(fā)表于 11-28 10:39 ?711次閱讀

    Llama 3 與 GPT-4 比較

    隨著人工智能技術(shù)的飛速發(fā)展,我們見證了代又代的AI模型不斷突破界限,各行各業(yè)帶來革命性的變化。在這場技術(shù)競賽中,Llama 3和GPT-4作為兩
    的頭像 發(fā)表于 10-27 14:17 ?1477次閱讀