一文讀懂大語言模型

簡介

本文旨在讓沒有計(jì)算機(jī)科學(xué)背景的人對(duì)ChatGPT和類似的人工智能系統(tǒng)(GPT-3、GPT-4、Bing Chat、Bard等)的工作原理有一些了解。ChatGPT是一種基于大語言模型(Large Language Model) 的對(duì)話式AI聊天機(jī)器人。這些詞匯當(dāng)前還比較陌生，但我們將逐步拆解，討論它們背后的核心概念。這篇文章不需要任何技術(shù)或數(shù)學(xué)背景，我們通過大量比喻來說明這些概念，討論核心概念的工作方式，以及ChatGPT這樣的大語言模型可以或不可以做什么。

這就是本文要做的，在沒有任何術(shù)語的情況下慢慢講解與大語言模型和ChatGPT相關(guān)的術(shù)語，對(duì)于必要術(shù)語，我將用常見詞匯來拆解解釋。我們從"什么是人工智能"開始，逐步深入。我會(huì)盡可能多的使用重復(fù)出現(xiàn)的比喻，從我們應(yīng)該期望AI能做什么或不能做什么來談?wù)撨@些技術(shù)的含義。

出發(fā)！

1. 什么是人工智能(Artificial Intelligence)?

我們先從一些可能經(jīng)常聽到的基本術(shù)語開始。什么是人工智能(artificial intelligence) ？

人工智能 : 如果一個(gè)實(shí)體的行為和人類類似，這個(gè)實(shí)體可能會(huì)被稱之為智能。

"智能"的定義并沒有達(dá)成一致，因此用"智能"這個(gè)詞來定義人工智能有點(diǎn)問題，不過我覺得這仍然相當(dāng)不錯(cuò)?；旧峡梢哉J(rèn)為，如果看一些人工的東西，做一些吸引人的、有用的、讓人驚嘆的事情，就可以稱之為智能。例如，我們經(jīng)常將"AI"一詞歸因于電腦游戲中由電腦控制的角色，這些機(jī)器人大多是簡單的if-then-else代碼(例如: 例如，"如果玩家在射程內(nèi)，那么射擊，然后移動(dòng)到……")。但如果工作會(huì)讓我們保持投入和興奮，而不是做那些明顯的傻事，我們可能會(huì)認(rèn)為這些工作更復(fù)雜。

我們一旦了解了某些東西是如何工作的，可能并不會(huì)留下太深刻的印象，而且會(huì)期望在幕后看到更復(fù)雜的東西，這完全取決于你對(duì)幕后發(fā)生事情了解多少。

重點(diǎn)是，人工智能不是魔法。因?yàn)椴皇悄Х?，所以可以解釋?/strong>

讓我們開始吧。

2. 什么是機(jī)器學(xué)習(xí)(Machine Learning)?

你經(jīng)常聽到的另一個(gè)與人工智能相關(guān)的術(shù)語是機(jī)器學(xué)習(xí)(machine learning) 。

機(jī)器學(xué)習(xí) : 一種通過獲取數(shù)據(jù)，形成模型，然后執(zhí)行模型來創(chuàng)建行為的方法。

有時(shí)候，手動(dòng)創(chuàng)建一堆if-then-else語句來捕捉復(fù)雜的現(xiàn)象(比如語言)非常困難。在這種情況下，我們試圖找到一堆數(shù)據(jù)，并用可以在數(shù)據(jù)中找到的模式來建模的算法。

但什么是模型呢？模型是對(duì)一些復(fù)雜現(xiàn)象的簡化。例如，模型汽車是一輛真正汽車的更小、更簡單版本，它有許多屬性，但并不意味著完全取代原來的汽車。一輛模型車可能看起來很真實(shí)，有時(shí)候很有用，但不能開它去購物。

就像我們能造出更小更簡單的汽車一樣，我們也能造出更小更簡單的人類語言。我們用術(shù)語" 大語言模型(large language models) "，因?yàn)榭紤]到它們需要多少內(nèi)存，這些模型非常大。生產(chǎn)中最大的模型，如ChatGPT、GPT-3和GPT-4，大到需要在數(shù)據(jù)中心服務(wù)器上運(yùn)行大型超級(jí)計(jì)算機(jī)來創(chuàng)建和運(yùn)行。

3. 什么是神經(jīng)網(wǎng)絡(luò)(Neural Network)?

有許多從數(shù)據(jù)中學(xué)習(xí)模型的方法，神經(jīng)網(wǎng)絡(luò)就是其中之一。該技術(shù)大致模仿人類大腦通過神經(jīng)元相互連接的腦細(xì)胞網(wǎng)絡(luò)而組成，這些神經(jīng)元來回傳遞電信號(hào)，以某種方式使人類能夠完成各種任務(wù)。20世紀(jì)40年代提出了神經(jīng)網(wǎng)絡(luò)的基本概念，但直到20世紀(jì)80年代才發(fā)明了訓(xùn)練神經(jīng)網(wǎng)絡(luò)的基本概念。神經(jīng)網(wǎng)絡(luò)效率非常低下，直到2017年左右，由于計(jì)算機(jī)硬件的發(fā)展，才讓大規(guī)模使用神經(jīng)網(wǎng)絡(luò)成為可能。

不過，相對(duì)于大腦，我更喜歡用電路來比喻神經(jīng)網(wǎng)絡(luò)。即使你不是電氣工程師，也應(yīng)該知道電是通過電線流動(dòng)的，而有種叫做電阻的東西，可以阻礙電流經(jīng)過電路的某些部分。

假設(shè)你想做一輛能在高速公路上行駛的自動(dòng)駕駛汽車，汽車的前部、后部和側(cè)面都配備了距離傳感器，當(dāng)有什么東西非常接近時(shí)，傳感器報(bào)告數(shù)值為1.0，而當(dāng)附近沒有任何東西時(shí)，報(bào)告數(shù)值為0.0。

你還調(diào)整了汽車的控制，使自動(dòng)裝置可以轉(zhuǎn)動(dòng)方向盤、踩剎車、踩油門。當(dāng)加速器接收到值1.0時(shí)，表示用最大的加速度，0.0表示不加速。同樣，發(fā)送給制動(dòng)裝置的值1.0表示猛踩剎車，0.0表示不剎車。發(fā)送給轉(zhuǎn)向裝置的值為-1.0到+1.0，負(fù)值表示向左轉(zhuǎn)向，正值表示向右轉(zhuǎn)向，0.0表示保持直線。

你還得記錄駕駛數(shù)據(jù)。當(dāng)前方道路暢通時(shí)，就加速。前面有車時(shí)，要減速。當(dāng)一輛車從左邊靠得太近時(shí)，就向右轉(zhuǎn)，改變車道(除非右邊也有一輛車)。這是一個(gè)復(fù)雜的過程，涉及基于不同傳感器信息的不同動(dòng)作組合(向左轉(zhuǎn)向，向右轉(zhuǎn)向，加速或減速，剎車)。

現(xiàn)在要把傳感器和自動(dòng)裝置連接起來。該怎么做？目前還不清楚。所以你把每個(gè)傳感器和每個(gè)自動(dòng)裝置驅(qū)動(dòng)器連接起來。

作為電路連接傳感器和執(zhí)行器的神經(jīng)網(wǎng)絡(luò)。

就這樣開車上路的話會(huì)發(fā)生什么？電流從所有傳感器流向所有執(zhí)行器，汽車同時(shí)向左、向右轉(zhuǎn)向、加速和剎車，一團(tuán)糟。

當(dāng)傳感器發(fā)送電流時(shí)，會(huì)流向所有執(zhí)行器，汽車就會(huì)同時(shí)加速、剎車和轉(zhuǎn)向。

這可不行。所以我想在電路的不同部分放上電阻，這樣電流就只能在某些傳感器和某些執(zhí)行器之間流動(dòng)。例如，我希望電流只從前方距離傳感器流向剎車，而不是流向方向盤。此外，我還放了一些叫做門的東西，可以阻止電流流動(dòng)，直到電力積累到足夠翻轉(zhuǎn)開關(guān)(只有當(dāng)前方距離傳感器和后方距離傳感器報(bào)告的數(shù)字比較高時(shí)才允許電流流動(dòng))，或者只有在輸入電流強(qiáng)度低時(shí)才流動(dòng)(當(dāng)前方距離傳感器報(bào)告數(shù)值較低時(shí)向加速器發(fā)送更多電流)。

但把這些電阻和門放在哪里呢？不知道。一開始我把它們隨意放在各個(gè)地方，然后再試一次。也許這次車開得更好了，它在數(shù)據(jù)顯示應(yīng)該剎車的時(shí)候剎車，應(yīng)該轉(zhuǎn)向的時(shí)候轉(zhuǎn)向，等等。但并不是每件事都做對(duì)了，有些事情做得更糟(數(shù)據(jù)顯示需要?jiǎng)x車的時(shí)候它卻加速了)，所以我一直隨機(jī)嘗試電阻和門的不同組合。最終，我偶然發(fā)現(xiàn)一種效果足夠好的組合，成功了。也許看起來像這樣:

經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。較暗的線表示電路中電流可以自由流動(dòng)的部分。中間的圓圈是門，在將電流發(fā)送到上面的執(zhí)行器之前，可能會(huì)從下面的傳感器積累大量電流，或者可能在幾乎沒有電流的情況下發(fā)送電流。

(我們在現(xiàn)實(shí)中不能增加或減少門，它們總是存在的，但可以修改門，使它們以更少或更多的電流激活。純粹的機(jī)器學(xué)習(xí)主義者可能會(huì)對(duì)這種描述感到惡心。不過從技術(shù)上說，這是通過調(diào)整門的偏置(bias) 來完成的，通常不會(huì)在圖表中顯示，但就電路比喻而言，可以將其視為直接插入電源的門的導(dǎo)線，然后可以像其他導(dǎo)線一樣進(jìn)行修改。)

讓我們試駕一下吧!

隨機(jī)嘗試是種很糟糕的方式，有一種被稱為反向傳播(back propagation) 的算法在猜測如何改變電路的配置方面相當(dāng)出色。算法細(xì)節(jié)并不重要，只需要知道算法會(huì)對(duì)電路進(jìn)行微小調(diào)整，讓電路的行為更接近數(shù)據(jù)的建議，經(jīng)過數(shù)百萬次調(diào)整，最終使電路與數(shù)據(jù)一致。

我們把電阻和門稱為參數(shù)，但實(shí)際上參數(shù)無所不在，反向傳播算法會(huì)聲明每個(gè)電阻的強(qiáng)弱，因此一旦知道了電路的布局和參數(shù)，就可以復(fù)制到其他汽車上。

4. 什么是深度學(xué)習(xí)(Deep Learning)?

深度學(xué)習(xí)可以讓我們在電路中加入除了電阻和門之外的其他東西。例如，可以在電路中進(jìn)行數(shù)學(xué)計(jì)算，在輸出電流之前進(jìn)行相加或相乘。深度學(xué)習(xí)仍然使用一樣基本增量技術(shù)猜測參數(shù)。

5. 什么是語言模型(Language Model)?

在汽車的例子里，我們試圖讓神經(jīng)網(wǎng)絡(luò)的行為與數(shù)據(jù)一致，從而創(chuàng)造出一種能夠操縱汽車機(jī)械裝置的電路，模擬司機(jī)的行為。我們可以用同樣的方式對(duì)待語言，看看人類寫的文本，并嘗試電路是否能產(chǎn)生與人類產(chǎn)生的單詞序列非常相似的單詞序列?，F(xiàn)在，當(dāng)傳感器看到單詞時(shí)就會(huì)啟動(dòng)，輸出的也是單詞。

我們要做什么？嘗試創(chuàng)建一個(gè)電路，在給定一堆輸入單詞的情況下，猜測輸出單詞。例如:

"Once upon a ___"

看上去空格里填"time"比"arm adillo"更合適。

我們傾向于從概率角度來討論語言模型，上述例子的數(shù)學(xué)形式為:

如果不熟悉這個(gè)符號(hào)，別擔(dān)心，這只是一個(gè)數(shù)學(xué)術(shù)語，意思是"time"這個(gè)詞在給定(|符號(hào)的意思表示給定 )一堆單詞"once"、"upon"和"a"條件下出現(xiàn)的概率(P)。我們期望好的語言模型輸出"time"這個(gè)詞的概率比"armadillo"這個(gè)詞的概率高。

可以將其概括為:

意思是計(jì)算序列中第n個(gè)單詞在給定在它之前所有單詞(從位置1到n-1的單詞)的條件下出現(xiàn)的概率。

不過現(xiàn)在退一步，想想老式打字機(jī)，就是那種有撞針的打字機(jī)。

DALL-E2生成了這張照片，看看那些撞針!

除了每個(gè)字母都有不同的撞針，我們給每個(gè)單詞都裝上一個(gè)撞針，如果英語有5萬個(gè)單詞，那么這會(huì)是一臺(tái)巨大的打字機(jī)！

設(shè)想一個(gè)與汽車網(wǎng)絡(luò)不同但類似的網(wǎng)絡(luò)，電路頂部有5萬個(gè)輸出連接到撞針上，每個(gè)單詞一個(gè)。相應(yīng)的，有5萬個(gè)傳感器，每個(gè)傳感器檢測不同輸入單詞。最終選擇一個(gè)能得到最高電流信號(hào)的撞針，對(duì)應(yīng)的單詞就會(huì)出現(xiàn)在空白紙上。

現(xiàn)在的情況是，如果想做一個(gè)簡單的電路，輸入一個(gè)單詞并產(chǎn)生一個(gè)單詞，就必須做一個(gè)有5萬個(gè)傳感器(每個(gè)單詞一個(gè))和5萬個(gè)輸出(每個(gè)撞針一個(gè))的電路。只需將傳感器連接到撞針上，總共50000 × 50000 = 25億根電線。

底部的每個(gè)圓圈表示一個(gè)單詞，需要5萬個(gè)傳感器來識(shí)別單詞"once"，電流通過網(wǎng)絡(luò)隨意傳播，上面每個(gè)圓圈都連接到一個(gè)單詞的撞針上，所有撞針都得到了一些電流，但其中某個(gè)會(huì)得到更多的電流。

這是個(gè)很大的網(wǎng)絡(luò)！

更糟的是，如果我想以"Once upon a ___ "為例，需要感知三個(gè)輸入位置都是哪個(gè)單詞，將會(huì)需要50000 × 3 = 150,000個(gè)傳感器，連接到5萬個(gè)撞針，得到15萬 × 5萬 = 75億個(gè)電線。截至2023年，大多數(shù)大型語言模型可以接收4000個(gè)單詞，最大的可以接收3.2萬個(gè)單詞。我要哭了。

以三個(gè)單詞作為輸入的網(wǎng)絡(luò)，每個(gè)單詞需要50000個(gè)傳感器。

需要一些技巧來處理這種情況，我們將分階段進(jìn)行。

5.1 編碼器(Encoders)

第一件事是把電路分成兩個(gè)電路，一個(gè)叫編碼器(encoder) ，一個(gè)叫解碼器(decoder) 。由于許多單詞的意思大致相同，比如以下短語:

The king sat on the ___

The queen sat on the ___

The princess sat on the ___

The regent sat on the ___

對(duì)于上面所有空格，一個(gè)合理的猜測是"throne"(或者"toilet")。也就是說，可能不需要在"king"和"throne"之間、"queen"和"throne"之間進(jìn)行區(qū)分，相反，如果有一些近似意味著"royalty"的東西，每次看到"king"或"queen"，就可以用這個(gè)東西來代替。然后就只需要關(guān)心哪些單詞的意思大致相同，然后該怎么做(向"throne"發(fā)送大量電流)。

這就是我們要做的。設(shè)置一個(gè)電路，有5萬個(gè)單詞的傳感器，并映射到一些較小的輸出集合(比如256個(gè)而不是5萬個(gè))。同時(shí)不是只能觸發(fā)一個(gè)撞針，而是可以一次觸發(fā)一堆。每種可能的撞針組合都可以代表不同的概念(如"royalty"或"armored mammals")。這256個(gè)輸出使我們能夠表示個(gè)概念，而在現(xiàn)實(shí)中甚至更多。就像在汽車的例子中，可以踩下部分剎車，這256個(gè)輸出的每一個(gè)都處于1.0和0.0之間。也許更貼切的比喻是256只撞針都向下?lián)舸?，但每只力度不同?/p>
好吧，以前一個(gè)單詞需要5萬個(gè)傳感器中的某一個(gè)來激活，現(xiàn)在我們把一個(gè)激活的傳感器和49999個(gè)關(guān)閉的傳感器濃縮成256個(gè)數(shù)字。所以"king"可能是[0.1, 0.0 , 0.9, …, 0.4]，"queen"可能是[0.1, 0.1 , 0.9, …, 0.4]，幾乎一樣。這些數(shù)字列表被稱為 encodings (由于歷史原因也稱為 隱藏狀態(tài)hidden state ，但我不想解釋這個(gè)，所以我們將堅(jiān)持使用encoding)。把5萬個(gè)傳感器壓縮成256個(gè)輸出的電路被稱為 encoder ，看上去是這樣的:

encoder網(wǎng)絡(luò)將監(jiān)測單個(gè)單詞所需的5萬個(gè)傳感器值壓縮為256個(gè)數(shù)字編碼(較淺和較深的藍(lán)色用于表示較高或較低的值)。

5.2 解碼器(Decoders)

但編碼器不會(huì)告訴我們下一個(gè)單詞應(yīng)該是哪個(gè)，所以我們將編碼器與解碼器網(wǎng)絡(luò)配對(duì)。解碼器是另一個(gè)電路，采用256個(gè)數(shù)字構(gòu)成編碼，并激活原始的5萬個(gè)撞針，每個(gè)單詞一個(gè)，然后選擇輸出電量最高的單詞，看起來是這樣的:

解碼器網(wǎng)絡(luò)將編碼中的256個(gè)值擴(kuò)展為與每個(gè)可能的單詞相關(guān)聯(lián)的5萬個(gè)撞針的激活值，數(shù)值最高的單詞被激活。

5.3 編碼器和解碼器的組合

編碼器和解碼器一起工作，形成一個(gè)大神經(jīng)網(wǎng)絡(luò):

編碼器-解碼器網(wǎng)絡(luò)。

順便說一下，通過編碼實(shí)現(xiàn)單個(gè)單詞輸入單個(gè)單詞輸出只需要(50000 × 256) × 2 = 2560萬個(gè)參數(shù)，看起來好多了。

這個(gè)例子是一個(gè)單詞輸入并產(chǎn)生一個(gè)單詞輸出，所以如果想要讀取n個(gè)單詞，將有50000 × n個(gè)輸入，編碼后將有256 × n個(gè)輸入。

為什么會(huì)這樣？通過將5萬個(gè)單詞都?jí)嚎s到一個(gè)小的數(shù)字集合中，我們迫使網(wǎng)絡(luò)做出妥協(xié)，并將可能觸發(fā)相同輸出單詞的輸入單詞分組在一起。這很像文件壓縮，壓縮文本文檔時(shí)，我們會(huì)得到一個(gè)較小的不可讀的文檔。但可以解壓縮文檔并恢復(fù)原始可讀文本。因?yàn)閦ip程序用符號(hào)替換了某些單詞模式，解壓縮時(shí)知道要將哪些文本替換符號(hào)。編碼器和解碼器電路學(xué)習(xí)了某種電阻和門的配置，可以用來壓縮和解壓縮單詞。

5.4 自監(jiān)督(Self-Supervision)

怎么才能知道每個(gè)單詞的最佳編碼方式？換句話說，怎么知道"king"的編碼應(yīng)該與"queen"的編碼相似，而不是"armadillo"？

作為思想實(shí)驗(yàn)，考慮一個(gè)編碼器-解碼器網(wǎng)絡(luò)，接收一個(gè)單詞(5萬個(gè)傳感器)并產(chǎn)生完全相同的單詞作為輸出。這是件蠢事，但對(duì)接下來的事情很有啟發(fā)意義。

編碼器-解碼器網(wǎng)絡(luò)被訓(xùn)練輸出與輸入相同的單詞。

輸入"king"，一個(gè)傳感器通過編碼器發(fā)送電信號(hào)，并在中間部分打開編碼中的256個(gè)值。如果編碼正確，那么解碼器將向同一個(gè)單詞"king"發(fā)送最高的電信號(hào)。容易對(duì)不對(duì)？先別下結(jié)論。很有可能會(huì)看到帶有"armadillo"字樣的撞針具有最高的電能，假設(shè)"king"的撞針得到0.051的電信號(hào)，"armadillo"的撞針得到0.23的電信號(hào)。而實(shí)際上我們根本不在乎"armadillo"的值是多少，可以只看"king"的輸出能量，就知道它不是1.0。1.0和0.051之間的差異是誤差(也稱為損耗 )，可以用反向傳播對(duì)解碼器和編碼器進(jìn)行一些更改，以便下次看到單詞"king"時(shí)的編碼稍微不同。

我們對(duì)所有單詞都這樣做，而編碼器將不得不妥協(xié)，因?yàn)?56比50000小得多。也就是說，有些詞必須使用相同的能量組合。因此選擇時(shí)，會(huì)希望"king"和"queen"的編碼幾乎相同，而"armadillo"的編碼則非常不同，這將使解碼器通過查看256個(gè)編碼值來更好的猜測單詞。如果解碼器看到256個(gè)值的特定組合，并猜測"king"為0.43，"queen"為0.42，只要"king"和"queen"得到最高的電信號(hào)，并且其余49998個(gè)撞針都得到較小的數(shù)字，就可以接受。另一種說法是，我們可能更容易接受網(wǎng)絡(luò)混淆king和queen，而不是混淆king和armadillo。

我們說神經(jīng)網(wǎng)絡(luò)是自我監(jiān)督(self-supervised) 的，因?yàn)榕c汽車的例子不同，不需要單獨(dú)收集數(shù)據(jù)來測試輸出，而只需要比較輸出和輸入(不需要為輸入和輸出單獨(dú)提供數(shù)據(jù))。

5.5 掩碼語言模型(Masked Language Models)

上面的思維實(shí)驗(yàn)看起來很傻，但是所謂的掩碼語言模型的基石，其思想是接收一個(gè)單詞序列并生成一個(gè)單詞序列，但掩蓋輸入和輸出中的一個(gè)單詞。

The [MASK] sat on the throne.

網(wǎng)絡(luò)會(huì)猜測所有單詞，我們只關(guān)心網(wǎng)絡(luò)對(duì)掩蔽詞的猜測。也就是說，對(duì)于輸出的每個(gè)單詞，有5萬個(gè)撞針，我們來看看這5萬個(gè)掩蔽詞的撞針。

掩碼序列。紅線表示上下所有東西之間的很多很多連接。

可以移動(dòng)掩碼，讓網(wǎng)絡(luò)在不同的地方猜測不同的單詞。

一種特殊類型的掩碼語言模型只在末尾有掩碼，這被稱為生成模型，因?yàn)椴聹y的掩碼總是序列中的下一個(gè)單詞，相當(dāng)于生成下一個(gè)單詞，看上去是這樣的:

The [MASK]

The queen [MASK]

The queen sat [MASK]

The queen sat on [MASK]

The queen sat on the [MASK]

我們也稱其為自回歸(auto-regressive) 模型。回歸(regressive) 這個(gè)詞聽起來不太好，但只是意味著試圖理解事物之間的關(guān)系，比如已經(jīng)輸入的單詞和應(yīng)該輸出的單詞。Auto的意思是"自我"，自回歸模型是自我預(yù)測的，預(yù)測下一個(gè)單詞，然后這個(gè)單詞又被用來預(yù)測下一個(gè)單詞，以此類推。其中有些有趣的含義，稍后會(huì)講到。

6. 什么是轉(zhuǎn)移模型(Transformer)?

我們聽過很多關(guān)于GPT-3、GPT-4和ChatGPT的東西。GPT是OpenAI公司開發(fā)的一種大語言模型的特定品牌。GPT代表生成式預(yù)訓(xùn)練轉(zhuǎn)移模型(Generative Pre-trained Transformer) 。我們來分析一下:

生成式(Generative) 。該模型能夠生成所提供輸入的延續(xù)，也就是說，給定一些文本，模型試圖猜測接下來出現(xiàn)的單詞。

預(yù)訓(xùn)練(Pre-trained) 。該模型是在一個(gè)非常大的通用文本語料庫上進(jìn)行訓(xùn)練的，只需訓(xùn)練一次，就可用于許多不同場景，而不需要從頭開始訓(xùn)練。

該模型是在一個(gè)非常大的通用文本語料庫上進(jìn)行訓(xùn)練的，涵蓋了大量可以想到的主題。這或多或少意味著"從互聯(lián)網(wǎng)上抓取"，而不是從一些專門的文本庫中獲取。通過對(duì)一般文本進(jìn)行訓(xùn)練，語言模型相對(duì)基于非常特定類型的文本(如來自醫(yī)療文檔的文本)上訓(xùn)練的語言模型更有能力響應(yīng)廣泛的輸入。在通用語料庫上訓(xùn)練的語言模型理論上可以合理響應(yīng)互聯(lián)網(wǎng)上文檔中可能出現(xiàn)的任何內(nèi)容，但可能對(duì)醫(yī)學(xué)文本響應(yīng)一般。只在醫(yī)療文檔上訓(xùn)練的語言模型可能對(duì)與醫(yī)療上下文相關(guān)的輸入響應(yīng)得很好，但在響應(yīng)閑聊或食譜等其他輸入時(shí)就很差了。

要么模型在很多事情上都足夠好，以至于人們不需要訓(xùn)練自己的模型，要么可以做一些所謂的微調(diào)(fine-tuning) ，即采用預(yù)先訓(xùn)練好的模型并對(duì)其進(jìn)行一些更新，使其在特定任務(wù)(如醫(yī)療)上能更好的工作。

接下來是轉(zhuǎn)移模型…

轉(zhuǎn)移模型(Transformer) 。一種特殊類型的自監(jiān)督編碼器-解碼器深度學(xué)習(xí)模型，具有一些非常有趣的屬性，使其擅長語言建模。

Transformer是一種特殊類型的深度學(xué)習(xí)模型，以一種特殊方式轉(zhuǎn)換編碼，使其更容易猜出空白的單詞，最早是由Vaswani等人在2017年發(fā)表的一篇名為Attention is All You Need ^[2]^ 的論文中介紹的。Transformer的核心是經(jīng)典的編碼器-解碼器網(wǎng)絡(luò)，編碼器執(zhí)行非常標(biāo)準(zhǔn)的編碼過程，你會(huì)驚訝于它的普通，但它還增加了另一種叫做自關(guān)注(self-attention) 的東西。

6.1 自關(guān)注(Self-Attention)

這是自關(guān)注的概念: 序列中的某些單詞與序列中的其他單詞相關(guān)。想想這個(gè)句子:"The alien landed on earth because it needed to hide on a planet."如果我們掩蓋第二個(gè)單詞"alien"，并讓神經(jīng)網(wǎng)絡(luò)猜測，它會(huì)通過"landing"和"earth"這樣的單詞更容易的猜出來。同樣的，如果我們把"it"遮住，讓神經(jīng)網(wǎng)絡(luò)猜這個(gè)詞，"alien"這個(gè)詞的出現(xiàn)可能會(huì)讓神經(jīng)網(wǎng)絡(luò)更傾向于選擇"it"，而不是"he"或"she"。

單詞通過功能、指稱同一事物或相互傳達(dá)意義而相互聯(lián)系。

我們知道，一個(gè)序列中的單詞會(huì)與其他單詞相關(guān)聯(lián)，因?yàn)樗鼈冎g有某種關(guān)系，這種關(guān)系并不一定為人所知。這種關(guān)系可以是解析代詞，可以是動(dòng)詞和主語的關(guān)系，也可以是與同一個(gè)概念相關(guān)的兩個(gè)單詞("earth"和"planet")。不管是什么，知道單詞之間存在某種聯(lián)系對(duì)預(yù)測很有用。

下一節(jié)將討論自關(guān)注的數(shù)學(xué)問題，要點(diǎn)是Transformer學(xué)習(xí)輸入序列中哪些單詞是相關(guān)的，然后為輸入序列中的每個(gè)位置創(chuàng)建一個(gè)新的編碼，該編碼是所有相關(guān)單詞的合集?？梢园阉胂蟪蓪W(xué)習(xí)創(chuàng)造一個(gè)新詞，這個(gè)新詞是"alien"、"landing"和"earth"的混合體(aliandearth?)。每個(gè)單詞都被編碼為一個(gè)數(shù)字列表，如果alien = [0.1, 0.2, 0.3, …, 0.4]，landing = [0.5, 0.6, 0.7, …, 0.8]，earth = [0.9, 1.0, 1.1, …, 1.2]，那么第二個(gè)單詞位置可能被編碼為所有這些編碼的總和[1.5, 1.8, 2.1, …, 2.4]，它本身不對(duì)應(yīng)任何單詞，但卻捕獲所有單詞的片段。這樣，當(dāng)解碼器最終看到這個(gè)單詞在第二個(gè)位置的新編碼時(shí)，就有了很多關(guān)于這個(gè)單詞在序列中是如何使用的信息，從而更好的猜測掩碼。(示例只是將編碼加在一起，但實(shí)際上比這更復(fù)雜)。

6.2 自關(guān)注是如何起作用的?

自關(guān)注是對(duì)普通編碼器-解碼器網(wǎng)絡(luò)的重大改進(jìn)，如果想了解更多有關(guān)其工作原理的信息，請繼續(xù)閱讀，否則可以跳過本節(jié)。自關(guān)注是數(shù)學(xué)運(yùn)算點(diǎn)積(dot product) 的一個(gè)博眼球的名字。

自關(guān)注分為三個(gè)階段。

(1) 對(duì)輸入序列的每個(gè)單詞進(jìn)行正常編碼。將單詞編碼復(fù)制四份，其中一份稱為 residual ，先保存起來。 (2) 在其他三份上運(yùn)行第二輪編碼(對(duì)編碼的編碼)。每一份都經(jīng)歷不同的編碼過程，所以出來的結(jié)果不同，一個(gè)為查詢(q)，一個(gè)為鍵(k)，一個(gè)為值(v)。

考慮有一大堆信息存儲(chǔ)在哈希表(在python中也稱為字典)中，每一行都有鍵 (唯一標(biāo)識(shí)符)和值 (存儲(chǔ)在該行中的數(shù)據(jù))。要從哈希表中檢索信息，可以執(zhí)行查詢，如果查詢匹配到鍵，則提取對(duì)應(yīng)的值。

可以用來查詢教授在哪個(gè)大學(xué)工作的哈希表。

自關(guān)注有點(diǎn)像一個(gè)模糊的哈希表，提供一個(gè)查詢，但不是查找與鍵的精確匹配，而是根據(jù)查詢和鍵之間的相似性查找近似匹配。如果沒有完美匹配，就返回值的一部分。這只有在查詢、鍵和值都是數(shù)值的情況下才有意義，類似這樣:

部分匹配的哈希表。

這就是我們要做的。對(duì)于輸入的每個(gè)單詞位置，采用q編碼和k編碼并計(jì)算相似度，計(jì)算方式是點(diǎn)積，也叫余弦相似度。不過這不重要，關(guān)鍵是每個(gè)單詞都是256個(gè)數(shù)字的列表(基于之前示例)，可以計(jì)算數(shù)字列表的相似性并記錄在矩陣中。我們稱這個(gè)矩陣為自關(guān)注得分(self-attention scores) 。如果有三個(gè)單詞的輸入序列，注意力得分可能是這樣:

每個(gè)單元格表示一個(gè)位置上的編碼單詞對(duì)另一個(gè)位置上的編碼單詞的關(guān)注程度。

網(wǎng)絡(luò)將第一個(gè)單詞視為查詢，并與第二個(gè)關(guān)鍵字進(jìn)行匹配(或者說第一個(gè)單詞"關(guān)注"第二個(gè)單詞)。如果第二個(gè)單詞是查詢，將與第三個(gè)鍵匹配。如果第三個(gè)單詞是查詢，將與第一個(gè)鍵匹配。在現(xiàn)實(shí)中永遠(yuǎn)不會(huì)有這樣的1和0，而是會(huì)在0和1之間進(jìn)行部分匹配，并且每個(gè)查詢(行)會(huì)對(duì)多個(gè)鍵(列)進(jìn)行部分匹配。

繼續(xù)檢索的比喻，把這個(gè)矩陣乘以v編碼，有趣的事情發(fā)生了。假設(shè)v編碼像這樣:

每一行都是序列中一個(gè)單詞的編碼。

也就是說，第一個(gè)單詞被編碼為數(shù)字列表0.10…0.19，第二個(gè)單詞被編碼為數(shù)字列表0.20…0.29，第三個(gè)單詞被編碼為數(shù)字列表0.30…0.39。這些數(shù)字是為了說明的目的而編出來的，實(shí)際上不會(huì)這么整齊。

將注意力與值相乘。

第一個(gè)查詢匹配第二個(gè)鍵，因此檢索第二個(gè)編碼單詞。第二個(gè)查詢與第三個(gè)鍵匹配，因此檢索第三個(gè)編碼單詞。第三個(gè)查詢匹配第一個(gè)鍵，因此檢索第一個(gè)編碼單詞。實(shí)際上做的是行交換！

實(shí)踐中，分?jǐn)?shù)不會(huì)是完美的1和0，而是將是每種編碼混合在一起的(例如，單詞1的97%加上1%或單詞3加上單詞2的2%)，但這說明自關(guān)注是一種混合和交換。在這個(gè)極端版本中，第一個(gè)單詞被替換為第二個(gè)單詞，依此類推。所以也許"earth"這個(gè)詞被換成了"planet"這個(gè)詞。

怎么知道正確編碼了q、k和v？如果整個(gè)網(wǎng)絡(luò)猜測掩碼最佳單詞的能力提高了，那么就正確編碼了q、k和v。如果沒有，那就改一下參數(shù)，用稍微不同的方式編碼。

(3) 第三件事是把所有數(shù)學(xué)運(yùn)算的結(jié)果加到residual上。還記得我們擱置的原始編碼的第一個(gè)副本嗎？沒錯(cuò)，現(xiàn)在要把混合交換的版本加進(jìn)去。現(xiàn)在，"earth"不僅僅是"earth"的編碼，而是某種虛構(gòu)的詞，是"earth"和"planet"的混搭……pearth？ealanet？都不是。無論如何，這是將被發(fā)送到解碼器的最終轉(zhuǎn)換編碼。每個(gè)位置都有一個(gè)假單詞，它實(shí)際上編碼了兩個(gè)或更多單詞，這更有利于對(duì)基于位置的單個(gè)單詞進(jìn)行預(yù)測。

然后再這樣做幾次(多層)。

這里省略了很多關(guān)于編碼器的最終編碼如何進(jìn)入解碼器的細(xì)節(jié)(另一輪關(guān)注，稱為 源關(guān)注source-attention ，其中編碼器每個(gè)位置的編碼被用作q和k，以應(yīng)用于另一個(gè)不同版本的v)，但現(xiàn)在你只需要知道個(gè)大概。最后，解碼器接收編碼器的編碼，將能量發(fā)送給撞針，挑選出能量最強(qiáng)的單詞。

7. 為什么大語言模型如此強(qiáng)大?

這一切意味著什么？包括ChatGPT、GPT-4等在內(nèi)的大語言模型只做一件事: 接收一堆單詞，并嘗試猜測下一個(gè)單詞應(yīng)該是什么。如果這是"推理"或"思考"，那也只是一種非常特殊的形式。

但即使是這種特殊的形式似乎也非常強(qiáng)大，因?yàn)镃hatGPT和類似的東西似乎可以很好的完成很多事情: 寫詩、回答有關(guān)科學(xué)和技術(shù)的問題、總結(jié)文檔、起草電子郵件，甚至編寫代碼。為什么會(huì)如此有效？

秘訣有兩個(gè)，第一個(gè)已經(jīng)討論過了: Transformer學(xué)習(xí)混合單詞上下文的方式，從而非常善于猜測下一個(gè)單詞。其次是如何訓(xùn)練系統(tǒng)。大語言模型根據(jù)從互聯(lián)網(wǎng)上抓取的大量信息進(jìn)行訓(xùn)練，包括書籍、博客、新聞網(wǎng)站、維基百科、reddit、社交媒體對(duì)話等。在訓(xùn)練過程中，從其中一個(gè)來源中輸入一段文本，并要求它猜測下一個(gè)單詞。如果猜錯(cuò)了，就稍微調(diào)整一下模型，直到猜對(duì)為止。想一下LLM被訓(xùn)練做什么，其實(shí)就是產(chǎn)生可以合理出現(xiàn)在互聯(lián)網(wǎng)上的文本。它記不住整個(gè)互聯(lián)網(wǎng)，所以用編碼來做出妥協(xié)，也許會(huì)有點(diǎn)錯(cuò)，但希望不要錯(cuò)得太離譜。

重要的是不要低估互聯(lián)網(wǎng)上文本的多樣性。LLM學(xué)習(xí)了一切，看了幾乎所有話題的數(shù)十億次對(duì)話。因此，LLM可以生成看起來像是在與你對(duì)話的單詞。它已經(jīng)看了數(shù)十億首詩歌和歌詞，幾乎可以想象，它可以產(chǎn)生看起來像詩歌的文本。它已經(jīng)看了數(shù)十億家庭作業(yè)及答案，所以可以對(duì)你的家庭作業(yè)做出合理的猜測。它看了數(shù)以十億計(jì)的標(biāo)準(zhǔn)化考試問題及答案。而今年的SAT試題和去年也不會(huì)有什么不同。它看過人們談?wù)摷倨谟?jì)劃，所以可以猜出看起來像假期計(jì)劃的單詞。它已經(jīng)看了數(shù)十億代碼示例，涵蓋各種各樣場景。程序員做的很多事情都是將非常典型和容易理解的代碼片段組裝成更大的代碼塊，因此LLM可以編寫這些小而通用的代碼片段。它已經(jīng)在stackoverflow.com上看了數(shù)十億個(gè)錯(cuò)誤代碼的例子和更正，這樣它就能針對(duì)你的錯(cuò)誤代碼提出修復(fù)建議。已經(jīng)有數(shù)十億人在推特上說，由于摸了熱爐子而燒傷了手指，所以LLM知道這些常識(shí)。它已經(jīng)閱讀了大量科學(xué)論文，所以可以猜測眾所周知的科學(xué)事實(shí)，即使你還不知道。它已經(jīng)看了數(shù)十億關(guān)于如何總結(jié)要點(diǎn)的例子，知道如何使文本更符合語法，更簡潔或更有說服力。

重點(diǎn)是，當(dāng)你要求ChatGPT或其他大語言模型做某些事，并且發(fā)現(xiàn)它完成了，很有可能你只是在要求它做一些它已經(jīng)見過數(shù)十億個(gè)例子的事情。即使你想出了一些非常獨(dú)特的東西，比如"告訴我閃電俠戈登吃了六個(gè)墨西哥卷餅后會(huì)做什么"(我甚至不知道這是不是獨(dú)特的)，而它已經(jīng)看了關(guān)于閃電俠戈登的同人小說，看到人們談?wù)摮粤颂嗟哪鞲缇盹?，并且可?由于自關(guān)注)混合和搭配零碎的東西來組合一個(gè)聽上去合理的回應(yīng)。

當(dāng)我們與大語言模型交互時(shí)，第一直覺不應(yīng)該是"哇，這東西一定非常聰明，或者非常有創(chuàng)造力，或者非常容易理解"。我們的第一反應(yīng)應(yīng)該是"我可能已經(jīng)要求它做一些它以前見過的東西"。不過即使它不是"認(rèn)真思考"或"做一些非常復(fù)雜的推理"，仍然非常有用。

我們不需要擬人化的來理解它做了什么來給我們提供回應(yīng)。

關(guān)于這個(gè)主題的最后一點(diǎn)說明: 由于大語言模型的工作方式和訓(xùn)練方式，它們傾向于提供某種程度上屬于中間響應(yīng)的答案。在詢問關(guān)于閃電俠戈登的故事后，模型往往會(huì)給出平庸的回答，這對(duì)我來說似乎很奇怪。但在一個(gè)故事或一首詩的背景下，這些回應(yīng)可以被認(rèn)為是許多人(在互聯(lián)網(wǎng)上寫作)會(huì)想到的。以一個(gè)人獨(dú)自思考的標(biāo)準(zhǔn)來看，這可能相當(dāng)不錯(cuò)。但你自己寫的故事和詩歌可能也很普通(但它們對(duì)你來說很特別)。對(duì)不起，事實(shí)如此。

8. 我應(yīng)該注意什么?

Transformer的工作方式和訓(xùn)練方式會(huì)產(chǎn)生一些微妙的影響，以下是一些技術(shù)細(xì)節(jié)。

大語言模型是在互聯(lián)網(wǎng)上訓(xùn)練的，這意味著也接受了人類陰暗面的訓(xùn)練。大語言模型可能會(huì)被輸入種族主義、性別歧視言論、對(duì)各種類型的人的各種侮辱、對(duì)他人的刻板假設(shè)、陰謀論、政治錯(cuò)誤信息等，因此語言模型選擇生成的單詞可能會(huì)反應(yīng)這種語言。

大語言模型沒有"核心信念"。他們是在玩填詞游戲，試圖預(yù)測如果同樣的句子出現(xiàn)在互聯(lián)網(wǎng)上，下一個(gè)單詞會(huì)是什么。因此，可以要求大語言模型寫一個(gè)支持或反對(duì)同一件事的句子，語言模型將遵循這兩種方式。這并不意味著它相信這個(gè)或那個(gè)，或者改變信仰，或者一個(gè)比另一個(gè)更正確。如果訓(xùn)練數(shù)據(jù)中一個(gè)事物的例子比另一個(gè)事物多，那么大語言模型將傾向于一致的響應(yīng)互聯(lián)網(wǎng)上出現(xiàn)的更頻繁的數(shù)據(jù)。記住: 該模型力求模仿最常見的反應(yīng)。

大語言模型沒有任何對(duì)與錯(cuò)的概念。有些事情我們認(rèn)為是事實(shí)，比如地球是圓的，LLM也會(huì)這么說。但如果換個(gè)上下文，它也會(huì)說相反的話，因?yàn)榛ヂ?lián)網(wǎng)上確實(shí)有關(guān)于地球是平的文字。LLM不能保證提供真相，只是傾向于猜測我們認(rèn)為正確的單詞，這是最接近于LLM"知道"真相或?qū)﹀e(cuò)的方式。

大語言模型可能會(huì)出錯(cuò)。訓(xùn)練數(shù)據(jù)可能有很多不一致的材料，當(dāng)我們問問題時(shí)，自關(guān)注可能不會(huì)關(guān)注到我們想要關(guān)注的所有事情。作為填詞游戲，它可能會(huì)做出錯(cuò)誤的猜測。有時(shí)，訓(xùn)練數(shù)據(jù)看到一個(gè)詞的次數(shù)太多，以至于更喜歡這個(gè)詞，即使它對(duì)輸入沒有意義。以上導(dǎo)致了一種被稱為" 幻覺(hallucination) "的現(xiàn)象，在這種現(xiàn)象中，一個(gè)詞是猜測出來的，既不是來自輸入，也不是"正確的"。LLM傾向于猜測較小的數(shù)字，因?yàn)檩^小的數(shù)字更常見。LLM并不擅長數(shù)學(xué)。LLM更喜歡數(shù)字"42"，因?yàn)槿祟愑捎谝槐咎貏e著名的書而喜歡這個(gè)數(shù)字。LLM更喜歡常用的名字，所以可能會(huì)虛構(gòu)成作者的名字。

大語言模型是自回歸的。因此，當(dāng)它們猜到不正確的單詞時(shí)，這些猜測的單詞會(huì)被添加到它們自己的輸入中，猜測下一個(gè)單詞。也就是說，錯(cuò)誤會(huì)累積。即使只有1%的幾率出錯(cuò)，自關(guān)注也會(huì)關(guān)注到那個(gè)錯(cuò)誤的選擇，并使錯(cuò)誤加倍。即使只犯了一個(gè)錯(cuò)誤，之后發(fā)生的所有事情也可能與這個(gè)錯(cuò)誤有關(guān)。然后，語言模型可能會(huì)在此基礎(chǔ)上產(chǎn)生額外的錯(cuò)誤。Transformer沒有辦法"改變主意"或再試一次或自我糾正,只能隨波逐流。

應(yīng)該始終驗(yàn)證大語言模型的輸出。如果你要求它做一些你自己無法勝任的事情，那么應(yīng)該考慮一下是否可以對(duì)所犯的錯(cuò)誤采取行動(dòng)。對(duì)于低風(fēng)險(xiǎn)任務(wù)(比如寫一個(gè)短篇故事)，這可能沒問題。而對(duì)于高風(fēng)險(xiǎn)任務(wù)(比如決定投資哪些股票)，這些錯(cuò)誤可能會(huì)導(dǎo)致你做出非常昂貴的決定。

自關(guān)注意味著在輸入提示中提供的信息越多，回答就會(huì)越專業(yè)，因?yàn)樗鼤?huì)在猜測中混合更多輸入的單詞。響應(yīng)的質(zhì)量與輸入提示的質(zhì)量成正比，更好的提示產(chǎn)生更好的結(jié)果。嘗試幾種不同的提示，看看哪種最適合。不要假設(shè)語言模型"理解"你想要做的事情，并且能在第一次就給出最好的結(jié)果。

你并沒有真正與大語言模型"進(jìn)行對(duì)話"。大言模型不會(huì)"記住"交流中發(fā)生的事情。你只是輸入并獲得輸出，LLM什么都不記得。也許你覺得初始輸入、響應(yīng)以及對(duì)響應(yīng)的響應(yīng)看起來像是在記憶，那也只是因?yàn)閷?duì)話日志作為了新的輸入。這是一個(gè)前端編程技巧，使大語言模型看起來像是在進(jìn)行對(duì)話。由于這個(gè)技巧，它可能會(huì)圍繞主題輸出，但不能保證不會(huì)與之前的回應(yīng)相矛盾。此外，可以輸入多少單詞是有限制的(目前ChatGPT允許大約4000個(gè)單詞，而GPT-4允許大約32000個(gè)單詞)。輸入可以相當(dāng)大，所以對(duì)話通常會(huì)在一段時(shí)間內(nèi)保持連貫。最終，累積的日志變得越來越大，不得不把一開始的對(duì)話刪掉，也就是說系統(tǒng)會(huì)"忘記"早期的內(nèi)容。

大語言模型無法自己解決問題或制定計(jì)劃，但可以要求他們制定計(jì)劃并解決問題。這里需要詳細(xì)解釋一下，解決問題(Problem-solving) 和計(jì)劃(planning) 是人工智能研究社區(qū)中某些團(tuán)體的保留術(shù)語，用于表示非常具體的東西。具體來說，意味著有一個(gè)目標(biāo)(想在未來完成的事情)并通過在若干可以接近目標(biāo)的備選方案中做出選擇來努力實(shí)現(xiàn)目標(biāo)。大語言模型沒有目標(biāo)，或者說他們只有一個(gè)目標(biāo)，即在給定輸入序列的情況下，選擇最有可能出現(xiàn)在訓(xùn)練數(shù)據(jù)中的單詞，也就是模式匹配。計(jì)劃通常涉及到前瞻性(look-ahead) ，人們做計(jì)劃時(shí)，會(huì)想象行動(dòng)結(jié)果，并根據(jù)目標(biāo)分析未來。如果看起來離目標(biāo)更近了一步，就是一個(gè)很好的行動(dòng)。如果沒有，可能會(huì)嘗試想象另一種行為的結(jié)果。實(shí)際生活中還有更多東西，但關(guān)鍵是大語言模型沒有目標(biāo)，也沒有前瞻性。Transformer只向后看，自關(guān)注只能應(yīng)用于已經(jīng)出現(xiàn)的輸入詞。現(xiàn)在，大語言模型可以生成看起來像計(jì)劃的輸出，只是因?yàn)樵谟?xùn)練數(shù)據(jù)中看了很多計(jì)劃，知道計(jì)劃是什么樣的，也知道關(guān)于某些主題的計(jì)劃應(yīng)該出現(xiàn)什么，因而對(duì)計(jì)劃可以做出很好的猜測。它們做出計(jì)劃可能會(huì)忽略特定細(xì)節(jié)，而傾向于最一般的計(jì)劃。大語言模型當(dāng)然沒有"考慮各種選擇"，也沒有嘗試一件事，然后又退回去嘗試另一件事。在Transformer內(nèi)部，沒有機(jī)制可以讓它對(duì)未來進(jìn)行這樣的考慮。因此在要求它給出計(jì)劃時(shí)，一定要驗(yàn)證其輸出。

9. 是什么讓ChatGPT如此特別?

"所以我聽說RLHF是ChatGPT真正聰明的地方。"

"ChatGPT使用強(qiáng)化學(xué)習(xí)，所以它這么聰明。"

不一而足……

現(xiàn)在人們對(duì)RLHF(基于人類反饋的強(qiáng)化學(xué)習(xí)，Reinforcement Learning with Human Feedback)感到非常興奮。業(yè)界在訓(xùn)練ChatGPT(以及其他越來越多的大語言模型)方面做了很多事情，這些并非是全新的技術(shù)，但是在ChatGPT發(fā)布時(shí)，這些技術(shù)的廣泛引入產(chǎn)生了很好的效果。

ChatGPT是基于Transformer的大語言模型，因其非常擅長生成對(duì)輸入提示的響應(yīng)以及拒絕回答某些可能被認(rèn)為是有害或固執(zhí)己見的問題而贏得了聲譽(yù)。它所做的與上面介紹的沒有什么不同，事實(shí)上它很普通，但在訓(xùn)練過程中有點(diǎn)不一樣。ChatGPT的訓(xùn)練方式和正常的一樣，從互聯(lián)網(wǎng)上抓取大量信息，提取文本片段，然后讓系統(tǒng)預(yù)測下一個(gè)單詞，這就產(chǎn)生了一個(gè)基本模型，已經(jīng)是非常強(qiáng)大的單詞預(yù)測器(相當(dāng)于GPT-3)，但還有兩個(gè)額外的訓(xùn)練步驟: 指令調(diào)優(yōu)(Instruction tuning) 和基于人類反饋的強(qiáng)化學(xué)習(xí)(reinforcement learning with human feedback) 。

9.1. 指令調(diào)優(yōu)(Instruction Tuning)

大語言模型有個(gè)特別的問題: 它們只接受輸入單詞序列并生成后續(xù)單詞。大多數(shù)時(shí)候，這正是人們想要的，但并非總是如此?？紤]以下輸入提示:

"寫一篇關(guān)于亞歷山大·漢密爾頓的文章。"

你認(rèn)為回答應(yīng)該是什么？可能會(huì)想到:"亞歷山大·漢密爾頓于1757年出生在尼維斯。他是政治家、律師、陸軍上校和美國第一任財(cái)政部長……"但實(shí)際上可能得到:

"你的文章應(yīng)該至少有五頁，雙倍行距，并包括至少兩次引用。"

發(fā)生了什么？嗯，語言模型可能已經(jīng)看到了很多學(xué)生作業(yè)的例子，這些作業(yè)以"寫一篇關(guān)于……的文章"開頭，包括詳細(xì)描述長度和格式的單詞。當(dāng)然，當(dāng)你寫"寫一篇文章……"時(shí)，你認(rèn)為是在給語言模型寫指令，就好像它是一個(gè)能夠理解意圖的人。語言模型不理解你的意圖或者它們自己的意圖，它們只將輸入與訓(xùn)練數(shù)據(jù)中看到的模式相匹配。

為了解決這個(gè)問題，可以做一些叫做指令調(diào)優(yōu)的事情。想法相當(dāng)簡單，如果你得到了錯(cuò)誤響應(yīng)，寫下正確的響應(yīng)應(yīng)該是什么，并將原始輸入和新的、經(jīng)過修正的輸出作為訓(xùn)練數(shù)據(jù)通過神經(jīng)網(wǎng)絡(luò)發(fā)送。有了足夠多的修正輸出的例子，系統(tǒng)將學(xué)會(huì)改變其回路，使新的答案成為首選。

不需要做太花哨的事，只要讓很多人與大語言模型交互，并要求它做很多事情，并在它行為不正確時(shí)糾正，然后收集所有出錯(cuò)的例子和新的、正確的輸出，并進(jìn)行更多的訓(xùn)練。

這使得大語言模型表現(xiàn)得好像能夠理解輸入提示的意圖，并表現(xiàn)得好像它在遵循指令。除了試著猜下一個(gè)單詞，它其實(shí)什么也沒做。但新的訓(xùn)練數(shù)據(jù)讓它能夠更好的猜測對(duì)輸入更匹配的單詞。

9.2. 基于人類反饋的強(qiáng)化學(xué)習(xí)(Reinforcement Learning from Human Feedback)

下一步是從人類反饋中進(jìn)行強(qiáng)化學(xué)習(xí)，這里需要一點(diǎn)解釋。

強(qiáng)化學(xué)習(xí)(Reinforcement learning) 是一種AI技術(shù)，傳統(tǒng)上用于機(jī)器人研究和虛擬游戲模擬(想想可以玩國際象棋、圍棋或星際爭霸的AI系統(tǒng))。強(qiáng)化學(xué)習(xí)特別擅長弄清楚當(dāng)它得到所謂的獎(jiǎng)勵(lì)時(shí)該怎么做。獎(jiǎng)勵(lì)只是一個(gè)數(shù)字，表明它做得有多好(做得非常好+100，做得很差-100)。在現(xiàn)實(shí)世界和游戲中，通常很少會(huì)有獎(jiǎng)勵(lì)。在游戲中，可能需要玩很久才能得分，甚至只會(huì)在游戲的最后一刻得分。在現(xiàn)實(shí)世界中，沒有足夠的人告訴你什么時(shí)候做得很好，除非你是一條狗。你唯一需要知道的是，強(qiáng)化學(xué)習(xí)系統(tǒng)試圖預(yù)測它們將獲得多少獎(jiǎng)勵(lì)，然后選擇最有可能獲得更多獎(jiǎng)勵(lì)的行為，這與人們用狗糧來訓(xùn)練狗的方式并沒有什么不同。

好吧，先不想這些，考慮下面的提示:

"Mark是什么方面的專家?"

假設(shè)語言模型的輸出為:

"Mark在人工智能、圖形學(xué)和人機(jī)交互方面發(fā)表了許多著作。"

這只是部分正確，但我沒有在圖形學(xué)方面發(fā)表過論文，所以很想給它一個(gè)!或者-1分。但這里只有"圖形學(xué)"是錯(cuò)的，如果告訴系統(tǒng)整個(gè)句子都是錯(cuò)的，語言模型可能會(huì)覺得所有這些單詞都應(yīng)該避免使用，但其實(shí)很多詞并沒什么問題。

這就是強(qiáng)化學(xué)習(xí)的用武之地。強(qiáng)化學(xué)習(xí)的工作原理是嘗試不同選擇，看看哪種選擇能獲得最大回報(bào)。假設(shè)我要求它對(duì)原始提示生成三個(gè)不同的響應(yīng)。

"Mark在人工智能、圖形學(xué)和人機(jī)交互方面發(fā)表了許多著作。"

"Mark曾從事人工智能、安全NLP系統(tǒng)和人機(jī)交互方面的工作。"

"Mark研究過人工智能、游戲AI和圖形學(xué)。"

我可以給第一個(gè)相應(yīng)-1，給第二個(gè)+1，給第三個(gè)-1。就像玩游戲一樣，強(qiáng)化學(xué)習(xí)算法可以回顧并找出導(dǎo)致-1的一個(gè)共同因素是"圖形學(xué)"這個(gè)詞。現(xiàn)在，系統(tǒng)可以鎖定這個(gè)單詞，調(diào)整神經(jīng)網(wǎng)絡(luò)，使其不與特定的輸入提示一起出現(xiàn)。

然后讓一群人與大語言模型交互，這一次系統(tǒng)會(huì)給出三種(或更多)可能的回答。我們可以通過要求大語言模型提供多次響應(yīng)并在響應(yīng)的選擇中引入一點(diǎn)隨機(jī)性來做到(還沒忘記吧？)我們有時(shí)可能會(huì)選擇排第二或第三的響應(yīng)，而不是選擇激活可能性的響應(yīng)。這就提供了不同的文本回復(fù)，人們可以選擇最喜歡的回復(fù)，第二喜歡的回復(fù)，等等?，F(xiàn)在有了選擇，有了權(quán)重?cái)?shù)字，就可以用強(qiáng)化學(xué)習(xí)來調(diào)整神經(jīng)網(wǎng)絡(luò)。

實(shí)際上，我們用"好"、"不好"的反饋來訓(xùn)練第二神經(jīng)網(wǎng)絡(luò)來預(yù)測人們的反應(yīng)。如果這個(gè)神經(jīng)網(wǎng)絡(luò)能夠很好的預(yù)測人們會(huì)喜歡什么，那么就可以用第二神經(jīng)網(wǎng)絡(luò)來猜測語言模型的反應(yīng)會(huì)得到"好"還是"不好"，然后用它來訓(xùn)練語言模型。

強(qiáng)化學(xué)習(xí)將文本生成視為游戲，每個(gè)動(dòng)作都是一個(gè)單詞。在序列最后，語言模型被告知是得分了還是丟分了。語言模型并沒有像前一節(jié)中討論的那樣精確的進(jìn)行預(yù)判，但是在某種意義上，它已經(jīng)被訓(xùn)練來預(yù)測哪些單詞會(huì)被點(diǎn)贊。大語言模型還是沒有明確目標(biāo)，但有一個(gè)"被點(diǎn)贊"的隱含目標(biāo)(或者也可以說有一個(gè)"滿足普通人"的隱含目標(biāo))，并且已經(jīng)學(xué)會(huì)將特定提示的特定反應(yīng)與獲得點(diǎn)贊聯(lián)系起來。這具有許多計(jì)劃的特性，但沒有明確的前瞻性機(jī)制，更像是記住了在很多情況下都有效的獲得獎(jiǎng)勵(lì)的策略。

那么RLHF有沒有讓ChatGPT更智能？它使ChatGPT更有可能產(chǎn)生我們希望看到的響應(yīng)，因此看起來更智能，它的輸出似乎傳達(dá)了一種感覺，即能夠理解我們輸入的意圖，并有自己的回應(yīng)意圖。其實(shí)這是一種錯(cuò)覺，因?yàn)樗匀恢皇菍?duì)文字進(jìn)行編碼和解碼。但話說回來，這不就是我們?yōu)樯兑獙戇@篇文章么。

指令調(diào)優(yōu)和RLHF還使ChatGPT能夠抵抗某些類型的濫用，例如產(chǎn)生種族主義、性別歧視或政治內(nèi)容。還是有可能輸出這些內(nèi)容，而且舊版本的GPT-3總是能夠被用來輸出這些東西。然而作為免費(fèi)的面向公眾的服務(wù)，ChatGPT針對(duì)某些類型的濫用所做的工作傳遞了一種安全感，并且它還抵制將意見作為事實(shí)提供，這也消除了對(duì)用戶的潛在傷害。

用強(qiáng)化學(xué)習(xí)來修改預(yù)訓(xùn)練的語言模型并不是什么新鮮事，至少可以追溯到2016年，并已被用于使大語言模型更安全。大多數(shù)基于強(qiáng)化學(xué)習(xí)的大語言模型調(diào)優(yōu)都用第二模型來提供獎(jiǎng)勵(lì)，這也是用ChatGPT完成的。ChatGPT值得注意的是通過強(qiáng)化學(xué)習(xí)調(diào)整系統(tǒng)的規(guī)模，以及大規(guī)模的人類反饋收集工作。

審核編輯：郭婷

閱讀全文

機(jī)器人(220833) 機(jī)器人(220833)

AI(298911) AI(298911)

人工智能(262996) 人工智能(262996)

點(diǎn)贊收藏

掃一掃，分享給好友

復(fù)制鏈接分享

加入交流群

掃碼添加小助手

加入工程師交流群

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

評(píng)論

查看更多

相關(guān)推薦

熱點(diǎn)推薦

一文讀懂智能家居產(chǎn)業(yè)全景
系統(tǒng)的介紹智能家居的文章略顯貧乏，基于此，小編今天就智能家居全局做個(gè)整合、歸納，取其名曰一篇文章讀懂智能家居，以饗讀者。
2016-07-11 13:46:562056
一文詳解知識(shí)增強(qiáng)的語言預(yù)訓(xùn)練模型
隨著預(yù)訓(xùn)練語言模型(PLMs)的不斷發(fā)展，各種NLP任務(wù)設(shè)置上都取得了不俗的性能。盡管PLMs可以從大量語料庫中學(xué)習(xí)一定的知識(shí)，但仍舊存在很多問題，如知識(shí)量有限、受訓(xùn)練數(shù)據(jù)長尾分布影響魯棒性不好等
2022-04-02 17:21:4310696
如何利用Transformers了解視覺語言模型
將模型稱為 “視覺語言” 模型是什么意思？一個(gè)結(jié)合了視覺和語言模態(tài)的模型？但這到底是什么意思呢？
2023-03-03 09:49:371578
一文理解多模態(tài)大語言模型——上
/understanding-multimodal-llms 在過去幾個(gè)月中， OpenVINO? 架構(gòu)師 Yury閱讀了眾多有關(guān)多模態(tài)大語言模型的論文和博客，在此基礎(chǔ)上，推薦了一篇解讀多模態(tài)大語言模型的最佳文章《Understand Multimodal LLMs》--
2024-12-02 18:29:022077
大語言模型背后的Transformer，與CNN和RNN有何不同
? 電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）近年來，隨著大語言模型的不斷出圈，Transformer這一概念也走進(jìn)了大眾視野。Transformer是一種非常流行的深度學(xué)習(xí)模型，最早于2017年由谷歌
2023-12-25 08:36:006285
2023年科技圈熱詞“大語言模型”，與自然語言處理有何關(guān)系
電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）大語言模型（LLM）是基于海量文本數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)模型。它不僅能夠生成自然語言文本，還能夠深入理解文本含義，處理各種自然語言任務(wù)，如文本摘要、問答、翻譯等
2024-01-02 09:28:334637
LLM之外的性價(jià)比之選，小語言模型
? 電子發(fā)燒友網(wǎng)報(bào)道（文/周凱揚(yáng)）大語言模型的風(fēng)靡給AI應(yīng)用創(chuàng)造了不少機(jī)會(huì)，無論是效率還是創(chuàng)意上，大語言模型都帶來了前所未有的表現(xiàn)，這些大語言模型很快成為大型互聯(lián)網(wǎng)公司或者AI應(yīng)用公司的殺手級(jí)產(chǎn)品
2024-06-03 05:15:003342
一文讀懂語言識(shí)別技術(shù)原理1
的孤立詞識(shí)別取得實(shí)質(zhì)性進(jìn)展。到了1980年，語音識(shí)別技術(shù)已經(jīng)從從孤立詞識(shí)別發(fā)展到連續(xù)詞識(shí)別，當(dāng)時(shí)出現(xiàn)了兩項(xiàng)非常重要的技術(shù)：隱馬爾科夫模型（ HMM ）、N-gram語言模型。1990年，大詞匯量連續(xù)詞識(shí)別
2018-06-28 11:27:08
一文讀懂DS18B20溫度傳感器及編程
一文讀懂DS18B20溫度傳感器及編程對(duì)于新手而言,DS18B20基本概念僅做了解,最重要的是利用單片機(jī)對(duì)DS18B20進(jìn)行編程,讀取溫度信息,并把讀取到的溫度信息利用數(shù)碼管,LCD1602或者上位
2021-07-06 07:10:47
一文讀懂中斷方式和輪詢操作有什么區(qū)別嗎
一文讀懂中斷方式和輪詢操作有什么區(qū)別嗎？
2021-12-10 06:00:50
一文讀懂什么是NEC協(xié)議
一文讀懂什么是NEC協(xié)議？
2021-10-15 09:22:14
一文讀懂傳感器的原理與結(jié)構(gòu)
一文讀懂傳感器傳感器在原理與結(jié)構(gòu)上千差萬別，如何根據(jù)具體的測量目的、測量對(duì)象以及測量環(huán)境合理地選用傳感器，是在進(jìn)行某個(gè)量的測量時(shí)首先要解決的問題。當(dāng)傳感器確定之后，與之相配套的測量方法和測量設(shè)備也就
2022-01-13 07:08:26
一文讀懂如何去優(yōu)化AC耦合電容？
一文讀懂如何去優(yōu)化AC耦合電容？
2021-06-08 07:04:12
一文讀懂接口模塊的組合應(yīng)用有哪些？
一文讀懂接口模塊的組合應(yīng)用有哪些？
2021-05-17 07:15:49
一文讀懂電阻和電容的不同
要了解它們的主要參數(shù)。一般情況下，對(duì)電阻器應(yīng)考慮其標(biāo)稱阻值、允許偏差和標(biāo)稱功率；對(duì)電容器則需了解其標(biāo)稱容量、允許偏差和耐壓。一文讀懂電阻和電容的不同　　電阻器和電容器的標(biāo)稱值和允許偏差一般都標(biāo)在電阻體
2017-11-14 10:25:25
一文了解Mojo編程語言
Mojo 是一種由 Modular AI 公司開發(fā)的編程語言，旨在將 Python 的易用性與 C 語言的高性能相結(jié)合，特別適合人工智能（AI）、高性能計(jì)算（HPC）和系統(tǒng)級(jí)編程場景。以下是關(guān)于
2025-11-07 05:59:01
【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 俯瞰全書
上周收到《大語言模型應(yīng)用指南》一書，非常高興，但工作項(xiàng)目繁忙，今天才品鑒體驗(yàn)，感謝作者編寫了一部內(nèi)容豐富、理論應(yīng)用相結(jié)合、印刷精美的著作，也感謝電子發(fā)燒友論壇提供了一個(gè)讓我了解大語言模型和機(jī)器學(xué)習(xí)
2024-07-21 13:35:17
【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)篇
今天開始學(xué)習(xí)《大語言模型應(yīng)用指南》第一篇——基礎(chǔ)篇，對(duì)于人工智能相關(guān)專業(yè)技術(shù)人員應(yīng)該可以輕松加愉快的完成此篇閱讀，但對(duì)于我還是有許多的知識(shí)點(diǎn)、專業(yè)術(shù)語比較陌生，需要網(wǎng)上搜索學(xué)習(xí)更多的資料才能理解書中
2024-07-25 14:33:23
【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識(shí)學(xué)習(xí)
的表達(dá)方式和生成能力。通過預(yù)測文本中缺失的部分或下一個(gè)詞，模型逐漸掌握語言的規(guī)律和特征。常用的模型結(jié)構(gòu) Transformer架構(gòu)：大語言模型通?；赥ransformer架構(gòu)，這是一種能夠處理序列數(shù)據(jù)
2024-08-02 11:03:41
【大語言模型：原理與工程實(shí)踐】大語言模型的基礎(chǔ)技術(shù)
模型架構(gòu)奠定基礎(chǔ)。然后，引介一些經(jīng)典的預(yù)訓(xùn)練模型，如BERT、GPT等。最后，解讀ChatGPT和LLaMA系列模型，幫助讀者初步感知大語言模型。文本主要由詞序列構(gòu)成，詞是自然語言處理的基本單元。文本
2024-05-05 12:17:03
【大語言模型：原理與工程實(shí)踐】大語言模型的應(yīng)用
，它通過抽象思考和邏輯推理，協(xié)助我們應(yīng)對(duì)復(fù)雜的決策。相應(yīng)地，我們設(shè)計(jì)了兩類任務(wù)來檢驗(yàn)大語言模型的能力。一類是感性的、無需理性能力的任務(wù)，類似于人類的系統(tǒng)1，如情感分析和抽取式問答等。大語言模型在這
2024-05-07 17:21:45
【大語言模型：原理與工程實(shí)踐】大語言模型的評(píng)測
計(jì)算和代碼糾錯(cuò)等。這些場景覆蓋日常生活和學(xué)習(xí)的多個(gè)方面，使得對(duì)話能力評(píng)測變得尤為復(fù)雜和關(guān)鍵。為了全面評(píng)估大語言模型在各種應(yīng)用場景下的對(duì)話能力，研究人員和使用者需要一套綜合性的評(píng)測框架。該框架主要包括評(píng)測
2024-05-07 17:12:40
【大語言模型：原理與工程實(shí)踐】大語言模型的預(yù)訓(xùn)練
訓(xùn)練數(shù)據(jù)時(shí)，數(shù)量、質(zhì)量和多樣性三者缺一不可。數(shù)據(jù)的多樣性對(duì)于大語言模型至關(guān)重要，這主要體現(xiàn)在數(shù)據(jù)的類別和來源兩個(gè)方面。豐富的數(shù)據(jù)類別能夠提供多樣的語言表達(dá)特征，如官方知識(shí)型數(shù)據(jù)、口語化表達(dá)的論壇
2024-05-07 17:10:27
【大語言模型：原理與工程實(shí)踐】探索《大語言模型原理與工程實(shí)踐》
《大語言模型》是一本深入探討人工智能領(lǐng)域中語言模型的著作。作者通過對(duì)語言模型的基本概念、基礎(chǔ)技術(shù)、應(yīng)用場景分析，為讀者揭開了這一領(lǐng)域的神秘面紗。本書不僅深入討論了語言模型的理論基礎(chǔ)，還涉及自然語言
2024-04-30 15:35:24
【大語言模型：原理與工程實(shí)踐】探索《大語言模型原理與工程實(shí)踐》2.0
《大語言模型“原理與工程實(shí)踐”》是關(guān)于大語言模型內(nèi)在機(jī)理和應(yīng)用實(shí)踐的一次深入探索。作者不僅深入討論了理論，還提供了豐富的實(shí)踐案例，幫助讀者理解如何將理論知識(shí)應(yīng)用于解決實(shí)際問題。書中的案例分析有助于
2024-05-07 10:30:50
【大語言模型：原理與工程實(shí)踐】揭開大語言模型的面紗
維基百科、網(wǎng)頁內(nèi)容和書籍等，不僅掌握了語言的語法、語義和上下文信息，還能生成結(jié)構(gòu)連貫、語義合理的句子和段落。大語言模型的一個(gè)顯著特點(diǎn)是其龐大的參數(shù)量，已達(dá)數(shù)億甚至數(shù)十億級(jí)別。這種規(guī)模賦予模型強(qiáng)大的表示和學(xué)習(xí)
2024-05-04 23:55:44
【轉(zhuǎn)帖】一文讀懂電阻和電容的不同
的主要參數(shù)。一般情況下，對(duì)電阻器應(yīng)考慮其標(biāo)稱阻值、允許偏差和標(biāo)稱功率；對(duì)電容器則需了解其標(biāo)稱容量、允許偏差和耐壓。一文讀懂電阻和電容的不同電阻器和電容器的標(biāo)稱值和允許偏差一般都標(biāo)在電阻體和電容體上，而在
2017-11-14 15:43:40
大語言模型：原理與工程實(shí)踐+初識(shí)2
的一系列變革。大語言模型是深度學(xué)習(xí)的應(yīng)用之一，可以認(rèn)為，這些模型的目標(biāo)是模擬人類交流，為了理解和生成人類語言。為此，模型需要在大量文本數(shù)據(jù)上訓(xùn)練，用來理解人類語言，進(jìn)而，實(shí)現(xiàn)與人類的無障礙對(duì)話交流
2024-05-13 00:09:37
大語言模型：原理與工程時(shí)間+小白初識(shí)大語言模型
開拓深度學(xué)習(xí)的思路。對(duì)于新涌現(xiàn)的大語言模型的能力，主要是表現(xiàn)在學(xué)習(xí)能力的提升、語言理解和生成能力、創(chuàng)新和探索的能力。基礎(chǔ)技術(shù) 詞表示技術(shù) 詞表示一般分為三種，主要是詞的獨(dú)熱表示（One-hot），詞
2024-05-12 23:57:34
自然語言處理的語言模型
自然語言處理——53 語言模型（數(shù)據(jù)平滑）
2020-04-16 11:11:25
自然語言處理的功能合一文法
自然語言處理——82 功能合一文法(Function Unification Grammar, FUG)
2020-03-25 11:19:20
C語言教程之產(chǎn)生唯一文件
C語言教程之產(chǎn)生唯一文件，很好的C語言資料，快來學(xué)習(xí)吧。
2016-04-25 16:09:480
一文讀懂車載攝像頭產(chǎn)業(yè)鏈
車載攝像頭的快速成長將帶動(dòng)產(chǎn)業(yè)鏈中其他環(huán)節(jié)的直接受益，攝像頭主要組成部分是鏡頭、CMOS傳感器、DSP、模組組裝及其他部件。帶你一文讀懂車載攝像頭產(chǎn)業(yè)鏈~
2017-11-22 15:41:1629
一種新的動(dòng)態(tài)微觀語言競爭社會(huì)仿真模型
語言競爭傳播演化現(xiàn)象是典型的不能假設(shè)、無法進(jìn)行真實(shí)性實(shí)驗(yàn)的社會(huì)科學(xué)問題，而建立在社會(huì)仿真模型基礎(chǔ)上的計(jì)算實(shí)驗(yàn)是可行的方案。利用基于Agent的社會(huì)圈子網(wǎng)絡(luò)理論并引入語言的內(nèi)部詞匯結(jié)構(gòu)給出一種新的動(dòng)態(tài)
2017-11-23 15:41:046
一文讀懂無線充電產(chǎn)業(yè)鏈
一文讀懂無線充電產(chǎn)業(yè)鏈，新用戶關(guān)注【電子發(fā)燒友網(wǎng)】微信公眾號(hào)，輸入“積分”，立送10積分！
2017-12-04 19:13:4246
自然語言處理常用模型解析
自然語言處理常用模型使用方法一、N元模型二、馬爾可夫模型以及隱馬爾可夫模型及目前常用的自然語言處理開源項(xiàng)目/開發(fā)包有哪些？
2017-12-28 15:42:306424
AI終會(huì)讀懂我們?nèi)祟悊?/a>
終有一天AI將能真正讀懂人類的語言、動(dòng)作、情緒等各類因素。屆時(shí)，如何處理好其間可能存在的問題，還需我們提前進(jìn)行思考。
2019-11-04 15:10:09844
一文讀懂NB-IoT 的現(xiàn)狀、挑戰(zhàn)和前景
一文讀懂 NB-IoT 的現(xiàn)狀、挑戰(zhàn)和前景
2020-02-28 15:42:137250
一文讀懂電子羅盤是什么？
一文讀懂電子羅盤是什么？電子羅盤也被稱為數(shù)字羅盤。它是利用地磁場來定北極的一種方法一般普遍較多應(yīng)用到手機(jī)上其實(shí)就是電子指南針。現(xiàn)在電子羅盤一般用磁阻傳感器和磁通門加工而成，雖然GPS在導(dǎo)航、定位
2020-03-17 09:56:458955
一文讀懂高溫厚膜電路
一文讀懂高溫厚膜電路用絲網(wǎng)印刷和燒結(jié)等厚膜工藝在同一基片上制作無源網(wǎng)絡(luò)，并在其上組裝分立的半導(dǎo)體器件芯片或單片集成電路或微型元件，再外加封裝而成的混合集成電路。厚膜混合集成電路是一種微型電子功能
2020-04-18 10:43:442005
一文讀懂高溫厚膜電路
一文讀懂高溫厚膜電路用絲網(wǎng)印刷和燒結(jié)等厚膜工藝在同一基片上制作無源網(wǎng)絡(luò)，并在其上組裝分立的半導(dǎo)體器件芯片或單片集成電路或微型元件，再外加封裝而成的混合集成電路。厚膜混合集成電路是一種微型電子功能
2020-04-16 09:16:491916
一文讀懂ARM微處理器指令系統(tǒng)
一文叫你如何讀懂ARM微處理器指令系統(tǒng)。
2021-03-26 14:30:5853
一文讀懂SRAM和DRAM資料下載
電子發(fā)燒友網(wǎng)為你提供一文讀懂SRAM和DRAM資料下載的電子資料下載，更有其他相關(guān)的電路圖、源代碼、課件教程、中文資料、英文資料、參考設(shè)計(jì)、用戶指南、解決方案等資料，希望可以幫助到廣大的電子工程師們。
2021-04-15 08:40:1417
一文讀懂攝像頭接口對(duì)ADAS系統(tǒng)的重要意義資料下載
電子發(fā)燒友網(wǎng)為你提供一文讀懂攝像頭接口對(duì)ADAS系統(tǒng)的重要意義資料下載的電子資料下載，更有其他相關(guān)的電路圖、源代碼、課件教程、中文資料、英文資料、參考設(shè)計(jì)、用戶指南、解決方案等資料，希望可以幫助到廣大的電子工程師們。
2021-04-17 08:42:2913
一文讀懂，電容如何識(shí)別資料下載
電子發(fā)燒友網(wǎng)為你提供一文讀懂，電容如何識(shí)別資料下載的電子資料下載，更有其他相關(guān)的電路圖、源代碼、課件教程、中文資料、英文資料、參考設(shè)計(jì)、用戶指南、解決方案等資料，希望可以幫助到廣大的電子工程師們。
2021-04-17 08:47:083
一文讀懂：LoRa模塊使用原理資料下載
電子發(fā)燒友網(wǎng)為你提供一文讀懂：LoRa模塊使用原理資料下載的電子資料下載，更有其他相關(guān)的電路圖、源代碼、課件教程、中文資料、英文資料、參考設(shè)計(jì)、用戶指南、解決方案等資料，希望可以幫助到廣大的電子工程師們。
2021-04-18 08:49:1512
一文帶你讀懂耦合與退耦，上拉與下拉資料下載
電子發(fā)燒友網(wǎng)為你提供一文帶你讀懂耦合與退耦，上拉與下拉資料下載的電子資料下載，更有其他相關(guān)的電路圖、源代碼、課件教程、中文資料、英文資料、參考設(shè)計(jì)、用戶指南、解決方案等資料，希望可以幫助到廣大的電子工程師們。
2021-04-21 08:50:4623
一文讀懂充電寶usb接口電路及制作原理詳細(xì)資料下載
電子發(fā)燒友網(wǎng)為你提供一文讀懂充電寶usb接口電路及制作原理詳細(xì)資料下載的電子資料下載，更有其他相關(guān)的電路圖、源代碼、課件教程、中文資料、英文資料、參考設(shè)計(jì)、用戶指南、解決方案等資料，希望可以幫助到廣大的電子工程師們。
2021-04-26 08:42:1822
一文讀懂MCU的特點(diǎn)、功能及如何編寫
一文讀懂MCU的特點(diǎn)、功能及如何編寫
2021-12-05 09:51:0524
Multilingual多語言預(yù)訓(xùn)練語言模型的套路
Facebook在Crosslingual language model pretraining（NIPS 2019）一文中提出XLM預(yù)訓(xùn)練多語言模型，整體思路基于BERT，并提出了針對(duì)多語言預(yù)訓(xùn)練的3個(gè)優(yōu)化任務(wù)。后續(xù)很多多語言預(yù)訓(xùn)練工作都建立在XLM的基礎(chǔ)上，我們來詳細(xì)看看XLM的整體訓(xùn)練過程。
2022-05-05 15:23:493893
一種基于亂序語言模型的預(yù)訓(xùn)練模型-PERT
由于亂序語言模型不使用[MASK]標(biāo)記，減輕了預(yù)訓(xùn)練任務(wù)與微調(diào)任務(wù)之間的gap，并由于預(yù)測空間大小為輸入序列長度，使得計(jì)算效率高于掩碼語言模型。PERT模型結(jié)構(gòu)與BERT模型一致，因此在下游預(yù)訓(xùn)練時(shí)，不需要修改原始BERT模型的任何代碼與腳本。
2022-05-10 15:01:272169
一文讀懂汽輪機(jī)轉(zhuǎn)子軸油封磨損修復(fù)的方法
一文讀懂，汽輪機(jī)轉(zhuǎn)子軸油封磨損修復(fù)的方法
2022-06-24 15:42:231
建立計(jì)算模型來預(yù)測一個(gè)給定博文的抱怨強(qiáng)度
在計(jì)算語言學(xué)中，先前的研究主要集中在建立自動(dòng)分類模型來識(shí)別抱怨是否存在。Jin提供了一個(gè)數(shù)據(jù)集，基于語用學(xué)注釋了不同嚴(yán)重程度的抱怨博文
2022-11-08 09:54:571089
一文讀懂何為深度學(xué)習(xí)1
自然語言處理領(lǐng)域的殿堂標(biāo)志 BERT 并非橫空出世，背后有它的發(fā)展原理。今天，螞蟻金服財(cái)富對(duì)話算法團(tuán)隊(duì)整理對(duì)比了深度學(xué)習(xí)模型在自然語言處理領(lǐng)域的發(fā)展歷程。從簡易的神經(jīng)元到當(dāng)前最復(fù)雜的BERT模型
2023-02-22 09:54:49870
一文讀懂何為深度學(xué)習(xí)2
自然語言處理領(lǐng)域的殿堂標(biāo)志 BERT 并非橫空出世，背后有它的發(fā)展原理。今天，螞蟻金服財(cái)富對(duì)話算法團(tuán)隊(duì)整理對(duì)比了深度學(xué)習(xí)模型在自然語言處理領(lǐng)域的發(fā)展歷程。從簡易的神經(jīng)元到當(dāng)前最復(fù)雜的BERT模型
2023-02-22 09:54:59687
一文讀懂何為深度學(xué)習(xí)3
自然語言處理領(lǐng)域的殿堂標(biāo)志 BERT 并非橫空出世，背后有它的發(fā)展原理。今天，螞蟻金服財(cái)富對(duì)話算法團(tuán)隊(duì)整理對(duì)比了深度學(xué)習(xí)模型在自然語言處理領(lǐng)域的發(fā)展歷程。從簡易的神經(jīng)元到當(dāng)前最復(fù)雜的BERT模型
2023-02-22 09:55:10719
大型語言模型有哪些用途？
大型語言模型能識(shí)別、總結(jié)、翻譯、預(yù)測和生成文本及其他內(nèi)容。 AI 應(yīng)用在大型語言模型的幫助下，可用于解決總結(jié)文章、編寫故事和參與長對(duì)話等多種繁重工作。大型語言模型（LLM）是一種深度學(xué)習(xí)算法，可以
2023-02-23 19:50:046084
百度文心一言背后的大模型實(shí)力如何？文心一言背后的它全面領(lǐng)先
文心一言背后的大模型實(shí)力如何？能否支撐起文心一言的應(yīng)用？ ? ? 近日，國際權(quán)威咨詢機(jī)構(gòu)IDC發(fā)布《2022中國大模型發(fā)展白皮書》，提出了行業(yè)首個(gè)大模型評(píng)估框架。 ? ? 根據(jù)評(píng)估結(jié)果，百度旗下
2023-03-04 14:26:043243
大型語言模型有哪些用途？大型語言模型如何運(yùn)作呢？
大型語言模型能識(shí)別、總結(jié)、翻譯、預(yù)測和生成文本及其他內(nèi)容。
2023-03-08 13:57:009399
對(duì)標(biāo) ChatGPT，百度正式推出大語言模型“文心一言”?。蝗彰剑号c中國“脫鉤”蔓延至軟件開發(fā)
熱點(diǎn)新聞 1、對(duì)標(biāo)?ChatGPT，百度正式推出大語言模型“文心一言” 百度今（16）日下午于北京總部召開新聞發(fā)布會(huì)。發(fā)布會(huì)上，百度正式推出大語言模型文心一言，并展示了文心一言在多個(gè)使用場景中的綜合
2023-03-17 04:40:011414
PyTorch教程-9.3. 語言模型
的語言模型將能夠自行生成自然文本，只需一次繪制一個(gè)標(biāo)記即可 xt～P(xt∣xt?1,…,x1). 與使用打字機(jī)的猴子完全不同，從這種模型中出現(xiàn)的所有文本都將作為自然語言傳遞，例如英文文本。此外，只需在先前的對(duì)話片段上調(diào)節(jié)文
2023-06-05 15:44:24767
一文讀懂方殼電池倉段差缺陷檢測
一文讀懂方殼電池倉段差缺陷檢測
2023-01-12 15:46:341799
一文讀懂紅外傳感器
一文讀懂紅外傳感器紅外傳感器是利用紅外熱成像技術(shù)感知并測量物體表面溫度分布的傳感器。它能夠?qū)⑽矬w表面發(fā)出的紅外輻射轉(zhuǎn)化為電信號(hào)，通過分析這些電信號(hào)的強(qiáng)度和分布來生成對(duì)應(yīng)的溫度圖像。
2023-04-07 15:21:103189
大型語言模型的應(yīng)用
?? 大型語言模型（LLM）是一種深度學(xué)習(xí)算法，可以通過大規(guī)模數(shù)據(jù)集訓(xùn)練來學(xué)習(xí)識(shí)別、總結(jié)、翻譯、預(yù)測和生成文本及其他內(nèi)容。大語言模型（LLM）代表著 AI 領(lǐng)域的重大進(jìn)步，并有望通過習(xí)得的知識(shí)改變
2023-07-05 10:27:352808
語言模型的發(fā)展歷程基于神經(jīng)網(wǎng)絡(luò)的語言模型解析
簡單來說，語言模型能夠以某種方式生成文本。它的應(yīng)用十分廣泛，例如，可以用語言模型進(jìn)行情感分析、標(biāo)記有害內(nèi)容、回答問題、概述文檔等等。但理論上，語言模型的潛力遠(yuǎn)超以上常見任務(wù)。
2023-07-14 11:45:401398
文心一言是什么？文心一言有哪些功能？
文心一言 *（英文名：ERNIE Bot）* 是百度全新一代知識(shí)增強(qiáng)大語言模型，文心大模型家族的新成員，能夠與人對(duì)話互動(dòng)，回答問題，協(xié)助創(chuàng)作，高效便捷地幫助人們獲取信息、知識(shí)和靈感。
2023-08-31 10:02:21598525
騰訊發(fā)布混元大語言模型
騰訊發(fā)布混元大語言模型騰訊全球數(shù)字生態(tài)大會(huì)上騰訊正式發(fā)布了混元大語言模型，參數(shù)規(guī)模超千億，預(yù)訓(xùn)練語料超2萬億tokens。作為騰訊自研的通用大語言模型，混元大語言模型具有中文創(chuàng)作能力、任務(wù)執(zhí)行
2023-09-07 10:23:541586
一文讀懂NTN衛(wèi)星通信
NTN衛(wèi)星通信是什么，為何在當(dāng)下成為熱點(diǎn)，它可以解決什么問題，芯訊通有推出與之對(duì)應(yīng)的產(chǎn)品嗎？一文帶你讀懂 NT N！什么是NTN衛(wèi)星通信？ NTN（ Non-Terrestrial
2023-11-09 19:15:023409
一文讀懂，什么是BLE？
一文讀懂，什么是BLE？
2023-11-27 17:11:144398
一文讀懂車規(guī)級(jí)AEC-Q認(rèn)證
一文讀懂車規(guī)級(jí)AEC-Q認(rèn)證
2023-12-04 16:45:101821
一文讀懂微力扭轉(zhuǎn)試驗(yàn)機(jī)的優(yōu)勢
一文讀懂微力扭轉(zhuǎn)試驗(yàn)機(jī)的優(yōu)勢
2023-11-30 09:08:111148
大語言模型簡介：基于大語言模型模型全家桶Amazon Bedrock
本文基于亞馬遜云科技推出的大語言模型與生成式AI的全家桶：Bedrock對(duì)大語言模型進(jìn)行介紹。大語言模型指的是具有數(shù)十億參數(shù)（B+）的預(yù)訓(xùn)練語言模型（例如：GPT-3, Bloom, LLaMA)。這種模型可以用于各種自然語言處理任務(wù)，如文本生成、機(jī)器翻譯和自然語言理解等。
2023-12-04 15:51:461470
大語言模型概述
在科技飛速發(fā)展的當(dāng)今時(shí)代，人工智能技術(shù)成為社會(huì)進(jìn)步的關(guān)鍵推動(dòng)力之一。在廣泛關(guān)注的人工智能領(lǐng)域中，大語言模型以其引人注目的特性備受矚目。大語言模型的定義及發(fā)展歷史大語言模型是一類基于深度學(xué)習(xí)技術(shù)
2023-12-21 17:53:593103
大語言模型使用指南
在信息爆炸的時(shí)代，我們渴望更智能、更高效的語言處理工具。GPT-3.5等大語言模型的崛起為我們提供了前所未有的機(jī)會(huì)。這不僅是技術(shù)的進(jìn)步，更是人與機(jī)器共舞的一幕。本篇文章將帶你走進(jìn)這個(gè)奇妙的語言王國
2023-12-29 14:18:591167
一文讀懂寬帶、帶寬、網(wǎng)速之間的區(qū)別與關(guān)系
一文讀懂寬帶、帶寬、網(wǎng)速之間的區(qū)別與關(guān)系? 寬帶、帶寬和網(wǎng)速是在網(wǎng)絡(luò)領(lǐng)域中經(jīng)常使用的術(shù)語，它們之間有一定的區(qū)別和關(guān)系。在深入理解寬帶、帶寬和網(wǎng)速之間的關(guān)系之前，讓我們先了解一下它們的定義。寬帶
2024-01-31 09:11:3011732
大語言模型中的語言與知識(shí)：一種神秘的分離現(xiàn)象
自然語言處理領(lǐng)域存在著一個(gè)非常有趣的現(xiàn)象：在多語言模型中，不同的語言之間似乎存在著一種隱含的對(duì)齊關(guān)系。
2024-02-20 14:53:061236
ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您？
]?就以“ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您”這樣的主題，開展了一次深度的大語言模型的測評(píng)。開放夜現(xiàn)場測評(píng)了十幾個(gè)國內(nèi)外大語言模型，測評(píng)角度從邏輯、數(shù)學(xué)、翻譯、倫理等方面，深入探討和體驗(yàn)了這些大語言模型的實(shí)際效能。測評(píng)的大語言模型：
2024-05-14 17:35:541440
大語言模型(LLM)快速理解
自2022年，ChatGPT發(fā)布之后，大語言模型（LargeLanguageModel），簡稱LLM掀起了一波狂潮。作為學(xué)習(xí)理解LLM的開始，先來整體理解一下大語言模型。一、發(fā)展歷史大語言模型的發(fā)展
2024-06-04 08:27:472712
如何加速大語言模型推理
隨著人工智能技術(shù)的飛速發(fā)展，大語言模型（LLM）已成為自然語言處理領(lǐng)域的核心工具，廣泛應(yīng)用于智能客服、文本生成、機(jī)器翻譯等多個(gè)場景。然而，大語言模型的高計(jì)算復(fù)雜度和資源消耗成為其在實(shí)際應(yīng)用中面臨
2024-07-04 17:32:041976
大語言模型的預(yù)訓(xùn)練
隨著人工智能技術(shù)的飛速發(fā)展，自然語言處理（NLP）作為人工智能領(lǐng)域的一個(gè)重要分支，取得了顯著的進(jìn)步。其中，大語言模型（Large Language Model, LLM）憑借其強(qiáng)大的語言理解和生成
2024-07-11 10:11:521581
一文讀懂新能源汽車的功能安全
電子發(fā)燒友網(wǎng)站提供《一文讀懂新能源汽車的功能安全.pdf》資料免費(fèi)下載
2024-09-04 09:22:244
一文讀懂MSA(測量系統(tǒng)分析)
一文讀懂MSA(測量系統(tǒng)分析)
2024-11-01 11:08:072117
大語言模型如何開發(fā)
大語言模型的開發(fā)是一個(gè)復(fù)雜且細(xì)致的過程，涵蓋了數(shù)據(jù)準(zhǔn)備、模型架構(gòu)設(shè)計(jì)、訓(xùn)練、微調(diào)和部署等多個(gè)階段。以下是對(duì)大語言模型開發(fā)步驟的介紹，由AI部落小編整理發(fā)布。
2024-11-04 10:14:43955
一文讀懂單燈控制器工作原理
一文讀懂單燈控制器工作原理
2024-11-11 13:13:102198
云端語言模型開發(fā)方法
云端語言模型的開發(fā)是一個(gè)復(fù)雜而系統(tǒng)的過程，涉及數(shù)據(jù)準(zhǔn)備、模型選擇、訓(xùn)練優(yōu)化、部署應(yīng)用等多個(gè)環(huán)節(jié)。下面，AI部落小編為您分享云端語言模型的開發(fā)方法。
2024-12-02 10:48:50964
一文理解多模態(tài)大語言模型——下
/understanding-multimodal-llms ? 《一文理解多模態(tài)大語言模型 - 上》介紹了什么是多模態(tài)大語言模型，以及構(gòu)建多模態(tài) LLM 有兩種主要方式之一：統(tǒng)一嵌入解碼器架構(gòu)(Unified Embedding Decoder Architecture)。本
2024-12-03 15:18:041110
大語言模型開發(fā)語言是什么
在人工智能領(lǐng)域，大語言模型（Large Language Models, LLMs）背后，離不開高效的開發(fā)語言和工具的支持。下面，AI部落小編為您介紹大語言模型開發(fā)所依賴的主要編程語言。
2024-12-04 11:44:411150
大語言模型開發(fā)框架是什么
大語言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語言模型的軟件工具和庫。下面，AI部落小編為您介紹大語言模型開發(fā)框架。
2024-12-06 10:28:43926
AI大語言模型開發(fā)步驟
開發(fā)一個(gè)高效、準(zhǔn)確的大語言模型是一個(gè)復(fù)雜且多階段的過程，涉及數(shù)據(jù)收集與預(yù)處理、模型架構(gòu)設(shè)計(jì)、訓(xùn)練與優(yōu)化、評(píng)估與調(diào)試等多個(gè)環(huán)節(jié)。接下來，AI部落小編為大家詳細(xì)闡述AI大語言模型的開發(fā)步驟。
2024-12-19 11:29:221321
一文說清楚什么是AI大模型
目前，大模型（特別是在2023年及之后的語境中）通常特指大語言模型（LLM, Large Language Model），但其范圍也涵蓋其他領(lǐng)域的超大規(guī)模深度學(xué)習(xí)模型，例如圖像生成模型（如
2025-01-02 09:53:514224
語言模型管理的作用
要充分發(fā)揮語言模型的潛力，有效的語言模型管理非常重要。以下，是對(duì)語言模型管理作用的分析，由AI部落小編整理。
2025-01-02 11:06:37618
一文讀懂：LED 驅(qū)動(dòng)電路二極管挑選要點(diǎn)
一文讀懂：LED 驅(qū)動(dòng)電路二極管挑選要點(diǎn)
2025-02-06 14:47:071213
一文讀懂什么是「雷電4」
Thunderbolt一文讀懂什么是「雷電4」目前大部分PC接口配備了USB接口、音頻接口、HDMI接口等，這些接口的功能基本覆蓋了用戶的日常使用需求。為了提供更高速、更便捷的數(shù)據(jù)傳輸和設(shè)備連接體
2025-02-05 17:52:586926
一文詳解視覺語言模型
視覺語言模型（VLM）是一種多模態(tài)、生成式 AI 模型，能夠理解和處理視頻、圖像和文本。
2025-02-12 11:13:183479
一文讀懂大模型常見的10個(gè)核心概念
這些常見的專業(yè)術(shù)語，你又了解多少？這篇文章將幫助你快速掌握AI行業(yè)常見的核心概念。1、大模型型號(hào)每個(gè)大模型都有其獨(dú)特的設(shè)計(jì)和功能，有些大模型可能在語言理解方面表現(xiàn)出
2025-09-22 17:02:381173

已全部加載完成

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

一文讀懂大語言模型

評(píng)論