精品精品自拍视视频大全,3D动漫A片区,欧美激情视频在线观看h

編者按：Feedly聯(lián)合創(chuàng)始人、大數(shù)據(jù)與機(jī)器學(xué)習(xí)主管Kireet Reddy講解了LogSumExp原理。

機(jī)器學(xué)習(xí)中有很多巧妙的竅門，可以加速訓(xùn)練，提升表現(xiàn)……今天我將討論LogSumExp這一機(jī)器學(xué)習(xí)中常見的模式。首先給出定義：

我們什么時(shí)候會(huì)見到這樣的式子？常見的一個(gè)地方是計(jì)算softmax函數(shù)的交叉熵?fù)p失。如果這聽起來冗長難解，那么：1) 習(xí)慣一下，ML中太多東西有著瘋狂的名字；2) 直接意識(shí)到這沒什么復(fù)雜的。有必要的話可以看看斯坦福cs231n的出色講解，或者，就本文而言，只需了解softmax是這樣一個(gè)函數(shù)就可以：

其中，分子中的xj是分母中的一個(gè)值（其中一個(gè)xi）。所以softmax做的基本上是對(duì)一些值取冪，然后歸一化，使得所有xj的可能值總和為1，以生成所需的概率分布。

所以，你可以把softmax函數(shù)看成一種接受任何數(shù)字并轉(zhuǎn)換為概率分布的非線性方法。至于交叉熵，只需了解它是對(duì)函數(shù)取對(duì)數(shù)。這就涌現(xiàn)出了LogSumExp模式：

為什么這是一種生成概率分布的好方法，也許看起來有點(diǎn)神秘。目前而言，不妨把這當(dāng)成是信條。

數(shù)值穩(wěn)定性

我們還是接著談?wù)凩ogSumExp吧。首先，從純數(shù)學(xué)的角度來說，LogSumExp沒什么特別的。但是，當(dāng)我們討論計(jì)算機(jī)上的數(shù)學(xué)時(shí)，LogSumExp就特別起來了。原因在于計(jì)算機(jī)表示數(shù)字的方式。計(jì)算機(jī)使用固定數(shù)目的位元表示數(shù)字。幾乎所有時(shí)刻這都沒什么問題，但是，因?yàn)椴豢赡苡霉潭〝?shù)目的位元精確表示數(shù)字的無限集合，所以有時(shí)這會(huì)導(dǎo)致誤差。

讓我們舉例演示這個(gè)問題，從xi中取樣兩個(gè)樣本：{1000, 1000, 1000}和{-1000, -1000, -1000}。將這兩個(gè)序列傳入softmax函數(shù)會(huì)得到同一概率分布{1/3, 1/3, 1/3}，然后1/3的對(duì)數(shù)是一個(gè)合理的負(fù)數(shù)?，F(xiàn)在讓我們嘗試用Python算下求和中的一項(xiàng)：

>>> import math

>>> math.e**1000

Traceback (most recent call last):

File "", line 1, in

OverflowError: (34, 'Result too large')

哎喲。也許-1000的運(yùn)氣要好些：

>>> math.e**-1000

0.0

也不對(duì)勁。所以我們碰到了某種數(shù)值穩(wěn)定性問題，即使看起來合理的輸入值也會(huì)導(dǎo)致溢出。

迂回方案

幸運(yùn)的是，人們找到了一個(gè)很好的緩解方法，根據(jù)冪的乘法法則：

以及對(duì)數(shù)的和差公式：

我們有：

上述變換的關(guān)鍵在于，我們引入了一個(gè)不牽涉log或exp函數(shù)的常數(shù)項(xiàng)c。現(xiàn)在我們只需為c選擇一個(gè)在所有情形下有效的良好的值。結(jié)果發(fā)現(xiàn)，max(x1…xn)很不錯(cuò)。

由此我們可以構(gòu)建對(duì)數(shù)softmax的新表達(dá)式：

現(xiàn)在我們用這個(gè)新表達(dá)式計(jì)算之前的兩個(gè)樣本。對(duì){1000, 1000, 1000}而言，c = 1000，所以xi-c恒為零，代入上式，我們有：

log(3)是一個(gè)很合理的數(shù)字，計(jì)算機(jī)計(jì)算起來毫無問題。所以上面的樣本沒問題。同理，{-1000, -1000, -1000}也沒問題。

關(guān)鍵點(diǎn)

思考一些例子后，我們可以得到以下結(jié)論：

如果xi的值都不會(huì)造成穩(wěn)定性問題，那么“樸素”版本的LogSumExp可以很好地工作。但“改良”版同樣可以工作。

如果至少有一個(gè)xi的值很大，那么樸素版本會(huì)溢出，改良版不會(huì)。其他類似的大數(shù)值xi同理，而并不大的那些xi，基本上逼近零。

對(duì)于絕對(duì)值較大的負(fù)數(shù)，翻轉(zhuǎn)下符號(hào)，道理是一樣的。

所以，盡管并不完美，我們?cè)诖蠖鄶?shù)情況下能夠得到相當(dāng)合理的表現(xiàn)，而不會(huì)溢出。我創(chuàng)建了一個(gè)簡單的python腳本，這樣，你可以通過親自試驗(yàn)驗(yàn)證這一點(diǎn)：git.io/fx5Vx

LogSumExp是一個(gè)巧妙的竅門，分解了它的機(jī)制后，實(shí)際上相當(dāng)容易理解。一旦了解了LogSumExp和數(shù)值穩(wěn)定性問題，你就不會(huì)感到一些庫的文檔和源代碼難以理解了。

為了鞏固記憶（同時(shí)操練下數(shù)學(xué)），我建議你過一段時(shí)間嘗試自行推導(dǎo)下數(shù)學(xué)，并在腦海中設(shè)想各種例子，做下推理。接著運(yùn)行我的代碼（或者自己動(dòng)手重寫），以驗(yàn)證你的直覺。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

函數(shù)

函數(shù)

+關(guān)注

關(guān)注
3

文章
4417

瀏覽量
67568
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8555

瀏覽量
137000

原文標(biāo)題：機(jī)器學(xué)習(xí)常見模式LogSumExp解密

文章出處：【微信號(hào)：jqr_AI，微信公眾號(hào)：論智】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

LogSumExp這一機(jī)器學(xué)習(xí)中常見的模式

評(píng)論