chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

100行Python代碼 輕松搞定神經(jīng)網(wǎng)絡

電子工程師 ? 來源:fqj ? 2019-05-05 08:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

tensorflow,pytorch這類深度學習庫來寫一個神經(jīng)網(wǎng)絡早就不稀奇了。

可是,你知道怎么用python和numpy來優(yōu)雅地搭一個神經(jīng)網(wǎng)絡嘛?

現(xiàn)如今,有多種深度學習框架可供選擇,他們帶有自動微分、基于圖的優(yōu)化計算和硬件加速等各種重要特性。對人們而言,似乎享受這些重要特性帶來的便利已經(jīng)是理所當然的事兒了。但其實,瞧一瞧隱藏在這些特性下的東西,能更好的幫助你理解這些網(wǎng)絡究竟是如何工作的。

所以今天,文摘菌就來手把手教大家搭一個神經(jīng)網(wǎng)絡。原料就是簡單的python和numpy代碼!

符號說明

在計算反向傳播時, 我們可以選擇使用函數(shù)符號、變量符號去記錄求導過程。它們分別對應了計算圖中的邊和節(jié)點來表示它們。

給定R^n→R和x∈R^n, 那么梯度是由偏導?f/?j(x)組成的n維行向量

如果f:R^n→R^m和x∈R^n,那么Jacobian矩陣是下列函數(shù)組成的一個m×n的矩陣。

100行Python代碼 輕松搞定神經(jīng)網(wǎng)絡

對于給定的函數(shù)f和向量a和b如果a=f(b)那么我們用?a/?b表示Jacobian矩陣,當a是實數(shù)時則表示梯度

鏈式法則

給定三個分屬于不同向量空間的向量a∈A及c∈C和兩個可微函數(shù)f:A→B及g:B→C使得f(a)=b和g(b)=c,我們能得到復合函數(shù)的Jacobian矩陣是函數(shù)f和g的jacobian矩陣的乘積:

100行Python代碼 輕松搞定神經(jīng)網(wǎng)絡

這就是大名鼎鼎的鏈式法則。提出于上世紀60、70年代的反向傳播算法就是應用了鏈式法則來計算一個實函數(shù)相對于其不同參數(shù)的梯度的。

要知道我們的最終目標是通過沿著梯度的相反方向來逐步找到函數(shù)的最小值 (當然最好是全局最小值), 因為至少在局部來說, 這樣做將使得函數(shù)值逐步下降。當我們有兩個參數(shù)需要優(yōu)化時, 整個過程如圖所示:

100行Python代碼 輕松搞定神經(jīng)網(wǎng)絡

反向模式求導

假設函數(shù)fi(ai)=ai+1由多于兩個函數(shù)復合而成,我們可以反復應用公式求導并得到:

100行Python代碼 輕松搞定神經(jīng)網(wǎng)絡

可以有很多種方式計算這個乘積,最常見的是從左向右或從右向左。

如果an是一個標量,那么在計算整個梯度的時候我們可以通過先計算?an/?an-1并逐步右乘所有的Jacobian矩陣?ai/?ai-1來得到。這個操作有時被稱作VJP或向量-Jacobian乘積(Vector-Jacobian Product)。

又因為整個過程中我們是從計算?an/?an-1開始逐步計算?an/?an-2,?an/?an-3等梯度到最后,并保存中間值,所以這個過程被稱為反向模式求導。最終,我們可以計算出an相對于所有其他變量的梯度。

100行Python代碼 輕松搞定神經(jīng)網(wǎng)絡

相對而言,前向模式的過程正相反。它從計算Jacobian矩陣如?a2/?a1開始,并左乘?a3/?a2來計算?a3/?a1。如果我們繼續(xù)乘上?ai/?ai-1并保存中間值,最終我們可以得到所有變量相對于?a2/?a1的梯度。當?a2/?a1是標量時,所有乘積都是列向量,這被稱為Jacobian向量乘積(或者JVP,Jacobian-Vector Product)。

100行Python代碼 輕松搞定神經(jīng)網(wǎng)絡

你大概已經(jīng)猜到了,對于反向傳播來說,我們更偏向應用反向模式——因為我們想要逐步得到損失函數(shù)對于每層參數(shù)的梯度。正向模式雖然也可以計算需要的梯度, 但因為重復計算太多而效率很低。

計算梯度的過程看起來像是有很多高維矩陣相乘, 但實際上,Jacobian矩陣常常是稀疏、塊或者對角矩陣,又因為我們只關心將其右乘行向量的結果,所以就不需要耗費太多計算和存儲資源。

在本文中, 我們的方法主要用于按順序逐層搭建的神經(jīng)網(wǎng)絡, 但同樣的方法也適用于計算梯度的其他算法或計算圖。

深度神經(jīng)網(wǎng)絡

在典型的監(jiān)督機器學習算法中, 我們通常用到一個很復雜函數(shù),它的輸入是存有標簽樣本數(shù)值特征的張量。此外,還有很多用于描述模型的權重張量。

損失函數(shù)是關于樣本和權重的標量函數(shù), 它是衡量模型輸出與預期標簽的差距的指標。我們的目標是找到最合適的權重讓損失最小。在深度學習中, 損失函數(shù)被表示為一串易于求導的簡單函數(shù)的復合。所有這些簡單函數(shù)(除了最后一個函數(shù)),都是我們指的層, 而每一層通常有兩組參數(shù): 輸入 (可以是上一層的輸出) 和權重。

而最后一個函數(shù)代表了損失度量, 它也有兩組參數(shù): 模型輸出y和真實標簽y^。例如, 如果損失度量l為平方誤差, 則?l/?y為 2 avg(y-y^)。損失度量的梯度將是應用反向模式求導的起始行向量。

Autograd

自動求導背后的思想已是相當成熟了。它可以在運行時或編譯過程中完成,但如何實現(xiàn)會對性能產(chǎn)生巨大影響。我建議你能認真閱讀 HIPS autograd的 Python 實現(xiàn),來真正了解autograd。

核心想法其實始終未變。從我們在學校學習如何求導時, 就應該知道這一點了。如果我們能夠追蹤最終求出標量輸出的計算, 并且我們知道如何對簡單操作求導 (例如加法、乘法、冪、指數(shù)、對數(shù)等等), 我們就可以算出輸出的梯度。

假設我們有一個線性的中間層f,由矩陣乘法表示(暫時不考慮偏置):

100行Python代碼 輕松搞定神經(jīng)網(wǎng)絡

為了用梯度下降法調(diào)整w值,我們需要計算梯度?l/?w。這里我們可以觀察到,改變y從而影響l是一個關鍵。

每一層都必須滿足下面這個條件: 如果給出了損失函數(shù)相對于這一層輸出的梯度, 就可以得到損失函數(shù)相對于這一層輸入(即上一層的輸出)的梯度。

現(xiàn)在應用兩次鏈式法則得到損失函數(shù)相對于w的梯度:

100行Python代碼 輕松搞定神經(jīng)網(wǎng)絡

相對于x的是:

100行Python代碼 輕松搞定神經(jīng)網(wǎng)絡

因此, 我們既可以后向傳遞一個梯度, 使上一層得到更新并更新層間權重, 以優(yōu)化損失, 這就行啦!

動手實踐

先來看看代碼, 或者直接試試Colab Notebook

我們從封裝了一個張量及其梯度的類(class)開始。

現(xiàn)在我們可以創(chuàng)建一個layer類,關鍵的想法是,在前向傳播時,我們返回這一層的輸出和可以接受輸出梯度和輸入梯度的函數(shù),并在過程中更新權重梯度。

然后, 訓練過程將有三個步驟, 計算前向傳遞, 然后后向傳遞, 最后更新權重。這里關鍵的一點是把更新權重放在最后, 因為權重可以在多個層中重用,我們更希望在需要的時候再更新它。

class Layer: def __init__(self): self.parameters = [] def forward(self, X): """ Override me! A simple no-op layer, it passes forward the inputs """ return X, lambda D: D def build_param(self, tensor): """ Creates a parameter from a tensor, and saves a reference for the update step """ param = Parameter(tensor) self.parameters.append(param) return param def update(self, optimizer): for param in self.parameters: optimizer.update(param)

標準的做法是將更新參數(shù)的工作交給優(yōu)化器, 優(yōu)化器在每一批(batch)后都會接收參數(shù)的實例。最簡單和最廣為人知的優(yōu)化方法是mini-batch隨機梯度下降。

class SGDOptimizer(): def __init__(self, lr=0.1): self.lr = lr def update(self, param): param.tensor -= self.lr * param.gradient param.gradient.fill(0)

在此框架下, 并使用前面計算的結果后, 線性層如下所示:

class Linear(Layer): def __init__(self, inputs, outputs): super().__init__() tensor = np.random.randn(inputs, outputs) * np.sqrt(1 / inputs) self.weights = self.build_param(tensor) self.bias = self.build_param(np.zeros(outputs)) def forward(self, X): def backward(D): self.weights.gradient += X.T @ D self.bias.gradient += D.sum(axis=0) return D @ self.weights.tensor.T return X @ self.weights.tensor + self.bias.tensor, backward

接下來看看另一個常用的層,激活層。它們屬于點式(pointwise)非線性函數(shù)。點式函數(shù)的 Jacobian矩陣是對角矩陣, 這意味著當乘以梯度時, 它是逐點相乘的。

class ReLu(Layer): def forward(self, X): mask = X > 0 return X * mask, lambda D: D * mask

計算Sigmoid函數(shù)的梯度略微有一點難度,而它也是逐點計算的:

class Sigmoid(Layer): def forward(self, X): S = 1 / (1 + np.exp(-X)) def backward(D): return D * S * (1 - S) return S, backward

當我們按序構建很多層后,可以遍歷它們并先后得到每一層的輸出,我們可以把backward函數(shù)存在一個列表內(nèi),并在計算反向傳播時使用,這樣就可以直接得到相對于輸入層的損失梯度。就是這么神奇:

class Sequential(Layer): def __init__(self, *layers): super().__init__() self.layers = layers for layer in layers: self.parameters.extend(layer.parameters) def forward(self, X): backprops = [] Y = X for layer in self.layers: Y, backprop = layer.forward(Y) backprops.append(backprop) def backward(D): for backprop in reversed(backprops): D = backprop(D) return D return Y, backward

正如我們前面提到的,我們將需要定義批樣本的損失函數(shù)和梯度。一個典型的例子是MSE,它被常用在回歸問題里,我們可以這樣實現(xiàn)它:

def mse_loss(Yp, Yt): diff = Yp - Yt return np.square(diff).mean(), 2 * diff / len(diff)

就差一點了!現(xiàn)在,我們定義了兩種層,以及合并它們的方法,下面如何訓練呢?我們可以使用類似于scikit-learn或者Keras中的API。

class Learner(): def __init__(self, model, loss, optimizer): self.model = model self.loss = loss self.optimizer = optimizer def fit_batch(self, X, Y): Y_, backward = self.model.forward(X) L, D = self.loss(Y_, Y) backward(D) self.model.update(self.optimizer) return L def fit(self, X, Y, epochs, bs): losses = [] for epoch in range(epochs): p = np.random.permutation(len(X)) X, Y = X[p], Y[p] loss = 0.0 for i in range(0, len(X), bs): loss += self.fit_batch(X[i:i + bs], Y[i:i + bs]) losses.append(loss) return losses

這就行了!如果你跟隨著我的思路,你可能就會發(fā)現(xiàn)其實有幾行代碼是可以被省掉的。

這代碼能用不?

現(xiàn)在可以用一些數(shù)據(jù)測試下我們的代碼了。

X = np.random.randn(100, 10)w = np.random.randn(10, 1)b = np.random.randn(1)Y = X @ W + Bmodel = Linear(10, 1)learner = Learner(model, mse_loss, SGDOptimizer(lr=0.05))learner.fit(X, Y, epochs=10, bs=10)

100行Python代碼 輕松搞定神經(jīng)網(wǎng)絡

我一共訓練了10輪。

我們還能檢查學到的權重和真實的權重是否一致。

print(np.linalg.norm(m.weights.tensor - W), (m.bias.tensor - B)[0])> 1.848553648022619e-05 5.69305886743976e-06

好了,就這么簡單。讓我們再試試非線性數(shù)據(jù)集,例如y=x1x2,并且再加上一個Sigmoid非線性層和另一個線性層讓我們的模型更復雜些。像下面這樣:

X = np.random.randn(1000, 2)Y = X[:, 0] * X[:, 1]losses1 = Learner( Sequential(Linear(2, 1)), mse_loss, SGDOptimizer(lr=0.01)).fit(X, Y, epochs=50, bs=50)losses2 = Learner( Sequential( Linear(2, 10), Sigmoid(), Linear(10, 1) ), mse_loss, SGDOptimizer(lr=0.3)).fit(X, Y, epochs=50, bs=50)plt.plot(losses1)plt.plot(losses2)plt.legend(['1 Layer', '2 Layers'])plt.show()

100行Python代碼 輕松搞定神經(jīng)網(wǎng)絡

比較單一層vs兩層模型在使用sigmoid激活函數(shù)的情況下的訓練損失。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4819

    瀏覽量

    106048
  • 代碼
    +關注

    關注

    30

    文章

    4922

    瀏覽量

    72217
  • python
    +關注

    關注

    56

    文章

    4848

    瀏覽量

    88920

原文標題:100行Python代碼,輕松搞定神經(jīng)網(wǎng)絡

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【PYNQ-Z2試用體驗】神經(jīng)網(wǎng)絡基礎知識

    python語言,可以很輕松地實現(xiàn)復雜的數(shù)學運算,降低編程難度。下一篇文章,將通過具體代碼,演示基于神經(jīng)網(wǎng)絡的手寫圖形識別。
    發(fā)表于 03-03 22:10

    卷積神經(jīng)網(wǎng)絡如何使用

    卷積神經(jīng)網(wǎng)絡(CNN)究竟是什么,鑒于神經(jīng)網(wǎng)絡在工程上經(jīng)歷了曲折的歷史,您為什么還會在意它呢? 對于這些非常中肯的問題,我們似乎可以給出相對簡明的答案。
    發(fā)表于 07-17 07:21

    【案例分享】ART神經(jīng)網(wǎng)絡與SOM神經(jīng)網(wǎng)絡

    今天學習了兩個神經(jīng)網(wǎng)絡,分別是自適應諧振(ART)神經(jīng)網(wǎng)絡與自組織映射(SOM)神經(jīng)網(wǎng)絡。整體感覺不是很難,只不過一些最基礎的概念容易理解不清。首先ART神經(jīng)網(wǎng)絡是競爭學習的一個代表,
    發(fā)表于 07-21 04:30

    如何構建神經(jīng)網(wǎng)絡

    原文鏈接:http://tecdat.cn/?p=5725 神經(jīng)網(wǎng)絡是一種基于現(xiàn)有數(shù)據(jù)創(chuàng)建預測的計算系統(tǒng)。如何構建神經(jīng)網(wǎng)絡?神經(jīng)網(wǎng)絡包括:輸入層:根據(jù)現(xiàn)有數(shù)據(jù)獲取輸入的層隱藏層:使用反向傳播優(yōu)化輸入變量權重的層,以提高模型的預測
    發(fā)表于 07-12 08:02

    不可錯過!人工神經(jīng)網(wǎng)絡算法、PID算法、Python人工智能學習等資料包分享(附源代碼

    為了方便大家查找技術資料,電子發(fā)燒友小編為大家整理一些精華資料,讓大家可以參考學習,希望對廣大電子愛好者有所幫助。 1.人工神經(jīng)網(wǎng)絡算法的學習方法與應用實例(pdf彩版) 人工神經(jīng) 網(wǎng)絡
    發(fā)表于 09-13 16:41

    如何提升AI算法速度 打造接近人腦規(guī)模的神經(jīng)網(wǎng)絡

    SET的靈感來自生物網(wǎng)絡以及特定神經(jīng)網(wǎng)絡,而這些特定神經(jīng)網(wǎng)絡之所以運行效率高有三個特征,包括網(wǎng)絡連接性相對較低、神經(jīng)中樞稀少以及路徑短。
    發(fā)表于 07-06 09:32 ?1277次閱讀

    Python從頭實現(xiàn)一個神經(jīng)網(wǎng)絡來理解神經(jīng)網(wǎng)絡的原理1

    有個事情可能會讓初學者驚訝:神經(jīng)網(wǎng)絡模型并不復雜!『神經(jīng)網(wǎng)絡』這個詞讓人覺得很高大上,但實際上神經(jīng)網(wǎng)絡算法要比人們想象的簡單。 這篇文章完全是為新手準備的。我們會通過用Python
    的頭像 發(fā)表于 02-27 15:05 ?1080次閱讀
    用<b class='flag-5'>Python</b>從頭實現(xiàn)一個<b class='flag-5'>神經(jīng)網(wǎng)絡</b>來理解<b class='flag-5'>神經(jīng)網(wǎng)絡</b>的原理1

    Python從頭實現(xiàn)一個神經(jīng)網(wǎng)絡來理解神經(jīng)網(wǎng)絡的原理2

    有個事情可能會讓初學者驚訝:神經(jīng)網(wǎng)絡模型并不復雜!『神經(jīng)網(wǎng)絡』這個詞讓人覺得很高大上,但實際上神經(jīng)網(wǎng)絡算法要比人們想象的簡單。 這篇文章完全是為新手準備的。我們會通過用Python
    的頭像 發(fā)表于 02-27 15:06 ?964次閱讀
    用<b class='flag-5'>Python</b>從頭實現(xiàn)一個<b class='flag-5'>神經(jīng)網(wǎng)絡</b>來理解<b class='flag-5'>神經(jīng)網(wǎng)絡</b>的原理2

    Python從頭實現(xiàn)一個神經(jīng)網(wǎng)絡來理解神經(jīng)網(wǎng)絡的原理3

    有個事情可能會讓初學者驚訝:神經(jīng)網(wǎng)絡模型并不復雜!『神經(jīng)網(wǎng)絡』這個詞讓人覺得很高大上,但實際上神經(jīng)網(wǎng)絡算法要比人們想象的簡單。 這篇文章完全是為新手準備的。我們會通過用Python
    的頭像 發(fā)表于 02-27 15:06 ?1146次閱讀
    用<b class='flag-5'>Python</b>從頭實現(xiàn)一個<b class='flag-5'>神經(jīng)網(wǎng)絡</b>來理解<b class='flag-5'>神經(jīng)網(wǎng)絡</b>的原理3

    Python從頭實現(xiàn)一個神經(jīng)網(wǎng)絡來理解神經(jīng)網(wǎng)絡的原理4

    有個事情可能會讓初學者驚訝:神經(jīng)網(wǎng)絡模型并不復雜!『神經(jīng)網(wǎng)絡』這個詞讓人覺得很高大上,但實際上神經(jīng)網(wǎng)絡算法要比人們想象的簡單。 這篇文章完全是為新手準備的。我們會通過用Python
    的頭像 發(fā)表于 02-27 15:06 ?1113次閱讀
    用<b class='flag-5'>Python</b>從頭實現(xiàn)一個<b class='flag-5'>神經(jīng)網(wǎng)絡</b>來理解<b class='flag-5'>神經(jīng)網(wǎng)絡</b>的原理4

    卷積神經(jīng)網(wǎng)絡python代碼

    卷積神經(jīng)網(wǎng)絡python代碼 ; 卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,簡稱CNN)是一種可以在圖像處理和語音識別等領域中很好地應用的
    的頭像 發(fā)表于 08-21 16:41 ?1456次閱讀

    卷積神經(jīng)網(wǎng)絡算法代碼python

    卷積神經(jīng)網(wǎng)絡算法代碼python? 卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)是深度學習中最為重要的算法之一。它在計算機視覺、自然語言處理、語音識
    的頭像 發(fā)表于 08-21 16:50 ?5747次閱讀

    卷積神經(jīng)網(wǎng)絡算法代碼matlab

    卷積神經(jīng)網(wǎng)絡算法代碼matlab 卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)是一種深度學習網(wǎng)絡模型,其特點是具有卷積層(Convolutional
    的頭像 發(fā)表于 08-21 16:50 ?1691次閱讀

    cnn卷積神經(jīng)網(wǎng)絡簡介 cnn卷積神經(jīng)網(wǎng)絡代碼

    cnn卷積神經(jīng)網(wǎng)絡簡介 cnn卷積神經(jīng)網(wǎng)絡代碼 卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,簡稱CNN)是目前深度學習領域中應用廣泛的一種
    的頭像 發(fā)表于 08-21 17:16 ?3586次閱讀

    如何使用Python進行神經(jīng)網(wǎng)絡編程

    。 為什么使用Python? Python是一種廣泛使用的高級編程語言,以其易讀性和易用性而聞名。Python擁有強大的庫,如TensorFlow、Keras和PyTorch,這些庫提供了構建和訓練
    的頭像 發(fā)表于 07-02 09:58 ?1134次閱讀