一文看懂常用的梯度下降算法 - 全文

編輯：祝鑫泉

一

概述

梯度下降算法（Gradient Descent Optimization）是神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練最常用的優(yōu)化算法。對(duì)于深度學(xué)習(xí)模型，基本都是采用梯度下降算法來進(jìn)行優(yōu)化訓(xùn)練的。梯度下降算法背后的原理：目標(biāo)函數(shù)

關(guān)于參數(shù)

的梯度將是目標(biāo)函數(shù)上升最快的方向。對(duì)于最小化優(yōu)化問題，只需要將參數(shù)沿著梯度相反的方向前進(jìn)一個(gè)步長(zhǎng)，就可以實(shí)現(xiàn)目標(biāo)函數(shù)的下降。這個(gè)步長(zhǎng)又稱為學(xué)習(xí)速率

。參數(shù)更新公式如下：

其中

是參數(shù)的梯度，根據(jù)計(jì)算目標(biāo)函數(shù)

采用數(shù)據(jù)量的不同，梯度下降算法又可以分為批量梯度下降算法（Batch Gradient Descent），隨機(jī)梯度下降算法（Stochastic GradientDescent）和小批量梯度下降算法（Mini-batch Gradient Descent）。對(duì)于批量梯度下降算法，其

是在整個(gè)訓(xùn)練集上計(jì)算的，如果數(shù)據(jù)集比較大，可能會(huì)面臨內(nèi)存不足問題，而且其收斂速度一般比較慢。隨機(jī)梯度下降算法是另外一個(gè)極端，

是針對(duì)訓(xùn)練集中的一個(gè)訓(xùn)練樣本計(jì)算的，又稱為在線學(xué)習(xí)，即得到了一個(gè)樣本，就可以執(zhí)行一次參數(shù)更新。所以其收斂速度會(huì)快一些，但是有可能出現(xiàn)目標(biāo)函數(shù)值震蕩現(xiàn)象，因?yàn)楦哳l率的參數(shù)更新導(dǎo)致了高方差。小批量梯度下降算法是折中方案，選取訓(xùn)練集中一個(gè)小批量樣本計(jì)算

，這樣可以保證訓(xùn)練過程更穩(wěn)定，而且采用批量訓(xùn)練方法也可以利用矩陣計(jì)算的優(yōu)勢(shì)。這是目前最常用的梯度下降算法。

對(duì)于神經(jīng)網(wǎng)絡(luò)模型，借助于BP算法可以高效地計(jì)算梯度，從而實(shí)施梯度下降算法。但梯度下降算法一個(gè)老大難的問題是：不能保證全局收斂。如果這個(gè)問題解決了，深度學(xué)習(xí)的世界會(huì)和諧很多。梯度下降算法針對(duì)凸優(yōu)化問題原則上是可以收斂到全局最優(yōu)的，因?yàn)榇藭r(shí)只有唯一的局部最優(yōu)點(diǎn)。而實(shí)際上深度學(xué)習(xí)模型是一個(gè)復(fù)雜的非線性結(jié)構(gòu)，一般屬于非凸問題，這意味著存在很多局部最優(yōu)點(diǎn)（鞍點(diǎn)），采用梯度下降算法可能會(huì)陷入局部最優(yōu)，這應(yīng)該是最頭疼的問題。這點(diǎn)和進(jìn)化算法如遺傳算法很類似，都無法保證收斂到全局最優(yōu)。因此，我們注定在這個(gè)問題上成為“高級(jí)調(diào)參師”。可以看到，梯度下降算法中一個(gè)重要的參數(shù)是學(xué)習(xí)速率，適當(dāng)?shù)膶W(xué)習(xí)速率很重要：學(xué)習(xí)速率過小時(shí)收斂速度慢，而過大時(shí)導(dǎo)致訓(xùn)練震蕩，而且可能會(huì)發(fā)散。理想的梯度下降算法要滿足兩點(diǎn)：收斂速度要快；能全局收斂。為了這個(gè)理想，出現(xiàn)了很多經(jīng)典梯度下降算法的變種，下面將分別介紹它們。

Momentum optimization

沖量梯度下降算法是BorisPolyak在1964年提出的，其基于這樣一個(gè)物理事實(shí)：將一個(gè)小球從山頂滾下，其初始速率很慢，但在加速度作用下速率很快增加，并最終由于阻力的存在達(dá)到一個(gè)穩(wěn)定速率。對(duì)于沖量梯度下降算法，其更新方程如下：

一文看懂常用的梯度下降算法

可以看到，參數(shù)更新時(shí)不僅考慮當(dāng)前梯度值，而且加上了一個(gè)積累項(xiàng)（沖量），但多了一個(gè)超參

一文看懂常用的梯度下降算法

，一般取接近1的值如0.9。相比原始梯度下降算法，沖量梯度下降算法有助于加速收斂。當(dāng)梯度與沖量方向一致時(shí)，沖量項(xiàng)會(huì)增加，而相反時(shí)，沖量項(xiàng)減少，因此沖量梯度下降算法可以減少訓(xùn)練的震蕩過程。TensorFlow中提供了這一優(yōu)化器：tf.train.MomentumOptimizer(learning_rate=learning_rate,momentum=0.9)。

NAG

NAG算法全稱Nesterov Accelerated Gradient,是YuriiNesterov在1983年提出的對(duì)沖量梯度下降算法的改進(jìn)版本，其速度更快。其變化之處在于計(jì)算“超前梯度”更新沖量項(xiàng)，具體公式如下：

一文看懂常用的梯度下降算法

既然參數(shù)要沿著

一文看懂常用的梯度下降算法

更新，不妨計(jì)算未來位置

一文看懂常用的梯度下降算法

的梯度，然后合并兩項(xiàng)作為最終的更新項(xiàng)，其具體效果如圖1所示，可以看到一定的加速效果。在TensorFlow中，NAG優(yōu)化器為：tf.train.MomentumOptimizer(learning_rate=learning_rate,momentum=0.9, use_nesterov=True)

一文看懂常用的梯度下降算法

圖1 NAG效果圖

AdaGrad

AdaGrad是Duchi在2011年提出的一種學(xué)習(xí)速率自適應(yīng)的梯度下降算法。在訓(xùn)練迭代過程，其學(xué)習(xí)速率是逐漸衰減的，經(jīng)常更新的參數(shù)其學(xué)習(xí)速率衰減更快，這是一種自適應(yīng)算法。其更新過程如下：

一文看懂常用的梯度下降算法

其中是梯度平方的積累量，在進(jìn)行參數(shù)更新時(shí)，學(xué)習(xí)速率要除以這個(gè)積累量的平方根，其中加上一個(gè)很小值是為了防止除0的出現(xiàn)。由于是該項(xiàng)逐漸增加的，那么學(xué)習(xí)速率是衰減的。考慮如圖2所示的情況，目標(biāo)函數(shù)在兩個(gè)方向的坡度不一樣，如果是原始的梯度下降算法，在接近坡底時(shí)收斂速度比較慢。而當(dāng)采用AdaGrad，這種情況可以被改觀。由于比較陡的方向梯度比較大，其學(xué)習(xí)速率將衰減得更快，這有利于參數(shù)沿著更接近坡底的方向移動(dòng)，從而加速收斂。

一文看懂常用的梯度下降算法

圖2 AdaGrad效果圖

前面說到AdaGrad其學(xué)習(xí)速率實(shí)際上是不斷衰減的，這會(huì)導(dǎo)致一個(gè)很大的問題，就是訓(xùn)練后期學(xué)習(xí)速率很小，導(dǎo)致訓(xùn)練過早停止，因此在實(shí)際中AdaGrad一般不會(huì)被采用，下面的算法將改進(jìn)這一致命缺陷。不過TensorFlow也提供了這一優(yōu)化器：tf.train.AdagradOptimizer。

RMSprop

RMSprop是Hinton在他的課程上講到的，其算是對(duì)Adagrad算法的改進(jìn)，主要是解決學(xué)習(xí)速率過快衰減的問題。其實(shí)思路很簡(jiǎn)單，類似Momentum思想，引入一個(gè)超參數(shù)，在積累梯度平方項(xiàng)進(jìn)行衰減：

一文看懂常用的梯度下降算法

可以認(rèn)為僅僅對(duì)距離時(shí)間較近的梯度進(jìn)行積累，其中一般取值0.9，其實(shí)這樣就是一個(gè)指數(shù)衰減的均值項(xiàng)，減少了出現(xiàn)的爆炸情況，因此有助于避免學(xué)習(xí)速率很快下降的問題。同時(shí)Hinton也建議學(xué)習(xí)速率設(shè)置為0.001。RMSprop是屬于一種比較好的優(yōu)化算法了，在TensorFlow中當(dāng)然有其身影：tf.train.RMSPropOptimizer(learning_rate=learning_rate,momentum=0.9, decay=0.9, epsilon=1e-10)。

不得不說點(diǎn)題外話，同時(shí)期還有一個(gè)Adadelta算法，其也是Adagrad算法的改進(jìn)，而且改進(jìn)思路和RMSprop很像，但是其背后是基于一次梯度近似代替二次梯度的思想，感興趣的可以看看相應(yīng)的論文，這里不再贅述。

Adam

Adam全稱Adaptive moment estimation，是Kingma等在2015年提出的一種新的優(yōu)化算法，其結(jié)合了Momentum和RMSprop算法的思想。相比Momentum算法，其學(xué)習(xí)速率是自適應(yīng)的，而相比RMSprop，其增加了沖量項(xiàng)。所以，Adam是兩者的結(jié)合體：

一文看懂常用的梯度下降算法

可以看到前兩項(xiàng)和Momentum和RMSprop是非常一致的，由于和的初始值一般設(shè)置為0，在訓(xùn)練初期其可能較小，第三和第四項(xiàng)主要是為了放大它們。最后一項(xiàng)是參數(shù)更新。其中超參數(shù)的建議值是

一文看懂常用的梯度下降算法

。Adm是性能非常好的算法，在TensorFlow其實(shí)現(xiàn)如下： tf.train.AdamOptimizer(learning_rate=0.001,beta1=0.9, beta2=0.999, epsilon=1e-08)。

二

學(xué)習(xí)速率

前面也說過學(xué)習(xí)速率的問題，對(duì)于梯度下降算法，這應(yīng)該是一個(gè)最重要的超參數(shù)。如果學(xué)習(xí)速率設(shè)置得非常大，那么訓(xùn)練可能不會(huì)收斂，就直接發(fā)散了；如果設(shè)置的比較小，雖然可以收斂，但是訓(xùn)練時(shí)間可能無法接受；如果設(shè)置的稍微高一些，訓(xùn)練速度會(huì)很快，但是當(dāng)接近最優(yōu)點(diǎn)會(huì)發(fā)生震蕩，甚至無法穩(wěn)定。不同學(xué)習(xí)速率的選擇影響可能非常大，如圖3所示。

一文看懂常用的梯度下降算法

圖3 不同學(xué)習(xí)速率的訓(xùn)練效果

理想的學(xué)習(xí)速率是：剛開始設(shè)置較大，有很快的收斂速度，然后慢慢衰減，保證穩(wěn)定到達(dá)最優(yōu)點(diǎn)。所以，前面的很多算法都是學(xué)習(xí)速率自適應(yīng)的。除此之外，還可以手動(dòng)實(shí)現(xiàn)這樣一個(gè)自適應(yīng)過程，如實(shí)現(xiàn)學(xué)習(xí)速率指數(shù)式衰減：

一文看懂常用的梯度下降算法

在TensorFlow中，你可以這樣實(shí)現(xiàn)：

initial_learning_rate = 0.1
decay_steps = 10000
decay_rate = 1/10
global_step = tf.Variable(0, trainable=False)
learning_rate = tf.train.exponential_decay(initial_learning_rate,
global_step, decay_steps, decay_rate)
# decayed_learning_rate = learning_rate *
# decay_rate ^ (global_step / decay_steps)
optimizer = tf.train.MomentumOptimizer(learning_rate, momentum=0.9)
training_op = optimizer.minimize(loss, global_step=global_step)

三

總結(jié)

本文簡(jiǎn)單介紹了梯度下降算法的分類以及常用的改進(jìn)算法，總結(jié)來看，優(yōu)先選擇學(xué)習(xí)速率自適應(yīng)的算法如RMSprop和Adam算法，大部分情況下其效果是較好的。還有一定要特別注意學(xué)習(xí)速率的問題。其實(shí)還有很多方面會(huì)影響梯度下降算法，如梯度的消失與爆炸，這也是要額外注意的。最后不得不說，梯度下降算法目前無法保證全局收斂還將是一個(gè)持續(xù)性的數(shù)學(xué)難題。

四

參考文獻(xiàn)

Anoverview of gradient descent optimization algorithms: .

Hands-OnMachine Learning with Scikit-Learn and TensorFlow, Aurélien Géron, 2017.

NAG:.

Adagrad:.

RMSprop:~tijmen/csc321/slides/lecture_slides_lec6.pdf.

Adadelta:https://arxiv.org/pdf/1212.5701v1.pdf.

Adam:https://arxiv.org/pdf/1412.6980.pdf.

不同的算法的效果可視化：https://imgur.com/a/Hqolp.

歡迎大家加群在群中探討

歡迎留言或贊賞。

推

薦

閱

讀

Object Detection R-CNN

掃描個(gè)人微信號(hào)，

拉你進(jìn)機(jī)器學(xué)習(xí)大牛群。

福利滿滿，名額已不多…

80%的AI從業(yè)者已關(guān)注我們微信公眾號(hào)

閱讀全文

上一頁(yè)1 2 3 4全文

評(píng)論

相關(guān)推薦

一文看懂常用貼片電感封裝規(guī)格可以升級(jí)嗎

一文看懂常用貼片電感封裝規(guī)格可以升級(jí)嗎編輯：谷景電子貼片電感作為電感產(chǎn)品中非常重要的一個(gè)類型，它的應(yīng)用普及度是非常廣泛的?？梢哉f在各種大家熟悉的電子產(chǎn)品中都能看到貼片電感的身影。關(guān)于貼片電感的類型

2022-12-17 14:25:46

一文看懂LoraNET協(xié)議

的次數(shù)也可配置，以便根據(jù)實(shí)際應(yīng)用的功耗需求，取一個(gè)功耗和可靠性的折中方案。2、帶防碰撞算法的定時(shí)主動(dòng)上報(bào)LORA模塊自帶的LoraNET協(xié)議棧，支持防碰撞算法，當(dāng)大量LORA模塊在同一個(gè)區(qū)域內(nèi)上報(bào)

2020-12-13 21:47:48

一文看懂PID算法

滯后的被控對(duì)象，比例+微分(PD)控制器能改善系統(tǒng)在調(diào)節(jié)過程中的動(dòng)態(tài)特性。綜上所述得到一個(gè)一條公式，這個(gè)就是模擬PID下面是關(guān)于應(yīng)用，增量式PID算法。其實(shí)PID的算法可以做很深，但沒必要，一

2018-07-19 16:54:49

一文看懂芯片設(shè)計(jì)

的電路圖。圖中可以看到藍(lán)、紅、綠、黃等不同顏色，每種不同的顏色就代表著一張光罩。至于光罩究竟要如何運(yùn)用呢？▲ 常用的演算芯片- FFT 芯片，完成電路布局與繞線的結(jié)果。1層層光罩，疊起一顆芯片　　首先

2016-06-29 11:13:51

一文教你如何看懂電源電路單元

組成的。因此初學(xué)者只要先熟悉常用的基本單元電路，再學(xué)會(huì)分析和分解電路的本領(lǐng)，看懂一般的電路圖應(yīng)該是不難的。按單元電路的功能可以把它們分成若干類，每一類又有好多種，全部單元電路大概總有幾百種。下面我們選

2019-02-20 18:33:27

一堂課幫你搞定PID算法

/1399.html這三種是最簡(jiǎn)單的基本算法，各有其特點(diǎn)，一般能滿足控制的大部份要求，而本課程也主要針對(duì)這三種算法進(jìn)行詳細(xì)講解。本課程主要講解什么？常用的控制算法與PID控制算法的異同點(diǎn)；PID控制算法的理論分析

2018-07-25 14:21:23

常用的一些PID算法有哪些？

PID的原理是什么？常用的一些PID算法有哪些？

2022-01-21 06:48:09

常用的校驗(yàn)算法有哪些？

常用的校驗(yàn)算法有哪些，是不是和通信規(guī)約有關(guān)。比如MODBUS一般都用CRC16（不確定是不是叫這個(gè)）。這些校驗(yàn)算法是之前積累下來的嗎。自己也可以定義一個(gè)校驗(yàn)算法吧，只要發(fā)送端和接收端用同一個(gè)算法就可以？比較常見的校驗(yàn)有哪些呢。

2023-11-03 06:50:59

常用的經(jīng)典濾波算法有哪些？？

2012-07-01 15:15:23

梯度更新算法的選擇

深度學(xué)習(xí)入門（四）梯度更新算法的選擇(附執(zhí)行代碼)

2020-06-09 11:02:14

AD轉(zhuǎn)換常用濾波算法

2016-08-01 10:46:57

AI算法中比較常用的模型都有什么？

AI算法中比較常用的模型都有什么

2022-08-27 09:19:06

C語(yǔ)言實(shí)現(xiàn)常用排序算法是什么？

2021-10-19 06:41:46

MATLAB多維極值之單純形法算法原理

一、算法原理1、問題引入在之前講解過的多維極值的算法中（最速下降法、牛頓法、共軛梯度法、擬牛頓法等），我們都利用了目標(biāo)函數(shù)的導(dǎo)數(shù)值，因?yàn)楹瘮?shù)的導(dǎo)數(shù)值是函數(shù)性態(tài)的反應(yīng)。但在實(shí)際的工程應(yīng)用中，會(huì)出現(xiàn)目標(biāo)

2021-08-17 09:24:08

MATLAB語(yǔ)言常用算法程序集

2012-05-10 22:26:13

Matlab數(shù)學(xué)建模常用的十大算法

2012-05-20 17:33:09

TensorFlow優(yōu)化器種類及其用法詳解

高中數(shù)學(xué)學(xué)過，函數(shù)在一階導(dǎo)數(shù)為零的地方達(dá)到其最大值和最小值。梯度下降算法基于相同的原理，即調(diào)整系數(shù)（權(quán)重和偏置）使損失函數(shù)的梯度下降。在回歸中，使用梯度下降來優(yōu)化損失函數(shù)并獲得系數(shù)。本節(jié)將介紹

2020-07-28 14:39:34

canny算法的具體程序

求助canny算法的具體步驟程序啊，老師不讓直接使用canny函數(shù)，不會(huì)啊，淚奔。步驟如下：1.用高斯濾波器平滑圖像．2.用一階偏導(dǎo)有限差分計(jì)算梯度幅值和方向.3.對(duì)梯度幅值進(jìn)行非極大值抑制．4.用雙閾值算法檢測(cè)和連接邊緣.求程序啊

2013-09-29 22:52:14

c語(yǔ)言常用算法

非常實(shí)用的《c語(yǔ)言常用算法程序集》針對(duì)工程中常用的行之有效的算法而編寫，其主要內(nèi)容包括多項(xiàng)式的計(jì)算、復(fù)數(shù)運(yùn)算、隨機(jī)數(shù)的產(chǎn)生、矩陣運(yùn)算、矩陣特征值與特征向量的計(jì)算、線性代數(shù)方程組的求解、非線性

2022-04-11 16:41:52

keras內(nèi)置的7個(gè)常用的優(yōu)化器介紹

=0.004)上述優(yōu)化器可以分為兩類：1 梯度下降算法類 2 自適應(yīng)學(xué)習(xí)率類。這些算法的基礎(chǔ)都是梯度下降算法，只是在梯度下降算法的基礎(chǔ)上做了一些優(yōu)化。 1 梯度下降算法包括基礎(chǔ)的梯度下降算法、批量梯度下降

2023-08-18 06:32:13

【最新課程推薦】PID控制算法

發(fā)燒友學(xué)院提供，本次課程主要講解常用的控制算法與PID控制算法的異同點(diǎn)；PID控制算法的理論分析；基于單片機(jī)的PID算法實(shí)現(xiàn)；PID算法的工程應(yīng)用的一些注意事項(xiàng)；演示板電路分析；PID算法C語(yǔ)言

2016-10-12 15:27:27

【轉(zhuǎn)帖】一文教你看懂電路圖

少數(shù)幾個(gè)單元電路組成的。只要先熟悉常用的基本單元電路，再學(xué)會(huì)分析和分解電路的本領(lǐng)，看懂一般的電路圖應(yīng)該是不難的。一、電子電路的意義電路圖是人們?yōu)榱搜芯亢凸こ痰男枰?，用約定的符號(hào)繪制的一種表示電路結(jié)構(gòu)

2018-04-03 15:20:57

從梯度下降法、牛頓法到擬牛頓法它們的聯(lián)系與區(qū)別是什么

從梯度下降法、牛頓法到擬牛頓法，淺談它們的聯(lián)系與區(qū)別

2020-05-21 11:06:52

分享一個(gè)自己寫的機(jī)器學(xué)習(xí)_Logistic分類算法

假設(shè)函數(shù)：代價(jià)函數(shù)：利用極大似然估計(jì)代價(jià)函數(shù) 實(shí)現(xiàn)了凸函數(shù)特征梯度下降算法：設(shè)定初始值收斂至局部最小值

2018-10-18 12:25:14

分享一個(gè)自己寫的機(jī)器學(xué)習(xí)線性回歸梯度下降算法

單變量線性回歸算法，利用Batch梯度梯度下降算法迭代計(jì)算得到誤差最小的代價(jià)函數(shù)theta0,theta1。調(diào)節(jié)學(xué)習(xí)率a可以觀察擬合得到的函數(shù)和代價(jià)函數(shù)誤差收斂情況。

2018-10-02 21:48:58

單片機(jī)C語(yǔ)言常用算法

2014-10-03 16:58:44

回歸算法有哪些，常用回歸算法（3種）詳解

回歸是數(shù)學(xué)建模、分類和預(yù)測(cè)中最古老但功能非常強(qiáng)大的工具之一?；貧w在工程、物理學(xué)、生物學(xué)、金融、社會(huì)科學(xué)等各個(gè)領(lǐng)域都有應(yīng)用，是數(shù)據(jù)科學(xué)家常用的基本工具?；貧w通常是機(jī)器學(xué)習(xí)中使用的第一個(gè)算法。通過學(xué)習(xí)

2020-07-28 14:36:05

如何看懂電路圖

的555電路如何看懂電路圖1－－學(xué)電子跟我來系列文章top電子設(shè)備中有各種各樣的圖。能夠說明它們工作原理的是電原理圖，簡(jiǎn)稱電路圖。電路圖有兩種，一種是說明模擬電子電路工作原理的。它用各種圖形符號(hào)表

2014-04-15 16:23:11

如何更新權(quán)重實(shí)現(xiàn)梯度下降

實(shí)現(xiàn)梯度下降

2019-07-15 10:09:11

怎樣學(xué)會(huì)去用并看懂快速傅里葉變換等算法

本人學(xué)過點(diǎn)51單片機(jī)看到別人做的東西都跑了算法自己也好奇想自己也嘗試下在網(wǎng)上看到那些代碼沒太看懂請(qǐng)教下各位大神怎么去學(xué)看懂這些算法我也學(xué)過復(fù)變信號(hào)與系統(tǒng)但是只是考考試沒怎么去用過所以想請(qǐng)教一下多謝各位大神了?。?！

2016-11-22 01:16:20

機(jī)器學(xué)習(xí)新手必學(xué)的三種優(yōu)化算法（牛頓法、梯度下降法、最速下降法）

轉(zhuǎn)換的算法復(fù)雜度是非常高的（O(n3)），因此牛頓法在這種情形下并不常用。梯度下降梯度下降是目前為止在機(jī)器學(xué)習(xí)和其他優(yōu)化問題中使用的最多的優(yōu)化算法。梯度算法的基本思想是，在每次迭代中向梯度方向走一

2019-05-07 08:30:00

深度學(xué)習(xí)RCNN算法

目標(biāo)檢測(cè)算法圖解：一文看懂RCNN系列算法

2019-08-29 09:50:56

電機(jī)控制之常用算法概述（3）

和驅(qū)動(dòng)順序是不變的。未完待續(xù)??！本文相關(guān)文章1? 電機(jī)控制之常用算法概述（1）2?電機(jī)控制之常用算法概述（2）

2018-10-29 16:45:58

電機(jī)控制之常用算法概述（4）

產(chǎn)生隨時(shí)間變化的電壓。其開關(guān)頻率范圍一般為10-20 KHz，以消除噪聲。這一通用電機(jī)的控制方法可以獲得更佳的電流控制和更佳的EMI性能，因此，效率更高。本文相關(guān)文章1? 電機(jī)控制之常用算法概述（1）2?電機(jī)控制之常用算法概述（2）3?電機(jī)控制之常用算法概述（3）

2018-10-26 11:00:57

電源常用技術(shù)與算法

電源常用技術(shù)與算法2.1有效值檢波技術(shù)2.1.1均值檢波技術(shù)2.1.2峰值檢波技術(shù)2.1.3均方根值檢波技術(shù)2.2高精度采樣技術(shù)2.2.1AD的選擇2.2.1.1A/D轉(zhuǎn)換器的性能指標(biāo)

2021-07-26 08:09:08

電源常用技術(shù)與算法是什么？

2021-09-27 06:40:27

經(jīng)典常用算法（源程序_Matlab）

2013-12-12 00:24:22

經(jīng)典算法大全（51個(gè)C語(yǔ)言算法+單片機(jī)常用算法+機(jī)器學(xué)十大算法）

算法的描述：是對(duì)要解決一個(gè)問題或要完成一項(xiàng)任務(wù)所采取的方法和步驟的描述，包括需要什么數(shù)據(jù)（輸入什么數(shù)據(jù)、輸出什么結(jié)果）、采用什么結(jié)構(gòu)、使用什么語(yǔ)句以及如何安排這些語(yǔ)句等。通常使用自然語(yǔ)言、結(jié)構(gòu)化

2018-10-23 14:31:12

請(qǐng)問改進(jìn)的Ferret算法和目前常用的測(cè)量算法有哪些不同？

數(shù)字圖像處理原理是什么？簡(jiǎn)單Ferret算法原理是什么？改進(jìn)的Ferret算法原理有哪些步驟？改進(jìn)的Ferret算法和目前常用的測(cè)量算法有哪些不同？

2021-04-15 06:58:37

輕松看懂機(jī)器學(xué)習(xí)十大常用算法

`通過本篇文章可以對(duì)ML的常用算法有個(gè)常識(shí)性的認(rèn)識(shí)，沒有代碼，沒有復(fù)雜的理論推導(dǎo)，就是圖解一下，知道這些算法是什么，它們是怎么應(yīng)用的，例子主要是分類問題。每個(gè)算法都看了好幾個(gè)視頻，挑出講的最清晰明了

2017-08-02 16:58:02

火電站負(fù)荷調(diào)度混沌變步長(zhǎng)混合遺傳算法

結(jié)合混沌運(yùn)動(dòng)的遍歷性和遺傳算法的群體搜索性,提出一種基于混沌變尺度梯度下降的混合遺傳算法,應(yīng)用于電廠負(fù)荷優(yōu)化調(diào)度。算法采用梯度下降法對(duì)遺傳變異獲得的優(yōu)良個(gè)體進(jìn)行局

2009-02-05 12:13:16

基于預(yù)條件共軛梯度法的混凝土層析成像

根據(jù)常規(guī)圖像重建的共軛梯度迭代算法，提出一種預(yù)條件共軛梯度法。用一種新的預(yù)條件子M來改善系數(shù)矩陣的條件數(shù)，結(jié)合一般的共軛梯度法，導(dǎo)出預(yù)條件共軛梯度法。實(shí)驗(yàn)結(jié)果表

2009-04-10 09:08:41

基于邊緣梯度方向直方圖的圖像檢索算法

在基于內(nèi)容的圖像檢索中，不同圖像對(duì)形狀細(xì)節(jié)的要求不同及形狀特征對(duì)旋轉(zhuǎn)的敏感性，影響檢索性能。對(duì)此，本文提出了一種基于邊緣梯度方向直方圖的圖像檢索算法：利用B樣

2009-06-25 14:03:26

磁共振成像梯度放大器控制算法

針對(duì)磁共振成像梯度放大器的性能要求，本文提出了一種使用狀態(tài)反饋和比例積分相結(jié)合的控制算法。文章首先介紹了放大器的主電路結(jié)構(gòu)和部分參數(shù)，并對(duì)輸出濾波器的參數(shù)做了

2010-02-18 12:43:05

傳感器網(wǎng)絡(luò)定向擴(kuò)散機(jī)制中梯度生成算法的研究

如何生成優(yōu)化的梯度是傳感器網(wǎng)絡(luò)定向擴(kuò)散中的一個(gè)關(guān)鍵問題, 本文在分析一種基本梯度生成算法的問題基礎(chǔ)之上,利用興趣包的轉(zhuǎn)發(fā)次數(shù)對(duì)其進(jìn)行改進(jìn), 設(shè)計(jì)了一種分布式的最短

2010-09-28 15:49:31

隨機(jī)梯度估值在盲均衡算法中的影響

該文引人隨機(jī)梯度估值，在梯度向量中加入噪聲成分，結(jié)合梯度估值引起的權(quán)偏差相關(guān)系數(shù)，分析其對(duì)盲均衡算法的影響．理論研究和仿真結(jié)果表明，隨機(jī)梯度估值引起權(quán)值偏差，影響

2012-03-07 14:41:04

[9.5.1]--9.5梯度下降法和反向傳播算法

算法

學(xué)習(xí)電子知識(shí)發(fā)布于 2023-02-17 20:17:35

Matlab語(yǔ)言常用算法程序集

Matlab語(yǔ)言常用算法程序集，又需要的下來看看。

2016-05-19 14:31:12

基于多新息隨機(jī)梯度算法的網(wǎng)側(cè)變流器參數(shù)辨識(shí)方法研究

基于多新息隨機(jī)梯度算法的網(wǎng)側(cè)變流器參數(shù)辨識(shí)方法研究_張敏

2017-01-02 15:24:00

隨機(jī)并行梯度下降圖像匹配方法性能研究及優(yōu)化_李松洋

2017-03-14 08:00:00

單片機(jī)常用算法設(shè)計(jì)

單片機(jī)常用算法歸納

2017-04-05 14:01:34

基于梯度下降法和互補(bǔ)濾波的航向姿態(tài)參考系統(tǒng)

針對(duì)微型無人機(jī)航向姿態(tài)參考系統(tǒng)低成本、小型化的工程實(shí)現(xiàn)需求，基于三軸陀螺儀、加速度計(jì)和磁力計(jì)，提出了一種在線實(shí)時(shí)姿態(tài)估計(jì)算法。該算法采用四元數(shù)描述系統(tǒng)模型，采用改進(jìn)的梯度下降法預(yù)處理加速度計(jì)和磁力計(jì)

2017-11-16 10:29:24

一種結(jié)合梯度下降法的二層搜索粒子群算法

針對(duì)標(biāo)準(zhǔn)粒子群優(yōu)化（PSO）算法在求解復(fù)雜優(yōu)化問題中出現(xiàn)的早熟收斂問題，提出一種結(jié)合梯度下降法的二次搜索粒子群算法。首先，當(dāng)全局極值超過預(yù)設(shè)的最大不變迭代次數(shù)時(shí)，判斷全局極值點(diǎn)處于極值陷阱中；然后

2017-11-27 17:28:12

一種改進(jìn)的梯度投影算法

的Barzilai-Borwein （B-B）梯度投影（Barzilai-Borwein Gradient Projection for Sparse Reconstruction，GPSR-BB）算法的基礎(chǔ)上，采用預(yù)測(cè)校正

2017-11-27 18:09:33

機(jī)器學(xué)習(xí)：隨機(jī)梯度下降和批量梯度下降算法介紹

隨機(jī)梯度下降（Stochastic gradient descent）批量梯度下降（Batch gradient descent）梯度下降（GD）是最小化風(fēng)險(xiǎn)函數(shù)、損失函數(shù)的一種常用方法，隨機(jī)

2017-11-28 04:00:28

8197

一種改進(jìn)擴(kuò)展卡爾曼的四旋翼姿態(tài)估計(jì)算法

為了提高標(biāo)準(zhǔn)擴(kuò)展卡爾曼姿態(tài)估計(jì)算法的精確度和快速性，將運(yùn)動(dòng)加速度抑制的動(dòng)態(tài)步長(zhǎng)梯度下降算法融入擴(kuò)展卡爾曼中，提出一種改進(jìn)擴(kuò)展卡爾曼的四旋翼姿態(tài)估計(jì)算法。該算法在卡爾曼測(cè)量更新中采用梯度下降法進(jìn)行

2017-12-04 11:31:26

改進(jìn)蟻群算法求解多約束服務(wù)質(zhì)量路由

針對(duì)目前多數(shù)改進(jìn)蟻群算法求解多約束服務(wù)質(zhì)量路由（ QoSR）存在收斂速度慢、易陷入局部最優(yōu)從而效率不高的問題，提出一種引入梯度下降的蟻群算法（ ACAGD）。該算法將梯度下降法引入到蟻群的局部搜索

2017-12-05 15:28:23

一種解決連續(xù)問題的真實(shí)在線自然梯度行動(dòng)者-評(píng)論家算法

式自然梯度行動(dòng)者一評(píng)論家算法（TOINAC）.TOINAC算法采用優(yōu)于傳統(tǒng)梯度的自然梯度，在真實(shí)在線時(shí)間差分（TOTD）算法的基礎(chǔ)上。提出了一種新型的向前觀點(diǎn)，改進(jìn)了自然梯度行動(dòng)者一評(píng)論家算法．在評(píng)論家部分，利用TOTD算法高效性的特點(diǎn)

2017-12-19 16:14:37

基于灰度平均梯度與粒子群優(yōu)化PSO算法的散焦圖像模糊參數(shù)估計(jì)

針對(duì)散焦模糊圖像的復(fù)原問題，提出一種基于灰度平均梯度與粒子群優(yōu)化（PSO）算法相結(jié)合的散焦圖像模糊參數(shù)估計(jì)方法。首先，利用PSO算法隨機(jī)生成一群不同模糊半徑的點(diǎn)擴(kuò)散函數(shù)，分別用維納濾波算法處理模糊

2017-12-21 09:27:42

基于梯度角度的直方圖HGA的圖像匹配算法

針對(duì)傳統(tǒng)的局部特征描述子在圖像匹配效果和效率上很難兼顧的問題，提出了一種基于梯度角度的直方圖（ HGA）的圖像匹配算法。該算法先通過加速片段測(cè)試特征（FAST）獲取的圖像關(guān)鍵點(diǎn)，然后采用塊梯度計(jì)算

2018-01-12 11:42:14

從方向?qū)?shù)這個(gè)角度來解析梯度的負(fù)方向?yàn)槭裁词蔷植?b class="flag-6" style="color: red">下降最快的方向

剛接觸梯度下降這個(gè)概念的時(shí)候，是在學(xué)習(xí)機(jī)器學(xué)習(xí)算法的時(shí)候，很多訓(xùn)練算法用的就是梯度下降，然后資料和老師們也說朝著梯度的反方向變動(dòng)，函數(shù)值下降最快，但是究其原因的時(shí)候，很多人都表達(dá)不清楚。所以我整理出自己的理解，從方向?qū)?shù)這個(gè)角度把這個(gè)結(jié)論證明出來，讓我們知其然也知其所以然。

2018-02-05 13:42:13

9340

計(jì)算機(jī)常用算法設(shè)計(jì)方法分享

常用算法設(shè)計(jì)方法

2018-03-22 14:38:09

基于復(fù)雜梯度網(wǎng)絡(luò)的能效優(yōu)化路由算法

為緩解快速增長(zhǎng)的網(wǎng)絡(luò)數(shù)據(jù)帶來較大的能耗，響應(yīng)節(jié)能減排的發(fā)展需求，提高能源的使用效率，提出一種能效優(yōu)化的路由算法。利用以無標(biāo)度網(wǎng)絡(luò)為底網(wǎng)構(gòu)建的復(fù)雜梯度網(wǎng)絡(luò)進(jìn)行建模，定義節(jié)點(diǎn)勢(shì)，該節(jié)點(diǎn)勢(shì)由鄰居節(jié)點(diǎn)

2018-03-29 15:56:13

機(jī)器學(xué)習(xí)中梯度下降法的過程

梯度下降法是一個(gè)用于尋找最小化成本函數(shù)的參數(shù)值的最優(yōu)化算法。當(dāng)我們無法通過分析計(jì)算（比如線性代數(shù)運(yùn)算）求得函數(shù)的最優(yōu)解時(shí)，我們可以利用梯度下降法來求解該問題。

2018-04-26 16:44:00

3221

梯度下降兩大痛點(diǎn)：陷入局部極小值和過擬合

基于梯度下降訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)，我們將冒網(wǎng)絡(luò)落入局部極小值的風(fēng)險(xiǎn)，網(wǎng)絡(luò)在誤差平面上停止的位置并非整個(gè)平面的最低點(diǎn)。這是因?yàn)檎`差平面不是內(nèi)凸的，平面可能包含眾多不同于全局最小值的局部極小值。

2018-04-27 17:01:36

19033

梯度下降算法及其變種：批量梯度下降，小批量梯度下降和隨機(jī)梯度下降

現(xiàn)在我們來討論梯度下降算法的三個(gè)變種，它們之間的主要區(qū)別在于每個(gè)學(xué)習(xí)步驟中計(jì)算梯度時(shí)使用的數(shù)據(jù)量，是對(duì)每個(gè)參數(shù)更新（學(xué)習(xí)步驟）時(shí)的梯度準(zhǔn)確性與時(shí)間復(fù)雜度的折衷考慮。

2018-05-03 15:55:34

20236

講解隨機(jī)梯度下降、類別數(shù)據(jù)編碼、Vowpal Wabbit機(jī)器學(xué)習(xí)庫(kù)

在數(shù)據(jù)量不大的情況下，上面的數(shù)學(xué)效果不錯(cuò)（我們這里不討論局部極小值、鞍點(diǎn)、學(xué)習(xí)率選擇、動(dòng)量等問題，請(qǐng)參考《深度學(xué)習(xí)》一書的數(shù)值計(jì)算那一章）。批量梯度下降有一個(gè)問題——梯度演算需要累加訓(xùn)練集中所有對(duì)象

2018-07-17 09:11:43

5797

機(jī)器學(xué)習(xí)優(yōu)化算法中梯度下降,牛頓法和擬牛頓法的優(yōu)缺點(diǎn)詳細(xì)介紹

梯度下降法實(shí)現(xiàn)簡(jiǎn)單，當(dāng)目標(biāo)函數(shù)是凸函數(shù)時(shí)，梯度下降法的解是全局解。一般情況下，其解不保證是全局最優(yōu)解，梯度下降法的速度也未必是最快的。

2018-08-04 11:40:10

50637

簡(jiǎn)單的梯度下降算法，你真的懂了嗎？

梯度下降算法的公式非常簡(jiǎn)單，”沿著梯度的反方向（坡度最陡）“是我們?nèi)粘＝?jīng)驗(yàn)得到的，其本質(zhì)的原因到底是什么呢？為什么局部下降最快的方向就是梯度的負(fù)方向呢？也許很多朋友還不太清楚。沒關(guān)系，接下來我將以

2018-09-19 00:17:01

668

深入淺出地介紹了梯度下降這一概念

初始化權(quán)重時(shí)，我們?cè)趽p失曲面的A點(diǎn)。我們首先要做的，是檢查一下，在x-y平面上的所有可能方向中，沿著哪個(gè)方向移動(dòng)能帶來最陡峭的損失值下降。這就是我們需要移動(dòng)的方向。這一方向恰好是梯度的反方向。梯度，導(dǎo)數(shù)的高維表兄弟，為我們提供了最陡峭的上升方向。

2018-09-28 09:06:47

4992

回溯的共軛梯度迭代硬閾值算法如何解決迭代次數(shù)多重構(gòu)時(shí)間長(zhǎng)的問題

并成候選集；然后，在候選集所對(duì)應(yīng)的矩陣列張成的空間中選擇新的支撐集，以此減少支撐集被反復(fù)選擇的次數(shù)，確保正確的支撐集被快速找到；最后，根據(jù)前后迭代支撐集是否相等的準(zhǔn)則來決定使用梯度下降法或共軛梯度法作為尋優(yōu)方法，加速算法

2018-12-20 14:08:49

為什么基于梯度的方法能夠在深度學(xué)習(xí)的優(yōu)化中行之有效

神經(jīng)網(wǎng)絡(luò)的優(yōu)化本質(zhì)上是一個(gè)非凸問題，而簡(jiǎn)單的基于梯度的算法在實(shí)踐中似乎總是能夠解決這類問題。

2018-12-24 09:41:21

3477

數(shù)據(jù)挖掘常用算法

本視頻主要詳細(xì)介紹了數(shù)據(jù)挖掘常用算法，分別是樸素貝葉斯、邏輯回歸（logisticregression）、最近鄰算法——KNN、決策樹、Adaboosting。

2019-04-10 16:32:33

13064

以線性回歸算法來對(duì)三種梯度下降法進(jìn)行比較

從上面公式可以注意到，它得到的是一個(gè)全局最優(yōu)解，但是每迭代一步，都要用到訓(xùn)練集所有的數(shù)據(jù)，如果樣本數(shù)目 m 很大，那么可想而知這種方法的迭代速度！所以，這就引入了另外一種方法，隨機(jī)梯度下降。

2019-04-19 17:03:26

3827

常用的三種機(jī)器學(xué)習(xí)優(yōu)化算法介紹和比較

其中，gradient(x_n)是函數(shù)位于x_n點(diǎn)時(shí)的梯度向量，hessian_matrix是一個(gè)尺寸為 nxn 的黑塞矩陣（hessian matrix），其值是函數(shù)位于x_n的二階導(dǎo)數(shù)。我們都知道，矩陣轉(zhuǎn)換的算法復(fù)雜度是非常高的（O(n3)），因此牛頓法在這種情形下并不常用。

2019-04-29 10:47:02

5553

機(jī)器學(xué)習(xí)之感知機(jī)python是如何實(shí)現(xiàn)的

算法選擇，最終的目標(biāo)是求損失函數(shù)的最小值，利用機(jī)器學(xué)習(xí)中最常用的梯度下降GD或者隨機(jī)梯度下降SGD來求解。

2020-03-30 09:36:51

845

基于分布式編碼的同步隨機(jī)梯度下降算法

基于數(shù)據(jù)并行化的異步隨機(jī)梯度下降（ASGD）算法由于需要在分布式計(jì)算節(jié)點(diǎn)之間頻繁交換梯度數(shù)據(jù)，從而影響算法執(zhí)行效率。提出基于分布式編碼的同步隨機(jī)梯度下降（SSGD）算法，利用計(jì)算任務(wù)的冗余分發(fā)策略

2021-04-27 13:56:06

一種螺旋結(jié)構(gòu)和梯度分析的圖像融合算法

為了提高圖像融合的效果，提出了螺旋結(jié)構(gòu)和梯度分析的圖像融合算法。算法首先進(jìn)行非下采樣輪廓波變換，得到一系列高低頻子圖。然后對(duì)低頻子圖中稀疏表示方法的滑窗模型進(jìn)行了研究，針對(duì)其融合時(shí)較慢

2021-05-19 15:53:10

帶延遲調(diào)整的脈沖神經(jīng)元學(xué)習(xí)算法

脈沖神經(jīng)元有監(jiān)督學(xué)習(xí)算法通過梯度下降法調(diào)整神經(jīng)元的突觸權(quán)值，但目標(biāo)學(xué)習(xí)序列長(zhǎng)度的增加會(huì)降低其精度并延長(zhǎng)學(xué)習(xí)周期。為此，提出一種帶延遲調(diào)整的梯度下降學(xué)習(xí)算法。將每個(gè)突觸的延遲作為學(xué)習(xí)參數(shù)，在學(xué)習(xí)過程中

2021-06-11 16:37:41

聊一下解梯度折射率

是一個(gè)很重要的自然的梯度折射率例子。眼睛的晶狀體的折射率中央層大約1.406，周邊密度低，逐漸下降到1.386。這有什么好處呢？我們的眼睛看近距離和遠(yuǎn)距離都能較好的看清楚物體，較好的分辨率和較低的像差（這也是梯度透鏡重要應(yīng)用之一）。

2022-08-12 14:34:03

2815

各種梯度下降法是如何工作的

導(dǎo)讀一圖勝千言，什么？還是動(dòng)畫，那就更棒啦！本文用了大量的資源來解釋各種梯度下降法（gradient descents），想給大家直觀地介紹一下這些方法是如何工作的。

2022-08-17 11:50:18

785

關(guān)于機(jī)器學(xué)習(xí)的六種基礎(chǔ)算法來源、用途、演變

這六種算法分別是：線性回歸、邏輯回歸、梯度下降、神經(jīng)網(wǎng)絡(luò)、決策樹與k均值聚類算法。

2022-11-04 10:18:06

659

機(jī)器學(xué)習(xí)常用術(shù)語(yǔ)匯總，中英對(duì)照！

在神經(jīng)網(wǎng)絡(luò)上執(zhí)行梯度下降法的主要算法。該算法會(huì)先按前向傳播方式計(jì)算（并緩存）每個(gè)節(jié)點(diǎn)的輸出值，然后再按反向傳播遍歷圖的方式計(jì)算損失函數(shù)值相對(duì)于每個(gè)參數(shù)的偏導(dǎo)數(shù)。

2023-03-13 10:23:33

1661

詳解神經(jīng)網(wǎng)絡(luò)中反向傳播和梯度下降

摘要：反向傳播指的是計(jì)算神經(jīng)網(wǎng)絡(luò)參數(shù)梯度的方法。

2023-03-14 11:07:10

589

梯度下降法在機(jī)器學(xué)習(xí)中的應(yīng)用

梯度下降法沿著梯度的反方向進(jìn)行搜索，利用了函數(shù)的一階導(dǎo)數(shù)信息。

2023-05-18 09:20:34

768

邊緣計(jì)算卸載算法--CD梯度下降

背景：我實(shí)現(xiàn)該算法是在邊緣計(jì)算單個(gè)工作流任務(wù)環(huán)境中，下面可以看到此背景下的java代碼實(shí)現(xiàn)。此處假設(shè)我們的工作流任務(wù)中只有3個(gè)任務(wù)節(jié)點(diǎn)（構(gòu)成一個(gè)有向無環(huán)圖），下面基于此假設(shè)分析算法。

2023-05-18 17:16:57

人工智能領(lǐng)域的梯度學(xué)習(xí)研究

前向梯度學(xué)習(xí)通常用于計(jì)算含有噪聲的方向梯度，是一種符合生物學(xué)機(jī)制、可替代反向傳播的深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法。然而，當(dāng)要學(xué)習(xí)的參數(shù)量很大時(shí)，標(biāo)準(zhǔn)的前向梯度算法會(huì)出現(xiàn)較大的方差。

2023-05-30 10:34:07

191