chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹機(jī)器學(xué)習(xí)中常用的三種優(yōu)化算法

汽車(chē)玩家 ? 來(lái)源:人工智能遇見(jiàn)磐創(chuàng) ? 作者:Walker ? 2020-05-04 18:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文主要介紹了常用的一些機(jī)器學(xué)習(xí)中常用的優(yōu)化算法。

在機(jī)器學(xué)習(xí)的世界中,通常我們會(huì)發(fā)現(xiàn)有很多問(wèn)題并沒(méi)有最優(yōu)的解,或是要計(jì)算出最優(yōu)的解要花費(fèi)很大的計(jì)算量,面對(duì)這類(lèi)問(wèn)題一般的做法是利用迭代的思想盡可能的逼近問(wèn)題的最優(yōu)解。我們把解決此類(lèi)優(yōu)化問(wèn)題的方法叫做優(yōu)化算法,優(yōu)化算法本質(zhì)上是一種數(shù)學(xué)方法,常見(jiàn)的優(yōu)化算法包括梯度下降法、牛頓法、Momentum,Nesterov Momentum,Adagrad,Adam等。其實(shí)大部分機(jī)器學(xué)習(xí)算法的本質(zhì)都是建立優(yōu)化模型,通過(guò)優(yōu)化算法對(duì)損失函數(shù)(優(yōu)化的目標(biāo)函數(shù))進(jìn)行優(yōu)化,從而訓(xùn)練出最好的模型。

(1)梯度下降法

梯度下降法是最常用的一種優(yōu)化算法。其核心思想是:在當(dāng)前位置尋找梯度下降最快的方向,來(lái)逐漸逼近優(yōu)化的目標(biāo)函數(shù)。且離目標(biāo)函數(shù)越近,逼近的“步伐”也就越小。梯度下降法本質(zhì)是一種迭代方法,常用于機(jī)器學(xué)習(xí)算法的模型參數(shù)求解。其示意圖如下圖1所示:

圖1梯度下降法

梯度下降法的更新公式為:

介紹機(jī)器學(xué)習(xí)中常用的三種優(yōu)化算法

其中α為梯度上每次逼近的步長(zhǎng),前邊的“-”表示搜索方向?yàn)樨?fù)梯度的方向,L我損失函數(shù)。算法更新終止的條件是梯度向量接近于0即可。此外需要特別注意的是,梯度下降法不一定能夠找到全局的最優(yōu)解,很有可能找到的是一個(gè)局部最優(yōu)解。

(2)梯度下降法的變式

通?;谔荻鹊南陆捣椒ㄓ钟泻芏嘧兪剑覀冎饕獮榇蠹医榻B:隨機(jī)梯度下降法(SGD), Momentum, Nesterov Momentum, Adagrad, Adam。

隨機(jī)梯度下降法是每次使用一批數(shù)據(jù)進(jìn)行梯度的計(jì)算,而非計(jì)算全部數(shù)據(jù)的梯度,因?yàn)槿绻看斡?jì)算全部數(shù)據(jù)的梯度,會(huì)導(dǎo)致運(yùn)算量加大,運(yùn)算時(shí)間變長(zhǎng),容易陷入局部最優(yōu)解,而隨機(jī)梯度下降可能每次不是朝著真正最小的方向,這樣反而可以跳出局部的最優(yōu)解。

Momentum是在隨機(jī)梯度下降法的基礎(chǔ)上,增加了動(dòng)量(Momentum)的技術(shù)。其核心是通過(guò)優(yōu)化相關(guān)方向的訓(xùn)練和弱化無(wú)關(guān)方向的振蕩,來(lái)加速SGD訓(xùn)練。Momentum的方法能夠在一定程度上緩解隨機(jī)梯度下降法收斂不穩(wěn)定的問(wèn)題,并且有一定的擺脫陷入局部最優(yōu)解的能力。

Nesterov Momentum是基于Momentum的加速算法,相比于傳統(tǒng)的動(dòng)量算法,最大的優(yōu)化是計(jì)算經(jīng)過(guò)動(dòng)量更新之后的位置梯度。

Adagrad即adaptive gradient,是一種自適應(yīng)學(xué)習(xí)率的梯度法。它通過(guò)記錄并調(diào)整每次迭代過(guò)程中的前進(jìn)方向和距離,使得針對(duì)不同問(wèn)題都有一套自適應(yīng)學(xué)習(xí)率的方法。Adagrad最大的優(yōu)勢(shì)是不需要手動(dòng)來(lái)調(diào)整學(xué)習(xí)率,但與此同時(shí)會(huì)降低學(xué)習(xí)率。

Adam即Adaptive Moment Estimation,是能夠自適應(yīng)時(shí)刻的估計(jì)方法,能夠針對(duì)每個(gè)參數(shù),計(jì)算自適應(yīng)學(xué)習(xí)率。這是一種綜合性的優(yōu)化方法,在機(jī)器學(xué)習(xí)實(shí)際訓(xùn)練中,往往能夠取得不錯(cuò)的效果。

(3)牛頓法和擬牛頓法

與上述梯度類(lèi)型的優(yōu)化算法最大的不同是,牛頓法是一種二階收斂算法,所以它的收斂速度相較于一階算法會(huì)更快。牛頓法二階的意義在于它不僅會(huì)沿著梯度最大的方向下降,還會(huì)考慮走的下一步坡度是不是也很大,它能夠以較遠(yuǎn)的目光全局的逼近目標(biāo)函數(shù)。其算法的具體步驟為:

1)首先選擇接近于函數(shù)f(x)的零點(diǎn)x0,并計(jì)算f(x0)處的斜率f’(x0)。然后我們求解以下方程,得到比剛剛的x0更加準(zhǔn)確的解x1。

2)接下來(lái)我們利用x1進(jìn)行下一輪的迭代,迭代公式如下所示。這樣經(jīng)過(guò)反復(fù)的迭代過(guò)程,我們便能取得函數(shù)f(x)的最優(yōu)解。

介紹機(jī)器學(xué)習(xí)中常用的三種優(yōu)化算法

牛頓法的迭代示意圖如下所示:

介紹機(jī)器學(xué)習(xí)中常用的三種優(yōu)化算法

圖2 牛頓法

雖然牛頓法相較于梯度下降法等優(yōu)化算法收斂速度更快,但每一步都需要求解復(fù)雜的Hessian矩陣,計(jì)算非常不易。所以后來(lái)美國(guó)Argonne國(guó)家實(shí)驗(yàn)室的物理學(xué)家W.C.Davidon又針對(duì)牛頓法計(jì)算復(fù)雜的缺陷提出了擬牛頓法。它的核心思想是使用正定矩陣來(lái)近似Hessian矩陣的逆,從而簡(jiǎn)化了運(yùn)算的復(fù)雜。另外,因?yàn)閿M牛頓法不需要二階導(dǎo)數(shù)的信息,所以現(xiàn)在擬牛頓法在機(jī)器學(xué)習(xí)實(shí)際問(wèn)題中應(yīng)用更加的廣泛。

【總結(jié)】:除了以上幾類(lèi)較為常見(jiàn)的優(yōu)化算法以外,還有共軛梯度法、啟發(fā)式優(yōu)化算法等。在實(shí)際的機(jī)器學(xué)習(xí)問(wèn)題中,往往需要具體問(wèn)題具體分析,根據(jù)每類(lèi)優(yōu)化問(wèn)題的特征,選擇合適的優(yōu)化算法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4786

    瀏覽量

    98231
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8558

    瀏覽量

    137069
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    請(qǐng)問(wèn)CW32芯片的三種工作模式是什么?

    CW32芯片的三種工作模式是什么?
    發(fā)表于 12-26 06:48

    單片機(jī)開(kāi)發(fā)中常用三種軟件架構(gòu)介紹

    消息的顯示} 4.事件驅(qū)動(dòng)架構(gòu)事件驅(qū)動(dòng)架構(gòu)是一編程范式,其中程序的執(zhí)行流程由事件(如用戶(hù)輸入、傳感器變化、定時(shí)器到期等)觸發(fā)。 在單片機(jī)開(kāi)發(fā)中,事件驅(qū)動(dòng)架構(gòu)通常用于響應(yīng)外部硬件中斷或軟件中斷。 以下
    發(fā)表于 11-26 08:05

    8常用的CRC算法分享

    CRC 計(jì)算單元可按所選擇的算法和參數(shù)配置來(lái)生成數(shù)據(jù)流的 CRC 碼。有些應(yīng)用中,可利用 CRC 技術(shù)來(lái)驗(yàn)證數(shù)據(jù)的傳輸和存儲(chǔ)的完整性。 8 常用的 CRC 算法,包括: CRC16_
    發(fā)表于 11-13 07:25

    量子機(jī)器學(xué)習(xí)入門(mén):三種數(shù)據(jù)編碼方法對(duì)比與應(yīng)用

    在傳統(tǒng)機(jī)器學(xué)習(xí)中數(shù)據(jù)編碼確實(shí)相對(duì)直觀:獨(dú)熱編碼處理類(lèi)別變量,標(biāo)準(zhǔn)化調(diào)整數(shù)值范圍,然后直接輸入模型訓(xùn)練。整個(gè)過(guò)程更像是數(shù)據(jù)清洗,而非核心算法組件。量子機(jī)器
    的頭像 發(fā)表于 09-15 10:27 ?816次閱讀
    量子<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>入門(mén):<b class='flag-5'>三種</b>數(shù)據(jù)編碼方法對(duì)比與應(yīng)用

    AI 驅(qū)動(dòng)維逆向:點(diǎn)云降噪算法工具與機(jī)器學(xué)習(xí)建模能力的前沿應(yīng)用

    維逆向工程領(lǐng)域,傳統(tǒng)方法在處理復(fù)雜數(shù)據(jù)和構(gòu)建高精度模型時(shí)面臨諸多挑戰(zhàn)。隨著人工智能(AI)技術(shù)的發(fā)展,點(diǎn)云降噪算法工具與機(jī)器學(xué)習(xí)建模能力的應(yīng)用,為
    的頭像 發(fā)表于 08-20 10:00 ?750次閱讀
    AI 驅(qū)動(dòng)<b class='flag-5'>三</b>維逆向:點(diǎn)云降噪<b class='flag-5'>算法</b>工具與<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>建模能力的前沿應(yīng)用

    三種SPWM波形生成算法的分析與實(shí)現(xiàn)

    摘要:變頻技術(shù)作為現(xiàn)代電力電子的核心技術(shù),集現(xiàn)代電子、信息和智能技術(shù)于一體。而SPW(正弦波脈寬調(diào)制)波的產(chǎn)生和控制則是變頻技術(shù)的核心之一。本文對(duì)SPI波形生成的三種算法-對(duì)稱(chēng)規(guī)則采樣法、不對(duì)稱(chēng)規(guī)則
    發(fā)表于 07-31 13:34

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    ,越來(lái)越多地被應(yīng)用于機(jī)器學(xué)習(xí)任務(wù)中。本文將探討 FPGA 在機(jī)器學(xué)習(xí)中的應(yīng)用,特別是在加速神經(jīng)網(wǎng)絡(luò)推理、優(yōu)化
    的頭像 發(fā)表于 07-16 15:34 ?2963次閱讀

    MEMS中的三種測(cè)溫方式

    在集成MEMS芯片的環(huán)境溫度測(cè)量領(lǐng)域,熱阻、熱電堆和PN結(jié)原理是三種主流技術(shù)。熱阻是利用熱敏電阻,如金屬鉑或注入硅的溫度電阻系數(shù)恒定,即電阻隨溫度線(xiàn)性變化的特性測(cè)溫,電阻變化直接對(duì)應(yīng)絕對(duì)溫度,需恒流源供電。
    的頭像 發(fā)表于 07-16 13:58 ?1723次閱讀
    MEMS中的<b class='flag-5'>三種</b>測(cè)溫方式

    開(kāi)關(guān)電源三種控制模式:PWM/PFM/PSM

    摘要 本文詳細(xì)介紹了開(kāi)關(guān)電源的三種主要調(diào)制方式:PWM(脈沖寬度調(diào)制)、PFM(脈沖頻率調(diào)制)和PSM(脈沖跨周期調(diào)制)。PWM通過(guò)調(diào)整脈沖寬度保持恒定頻率,適用于重負(fù)載,但輕負(fù)載效率低。PFM則在
    發(fā)表于 06-09 16:11

    HarmonyOS基礎(chǔ)組件:Button三種類(lèi)型的使用

    中的Button相較于Android原生來(lái)說(shuō),功能比較豐富,擴(kuò)展性高,減少了開(kāi)發(fā)者的代碼數(shù)量,簡(jiǎn)化了使用方式。不僅可以自定義圓角還支持三種樣式。 常用屬性 名稱(chēng) 參數(shù)類(lèi)型 描述 type
    的頭像 發(fā)表于 06-09 15:48 ?2643次閱讀
    HarmonyOS基礎(chǔ)組件:Button<b class='flag-5'>三種</b>類(lèi)型的使用

    介紹三種常見(jiàn)的MySQL高可用方案

    在生產(chǎn)環(huán)境中,為了確保數(shù)據(jù)庫(kù)系統(tǒng)的連續(xù)可用性、降低故障恢復(fù)時(shí)間以及實(shí)現(xiàn)業(yè)務(wù)的無(wú)縫切換,高可用(High Availability, HA)方案至關(guān)重要。本文將詳細(xì)介紹三種常見(jiàn)的 MySQL 高可用
    的頭像 發(fā)表于 05-28 17:16 ?1302次閱讀

    【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】視覺(jué)實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    : 一、機(jī)器人視覺(jué):從理論到實(shí)踐 第7章詳細(xì)介紹了ROS2在機(jī)器視覺(jué)領(lǐng)域的應(yīng)用,涵蓋了相機(jī)標(biāo)定、OpenCV集成、視覺(jué)巡線(xiàn)、二維碼識(shí)別以及深度學(xué)習(xí)目標(biāo)檢測(cè)等內(nèi)容。通過(guò)
    發(fā)表于 05-03 19:41

    雙極型極管放大電路的三種基本組態(tài)的學(xué)習(xí)課件免費(fèi)下載

      本文檔的主要內(nèi)容詳細(xì)介紹的是雙極型極管放大電路的三種基本組態(tài)的學(xué)習(xí)課件免費(fèi)下載包括了:共集電極放大電路,共基極放大電路,三種基本組態(tài)
    發(fā)表于 04-11 16:39 ?37次下載

    redis三種集群方案詳解

    在Redis中提供的集群方案總共有三種(一般一個(gè)redis節(jié)點(diǎn)不超過(guò)10G內(nèi)存)。
    的頭像 發(fā)表于 03-31 10:46 ?1579次閱讀
    redis<b class='flag-5'>三種</b>集群方案詳解

    CMOS,Bipolar,F(xiàn)ET這三種工藝的優(yōu)缺點(diǎn)是什么?

    在我用photodiode工具選型I/V放大電路的時(shí)候,系統(tǒng)給我推薦了AD8655用于I/V,此芯片為CMOS工藝 但是查閱資料很多都是用FET工藝的芯片,所以請(qǐng)教下用于光電信號(hào)放大轉(zhuǎn)換(主要考慮信噪比和帶寬)一般我們用哪種工藝的芯片, CMOS,Bipolar,F(xiàn)ET這三種工藝的優(yōu)缺點(diǎn)是什么?
    發(fā)表于 03-25 06:23