chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

介紹機器學習中常用的三種優(yōu)化算法

汽車玩家 ? 來源:人工智能遇見磐創(chuàng) ? 作者:Walker ? 2020-05-04 18:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文主要介紹了常用的一些機器學習中常用的優(yōu)化算法。

在機器學習的世界中,通常我們會發(fā)現(xiàn)有很多問題并沒有最優(yōu)的解,或是要計算出最優(yōu)的解要花費很大的計算量,面對這類問題一般的做法是利用迭代的思想盡可能的逼近問題的最優(yōu)解。我們把解決此類優(yōu)化問題的方法叫做優(yōu)化算法,優(yōu)化算法本質上是一種數(shù)學方法,常見的優(yōu)化算法包括梯度下降法、牛頓法、Momentum,Nesterov Momentum,Adagrad,Adam等。其實大部分機器學習算法的本質都是建立優(yōu)化模型,通過優(yōu)化算法對損失函數(shù)(優(yōu)化的目標函數(shù))進行優(yōu)化,從而訓練出最好的模型。

(1)梯度下降法

梯度下降法是最常用的一種優(yōu)化算法。其核心思想是:在當前位置尋找梯度下降最快的方向,來逐漸逼近優(yōu)化的目標函數(shù)。且離目標函數(shù)越近,逼近的“步伐”也就越小。梯度下降法本質是一種迭代方法,常用于機器學習算法的模型參數(shù)求解。其示意圖如下圖1所示:

圖1梯度下降法

梯度下降法的更新公式為:

介紹機器學習中常用的三種優(yōu)化算法

其中α為梯度上每次逼近的步長,前邊的“-”表示搜索方向為負梯度的方向,L我損失函數(shù)。算法更新終止的條件是梯度向量接近于0即可。此外需要特別注意的是,梯度下降法不一定能夠找到全局的最優(yōu)解,很有可能找到的是一個局部最優(yōu)解。

(2)梯度下降法的變式

通?;谔荻鹊南陆捣椒ㄓ钟泻芏嘧兪剑覀冎饕獮榇蠹医榻B:隨機梯度下降法(SGD), Momentum, Nesterov Momentum, Adagrad, Adam。

隨機梯度下降法是每次使用一批數(shù)據(jù)進行梯度的計算,而非計算全部數(shù)據(jù)的梯度,因為如果每次計算全部數(shù)據(jù)的梯度,會導致運算量加大,運算時間變長,容易陷入局部最優(yōu)解,而隨機梯度下降可能每次不是朝著真正最小的方向,這樣反而可以跳出局部的最優(yōu)解。

Momentum是在隨機梯度下降法的基礎上,增加了動量(Momentum)的技術。其核心是通過優(yōu)化相關方向的訓練和弱化無關方向的振蕩,來加速SGD訓練。Momentum的方法能夠在一定程度上緩解隨機梯度下降法收斂不穩(wěn)定的問題,并且有一定的擺脫陷入局部最優(yōu)解的能力。

Nesterov Momentum是基于Momentum的加速算法,相比于傳統(tǒng)的動量算法,最大的優(yōu)化是計算經(jīng)過動量更新之后的位置梯度。

Adagrad即adaptive gradient,是一種自適應學習率的梯度法。它通過記錄并調(diào)整每次迭代過程中的前進方向和距離,使得針對不同問題都有一套自適應學習率的方法。Adagrad最大的優(yōu)勢是不需要手動來調(diào)整學習率,但與此同時會降低學習率。

Adam即Adaptive Moment Estimation,是能夠自適應時刻的估計方法,能夠針對每個參數(shù),計算自適應學習率。這是一種綜合性的優(yōu)化方法,在機器學習實際訓練中,往往能夠取得不錯的效果。

(3)牛頓法和擬牛頓法

與上述梯度類型的優(yōu)化算法最大的不同是,牛頓法是一種二階收斂算法,所以它的收斂速度相較于一階算法會更快。牛頓法二階的意義在于它不僅會沿著梯度最大的方向下降,還會考慮走的下一步坡度是不是也很大,它能夠以較遠的目光全局的逼近目標函數(shù)。其算法的具體步驟為:

1)首先選擇接近于函數(shù)f(x)的零點x0,并計算f(x0)處的斜率f’(x0)。然后我們求解以下方程,得到比剛剛的x0更加準確的解x1。

2)接下來我們利用x1進行下一輪的迭代,迭代公式如下所示。這樣經(jīng)過反復的迭代過程,我們便能取得函數(shù)f(x)的最優(yōu)解。

介紹機器學習中常用的三種優(yōu)化算法

牛頓法的迭代示意圖如下所示:

介紹機器學習中常用的三種優(yōu)化算法

圖2 牛頓法

雖然牛頓法相較于梯度下降法等優(yōu)化算法收斂速度更快,但每一步都需要求解復雜的Hessian矩陣,計算非常不易。所以后來美國Argonne國家實驗室的物理學家W.C.Davidon又針對牛頓法計算復雜的缺陷提出了擬牛頓法。它的核心思想是使用正定矩陣來近似Hessian矩陣的逆,從而簡化了運算的復雜。另外,因為擬牛頓法不需要二階導數(shù)的信息,所以現(xiàn)在擬牛頓法在機器學習實際問題中應用更加的廣泛。

【總結】:除了以上幾類較為常見的優(yōu)化算法以外,還有共軛梯度法、啟發(fā)式優(yōu)化算法等。在實際的機器學習問題中,往往需要具體問題具體分析,根據(jù)每類優(yōu)化問題的特征,選擇合適的優(yōu)化算法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4710

    瀏覽量

    95405
  • 機器學習
    +關注

    關注

    66

    文章

    8503

    瀏覽量

    134635
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    HarmonyOS基礎組件:Button三種類型的使用

    中的Button相較于Android原生來說,功能比較豐富,擴展性高,減少了開發(fā)者的代碼數(shù)量,簡化了使用方式。不僅可以自定義圓角還支持三種樣式。 常用屬性 名稱 參數(shù)類型 描述 type
    的頭像 發(fā)表于 06-09 15:48 ?263次閱讀
    HarmonyOS基礎組件:Button<b class='flag-5'>三種</b>類型的使用

    介紹三種常見的MySQL高可用方案

    在生產(chǎn)環(huán)境中,為了確保數(shù)據(jù)庫系統(tǒng)的連續(xù)可用性、降低故障恢復時間以及實現(xiàn)業(yè)務的無縫切換,高可用(High Availability, HA)方案至關重要。本文將詳細介紹三種常見的 MySQL 高可用
    的頭像 發(fā)表于 05-28 17:16 ?386次閱讀

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎算法的應用

    : 一、機器人視覺:從理論到實踐 第7章詳細介紹了ROS2在機器視覺領域的應用,涵蓋了相機標定、OpenCV集成、視覺巡線、二維碼識別以及深度學習目標檢測等內(nèi)容。通過
    發(fā)表于 05-03 19:41

    雙極型極管放大電路的三種基本組態(tài)的學習課件免費下載

      本文檔的主要內(nèi)容詳細介紹的是雙極型極管放大電路的三種基本組態(tài)的學習課件免費下載包括了:共集電極放大電路,共基極放大電路,三種基本組態(tài)
    發(fā)表于 04-11 16:39 ?26次下載

    VirtualLab Fusion應用:參數(shù)優(yōu)化文檔介紹

    摘要 VirtualLab Fusion的參數(shù)優(yōu)化文檔使用戶能夠為其光學裝置應用非線性優(yōu)化算法。該文檔指導您完成優(yōu)化配置并最終輸出結果。這個用例解釋了參數(shù)
    發(fā)表于 02-28 08:44

    機器學習模型市場前景如何

    當今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機器
    的頭像 發(fā)表于 02-13 09:39 ?365次閱讀

    示波器的三種觸發(fā)模式

    示波器的觸發(fā)方式不僅影響波形捕捉的時機,還決定了顯示的波形是否穩(wěn)定。 常見的觸發(fā)模式有三種: 單次觸發(fā) (Single)、 正常觸發(fā) (Normal)和 自動觸發(fā) (Auto)。下面將對這三種觸發(fā)
    的頭像 發(fā)表于 01-07 11:04 ?7706次閱讀
    示波器的<b class='flag-5'>三種</b>觸發(fā)模式

    華為云 Flexus X 實例部署安裝 Jupyter Notebook,學習 AI,機器學習算法

    前言 由于本人最近在學習一些機器算法,AI 算法的知識,需要搭建一個學習環(huán)境,所以就在最近購買的華為云 Flexus X 實例上安裝了
    的頭像 發(fā)表于 01-02 13:43 ?539次閱讀
    華為云 Flexus X 實例部署安裝 Jupyter Notebook,<b class='flag-5'>學習</b> AI,<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b>

    傳統(tǒng)機器學習方法和應用指導

    在上一篇文章中,我們介紹機器學習的關鍵概念術語。在本文中,我們會介紹傳統(tǒng)機器學習的基礎知識和多
    的頭像 發(fā)表于 12-30 09:16 ?1192次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一專門為深度
    的頭像 發(fā)表于 11-15 09:19 ?1224次閱讀

    Windows管理內(nèi)存的三種主要方式

    Windows操作系統(tǒng)提供了多種方式來管理內(nèi)存,以確保系統(tǒng)資源的有效利用和性能的優(yōu)化。以下是關于Windows管理內(nèi)存的三種主要方式的詳細闡述,包括堆內(nèi)存管理、虛擬內(nèi)存管理以及共享內(nèi)存管理,每種方式都將從概念、原理、運作機制和應用等方面進行
    的頭像 發(fā)表于 10-12 17:09 ?2389次閱讀

    mosfet的三種工作狀態(tài)及工作條件是什么

    的工作狀態(tài)及工作條件對于理解和設計相關電路至關重要。以下是MOSFET的三種主要工作狀態(tài)及其工作條件的介紹。 一、MOSFET的三種工作狀態(tài) MOSFET根據(jù)其柵源電壓(VGS)和漏源電壓(VDS
    的頭像 發(fā)表于 10-06 16:51 ?6224次閱讀

    干貨!恒流電路常用三種設計方案

    作為硬件研發(fā)工程師相信對恒流電路不會陌生,本文介紹三種恒流電路的原理圖。 極管恒流電路 極管恒流電路 極管的恒流電路,主要是利用Q
    發(fā)表于 09-09 10:40

    常用的pwm跟蹤控制方式是哪三種

    PWM(脈寬調(diào)制)跟蹤控制是一廣泛應用于電機控制、電源管理、通信等領域的技術。它通過調(diào)整脈沖的寬度來控制輸出信號的占空比,從而實現(xiàn)對系統(tǒng)的精確控制。常用的PWM跟蹤控制方式主要有三種:增量式PWM
    的頭像 發(fā)表于 08-14 10:34 ?2601次閱讀

    請問IR900NAT配置常用三種情景是什么?

    IR900NAT配置常用三種情景
    發(fā)表于 07-26 07:02