資料介紹
強(qiáng)化學(xué)習(xí)是人工智能領(lǐng)域中的一個(gè)研究熱點(diǎn)。在求解強(qiáng)化學(xué)習(xí)問題時(shí),傳統(tǒng)的最小二乘法作為一類特殊的函數(shù)逼近學(xué)習(xí)方法,具有收斂速度快、充分利用樣本數(shù)據(jù)的優(yōu)勢(shì)。通過對(duì)最小二乘時(shí)序差分算法( Least-squares Temporal DifferenceLSTD)的研究與分析,并以該方法為基礎(chǔ)提出了雙權(quán)重最小二乘 Sarsa算法( Double Weights With Least Squares Sarsa,DWLSrsa)。 Dwls-sarsa算法將兩權(quán)重通過一定方式進(jìn)行關(guān)聯(lián)得到目標(biāo)權(quán)重,并利用 Sarsa方法對(duì)時(shí)序差分誤差進(jìn)行控制。在算法訓(xùn)練過程中,兩權(quán)重會(huì)因?yàn)楦聵颖镜牟煌a(chǎn)生不同的值,保證了算法可以有效地進(jìn)行探索;兩權(quán)重也會(huì)因?yàn)闃颖緮?shù)據(jù)的分布而逐漸縮小之間的差距直到收斂至同一最優(yōu)值,確保了算法的收斂性能。最后將DwLS- Sarsa算法與其他強(qiáng)化學(xué)習(xí)算法進(jìn)行實(shí)驗(yàn)對(duì)比,結(jié)果表明 Dwls-sarsa算法具有較優(yōu)的學(xué)習(xí)性能與魯棒性,可以有效地處理局部最優(yōu)問題并提高算法收斂時(shí)的表現(xiàn)效果。
- 一種新型的多智能體深度強(qiáng)化學(xué)習(xí)算法 36次下載
- 機(jī)器學(xué)習(xí)中的無模型強(qiáng)化學(xué)習(xí)算法及研究綜述 11次下載
- 增量式約簡最小二乘孿生攴持向量回歸機(jī)算法 15次下載
- 最小二乘修正的隨機(jī)Hough變換直線檢測(cè) 1次下載
- 【智能控制】最小二乘參數(shù)辨識(shí)方法及原理 0次下載
- 最小二乘法_(C語言) 17次下載
- 基于遞推總體最小二乘的北斗T_R_n型被動(dòng)雷達(dá)定位_李文超 0次下載
- 改進(jìn)遞歸最小二乘RBF神經(jīng)網(wǎng)絡(luò)溶解氧預(yù)測(cè)_袁紅春 1次下載
- 偏最小二乘回歸在氣溫預(yù)測(cè)中的研究與應(yīng)用汪春輝 0次下載
- 類最小二乘調(diào)度與控制的耦合設(shè)計(jì)_趙順利 0次下載
- 永磁同步電機(jī)雙率殘差增廣最小二乘參數(shù)辨識(shí) 0次下載
- 基于空間響應(yīng)偏差約束的最小二乘寬帶波束形成 0次下載
- 算法大全_偏最小二乘回歸 0次下載
- 基于最小二乘法的K-NN航跡關(guān)聯(lián)算法研究
- 基于子空間的線性約束最小二乘恒模算法
- 使用最小二乘法解決曲線擬合問題 1273次閱讀
- Python實(shí)現(xiàn)最小二乘法是什么 987次閱讀
- 淺談時(shí)序差分的在線控制算法—SARSA 2306次閱讀
- 懶惰強(qiáng)化學(xué)習(xí)算法在發(fā)電調(diào)控REG框架的應(yīng)用 936次閱讀
- 對(duì)NAS任務(wù)中強(qiáng)化學(xué)習(xí)的效率進(jìn)行深入思考 5086次閱讀
- 量化深度強(qiáng)化學(xué)習(xí)算法的泛化能力 2423次閱讀
- 如何構(gòu)建強(qiáng)化學(xué)習(xí)模型來訓(xùn)練無人車算法 4911次閱讀
- 基于強(qiáng)化學(xué)習(xí)的MADDPG算法原理及實(shí)現(xiàn) 2.1w次閱讀
- 基于目標(biāo)圖像的視覺強(qiáng)化學(xué)習(xí)算法,讓機(jī)器人可以同時(shí)學(xué)習(xí)多個(gè)任務(wù) 7076次閱讀
- 用PopArt進(jìn)行多任務(wù)深度強(qiáng)化學(xué)習(xí) 5699次閱讀
- 強(qiáng)化學(xué)習(xí)和監(jiān)督式學(xué)習(xí), 非監(jiān)督式學(xué)習(xí)的區(qū)別 2w次閱讀
- 什么是強(qiáng)化學(xué)習(xí)?純強(qiáng)化學(xué)習(xí)有意義嗎?強(qiáng)化學(xué)習(xí)有什么的致命缺陷? 1.7w次閱讀
- Q Learning算法學(xué)習(xí) 3693次閱讀
- 一種新型的強(qiáng)化學(xué)習(xí)算法,能夠教導(dǎo)算法如何在沒有人類協(xié)助的情況下解開魔方 3869次閱讀
- 強(qiáng)化學(xué)習(xí)究竟是什么?它與機(jī)器學(xué)習(xí)技術(shù)有什么聯(lián)系? 1.4w次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1491次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 95次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關(guān)電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費(fèi)
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于單片機(jī)和 SG3525的程控開關(guān)電源設(shè)計(jì)
- 0.23 MB | 4次下載 | 免費(fèi)
- 8基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537793次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論