完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 強化學(xué)習(xí)
文章:225個 瀏覽:11894次 帖子:1個
復(fù)雜應(yīng)用中運用人工智能核心 強化學(xué)習(xí)
近期,有不少報道強化學(xué)習(xí)算法在 GO、Dota 2 和 Starcraft 2 等一系列游戲中打敗了專業(yè)玩家的新聞。強化學(xué)習(xí)是一種機器學(xué)習(xí)類型,能夠在電...
2020-07-27 標(biāo)簽:人工智能機器學(xué)習(xí)強化學(xué)習(xí) 1.2k 0
碾壓GPT-4!谷歌DeepMind CEO自曝:下一代大模型將與AlphaGo合體
一個是用強化學(xué)習(xí)擊敗人類圍棋冠軍、創(chuàng)造歷史的AI系統(tǒng),一個是目前霸榜幾乎所有大模型榜單、一騎絕塵的最強多模態(tài)大模型,兩個AI一合體,簡直要無敵了!
2023-07-04 標(biāo)簽:語言模型強化學(xué)習(xí)DeepMind 1.2k 0
Facebook開源Horizon主要是為了推進(jìn)AI強化學(xué)習(xí)的發(fā)展
11月1日,F(xiàn)acebook開源了Horizon,一個由Facebook的AI研究人員、推薦系統(tǒng)專家和工程師共同搭建的強化學(xué)習(xí)平臺,其框架的構(gòu)建工作開始...
2018-11-05 標(biāo)簽:AIFacebook強化學(xué)習(xí) 1.1k 0
MoDem解決了視覺強化學(xué)習(xí)領(lǐng)域的三個挑戰(zhàn)
他表示,僅給出5個演示,MoDem就能在100K交互步驟中解決具有稀疏獎勵和高維動作空間的具有挑戰(zhàn)性的視覺運動控制任務(wù),大大優(yōu)于現(xiàn)有的最先進(jìn)方法。
2023-01-05 標(biāo)簽:解碼器Meta強化學(xué)習(xí) 1.1k 0
微軟稱,帶有38億參數(shù)的phi-3-mini經(jīng)過3.3萬億token的強化學(xué)習(xí),其基礎(chǔ)表現(xiàn)已經(jīng)超過Mixtral 8x7B及GPT-3.5;此外,該模型...
2024-04-23 標(biāo)簽:微軟移動設(shè)備強化學(xué)習(xí) 1k 0
83篇文獻(xiàn)、萬字總結(jié)強化學(xué)習(xí)之路
深度強化學(xué)習(xí)是深度學(xué)習(xí)與強化學(xué)習(xí)相結(jié)合的產(chǎn)物,它集成了深度學(xué)習(xí)在視覺等感知問題上強大的理解能力,以及強化學(xué)習(xí)的決策能力,實現(xiàn)了...
2020-12-10 標(biāo)簽:人工智能強化學(xué)習(xí) 1k 0
靠強化學(xué)習(xí)來調(diào)整機器人假肢的系統(tǒng) 讓假肢更加靈活
來自北卡羅來納州立大和亞利桑那州立大學(xué)的研究人員開發(fā)了一種智能系統(tǒng),可以“調(diào)節(jié)”動力假肢膝蓋,讓患者在幾分鐘內(nèi)就能自如地使用假肢行走,而不是由訓(xùn)練有素的...
2019-04-05 標(biāo)簽:機器人智能機器人強化學(xué)習(xí) 998 0
特斯拉自動駕駛團(tuán)隊再受重挫,頂尖工程師Paril Jain離任,高層人事變動
數(shù)周內(nèi),特斯拉已在各部門實施多輪裁員。此外,還有報道顯示部分員工因士氣低落而選擇離司。種種跡象表明,特斯拉正面臨嚴(yán)重的人才流失問題。
2024-05-15 標(biāo)簽:特斯拉自動駕駛強化學(xué)習(xí) 982 0
谷歌AlphaChip強化學(xué)習(xí)工具發(fā)布,聯(lián)發(fā)科天璣芯片率先采用
近日,谷歌在芯片設(shè)計領(lǐng)域取得了重要突破,詳細(xì)介紹了其用于芯片設(shè)計布局的強化學(xué)習(xí)方法,并將該模型命名為“AlphaChip”。據(jù)悉,AlphaChip有望...
2024-09-30 標(biāo)簽:谷歌芯片設(shè)計強化學(xué)習(xí) 920 0
強化學(xué)習(xí)正在推進(jìn)AI應(yīng)用
就在幾年前,能夠感知周圍環(huán)境、識別重要細(xì)節(jié)——并忽略其余部分——然后利用這些細(xì)節(jié)來完成任務(wù)的技術(shù)應(yīng)用似乎還只是科幻小說中的內(nèi)容。
2022-12-30 標(biāo)簽:AI機器學(xué)習(xí)強化學(xué)習(xí) 797 0
近日,智譜公司正式發(fā)布了其深度推理模型GLM-Zero的預(yù)覽版——GLM-Zero-Preview。這款模型標(biāo)志著智譜在擴展強化學(xué)習(xí)技術(shù)訓(xùn)練推理模型方面...
2025-01-03 標(biāo)簽:模型強化學(xué)習(xí)智譜 755 0
適合初學(xué)者的神經(jīng)網(wǎng)絡(luò)理論到實踐(3):打破概念束縛:什么是強化學(xué)習(xí)?
專欄中《零神經(jīng)網(wǎng)絡(luò)實戰(zhàn)》系列持續(xù)更新介紹神經(jīng)元怎么工作,最后使用python從0到1不調(diào)用任何依賴神經(jīng)網(wǎng)絡(luò)框架(不使用tensorflow等框架)...
2020-12-10 標(biāo)簽:人工智能強化學(xué)習(xí) 625 0
換一批
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
| 電機控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
| BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
| 無刷電機 | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
| 直流電機 | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
| 步進(jìn)電機 | SPWM | 充電樁 | IPM | 機器視覺 | 無人機 | 三菱電機 | ST |
| 伺服電機 | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
| Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
| 示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
| OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
| C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
| Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
| DuerOS | Brillo | Windows11 | HarmonyOS |