chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開辟新篇章!谷歌機(jī)器學(xué)習(xí)又有新進(jìn)展!

DR2b_Aiobservat ? 來源:YXQ ? 2019-06-22 11:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在谷歌最新的論文中,研究人員提出了“非政策強(qiáng)化學(xué)習(xí)”算法OPC,它是強(qiáng)化學(xué)習(xí)的一種變體,它能夠評估哪種機(jī)器學(xué)習(xí)模型將產(chǎn)生最好的結(jié)果。數(shù)據(jù)顯示,OPC比基線機(jī)器學(xué)習(xí)算法有著顯著的提高,更加穩(wěn)健可靠。

在谷歌AI研究團(tuán)隊一篇新發(fā)表的論文《通過非政策分類進(jìn)行非政策評估》(Off-PolicyEvaluation via Off-Policy Classification)和博客文章中,他們提出了所稱的“非政策分類”,即OPC(off-policy classification)。它能夠評估AI的表現(xiàn),通過將評估視為一個分類問題來驅(qū)動代理性能。

研究人員認(rèn)為他們的方法是強(qiáng)化學(xué)習(xí)的一種變體,它利用獎勵來推動軟件政策實現(xiàn)與圖像輸入?yún)f(xié)同工作這個目標(biāo),并擴(kuò)展到包括基于視覺的機(jī)器人抓取在內(nèi)的任務(wù)。

“完全脫離政策強(qiáng)化學(xué)習(xí)是一種變體。代理完全從舊數(shù)據(jù)中學(xué)習(xí),對于工程師來說這是很有吸引力的,因為它可以在不需要物理機(jī)器人的情況下進(jìn)行模型迭代?!?/p>

Robotics at Google(專注機(jī)器學(xué)的的谷歌新團(tuán)隊)的軟件工程師Alexa Irpan寫道,“完全脫離政策的RL,可以在先前代理收集的同一固定數(shù)據(jù)集上訓(xùn)練多個模型,然后選擇出最佳的那個模型?!?/p>

但是OPC并不像聽起來那么容易,正如Irpan在論文中所描述的,非政策性強(qiáng)化學(xué)習(xí)可以通過機(jī)器人進(jìn)行人工智能模型培訓(xùn),但不能進(jìn)行評估。并且在需要評估大量模型的方法中,地面實況評估通常效率太低。

OPC在假設(shè)任務(wù)狀態(tài)變化方面幾乎沒有隨機(jī)性,同時假設(shè)代理在實驗結(jié)束時用“成功或失敗”來解決這個問題。兩個假設(shè)中第二個假設(shè)的二元性質(zhì),允許為每個操作分配兩個分類標(biāo)簽(“有效”表示成功或“災(zāi)難性”表示失敗)。

另外,OPC還依賴Q函數(shù)(通過Q學(xué)習(xí)算法學(xué)習(xí))來估計行為的未來總回報。代理商選擇具有最大預(yù)期回報的行動,其績效通過所選行動的有效頻率來衡量(這取決于Q函數(shù)如何正確地將行動分類為有效與災(zāi)難性),并以分類準(zhǔn)確性作為非政策評估分?jǐn)?shù)。

(左圖為基線,右圖為建議的方法之一,SoftOpC)

谷歌AI團(tuán)隊使用完全非策略強(qiáng)化學(xué)習(xí)對機(jī)器學(xué)習(xí)策略進(jìn)行了模擬培訓(xùn),然后使用從以前的實際數(shù)據(jù)中列出的非策略分?jǐn)?shù)對其進(jìn)行評估。

在機(jī)器人抓取任務(wù)時,他們報告OPC的一種變體SoftOPC在預(yù)測最終成功率方面表現(xiàn)最佳。假設(shè)有15種模型(其中7種純粹在模擬中訓(xùn)練)具有不同的穩(wěn)健性,SoftOPC產(chǎn)生的分?jǐn)?shù)與與真正的抓取成功密切相關(guān),并且相比于基線方法更加穩(wěn)定可靠。

在未來的研究中,研究人員打算用“噪聲”(noisier)和非二進(jìn)制動力學(xué)來探索機(jī)器學(xué)習(xí)任務(wù)。“我們認(rèn)為這個結(jié)果有希望應(yīng)用于許多現(xiàn)實世界的RL問題,”Irpan在論文結(jié)尾寫道。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6246

    瀏覽量

    110313
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8541

    瀏覽量

    136264
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    立訊精密披露在人形機(jī)器人領(lǐng)域的最新進(jìn)展

    11月26日,立訊精密在最新的投資者關(guān)系活動記錄中披露了在人形機(jī)器人領(lǐng)域的最新進(jìn)展。
    的頭像 發(fā)表于 12-03 14:50 ?578次閱讀

    廣汽集團(tuán)與華為數(shù)字能源開啟深度協(xié)同新篇章

    和充電表現(xiàn)、整車駕乘體驗提升,圍繞動力域相關(guān)系統(tǒng)和整車產(chǎn)品的設(shè)計、制造、銷售服務(wù)展開深入合作,開啟深度協(xié)同新篇章。
    的頭像 發(fā)表于 11-11 15:22 ?301次閱讀

    西班牙工程與技術(shù)公司攜手FLIR開啟高溫檢測新篇章

    在鋼鐵制造這一傳統(tǒng)而充滿挑戰(zhàn)的領(lǐng)域,高溫與惡劣環(huán)境如同兩道難以逾越的鴻溝,橫亙在提升生產(chǎn)效率與質(zhì)量的道路上。然而,西班牙工程與技術(shù)先鋒BcB Informatica y Control攜手Flir公司,構(gòu)建了創(chuàng)新的技術(shù)解決方案,正為這一行業(yè)注入智能化升級的新動力,開啟高溫檢測的新篇章。
    的頭像 發(fā)表于 11-02 11:37 ?632次閱讀

    云臺電機(jī)驅(qū)動:開啟智能化時代的新篇章

    在科技飛速發(fā)展的今天,智能化已經(jīng)滲透到我們生活的方方面面。而在眾多科技領(lǐng)域中,云臺電機(jī)驅(qū)動技術(shù)正以其獨(dú)特的魅力,開啟著智能化時代的新篇章。
    的頭像 發(fā)表于 07-23 18:16 ?742次閱讀

    東風(fēng)汽車轉(zhuǎn)型突破取得新進(jìn)展

    上半年,東風(fēng)汽車堅定高質(zhì)量發(fā)展步伐,整體銷量逐月回升,經(jīng)營質(zhì)量持續(xù)改善,自主品牌和新能源滲透率和收益性進(jìn)一步提升,半年累計終端銷售汽車111.6萬輛,轉(zhuǎn)型突破取得新進(jìn)展。
    的頭像 發(fā)表于 07-10 15:29 ?762次閱讀

    編碼器線:精準(zhǔn)連接,高效傳動,引領(lǐng)科技新篇章

    在日新月異的科技時代,每一個微小的進(jìn)步都可能成為推動行業(yè)變革的關(guān)鍵。編碼器線,這一看似不起眼的組件,卻在自動化、智能制造、機(jī)器人技術(shù)等眾多高科技領(lǐng)域中扮演著至關(guān)重要的角色。今天,就讓我們一起走進(jìn)編碼器線的世界,探索它如何以精準(zhǔn)連接和高效傳動,引領(lǐng)科技新篇章。
    的頭像 發(fā)表于 06-27 16:57 ?770次閱讀

    恭賀全球購檢測榮獲CBTL資質(zhì),邁向國際檢測認(rèn)證新篇章

    恭賀全球通檢測榮獲CBTL資質(zhì)!邁向國際檢測認(rèn)證新篇章賦能中國企業(yè)全球化近日,中國檢測認(rèn)證領(lǐng)域迎來里程碑時刻——全球通檢測(GlobalTestingServices)正式通過國際電工
    的頭像 發(fā)表于 05-27 10:41 ?405次閱讀
    恭賀全球購檢測榮獲CBTL資質(zhì),邁向國際檢測認(rèn)證<b class='flag-5'>新篇章</b>!

    百度在AI領(lǐng)域的最新進(jìn)展

    近日,我們在武漢舉辦了Create2025百度AI開發(fā)者大會,與全球各地的5000多名開發(fā)者,分享了百度在AI領(lǐng)域的新進(jìn)展
    的頭像 發(fā)表于 04-30 10:14 ?1112次閱讀

    松下攜手深圳廣電集團(tuán)開啟視聽傳播新篇章

    在2025年深圳廣播電影電視集團(tuán)(以下簡稱“深圳廣電集團(tuán)”)的4K超高清采購項目中,松下憑借卓越的技術(shù)實力與豐富的行業(yè)經(jīng)驗,成功中標(biāo)“新聞演播室群”、“外拍設(shè)備”等核心項目,標(biāo)志著松下的新媒體技術(shù)與專業(yè)視音頻產(chǎn)品在深圳廣電集團(tuán)實現(xiàn)了全面落地應(yīng)用,雙方攜手開啟視聽傳播新篇章。
    的頭像 發(fā)表于 04-15 15:16 ?836次閱讀

    谷歌Gemini API最新進(jìn)展

    體驗的 Live API 的最新進(jìn)展,以及正式面向開發(fā)者開放的高質(zhì)量視頻生成工具 Veo 2。近期,我們面向在 Google AI Studio 中使用 Gemini API 的開發(fā)者推出了許多不容錯過的重要更新,一起來看看吧。
    的頭像 發(fā)表于 04-12 16:10 ?1486次閱讀

    華為公布AI基礎(chǔ)設(shè)施架構(gòu)突破性新進(jìn)展

    近日,華為公司常務(wù)董事、華為云計算CEO張平安在華為云生態(tài)大會2025上公布了AI基礎(chǔ)設(shè)施架構(gòu)突破性新進(jìn)展——推出基于新型高速總線架構(gòu)的CloudMatrix 384超節(jié)點集群,并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線。
    的頭像 發(fā)表于 04-12 15:09 ?1711次閱讀

    國產(chǎn)首款量產(chǎn)型七位半萬用表!青島漢泰開啟國產(chǎn)高精度測量新篇章。

    國產(chǎn)首款量產(chǎn)型七位半萬用表!青島漢泰開啟國產(chǎn)高精度測量新篇章。 2025年3月18日,青島漢泰推出全新HDM3075系列7位半數(shù)字萬用表。HDM3075系列是國產(chǎn)首款實現(xiàn)量產(chǎn)的七位半萬用表產(chǎn)品,它
    發(fā)表于 04-01 13:15

    微軟攜手長虹佳華開啟AI視頻廣告行業(yè)新篇章

    近日,微軟重磅發(fā)布了新的AI視頻廣告解決方案,并與長虹佳華在AI視頻廣告領(lǐng)域達(dá)成戰(zhàn)略合作。雙方共同舉辦了“數(shù)智創(chuàng)翼,生態(tài)領(lǐng)航”戰(zhàn)略合作啟動儀式,攜手開啟廣告行業(yè)的新篇章。
    的頭像 發(fā)表于 02-26 11:06 ?1010次閱讀

    智慧路燈:點亮城市,智慧公交站臺開啟智慧新篇章

    智慧路燈:點亮城市,智慧公交站臺開啟智慧新篇章
    的頭像 發(fā)表于 02-11 13:40 ?688次閱讀
    智慧路燈:點亮城市,智慧公交站臺開啟智慧<b class='flag-5'>新篇章</b>

    FF將發(fā)布FX品牌最新進(jìn)展

    "、"FF"或 "公司")今天宣布,將于2025年1月8日盤后公布其自2024年9月19日FX品牌發(fā)布以來的最新進(jìn)展,包括最新項目進(jìn)展、重大里程碑、新產(chǎn)品品類戰(zhàn)略及下一步計劃。
    的頭像 發(fā)表于 01-03 15:58 ?985次閱讀