chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能體如何應(yīng)對訓(xùn)練中故意碰瓷兒的“弱”對手呢?

倩倩 ? 來源:大數(shù)據(jù)文摘 ? 2020-01-02 15:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人們通常會派出最強(qiáng)大的選手和場景訓(xùn)練人工智能,但是,智能體如何應(yīng)對訓(xùn)練中故意碰瓷兒的“弱”對手呢?

來看看下邊的兩個場景:兩個AI智能體正在“訓(xùn)練場“進(jìn)行一場激烈的足球賽,一個守門、一個射門。當(dāng)守門員忽然自己摔倒,攻方?jīng)]有選擇乘勝追擊,也忽然不知所措了起來。

在相撲的規(guī)則下也一樣,當(dāng)其中一個隊(duì)員開始不按套路出牌時(shí),另一個對手也亂作一團(tuán),雙方立刻開始毫無規(guī)則扭打在一起。

這樣“人工智障”的場景可不是隨意配置的游戲,而是一項(xiàng)對AI對抗訓(xùn)練的研究。

我們知道,通常情況下,智能體都是通過相互對抗來訓(xùn)練的,無論是下圍棋的阿法狗還是玩星際爭霸的AlphaStar,都是通過海量的對局來訓(xùn)練自己的模型,從而探索出獲勝之道。

但是試想一下,如果給阿法狗的訓(xùn)練數(shù)據(jù)都是圍棋小白亂下的對局,給AlphaStar提供的是小學(xué)生局,結(jié)果會是如何?

近期,來自伯克利的研究人員就進(jìn)行了這樣的實(shí)驗(yàn)。紅色機(jī)器人與已經(jīng)是專家級別的藍(lán)色機(jī)器人進(jìn)行對抗訓(xùn)練,紅色機(jī)器人采取一定的對抗策略攻擊藍(lán)色機(jī)器人進(jìn)行的深度學(xué)習(xí)。這項(xiàng)研究的論文作者也在NIPS大會上對該研究進(jìn)行了展示。

論文鏈接:

https://arxiv.org/pdf/1905.10615.pdf

在實(shí)驗(yàn)中,紅色機(jī)器人為了不讓藍(lán)色機(jī)器人繼續(xù)從對抗中學(xué)習(xí),沒有按照應(yīng)有的方式玩游戲,而是開始“亂舞”起來,結(jié)果,藍(lán)色機(jī)器人開始玩得很糟糕,像喝醉了的海盜一樣來回?fù)u晃,輸?shù)舻挠螒驍?shù)量是正常情況下的兩倍。

研究發(fā)現(xiàn),在采取對抗性政策的對局中,獲勝不是努力成為一般意義上的強(qiáng)者,而是采取迷惑對手的行動。研究人員通過對對手行為的定性觀察來驗(yàn)證這一點(diǎn),并發(fā)現(xiàn)當(dāng)被欺騙的AI在對對手視而不見時(shí),其表現(xiàn)會有所改善。

我們都知道,讓人工智能變得更聰明的一個方法是讓它從環(huán)境中學(xué)習(xí),例如,未來的自動駕駛可能比人類更善于識別街道標(biāo)志和避開行人,因?yàn)樗鼈兛梢酝ㄟ^海量的視頻獲得更多的經(jīng)驗(yàn)。

但是如果有人利用這一方式進(jìn)行研究中所示的“對抗性攻擊” ——通過巧妙而精確地修改圖像,那么你就可以愚弄人工智能,讓它對圖像產(chǎn)生錯誤的理解。例如,在一個停車標(biāo)志上貼上幾個貼紙可能被視為限速標(biāo)志,同時(shí)這項(xiàng)新的研究也表明,人工智能不僅會被愚弄,看到不該看到的東西,還會以不該看到的方式行事。

這給基于深度學(xué)習(xí)的人工智能應(yīng)用敲響了一個警鐘,這種對抗性的攻擊可能會給自動駕駛、金融交易或產(chǎn)品推薦系統(tǒng)帶來現(xiàn)實(shí)問題。

論文指出,在這些安全關(guān)鍵型的系統(tǒng)中,像這樣的攻擊最受關(guān)注,標(biāo)準(zhǔn)做法是驗(yàn)證模型,然后凍結(jié)它,以確保部署的模型不會因再訓(xùn)練而產(chǎn)生任何新問題。

因此,這項(xiàng)研究中的攻擊行為也真實(shí)地反映了在現(xiàn)實(shí)環(huán)境中,例如在自動駕駛車輛中看到的深度學(xué)習(xí)訓(xùn)練策略,此外,即使被攻擊目標(biāo)使用持續(xù)學(xué)習(xí),也會有針對固定攻擊目標(biāo)進(jìn)行訓(xùn)練的策略,攻擊者可以對目標(biāo)使用模擬學(xué)習(xí)來生成攻擊模型。

或者,在自動駕駛車輛,攻擊者可以通過購買系統(tǒng)的副本并定期在工廠重置它,一旦針對目標(biāo)訓(xùn)練出了敵對策略,攻擊者就可以將此策略傳輸?shù)侥繕?biāo),并利用它直到攻擊成功為止。

研究也對今后的工作提出了一些方向:深度學(xué)習(xí)策略容易受到攻擊,這突出了有效防御的必要性,因此在系統(tǒng)激活時(shí)可以使用密度模型檢測到可能的對抗性攻擊,在這種情況下,還可以及時(shí)退回到保守策略。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31064

    瀏覽量

    222128
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    468

    瀏覽量

    11604
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5598

    瀏覽量

    124382
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    宗申命名“”智界和問界!三輪車龍頭的電動化轉(zhuǎn)型焦慮

    旗下高端汽車品牌“智界”“問界”高度重合,引發(fā)輿論質(zhì)疑“營銷”。盡管宗申迅速發(fā)布致歉聲明,承諾整改命名并加強(qiáng)審核,但這場風(fēng)波背后,折射出傳統(tǒng)三輪車企業(yè)向新能源轉(zhuǎn)型的迫切需求,也暴露出市場競爭白熱化的現(xiàn)實(shí)。 ? 三輪車龍頭
    的頭像 發(fā)表于 07-12 00:14 ?1.1w次閱讀

    藝開放平臺鴻蒙智能版本管理

    智能的版本管理功能,包括查看、回退到歷史版本。版本記錄包括智能上下架及撤回審核時(shí)的版本。 查看歷史版本 點(diǎn)擊
    發(fā)表于 02-27 19:18

    歡迎使用中國香河英茂科工豆包智能

    中國香河英茂科工 - 豆包智能 創(chuàng)建分身,分兩種:AI智能分身(替你干活) 和數(shù)字人分身(替你出鏡),零基礎(chǔ)也能快速上手。 ? 一、AI智能分身(替你思考/干活) 適合:一人公司、客
    發(fā)表于 02-14 07:22

    鴻蒙智能上/下架、升級流程介紹

    先完成檢查清單待完成項(xiàng)后方可發(fā)起。 上下架操作&權(quán)限管控: 方式1:開發(fā)者可通過智能編排頁面內(nèi)右上角【上架】/【升級】按鈕發(fā)起審核。 方式2:開發(fā)者可通過【工作空間】-【智能
    發(fā)表于 02-10 10:38

    開發(fā)智能調(diào)試與預(yù)覽---真機(jī)測試

    重新啟動小藝,在對話列表中看到“開發(fā)”標(biāo)簽的智能。 4、發(fā)布真機(jī)測試后,智能的開發(fā)態(tài)15天內(nèi)有效(即端側(cè)可見“開發(fā)
    發(fā)表于 02-09 15:37

    開發(fā)智能配置-內(nèi)容合規(guī)

    智能上架前,需完成“人工智能生成合成內(nèi)容標(biāo)識”和“大模型備案信息”填寫 ,以供平臺審核;可在智能【配置】-【內(nèi)容合規(guī)】
    發(fā)表于 02-07 11:44

    開發(fā)智能配置-隱私協(xié)議服務(wù)

    1.已有描述隱私政策和用戶隱私權(quán)利的隱私網(wǎng)址:在智能【配置】-【隱私協(xié)議服務(wù)】頁面,隱私聲明處選擇“自定義隱私政策”,在隱私政策網(wǎng)址中直接填寫隱私網(wǎng)址。 2.沒有自定義隱私網(wǎng)址,平臺提供了隱私
    發(fā)表于 02-03 15:54

    小藝開放平臺鴻蒙智能開發(fā)智能配置-基礎(chǔ)信息

    創(chuàng)建智能后,開發(fā)者可以進(jìn)入智能配置頁面對智能基礎(chǔ)信息進(jìn)行編輯。支持編輯
    發(fā)表于 02-02 16:47

    小藝智能調(diào)試與預(yù)覽---真機(jī)測試

    重新啟動小藝,在對話列表中看到“開發(fā)”標(biāo)簽的智能。 4、發(fā)布真機(jī)測試后,智能的開發(fā)態(tài)15天內(nèi)有效(即端側(cè)可見“開發(fā)
    發(fā)表于 01-28 14:16

    智能強(qiáng)化學(xué)習(xí)(MARL)核心概念與算法概覽

    訓(xùn)練單個RL智能的過程非常簡單,那么我們現(xiàn)在換一個場景,同時(shí)訓(xùn)練五個智能,而且每個都有自己的
    的頭像 發(fā)表于 01-21 16:21 ?188次閱讀
    多<b class='flag-5'>智能</b><b class='flag-5'>體</b>強(qiáng)化學(xué)習(xí)(MARL)核心概念與算法概覽

    小藝開放平臺快速創(chuàng)建鴻蒙智能

    1.登錄小藝開放平臺,進(jìn)入小藝智能平臺頁面,點(diǎn)擊立即體驗(yàn),進(jìn)入創(chuàng)建頁面。 2.點(diǎn)擊左上角【+創(chuàng)建智能】按鈕,即可進(jìn)入智能
    發(fā)表于 01-19 11:00

    NFC“”,讓交互更便捷

    作為新一代智能應(yīng)用入口,融智興科技推出的NFC“”產(chǎn)品,以“輕觸即連、無感體驗(yàn)”的優(yōu)勢,為企業(yè)和用戶帶來全新的交互方式。
    的頭像 發(fā)表于 09-26 17:11 ?2841次閱讀
    NFC“<b class='flag-5'>碰</b>一<b class='flag-5'>碰</b>”,讓交互更便捷

    【HarmonyOS NEXT】華為分享-開發(fā)分享

    注冊監(jiān)聽事件,當(dāng)目標(biāo)設(shè)備與宿主設(shè)備進(jìn)行操作后,宿主應(yīng)用發(fā)現(xiàn)設(shè)備,調(diào)用分享事件回
    發(fā)表于 05-16 16:19

    (GUOCI)F系列貼片電容

    F系列防嘯叫、低ESR貼片電容 國F系列產(chǎn)品采用特殊陶瓷材料設(shè)計(jì),其由精確的介電材料和適當(dāng)?shù)膶?dǎo)電漿料配制,自動化制程的穩(wěn)定生產(chǎn)和嚴(yán)謹(jǐn)?shù)馁|(zhì)量精確管控了介電設(shè)計(jì)厚度、電極完整性以及端電極連接的良好特性,實(shí)現(xiàn)了最佳可靠度、失效開路的產(chǎn)品性能。
    發(fā)表于 05-09 15:14

    學(xué)習(xí)智能開發(fā)

    智能是大模型的應(yīng)用落地,正在學(xué)習(xí),這本書太及時(shí)了,非常想看看。
    發(fā)表于 03-27 15:48