chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于AI的兵棋類模擬開發(fā)項(xiàng)目

AI智勝未來(lái) ? 來(lái)源:中國(guó)指揮與控制學(xué)會(huì) ? 2023-12-18 09:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要:本文介紹了一項(xiàng)旨在為兵棋類模擬開發(fā)基于AI的強(qiáng)大人工對(duì)手的項(xiàng)目。本文提供了兩種方法。第一種方法主要基于對(duì)制定可靠戰(zhàn)術(shù)所必需的復(fù)雜知識(shí)進(jìn)行漸進(jìn)式主動(dòng)學(xué)習(xí)方法,但這需要對(duì)該領(lǐng)域知識(shí)有深入了解的高水平教練。

第二種方法是嘗試將整個(gè)軍隊(duì)各層級(jí)的決策制定過(guò)程建模為某種形式的復(fù)雜的知識(shí)密集型問(wèn)題解決過(guò)程。后續(xù)工作將研究綜合運(yùn)用上述方法的可能性,以及其他方法,例如基于案例的推理等。

目的

本項(xiàng)目的目的是在計(jì)算機(jī)兵棋嘗試一系列AI方法,這些兵棋以一定的歷史真實(shí)感模擬了前幾個(gè)世紀(jì)的軍事戰(zhàn)術(shù)。我們的主要?jiǎng)訖C(jī)是檢驗(yàn)并改進(jìn)這些AI技術(shù)。而在此過(guò)程中,一些兵棋也可以獲得高質(zhì)量的人工對(duì)手。

戰(zhàn)略兵棋與國(guó)際象棋

到目前為止,我們的研究將重點(diǎn)放在非常成熟的模擬拿破侖時(shí)期重要戰(zhàn)斗的商業(yè)兵棋上。這款兵棋有非常強(qiáng)大的對(duì)陣員社區(qū),因此當(dāng)我們的系統(tǒng)準(zhǔn)備就緒時(shí),我們可以邀請(qǐng)一些外部專家對(duì)其進(jìn)行測(cè)試。此外,在研究的第一階段,為檢驗(yàn)一些想法,特別是SOAR的使用,我們還使用了另一款由UPMC學(xué)員設(shè)計(jì)的相對(duì)簡(jiǎn)單的兵棋,該兵棋在許多方面與拿破侖兵棋相似,但側(cè)重于中世紀(jì)戰(zhàn)術(shù)。

我們不打算詳細(xì)討論這兩款兵棋的規(guī)則,而是通過(guò)強(qiáng)調(diào)它們與經(jīng)典國(guó)際象棋的差異性來(lái)說(shuō)明兵棋的基本理念。和國(guó)際象棋一樣,每個(gè)對(duì)陣員在沖突中推演一方。戰(zhàn)場(chǎng)用棋盤表示。對(duì)陣員根據(jù)一系列規(guī)則在棋盤上移動(dòng)棋子,輪流進(jìn)行推演。與國(guó)際象棋相比,沒(méi)處差異都可被視作復(fù)雜性的增加。

我們使用的兵棋棋盤由六角格覆蓋而非正方形。這使得機(jī)動(dòng)模式更加復(fù)雜(每個(gè)位置有六個(gè)鄰居)。更重要地,國(guó)際象棋棋盤上只有64個(gè)方格,而我們使用的兵棋中包含數(shù)千個(gè)六角格。

每個(gè)六角格除了位置外,還由一系列參數(shù)定義,例如地形類型(森林、平原。。。)、海拔高度等,這些參數(shù)反過(guò)來(lái)會(huì)影響單位的機(jī)動(dòng)或戰(zhàn)斗能力。

每個(gè)單位都有若干特點(diǎn),這會(huì)影響其機(jī)動(dòng)、戰(zhàn)斗能力以及質(zhì)量、疲勞和組織等。其中一些特征(例如單位配置),可被視作影響單位能力(機(jī)動(dòng)或戰(zhàn)斗等)的單位參數(shù)。

單位按級(jí)別組織(例如、軍、軍團(tuán)、師、旅等)。根據(jù)軍隊(duì)凝聚力要求,屬于同一級(jí)別的單位互相戰(zhàn)斗。每個(gè)回合分為若干階段,每個(gè)階段分配不同活動(dòng)類型,例如機(jī)動(dòng)、遠(yuǎn)程射擊等。

戰(zhàn)斗本身的建模相對(duì)復(fù)雜:包括遠(yuǎn)程射擊(步兵使用滑膛槍或者火炮從遠(yuǎn)處射擊)和近戰(zhàn)(徒手格斗)。戰(zhàn)斗解決方法需要考慮許多參數(shù),包括各方的規(guī)模、素質(zhì)、狀態(tài)和疲勞度等。它還包含隨機(jī)因素,因此結(jié)果幾乎永遠(yuǎn)無(wú)法保證。

在特定時(shí)間內(nèi)得分最高的一方獲演勝。攻占(或成功防守)重要位置,以及使敵方單位失去戰(zhàn)斗力,即可獲得分?jǐn)?shù)。

從計(jì)算視角來(lái)開,我兵棋與國(guó)際象棋更顯著的差異在于,各回合每個(gè)單位都可以活動(dòng)。這與國(guó)際象棋截然不同,在國(guó)際象棋中各方選擇一枚獨(dú)特的棋子移動(dòng)。這最終導(dǎo)致兵棋的復(fù)雜性大大增加。

如果有p個(gè)單位,每個(gè)單位可能采取m種行動(dòng),則國(guó)際象棋來(lái)的分支因素是p.m,而兵棋是mp。除了爆炸性的復(fù)雜性,這種不同的設(shè)置方式具有以下優(yōu)勢(shì):讓模擬更接近歷史,或者更接近于人類代理的模擬。軍隊(duì)單位確實(shí)在戰(zhàn)場(chǎng)上以相似方式機(jī)動(dòng),因此如果擔(dān)心歷史合理性,那么順序行動(dòng)(如國(guó)際象棋)是不可能的。

因此,我們可以設(shè)想通過(guò)盲搜方法將國(guó)際象棋下到一定水平,當(dāng)該方法對(duì)于兵棋而言是難以想象的,因?yàn)樵趍=20,p=100的情況下,即使得出下一回合的所有可能狀態(tài)都是不可能的。因此與國(guó)際象棋相比,對(duì)于大多數(shù)真正的人工智能問(wèn)題來(lái)說(shuō),一切都取決于系統(tǒng)學(xué)習(xí)的或者為系統(tǒng)提供的知識(shí)的質(zhì)量。

主動(dòng)學(xué)習(xí)方法

我們嘗試的第一種方法是對(duì)背景知識(shí)要求最低的方法。我們的想法是從模擬小規(guī)模對(duì)抗實(shí)現(xiàn)簡(jiǎn)單目標(biāo)開始,以便個(gè)體單位學(xué)習(xí)一些基本知識(shí),然后循序漸進(jìn),通過(guò)模擬更復(fù)雜的態(tài)勢(shì)學(xué)習(xí)更加復(fù)雜的知識(shí)。我們的第一種學(xué)習(xí)方法是基于基因的規(guī)則庫(kù)學(xué)習(xí)。

我們嘗試了不同設(shè)置,一些僅使用基本的感知信息(除了單位目標(biāo),還有周圍環(huán)境的信息,包括敵方單位的存在),一些則以基因代碼方式體現(xiàn)了一些中間概念,比如觀察到的當(dāng)?shù)乇Ρ龋ㄖ苯芋w現(xiàn)威脅概念)。在這些初始階段完成之后,可通過(guò)讓單位在更大的編隊(duì)內(nèi)在復(fù)雜性不斷增加的“指導(dǎo)性想定中”發(fā)揮作用來(lái)獲取新的規(guī)則集。

這一方法令人非常振奮,因?yàn)樗钣锌赡墚a(chǎn)生意想不到的結(jié)果(因?yàn)樗苌僖驗(yàn)槲覀兊慕?jīng)驗(yàn)--針對(duì)特定態(tài)勢(shì)采取哪種戰(zhàn)略更合適,產(chǎn)生偏見(jiàn))。出其不意可能是我們系統(tǒng)顯示的某種形式的戰(zhàn)略創(chuàng)造力的結(jié)果,也可能意味著推演規(guī)則不切實(shí)際,或者我們的方法與其它人工或人為方法相比,更能發(fā)現(xiàn)這些規(guī)則中的漏洞。

這種漸進(jìn)式分類系統(tǒng)學(xué)習(xí)方法,可能會(huì)增大知識(shí)庫(kù)最終趨同的可能性。當(dāng)然在現(xiàn)階段就斷言它們會(huì)趨同還為時(shí)過(guò)早。設(shè)計(jì)合適的訓(xùn)練方案,逐步增加復(fù)雜性讓系統(tǒng)從學(xué)習(xí)基本概念和戰(zhàn)術(shù)開始,然后逐漸學(xué)習(xí)更高級(jí)的戰(zhàn)略存在一定的困難。實(shí)驗(yàn)初步表明,這一階段本身就需要深入了解一些兵棋知識(shí)。

因此,盡管該學(xué)習(xí)方法在最初看起來(lái)似乎對(duì)背景知識(shí)的要求不高(在許多方面的確如此),但是看起來(lái),“知識(shí)密集型”方法在建模和知識(shí)開發(fā)階段吸取的所有經(jīng)驗(yàn)教訓(xùn),都能讓主動(dòng)學(xué)習(xí)方法獲益匪淺。

知識(shí)密集型方法

此外,我們通過(guò)在SOAR框架內(nèi)引出相關(guān)知識(shí)來(lái)應(yīng)用知識(shí)密集型方法。多年來(lái)的實(shí)踐證明,SOAR是一種在動(dòng)態(tài)環(huán)境內(nèi)體現(xiàn)并使用復(fù)雜知識(shí)的可靠框架。繼應(yīng)用于一些軍事模擬和規(guī)劃中之后,該框架已經(jīng)成功應(yīng)用于大量計(jì)算機(jī)推演中。

該方法的難點(diǎn)是如何為知識(shí)庫(kù)設(shè)定良好的角色以及如何選擇相關(guān)中間概念。同時(shí),充分利用SOAR內(nèi)的分塊學(xué)習(xí)能力尤為重要,因?yàn)樽畛醯闹庇X(jué),當(dāng)前的系統(tǒng)因其學(xué)習(xí)能力受限。

我們可以將各單位視作不同代理。事實(shí)上兵棋讓對(duì)陣員像指揮官一樣(在當(dāng)前態(tài)勢(shì)范圍內(nèi))決定各單位(如步兵營(yíng)、騎兵中隊(duì)等)的行動(dòng)。但是,各單位指揮官只有在上級(jí)指揮官(師、軍團(tuán)、集團(tuán)軍級(jí)別)制定的全球戰(zhàn)略背景下解決行動(dòng)問(wèn)題才有意義。

因此信息流是雙向的:一方面它是上行的(下級(jí)指揮官報(bào)告觀察到的情況,報(bào)告行動(dòng)的成功/失?。6硪环矫嫠质窍滦械?,戰(zhàn)略被選擇,命令被下達(dá)解讀并盡可能執(zhí)行(有時(shí)需一定調(diào)整)。

觀察發(fā)現(xiàn)這種分層信息流與SOAR中目標(biāo)和操作符的組織方式很相似。也就是說(shuō),當(dāng)前的設(shè)計(jì)方案是,將整個(gè)軍隊(duì)當(dāng)作一個(gè)復(fù)雜的問(wèn)題解決代理,其大部分層級(jí)結(jié)構(gòu)可通過(guò)SOAR操作符的等級(jí)體現(xiàn)。

由于這種選擇,我們決定在在同一單位類型之間共享知識(shí)庫(kù)庫(kù),也就是只能按單位類型進(jìn)行學(xué)習(xí),個(gè)體單位無(wú)法學(xué)習(xí)。當(dāng)然,單位組織層次中的每一級(jí)都可獨(dú)立于上一級(jí)或下一級(jí)進(jìn)行學(xué)習(xí)。同時(shí),兵棋還有一個(gè)專門指導(dǎo)模式,在這種模式下如果當(dāng)前知識(shí)庫(kù)內(nèi)容不充分或者有待提高,用戶可以向程序提供行動(dòng)方案建議。

后續(xù)研究

在后續(xù)研究中,我們希望在兵棋中采用一些懶惰學(xué)習(xí)形式。就對(duì)背景知識(shí)的要求而言,該方法可能介于主動(dòng)學(xué)習(xí)和知識(shí)密集型方法之間?;诎咐耐评硇枰恍┡c案例表征、案例庫(kù)組織、案例檢索相似度度量以及戰(zhàn)略調(diào)整選擇相關(guān)的知識(shí)。因此與基于基因的學(xué)習(xí)方法相比,這種方法需要更多的知識(shí),但又低于知識(shí)密集型方法。

該方法的優(yōu)勢(shì)在于可以提出利用過(guò)去獲得成功的一整套行動(dòng)方,解決潛在的態(tài)勢(shì)問(wèn)題。不同組織層級(jí)需要不同的案例庫(kù),案例相似性計(jì)算要考慮的一個(gè)重要元素是單位目標(biāo)之間的相似性,因?yàn)閼B(tài)勢(shì)(地理和環(huán)境)之間的相似性還不足以激發(fā)案例的檢索。

除了實(shí)驗(yàn)更多方法,后續(xù)研究會(huì)將最有希望的方法整合到一體化系統(tǒng)中,以便利用最適合當(dāng)前態(tài)勢(shì)的技術(shù)。因?yàn)槲覀儜?yīng)用的所有技術(shù)都依賴一些學(xué)習(xí)要素,因此有必要通過(guò)一些形式的實(shí)驗(yàn),讓系統(tǒng)與自己高速對(duì)抗,從而達(dá)到某種基本性能水平。

對(duì)于主動(dòng)學(xué)習(xí)方法,可以讓系統(tǒng)與知識(shí)密集型方法對(duì)抗(即使剛開始是其知識(shí)庫(kù)很簡(jiǎn)單)。我們的想法是,主動(dòng)學(xué)習(xí)方法將以隨機(jī)對(duì)陣員的身份開始(在學(xué)習(xí)到任何知識(shí)之前),這樣在與自己的對(duì)抗中就不會(huì)有太大進(jìn)步。此外,利用知識(shí)密集型方法獲取知識(shí),有助于為漸進(jìn)式主動(dòng)學(xué)習(xí)方法設(shè)計(jì)更好的指導(dǎo)方案。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37012

    瀏覽量

    289973

原文標(biāo)題:如何利用AI方法為兵棋制定戰(zhàn)略

文章出處:【微信號(hào):AI智勝未來(lái),微信公眾號(hào):AI智勝未來(lái)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【Sipeed MaixCAM Pro開發(fā)板試用體驗(yàn)】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    1. 項(xiàng)目概述 本項(xiàng)目旨在開發(fā)并部署一個(gè)高精度的深度學(xué)習(xí)模型,用于自動(dòng)鑒別一張圖片是由AI生成(如Stable Diffusion, DALL-E, Midjourney等工具生成)還
    發(fā)表于 08-21 13:59

    嵌入式AI技術(shù)漫談 如何組建一個(gè)AI項(xiàng)目開發(fā)小組

    我們來(lái)談一談如何組建一個(gè)AI項(xiàng)目開發(fā)小組: 為什么要為嵌入式AI項(xiàng)目 組建一個(gè)專門的開發(fā)小組 相
    的頭像 發(fā)表于 06-11 16:34 ?926次閱讀

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+讀《零基礎(chǔ)開發(fā)AI Agent》掌握扣子平臺(tái)開發(fā)智能體方法

    /, 在上面注冊(cè)一個(gè)賬號(hào),并由快速開始進(jìn)入開發(fā)操作空間,建立開發(fā)AI Agent的各開發(fā)要素進(jìn)行定義,從而完成AI Agent的
    發(fā)表于 05-14 19:51

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+ 入門篇學(xué)習(xí)

    很高興又有機(jī)會(huì)學(xué)習(xí)ai技術(shù),這次試讀的是「零基礎(chǔ)開發(fā)AI Agent」,作者葉濤、管鍇、張心雨。 大模型的普及是近三年來(lái)的一件大事,萬(wàn)物皆可大模型已成為趨勢(shì)。作為大模型開發(fā)應(yīng)用中重要組
    發(fā)表于 05-02 09:26

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    AI的演進(jìn)正在逼近“終端智能涌現(xiàn)”的拐點(diǎn),從通用模型向場(chǎng)景落地遷移成為關(guān)鍵議題。聯(lián)發(fā)科以“AI隨芯,應(yīng)用無(wú)界”為主題召開天璣開發(fā)者大會(huì)2025(MDDC 2025),不僅聚合了全球生態(tài)資源,還
    發(fā)表于 04-13 19:52

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    再次感謝發(fā)燒友提供的閱讀體驗(yàn)活動(dòng)。本期跟隨《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》這本書學(xué)習(xí)如何構(gòu)建開發(fā)一個(gè)視頻應(yīng)用。AI Agent是一種智能應(yīng)用,能夠根據(jù)用戶需求和環(huán)境變化做出相應(yīng)響應(yīng)
    發(fā)表于 03-05 19:52

    AI Agent應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀體驗(yàn)--跟著迪哥學(xué)Agent

    感謝電子發(fā)燒友的這次活動(dòng),讓我有幸抽中了《AI Agent應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》(以下簡(jiǎn)稱《Agent》)這本書的贈(zèng)送。 收到書本之后我就迫不及待地學(xué)習(xí)書本中的知識(shí)。如果說(shuō)依靠各種平臺(tái)上的文章了解關(guān)于AI
    發(fā)表于 03-02 12:28

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀心得2——客服機(jī)器人、AutoGen框架 、生成式代理

    ,斯坦福小鎮(zhèn)是一個(gè)非常有有意思的項(xiàng)目。生成式智能體作為AI領(lǐng)域的革命性突破,向我們揭示了計(jì)算機(jī)模擬人類行為的無(wú)限可能。憑借其創(chuàng)新的技術(shù)架構(gòu)與精密的算法設(shè)計(jì),這些智能體能夠在虛擬環(huán)境中栩栩如生地生活與交互
    發(fā)表于 02-25 21:59

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》第1-2章閱讀心得——理解Agent框架與Coze平臺(tái)的應(yīng)用

    不同平臺(tái)的內(nèi)容特點(diǎn),生成符合平臺(tái)調(diào)性的文案,這種能力在社交媒體運(yùn)營(yíng)中極其重要。 Agent技術(shù)正在重塑AI應(yīng)用的開發(fā)模式。通過(guò)對(duì)《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》第1-2章的深入學(xué)習(xí)
    發(fā)表于 02-19 16:35

    AI項(xiàng)目管理平臺(tái)有什么用

    當(dāng)今,AI項(xiàng)目的復(fù)雜性和多變性給項(xiàng)目管理帶來(lái)了前所未有的挑戰(zhàn)。為了有效應(yīng)對(duì)這些挑戰(zhàn),AI項(xiàng)目管理平臺(tái)應(yīng)運(yùn)而生。那么,
    的頭像 發(fā)表于 02-19 11:16 ?507次閱讀

    國(guó)外AI開發(fā)者平臺(tái)好用嗎

    當(dāng)今,AI項(xiàng)目的復(fù)雜性和多變性給項(xiàng)目管理帶來(lái)了前所未有的挑戰(zhàn)。為了有效應(yīng)對(duì)這些挑戰(zhàn),AI項(xiàng)目管理平臺(tái)應(yīng)運(yùn)而生。那么,
    的頭像 發(fā)表于 02-19 10:16 ?474次閱讀

    正點(diǎn)原子ESP32S3系列開發(fā)板全面支持小智AI

    本帖最后由 jf_85110202 于 2025-2-14 17:39 編輯 什么是小智AI? 小智AI項(xiàng)目是由蝦哥發(fā)起并開源的一個(gè)項(xiàng)目。該項(xiàng)
    發(fā)表于 02-14 17:01

    AI開發(fā)框架集成介紹

    隨著AI應(yīng)用的廣泛深入,單一框架往往難以滿足多樣化的需求,因此,AI開發(fā)框架的集成成為了提升開發(fā)效率、促進(jìn)技術(shù)創(chuàng)新的關(guān)鍵路徑。以下,是對(duì)AI
    的頭像 發(fā)表于 01-07 15:58 ?763次閱讀

    HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能對(duì)話框

    一、練習(xí)內(nèi)容 在這個(gè)HarmonyOS NEXT原生應(yīng)用DEMO中,我們將使用ArkTS開發(fā)語(yǔ)言創(chuàng)建一個(gè)功能更為豐富的AI智能對(duì)話框。這個(gè)對(duì)話框不僅具備基本的聊天功能,還能展示圖片消息、表情符號(hào),并
    發(fā)表于 01-03 11:29

    AI項(xiàng)目管理平臺(tái)怎么用

    AI項(xiàng)目管理平臺(tái)是一種集成了項(xiàng)目管理工具、AI開發(fā)環(huán)境和數(shù)據(jù)分析能力的綜合性平臺(tái)。接下來(lái),AI
    的頭像 發(fā)表于 11-13 09:38 ?916次閱讀