基于圖嵌入的兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識表示學習方法
來源:《指揮控制與仿真》,作者王???/p>
摘 要:為將基于離散符號的兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識表示為機器更加容易學習、處理和應用的形式,根據(jù)兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識的特點,提出一種基于圖嵌入的兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識表示學習方法。該方法采用基于元路徑的多層異構圖嵌入模型,對想定場景中的兵棋聯(lián)合作戰(zhàn)態(tài)勢實體及其關系知識進行表示學習,將其映射為連續(xù)向量空間中的稠密實值向量,從而有效揭示兵棋聯(lián)合作戰(zhàn)態(tài)勢實體之間的全局隱含特征,為大規(guī)模聯(lián)合作戰(zhàn)態(tài)勢知識的獲取、融合與推理奠定良好基礎。實驗結果表明,基于圖嵌入的兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識表示學習方法針對性強,對于評估指標提升較大,為復雜兵棋聯(lián)合作戰(zhàn)態(tài)勢知識的表示學習提供了可行范例。
關鍵詞:兵棋;聯(lián)合作戰(zhàn)態(tài)勢知識;圖嵌入;知識表示學習;元路徑
聯(lián)合作戰(zhàn)態(tài)勢是聯(lián)合作戰(zhàn)時空、信息、表征和不確定性等多重復雜因素綜合作用的結果,是聯(lián)合作戰(zhàn)復雜性的外在表現(xiàn)[1]。對反映聯(lián)合作戰(zhàn)態(tài)勢的實體知識進行客觀準確表征,是研究聯(lián)合作戰(zhàn)態(tài)勢的基礎和前提,其核心和要點在于描繪聯(lián)合作戰(zhàn)態(tài)勢實體之間的復雜關聯(lián)關系[2]。作戰(zhàn)大數(shù)據(jù)是聯(lián)合作戰(zhàn)態(tài)勢知識的主要來源,具有海量、稀疏和結構復雜等特點[3]。聯(lián)合作戰(zhàn)態(tài)勢知識表示是在特定場景范圍內(nèi),針對聯(lián)合作戰(zhàn)態(tài)勢實體和關系進行建模,使得機器可以學習、處理和運用各種聯(lián)合作戰(zhàn)態(tài)勢知識[4]。傳統(tǒng)基于離散符號的聯(lián)合作戰(zhàn)態(tài)勢知識表示方法善于表征顯性的形式化作戰(zhàn)態(tài)勢知識,但計算效率低下,不易融合擴展。需要進一步深入探索聯(lián)合作戰(zhàn)態(tài)勢實體知識的非形式化表示方法,將聯(lián)合作戰(zhàn)態(tài)勢知識表示為機器易于計算、學習和處理的形式,為智能指揮決策提供堅實的基礎知識支撐[5]。
聯(lián)合作戰(zhàn)態(tài)勢實體知識表示學習是面向聯(lián)合作戰(zhàn)態(tài)勢知識中的實體及其關系知識進行表示學習,將聯(lián)合作戰(zhàn)態(tài)勢知識中的實體、屬性及其關聯(lián)關系表示為連續(xù)向量空間中的稠密實值向量,使得機器可以高效學習、處理和運用各種聯(lián)合作戰(zhàn)態(tài)勢實體知識。其本質(zhì)是在低維向量空間中對符號化的聯(lián)合作戰(zhàn)態(tài)勢實體及其關系語義知識進行向量化重構,從而提高知識計算效率,實現(xiàn)異構信息融合,有效緩解數(shù)據(jù)稀疏帶來的諸多知識計算難題,有效提升聯(lián)合作戰(zhàn)態(tài)勢知識獲取、融合、推理的性能[6]。因此,在知識表示學習過程中保證聯(lián)合作戰(zhàn)態(tài)勢知識的結構信息以及實體和關系的語義描述信息不失真,確保從離散符號向連續(xù)向量映射的準確性顯得極為重要。由于聯(lián)合作戰(zhàn)態(tài)勢實體知識的異構性特征和層次化特點,對于聯(lián)合作戰(zhàn)態(tài)勢實體知識的表示學習主要存在兩方面挑戰(zhàn):一是聯(lián)合作戰(zhàn)態(tài)勢實體之間可能存在不同類型的連接關系,使得聯(lián)合作戰(zhàn)態(tài)勢實體知識難以進行統(tǒng)一嵌入表達;二是作為聯(lián)合作戰(zhàn)態(tài)勢實體關系連接服從冪率分布,存在大量擁有少量鄰居節(jié)點的聯(lián)合作戰(zhàn)態(tài)勢實體節(jié)點,此類實體節(jié)點難以有效表征。
兵棋作為一種特殊的戰(zhàn)爭模擬系統(tǒng),是研究智能化作戰(zhàn)的重要工具和手段,也是檢驗軍事智能技術和探索軍事智能應用的最佳平臺,可為聯(lián)合作戰(zhàn)態(tài)勢實體知識的表示學習研究提供了重要依托。本文依托兵棋推演平臺,以兵棋聯(lián)合作戰(zhàn)想定場景中的態(tài)勢實體、屬性及其關系為基礎,提出一種基于元路徑的多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識表示學習方法,通過設計合理的兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識元路徑模式,利用兵棋聯(lián)合作戰(zhàn)態(tài)勢實體豐富的屬性信息和不同實體類型的多層拓撲結構信息,力圖捕捉兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識的多層異構網(wǎng)絡結構信息和實體語義關聯(lián)信息,從而有效提升基于離散向量的聯(lián)合作戰(zhàn)態(tài)勢知識的表征能力。實驗結果表明,在聯(lián)合作戰(zhàn)態(tài)勢實體關系推理任務中,本文提出的算法性能更佳。
1 圖嵌入概述
圖嵌入(Graph Embedding)也稱網(wǎng)絡嵌入(Network Embedding)或圖表示學習(Graph Representation Learning)。其通過將信息網(wǎng)絡嵌入低維向量空間,實現(xiàn)網(wǎng)絡實體分類、關系推理和社團檢測等任務?;趫D嵌入的兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識表示學習是下游深度學習和多關系型聯(lián)合作戰(zhàn)大數(shù)據(jù)挖掘任務的基礎。根據(jù)圖的網(wǎng)絡結構特性不同,目前的圖嵌入模型研究主要集中在同質(zhì)網(wǎng)絡嵌入、異構網(wǎng)絡嵌入和多層異構網(wǎng)絡嵌入三個方面。
1.1 同質(zhì)網(wǎng)絡嵌入
同質(zhì)網(wǎng)絡(Homogeneous Network)中互相連接的實體和關系類型傾向于具有更多的相似性。DeepWalk[7]模型采用無監(jiān)督特征學習技術,通過隨機游走的方式,從信息網(wǎng)絡中的某個節(jié)點開始生成文本序列,然后,采用Skip-Gram模型訓練得到網(wǎng)絡節(jié)點的詞向量。LINE[8]模型為解決大規(guī)模網(wǎng)絡嵌入問題,將節(jié)點的一階相似性與二階相似性引入目標函數(shù),能夠更加靈活地對信息網(wǎng)絡的局部結構和全局結構特征進行知識表示學習。與DeepWalk模型相比,LINE模型適用范圍更廣,可用于有/無向圖,以及有/無權圖的知識表示學習。node2vec[9]模型靈活定義了節(jié)點網(wǎng)絡鄰居概念,設計了一個偏置隨機游走過程,通過綜合考慮深度優(yōu)先和廣度優(yōu)先搜索,實現(xiàn)了對鄰居實體的有效探索,從而學習到了更加豐富的實體知識表示信息。SDNE[10]模型為應對圖嵌入知識表示的高度非線性、結構特征保持和網(wǎng)絡稀疏難題等挑戰(zhàn),采用半監(jiān)督深度學習模型,通過設計合理的目標函數(shù)保留網(wǎng)絡結構的局部和全局信息,并對稀疏網(wǎng)絡具有魯棒性。圖神經(jīng)網(wǎng)絡(GNN)是一種基于圖結構的深度學習模型,其目標是學習包含鄰居信息的節(jié)點狀態(tài)嵌入向量[11]。GCN[12]模型是一種基于卷積神經(jīng)網(wǎng)絡(CNN)的圖結構數(shù)據(jù)半監(jiān)督學習方法,受圖譜卷積局部結構一階相似選擇的啟發(fā),將圖的結構特征和節(jié)點的特征信息共同編碼進行知識表示學習。GraphSAGE[13]模型提出了一個通用的歸納框架,有效利用網(wǎng)絡節(jié)點的特性信息為以前未見過的實體節(jié)點生成嵌入向量。與以往為每個實體節(jié)點單獨訓練嵌入向量不同的是,GraphSAGE模型提供了一個通過從實體節(jié)點的本地鄰居中采樣和聚集特性來生成嵌入向量的函數(shù)。
1.2 異構網(wǎng)絡嵌入
異構網(wǎng)絡(Heterogeneous Network)相對于同質(zhì)網(wǎng)絡而言,網(wǎng)絡中的實體節(jié)點或邊具有多種類型。由于異構網(wǎng)絡中實體節(jié)點和邊類型的多樣性特征,其網(wǎng)絡特性挖掘和網(wǎng)絡表示學習的難度較大。PTE[14]模型提供了一種用于文本數(shù)據(jù)的半監(jiān)督預測性文本嵌入方法。首先將標記信息和不同層次的詞共現(xiàn)信息表示為一個大規(guī)模的異構文本網(wǎng)絡,然后將其嵌入到一個低維向量空間中。PTE模型不僅保留了單詞和文檔的語義相近性,而且對特定任務具有很強的預測能力。metapath2vec[15]模型首先基于元路徑的隨機游走方法,形式化構造網(wǎng)絡實體節(jié)點的異構性鄰居,然后利用異構Skip-Gram模型進行實體節(jié)點嵌入。metapath2vec++模型則進一步通過對異構網(wǎng)絡的結構和語義相關性特征進行網(wǎng)絡嵌入學習。metapath2vec和metapath2vec++不僅在各種異構網(wǎng)絡挖掘任務中表現(xiàn)突出,而且還能分辨不同網(wǎng)絡實體之間的結構和語義相關性。HERec[16]模型設計了一種基于元路徑的隨機游走策略來生成有意義的節(jié)點序列進行網(wǎng)絡嵌入。首先利用一組融合函數(shù)對學習到的節(jié)點嵌入進行變換,然后將其集成到擴展的矩陣分解模型中,將擴展后的矩陣分解模型與融合函數(shù)結合起來,對等級預測任務進行聯(lián)合優(yōu)化。
1.3 多層異構網(wǎng)絡嵌入
現(xiàn)實世界的許多網(wǎng)絡不僅節(jié)點類型多樣,而且具有多重結構,稱之為多層異構網(wǎng)絡(Multiplex Heterogeneous Network)。PMNE[17]模型提供了網(wǎng)絡聚合、結果聚合和層間協(xié)同分析三種方法,將多層網(wǎng)絡映射到連續(xù)向量空間?!熬W(wǎng)絡聚合”和“結果聚合”可以在不利用層間交互的情況下,將標準的網(wǎng)絡嵌入方法應用于合并后的圖或每一層,為多層網(wǎng)絡尋找向量空間。“層間協(xié)同分析”考慮了層間相互作用的影響,能夠將任何單層網(wǎng)絡嵌入方法擴展為多層網(wǎng)絡。MVE[18]模型通過投票機制,設計了一種多層網(wǎng)絡表示學習方法。通過在投票過程中引入注意力機制,對多視圖的權重信息進行整合,將多層網(wǎng)絡嵌入到魯棒性最高的單個協(xié)作嵌入向量中。MNE[19]模型在保持關系特性的基礎上,結合不同類型的關系信息,對每個節(jié)點分別提出了一種高維的通用嵌入和一種低維的附加嵌入方法。該模型可以基于統(tǒng)一的網(wǎng)絡嵌入模型,聯(lián)合學習多個關系嵌入向量。Mvn2vec[20]模型研究了保存和協(xié)作對網(wǎng)絡表示學習的影響,探索了同時建模來獲得更好的嵌入質(zhì)量的可行性。該模型證實了保存和協(xié)作對于多層網(wǎng)絡嵌入的有效性和重要性。AMHEN模型提出了一個支持直推學習和歸納學習的通用框架GATNE和GATNE-I,并將網(wǎng)絡實體的屬性考慮在內(nèi)進行圖嵌入學習。該模型的基本嵌入和屬性嵌入可以在不同類型的實體關系中共享,而邊嵌入通過自注意力機制對鄰域信息進行匯聚計算。
綜合分析上述四種嵌入模型,多層異構網(wǎng)絡嵌入模型考慮了聯(lián)合作戰(zhàn)態(tài)勢實體知識結構的多層次特征,以及實體和關系的類型多樣性特征,更加符合聯(lián)合作戰(zhàn)態(tài)勢實體及其關系的特點。但由于真實想定場景中聯(lián)合作戰(zhàn)態(tài)勢知識圖譜的結構及其元路徑模式相比公開數(shù)據(jù)集而言更加復雜,僅基于網(wǎng)絡的結構特征和固定元路徑模式進行聯(lián)合作戰(zhàn)態(tài)勢知識表示學習,無法完全反映聯(lián)合作戰(zhàn)態(tài)勢實體及其關系的復雜語義描述信息,需要根據(jù)軍事領域知識的具體特點進行針對性建模。本文以兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜為起點,深入分析聯(lián)合作戰(zhàn)態(tài)勢知識圖譜的實體和關系類型,充分利用實體屬性描述信息,并結合自注意力機制,根據(jù)聯(lián)合作戰(zhàn)體系構建內(nèi)容,設計了五種不同類型的實體關系類型模式,采用圖嵌入模型中的變長元路徑計算方法,對聯(lián)合作戰(zhàn)態(tài)勢中的實體及其關系進行知識表示學習。
2 模型定義
定義1:兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜G=(V,E),描述兵棋聯(lián)合作戰(zhàn)態(tài)勢的實體及其關聯(lián)關系。更進一步講,是通過作戰(zhàn)態(tài)勢實體特征的概念化,以及實體關系的語義化對兵棋聯(lián)合作戰(zhàn)想定場景的態(tài)勢實體及其關系進行整體描述,如圖1所示。其中,V={v1,v2,…,vn}表示聯(lián)合作戰(zhàn)態(tài)勢中的實體集,vi表示聯(lián)合作戰(zhàn)態(tài)勢實體,如各種飛機類型實體、目標類型實體等,n表示聯(lián)合作戰(zhàn)態(tài)勢中實體的數(shù)量。E={eij}表示實體之間的關系集,eij={vi,vj}表示節(jié)點vi和vj間的關系,權重wij≥0表示vi和vj間語義關系的屬性強度。由于兵棋聯(lián)合作戰(zhàn)態(tài)勢實體間關系具有明確的指向性,因此兵棋聯(lián)合作戰(zhàn)態(tài)勢知識圖譜為有向有權圖,且eij≠eji和wij≠wji。如海軍航空兵對敵水面艦船實施火力打擊,由于受環(huán)境、飛機武器掛載以及艦艇類型等不同因素的影響,不同類型的飛機對不同類型艦船的命中概率不同,都能夠通過聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜進行整體描述。
圖1 兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜示意圖
定義2:多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜G=(V,E,O,R,A)滿足態(tài)勢實體類型映射函數(shù)φ:V→O和關系類型映射函數(shù)ψ:E→R。其中,O和R分別表示實體和關系類型的集合。對聯(lián)合作戰(zhàn)想定場景中的每一個態(tài)勢實體v∈V和關系e∈E均屬于某一特定的實體或關系類型,即φ(v)∈O和ψ(e)∈R,且|O|+|R|>2。否則,該兵棋聯(lián)合作戰(zhàn)態(tài)勢知識圖譜是同質(zhì)的。因此,多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢知識圖譜中的實體及關系不再簡單表示為vi和eij,而是加入了相應的類型描述,分別表示為
和
表示多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜中實體包含的屬性信息集。
定義3:多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜嵌入是給定兵棋聯(lián)合作戰(zhàn)態(tài)勢異構實體知識圖譜,在不同實體關系類型情況下,學習不同類型態(tài)勢實體在低維連續(xù)向量空間中的實值嵌入向量,即對每一種不同的實體間關系類型r,通過映射函數(shù)fr:V→
d學習實體集V的低維嵌入向量X∈
|V|×d。其中,d?|V|,Xv表示實體節(jié)點v的嵌入向量。
3 模型框架
如圖2所示,本節(jié)重點介紹基于元路徑的多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜嵌入模型框架。該模型框架主要由兩部分組成,分別是兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識表示學習模型和異構Skip-Gram模型。前者通過匯聚生成態(tài)勢實體的低維嵌入向量捕捉聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜的網(wǎng)絡拓撲結構信息、實體屬性信息和實體關系信息,其結果作為異構Skip-Gram模型的輸入學習捕捉態(tài)勢實體知識的語義信息。
圖2 多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢實體
知識圖譜嵌入模型框架
兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識表示學習模型主要由三部分組成,分別是基本嵌入向量生成模型、實體節(jié)點屬性向量生成模型和邊嵌入向量生成模型。三個模型的輸出結果匯聚生成聯(lián)合作戰(zhàn)態(tài)勢實體嵌入向量。對于基本嵌入向量生成模型,沒有考慮不同類型實體以及不同類型實體關系對生成實體節(jié)點嵌入向量的影響,只考慮了多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜的結構特征,采用隨機游走方法直接生成每個實體節(jié)點vi的基本嵌入向量bi。當進一步考慮實體節(jié)點的屬性對生成實體嵌入向量的影響時,實體嵌入向量是相應實體類型z=φ(vi)的函數(shù),表示為bi=hz(xi)。值得注意的是,對于不同類型的實體節(jié)點vi,其屬性向量xi可能具有不同的維度。
對于每個實體節(jié)點vi在實體關系類型r情況下的k階邊嵌入向量,由實體節(jié)點vi鄰居的邊嵌入向量聚合而成,表示為
(1)
其中,Ni,r表示與實體節(jié)點vi關系類型為r的鄰居節(jié)點集合。模型中,每個關系類型為r的實體節(jié)點vi初始邊嵌入向量為實體屬性xi的函數(shù),表示為
其中,gz,r是關系類型為r的實體節(jié)點vi的特征轉換函數(shù),邊嵌入向量的聚合函數(shù)采用平均聚合而成。因此,公式(1)可進一步表示為
(2)
其中,σ(x)=1/(1+exp(-x))為Sigmoid激活函數(shù)。將實體節(jié)點vi的所有K階邊嵌入向量
表示為ui,r。
最終,聚合成實體節(jié)點vi的s×m維邊嵌入向量Ui:
Ui=(ui,1,ui,2,…,ui,m)
(3)
其中,s表示邊嵌入向量的維度,m表示與實體節(jié)點vi連接的邊類型的數(shù)量。
根據(jù)以上分析,計算匯聚后的邊類型為r的兵棋聯(lián)合作戰(zhàn)態(tài)勢實體節(jié)點vi的嵌入向量vi,r,可得
(4)
其中,bi表示實體節(jié)點vi的基本嵌入向量。αr為超參數(shù),表示在總的實體嵌入向量中邊嵌入向量的重要性。
表示需要訓練的變換矩陣。由于自注意力機制有利于捕捉影響力更強的邊類型[21],因此,本文采用自注意力機制計算r型邊的實體節(jié)點嵌入向量Ui的線性向量組合系數(shù)ai,r∈Rm:
(5)
其中,wr和Wr分別表示r類型邊的da維和da×s維訓練參數(shù),上標T表示向量或矩陣的轉置運算。由此,可以進一步得到
(6)
其中,λp表示ai,r的第p個元素,計算方法為
(7)
對于實體節(jié)點vi的屬性向量生成項,βr為超參數(shù),Dz表示實體類型為z的節(jié)點vi的特征轉換矩陣。
模型首先采用基于元路徑的隨機游走方法匯聚生成兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識的節(jié)點序列,然后,采用異構Skip-Gram模型[22]學習序列中實體知識節(jié)點的嵌入向量。具體而言,從邊類型r的角度描述兵棋聯(lián)合作戰(zhàn)態(tài)勢知識圖譜時,生成子圖Gr=(V,Er,A),進而可以從中提取邊類型為r的元路徑模式Γ:V1→V2→…→Vt→…→Vl。其中,游走的元路徑模式Γ通過預先定義完成,l表示該元路徑模式Γ的長度。然而,由于兵棋聯(lián)合作戰(zhàn)態(tài)勢實體的關系復雜性特征,本節(jié)基于聯(lián)合作戰(zhàn)體系的構建內(nèi)容,將兵棋聯(lián)合作戰(zhàn)態(tài)勢實體間關系定義為偵察情報關系、指揮控制關系、聯(lián)合打擊關系、信息保障關系和后裝保障關系5類。然而,在這些不同類型的聯(lián)合作戰(zhàn)態(tài)勢實體關系中,每種關系的實體關聯(lián)元路徑長度并不一致。以聯(lián)合打擊關系元路徑模式為例,空中飛行中隊通過選擇的作戰(zhàn)飛機類型及其掛載類別,選擇掛載相應的攻擊性武器,并通過空空武器殺傷指數(shù)定義表對相應空中飛行目標類別的機型實施打擊。但對后裝保障關系元路徑模式,要對攻擊性武器實施保障,首先應確定保障的后勤物資類型,然后實施相應的保障。因此,本節(jié)在每種關系內(nèi)部采用變長元路徑模式描述實體之間的語義聯(lián)系?;隈R爾科夫過程,在步驟t時基于元路徑模式隨機游走的轉移概率定義為
(8)
其中,vi∈Vt,Ni,r表示與實體節(jié)點vi關系類型為r的鄰居?;谠窂降碾S機游走策略可以確保不同類型節(jié)點之間的語義聯(lián)系,從而將更加合適的實體節(jié)點序列輸入異構Skip-Gram模型,增強基于語義信息的嵌入向量生成效果。假設在類型為r邊上長度為l的隨機游走路徑為P=(vp1,…,vpl)。由此可得,該路徑上的邊(vpt-1,vpt)∈Er(t=2…l)所處的語義上下文為C={vpk|vpk∈P,|k-t|≤c,t≠k}。其中,c為上下文窗口半徑。
因此,在給定實體節(jié)點vi及其路徑語義上下文C情況下,多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜嵌入模型的目標是最小化以下負對數(shù)似然函數(shù):
-logPθ({vj|vj∈C}|vi)=∑vj∈C-logPθ(vj|vi)
(9)
其中,θ表示模型相關參數(shù)。本章采用異構softmax函數(shù)對實體vi的節(jié)點類型進行歸一化處理,然后,在給定實體節(jié)點vi情況下,計算游走到實體節(jié)點vj的轉移概率,可得
(10)
其中,vj∈Vt,ck表示實體節(jié)點vk的上下文向量,vi表示邊類型為r的實體節(jié)點vi匯聚后的嵌入向量。
最后,采用異構負采樣方法計算每個實體節(jié)點對的目標函數(shù)-log?Pθ(vj|vi)可得
(11)
其中,L為訓練樣本中的負樣本數(shù)量,vk由實體節(jié)點vj對應集合Vt中定義的噪聲分布中隨機選取。模型算法總結如表1所示。
4 實驗分析
首先介紹實驗過程中采用的兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識數(shù)據(jù)集及相關基線模型,然后根據(jù)兵棋聯(lián)合作戰(zhàn)態(tài)勢實體關系,推理任務評估算法性能,最后通過模型參數(shù)的敏感性分析討論模型的魯棒性。
1)數(shù)據(jù)集
本節(jié)聚焦多模態(tài)兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識獲取任務,采用多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜作為知識庫。知識庫中包括兵棋聯(lián)合作戰(zhàn)態(tài)勢相關的人員、裝備、設施、目標、自然環(huán)境和作戰(zhàn)能力等類型實體及其屬性信息,以及基于聯(lián)合作戰(zhàn)體系內(nèi)容視角的不同態(tài)勢實體間關系,其中包括情報偵察關系、指揮控制關系、聯(lián)合打擊關系、信息保障關系和后裝保障關系。以指揮控制關系類型為例,本節(jié)根據(jù)聯(lián)合作戰(zhàn)體系構建內(nèi)容基本理論,貫穿戰(zhàn)略、戰(zhàn)役、戰(zhàn)術各層級,從作戰(zhàn)集團到聯(lián)合作戰(zhàn)指揮機構,再到作戰(zhàn)任務執(zhí)行部隊,以及具體的作戰(zhàn)行動人員或裝備,設計構建完整的聯(lián)合作戰(zhàn)指揮控制關系類型元路徑模式。該元路徑模式不再詳細區(qū)分隸屬、配屬、所屬、指揮等細粒度關系類型,而是聚焦于聯(lián)合戰(zhàn)役級指揮控制相關態(tài)勢要素,將該元路徑上相關的部隊、人員、裝備等實體之間的序列關系均定義為指揮控制關系。該方法既反映了聯(lián)合作戰(zhàn)體系構建的基本特征,同時減少了態(tài)勢實體間的關系類型數(shù)量,降低了模型計算的復雜度,提高了模型的語義表達性能。
表1 模型算法
同時,為增強本節(jié)基于元路徑的多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜嵌入模型算法的性能比較優(yōu)勢,本文還采用公開的亞馬遜電子類產(chǎn)品數(shù)據(jù)集進行對比分析[23]。該數(shù)據(jù)集中包含了電子類產(chǎn)品的屬性信息、商品共現(xiàn)關系信息和同時購買關系信息。其中,商品的屬性信息主要包括價格、品牌和種類等。數(shù)據(jù)集的統(tǒng)計情況如表2所示。
表2 數(shù)據(jù)集統(tǒng)計情況
2)基線模型及參數(shù)設定
根據(jù)不同的網(wǎng)絡結構特征,分別選取經(jīng)典的圖嵌入模型作為基線模型進行性能比較分析。其中,在異構網(wǎng)絡中選取了metapath2vec模型,在多層異構網(wǎng)絡中選取了GATNE-I模型。需要說明的是,為增強模型比較,在所有模型中本節(jié)設定的最終嵌入向量維度為d=200,邊嵌入向量維度為s=10,每個節(jié)點的游走次數(shù)設定為20,游走長度根據(jù)不同的元路徑模式長度而定,實體節(jié)點語義上下文窗口半徑c=5,每個正訓練樣本的負樣本數(shù)設置為L=5,最大迭代次數(shù)為50,模型在每個訓練過程中停止的條件為驗證集上的ROC-AUC在一個訓練過程中沒有改善,每種關系類型r的超參數(shù)設置為αr=1和βr=1。模型采用TensorFlow中的自適應矩估計(Adam Optimizer)進行優(yōu)化,學習率設定為η=0.001。
3)模型性能
實體關系推理是一種用于發(fā)現(xiàn)實體間潛在關系的常見方法,多用于知識圖譜補全。聯(lián)合作戰(zhàn)態(tài)勢實體關系推理任務主要是基于知識圖譜中已有的態(tài)勢實體關系,推理預測可能存在的態(tài)勢實體關系。在實驗過程中,隱藏多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜中的部分實體關系,對剩余作戰(zhàn)態(tài)勢實體知識圖譜中的實體及其關系進行訓練。實驗分別構建了訓練集、驗證集和測試集。訓練集用于模型參數(shù)訓練,驗證集用于超參數(shù)調(diào)優(yōu)和模型訓練中止,測試集用于評估模型性能且在已調(diào)優(yōu)的超參數(shù)下只運行一次。驗證集和測試集分別包含了按10%隨機選擇的正邊。對于每種邊的類型,隨機選擇的負邊數(shù)量相等。
在性能分析過程中,這里采用常見的評估標準,如ROC-AUC、PR-AUC和F1分數(shù)。為避免閾值產(chǎn)生的影響,假設測試集中隱藏的邊數(shù)量是給定的,相關指標在選定的邊類型中均勻分布。兩個數(shù)據(jù)集在三個評估標準下的定量實驗結果如表3所示。實驗結果顯示,在亞馬遜公開數(shù)據(jù)集上,這里提出的模型性能與經(jīng)典模型差別不大,F1分數(shù)甚至低于metapath2vec模型。其主要原因在于,亞馬遜數(shù)據(jù)集實體類型和關系類型相比較而言簡單,本節(jié)提出的模型優(yōu)勢沒有充分體現(xiàn)。值得注意的是,三種經(jīng)典圖嵌入模型算法在兵棋聯(lián)合作戰(zhàn)態(tài)勢數(shù)據(jù)集上的性能下降明顯,其主要原因在于聯(lián)合作戰(zhàn)態(tài)勢數(shù)據(jù)集中的實體及其關系類型更為多樣,元路徑模式更為復雜。相比較三種經(jīng)典圖嵌入模型算法,本節(jié)提出的模型性能提升較為明顯,尤其在兵棋聯(lián)合作戰(zhàn)態(tài)勢數(shù)據(jù)集上的表現(xiàn)更為突出,相比較GATNE-I模型,ROC-AUC、PR-AUC和F1分數(shù)分別提升5.63%、1.82%和1.85%。這說明,兵棋聯(lián)合作戰(zhàn)態(tài)勢實體及其關系相比電商領域實體及其關系更為復雜,需要從具體應用場景出發(fā),針對領域實際特點和領域數(shù)據(jù)集中的多關系型數(shù)據(jù)不同的網(wǎng)絡結構特征和實體間的語義聯(lián)系,設計更為適應的元路徑模式,從而提高兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識表示學習模型的性能。
表3 不同模型在數(shù)據(jù)集上的性能比較
接下來考察多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜嵌入模型中的實體嵌入向量維度d以及邊嵌入向量維度s在聯(lián)合作戰(zhàn)態(tài)勢數(shù)據(jù)集上相對于指標ROC-AUC的敏感性。由圖3的實驗結果可知,相比較模型中的默認設置實體嵌入向量維度d=200和邊嵌入向量維度為s=10而言,ROC-AUC曲線隨著維度變化的波動幅度較小。由此可以得出結論,本節(jié)模型在較大的基本嵌入或邊嵌入維度范圍內(nèi),性能相對穩(wěn)定,魯棒性較好,僅當基本嵌入或邊嵌入維度太小或太大時性能才會出現(xiàn)小幅下降。
圖3 不同基本嵌入或邊嵌入維度對模型性能的影響
5 結束語
本文針對多源異構聯(lián)合作戰(zhàn)態(tài)勢信息的復雜性特點,依托兵棋推演平臺,以兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識為研究對象,以兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜為研究起點,聚焦兵棋聯(lián)合作戰(zhàn)想定場景中多層異構兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識嵌入問題,基于聯(lián)合作戰(zhàn)體系構建基本理論,通過合理設計了實體間語義聯(lián)系的元路徑模式,提出了基于元路徑的兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜嵌入模型,將作戰(zhàn)態(tài)勢實體知識轉化為更加適合機器學習和處理的向量形式,實現(xiàn)了對兵棋聯(lián)合作戰(zhàn)態(tài)勢實體知識圖譜結構特征和作戰(zhàn)態(tài)勢實體間語義關系特征的有效捕捉,為大規(guī)模聯(lián)合作戰(zhàn)態(tài)勢知識的智能獲取和推理奠定良好基礎。
審核編輯:符乾江
評論