過(guò)去三年,在與微軟亞洲研究院“創(chuàng)新匯”成員企業(yè)探討 AI 如何在各行業(yè)落地的過(guò)程中,微軟亞洲研究院的研究員們發(fā)現(xiàn),資源調(diào)度優(yōu)化是很多領(lǐng)域都存在的通用問(wèn)題,這也是為什么經(jīng)久不衰的“運(yùn)籌學(xué)”廣泛應(yīng)用于各行各業(yè)的原因。因此,基于三年來(lái)與成員企業(yè)的合作研究,微軟亞洲研究院發(fā)布了多智能體資源優(yōu)化平臺(tái)“群策 MARO”,并將其開源。
MARO 適用于由資源供需不平衡導(dǎo)致的資源利用率低的問(wèn)題,而這樣的問(wèn)題廣泛存在于多個(gè)行業(yè)的不同場(chǎng)景。如何更好地在不同參與者間以合理的成本提高資源利用率,為行業(yè)創(chuàng)造更大的利潤(rùn)空間,且為社會(huì)節(jié)省不必要的資源浪費(fèi),是 MARO 的使命。這其中,利用創(chuàng)新技術(shù)助力企業(yè)和組織在關(guān)鍵場(chǎng)景中高效配置資源、節(jié)能減排,也是微軟可持續(xù)發(fā)展戰(zhàn)略中的重要一環(huán)。
資源分配如何優(yōu)化?
MARO來(lái)幫忙
剛剛過(guò)去的雙11其實(shí)就是一個(gè)典型的倉(cāng)儲(chǔ)物流行業(yè)資源匹配的場(chǎng)景,由于大家的“爆發(fā)式”采購(gòu),三五年前我們經(jīng)常聽到出現(xiàn)“爆倉(cāng)”的問(wèn)題,但近兩年這個(gè)問(wèn)題相對(duì)得到了緩解,其主要原因就是倉(cāng)儲(chǔ)物流調(diào)度水平的大幅提升。其他常見(jiàn)的、需要資源調(diào)度優(yōu)化的場(chǎng)景還有共享單車中自行車與站點(diǎn)、人的匹配,物流運(yùn)輸中集裝箱與港口、船只、貨物的匹配,電信領(lǐng)域無(wú)線基站帶寬與用戶流量的匹配,數(shù)據(jù)中心計(jì)算資源與運(yùn)行任務(wù)之間的匹配,制造企業(yè)的生產(chǎn)與排程等等。
微軟亞洲研究院的研究員們將資源調(diào)度優(yōu)化這個(gè)場(chǎng)景高度抽象,搭建出了一個(gè)可以讓 AI 技術(shù)更好賦能這一場(chǎng)景的、通用的技術(shù)平臺(tái) MARO。MARO是一個(gè)面向多行業(yè)橫截面上的全鏈條資源優(yōu)化 AI 解決方案,對(duì)于 MARO 已經(jīng)涵蓋的場(chǎng)景,用戶只需提供合規(guī)的數(shù)據(jù),MARO 就可以構(gòu)建仿真環(huán)境并支持分布式并行訓(xùn)練,進(jìn)而給出最終的解決方案;而對(duì)于尚未支持的場(chǎng)景(如不同的資源實(shí)體,不同的資源產(chǎn)生和消耗邏輯等),MARO 則可以在限定的成本下幫助構(gòu)建可行的方案。
從技術(shù)角度來(lái)看,智能資源調(diào)度優(yōu)化可以分為三個(gè)層面:最底層,可以理解為信息感知層,在這里需要通過(guò)一些智能感知技術(shù)把整個(gè)過(guò)程真正數(shù)字化,比如共享單車場(chǎng)景里的每個(gè)停車點(diǎn)、每輛單車,或是航運(yùn)物流里的每個(gè)集裝箱、船只、港口等;第二層是信息的推理層,它建立在信息感知層之上,通過(guò)預(yù)測(cè)模型刻畫未來(lái)的資源供需情況,然后基于這些情況來(lái)設(shè)計(jì)算法去優(yōu)化資源調(diào)度;最高層則是智能決策層,該層無(wú)需額外的算法模型,因?yàn)橹悄苣P涂梢灾苯永玫谝粚雍偷诙拥男畔⒔o出最終的優(yōu)化方案,實(shí)現(xiàn)完全的、端到端的決策。目前,業(yè)界的優(yōu)化應(yīng)用大多處于第二層,而 MARO 在兼顧第二層需求的前提下,可助力資源優(yōu)化實(shí)現(xiàn)第三層中的智能決策。
打開MARO的正確姿勢(shì)
考慮到不同行業(yè)用戶對(duì) AI 技術(shù)的掌握程度會(huì)有所不同,MARO 平臺(tái)提供了三種面向不同用戶的構(gòu)建方式,以幫助相關(guān)人員由淺入深地應(yīng)用 AI 技術(shù),創(chuàng)建自己的資源調(diào)度優(yōu)化模型,同時(shí),也降低了科研成果在真實(shí)場(chǎng)景中應(yīng)用的門檻,讓 AI 可以助力解決業(yè)界更多的實(shí)際問(wèn)題。
MARO 平臺(tái)的三層架構(gòu)
MARO Service:服務(wù)層,開箱即用
對(duì)于擁有行業(yè)領(lǐng)域知識(shí),但沒(méi)有機(jī)器學(xué)習(xí)開發(fā)經(jīng)驗(yàn)的人員來(lái)說(shuō),MARO Service 提供了一些現(xiàn)成的資源調(diào)度場(chǎng)景的優(yōu)化模型,如已經(jīng)上線的空集裝箱調(diào)配和共享單車場(chǎng)景等。如果用戶面臨與這三個(gè)模型高度匹配的業(yè)務(wù)場(chǎng)景,那么導(dǎo)入自己的業(yè)務(wù)數(shù)據(jù),即可使用相應(yīng)的模型直接連接上下游業(yè)務(wù)系統(tǒng)。MARO 團(tuán)隊(duì)還在不斷改進(jìn)該層服務(wù),未來(lái)將會(huì)選取更多領(lǐng)域的典型資源優(yōu)化場(chǎng)景加入到平臺(tái)中,讓更多行業(yè)用戶受益。
MARO Platform:構(gòu)建和訓(xùn)練自己的資源調(diào)度模型,并可直接用于生產(chǎn)
對(duì)于需要構(gòu)建自有模型的用戶來(lái)說(shuō),如今無(wú)需太高的 AI 技術(shù)要求,就可以在 MARO Platform 靈活創(chuàng)建新場(chǎng)景、訓(xùn)練新模型,不斷測(cè)試新算法的優(yōu)劣,通過(guò)反饋持續(xù)調(diào)整優(yōu)化模型。例如,有一定規(guī)模的物流企業(yè),本身已具有相應(yīng)的技術(shù)積累,也有自己的傳統(tǒng)解決方案,如果希望利用 AI 尋找創(chuàng)新的優(yōu)化方案,那么此時(shí)就可以通過(guò) MARO 提供的工具快速構(gòu)建模擬場(chǎng)景,并基于實(shí)際的數(shù)據(jù)和業(yè)務(wù)邏輯進(jìn)行優(yōu)化,從而迭代出自己的模型,且可以將該模型集成到自有的生成環(huán)境中使用。
在技術(shù)實(shí)現(xiàn)方面,MARO Platform 中所提供的高性能仿真器是其精髓所在。首先,用戶需要在仿真器環(huán)境中構(gòu)建一張初始的靜態(tài)圖,根據(jù)實(shí)際場(chǎng)景可以包含異構(gòu)的點(diǎn)和邊。比如在共享單車場(chǎng)景中,單車站點(diǎn)對(duì)應(yīng)靜態(tài)圖中的“點(diǎn)”,而站點(diǎn)的位置遠(yuǎn)近對(duì)應(yīng)“邊”,再加上站點(diǎn)容量等其他信息,就可以構(gòu)建出一張靜態(tài)圖,也是機(jī)器認(rèn)知的初始環(huán)境。
搭建包含業(yè)務(wù)邏輯的動(dòng)態(tài)環(huán)境
然后,導(dǎo)入用戶的騎行數(shù)據(jù)(資源需求流),這對(duì)系統(tǒng)而言相當(dāng)于一個(gè)個(gè)事件(Event)流,它們不斷觸發(fā)、更改圖上節(jié)點(diǎn)以及邊的各種屬性,從而形成了一個(gè)包含業(yè)務(wù)邏輯的動(dòng)態(tài)環(huán)境。通過(guò)環(huán)境與事件的不停交互,MARO 可提供基于 AI 算法的幾近實(shí)時(shí)的優(yōu)化策略,傳統(tǒng)方法需要幾小時(shí)才能生成的策略,MARO 幾秒鐘就可以提供。而且環(huán)境增強(qiáng)的方法使得 MARO 的仿真環(huán)境可以在一定程度上模仿現(xiàn)實(shí)的異常環(huán)境,進(jìn)而提高模型的魯棒性,比如資源網(wǎng)絡(luò)中任意一個(gè)節(jié)點(diǎn)出現(xiàn)問(wèn)題,只需把該節(jié)點(diǎn)停掉即可,并不會(huì)影響整體算法。
這其中,資源需求的時(shí)序信息、資源持有者的空間信息等,都可以通過(guò)圖神經(jīng)網(wǎng)絡(luò)有機(jī)地整合在一起,以輔助做出更好的決策。同時(shí),MARO 還會(huì)考慮資源持有者相互之間的競(jìng)爭(zhēng),包容每個(gè)資源持有者可能會(huì)著眼于局部?jī)?yōu)化,而給出相對(duì)“自私”一點(diǎn)的策略,來(lái)完成競(jìng)合策略學(xué)習(xí),但其最終目的還是希望全局網(wǎng)絡(luò)能夠?qū)崿F(xiàn)更好的優(yōu)化。
如果將共享單車的場(chǎng)景延伸到數(shù)據(jù)中心虛擬機(jī)的分配中,那么關(guān)鍵資源則由自行車變成了計(jì)算機(jī)集群上的計(jì)算資源,如 CPU、存儲(chǔ),而事件流變成了客戶對(duì)資源的實(shí)時(shí)需求,如需要10 個(gè) CPU、100GB 內(nèi)存這樣的事件。盡管使用場(chǎng)景變了,但調(diào)度優(yōu)化的本質(zhì)并沒(méi)有改變。因此,MARO 可以最大程度地適用于多個(gè)行業(yè)需要資源優(yōu)化的各種場(chǎng)景,同時(shí)它還可以與基于運(yùn)籌學(xué)和組合優(yōu)化的傳統(tǒng)方法相互融合。
MARO Framework:基礎(chǔ)設(shè)施快速搭建,SDK調(diào)用所需資源
對(duì)于有著較深開發(fā)積累的用戶來(lái)說(shuō),MARO Framework 提供了一個(gè)可擴(kuò)展的工具包,可以基于現(xiàn)有的高性能模塊以及通用接口實(shí)現(xiàn)“更加原創(chuàng)的”仿真環(huán)境構(gòu)建和問(wèn)題建模。開發(fā)人員可以通過(guò) SDK 調(diào)用任何所需的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等資源,也可以根據(jù)自己已有的計(jì)算機(jī)集群搭建 MARO 的平臺(tái),進(jìn)而獲得在分布式環(huán)境下進(jìn)行并行訓(xùn)練的支持。此外,對(duì)于現(xiàn)有問(wèn)題 MARO 還提供了一批基準(zhǔn)算法實(shí)現(xiàn),包括基于經(jīng)典規(guī)則的方法、基于運(yùn)籌學(xué)的組合優(yōu)化方法、以及基于經(jīng)典的強(qiáng)化學(xué)習(xí)的方法,方便用戶進(jìn)行算法比較并快速上手。
由于資源優(yōu)化是個(gè)獨(dú)有卻普遍存在于各個(gè)行業(yè)的應(yīng)用場(chǎng)景,所以 MARO 為不同行業(yè)、不同需求的用戶分層提供了相應(yīng)的框架和工具,用戶可以更好地專注于自己業(yè)務(wù)邏輯場(chǎng)景的開發(fā)和目標(biāo)模型的優(yōu)化,其他諸如訓(xùn)練和管理模型、基礎(chǔ)設(shè)施提供甚至可視化分析等“雜事”都可以放心地交給 MARO 來(lái)處理。
責(zé)任編輯:lq
-
微軟
+關(guān)注
關(guān)注
4文章
6686瀏覽量
105772 -
新技術(shù)
+關(guān)注
關(guān)注
0文章
32瀏覽量
8995 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1308瀏覽量
25165
發(fā)布評(píng)論請(qǐng)先 登錄
HarmonyOS優(yōu)化應(yīng)用預(yù)置圖片資源加載耗時(shí)問(wèn)題性能優(yōu)化
HarmonyOS優(yōu)化應(yīng)用內(nèi)存占用問(wèn)題性能優(yōu)化一
HarmonyOS優(yōu)化應(yīng)用包體積大小問(wèn)題性能優(yōu)化
提升AI訓(xùn)練性能:GPU資源優(yōu)化的12個(gè)實(shí)戰(zhàn)技巧

評(píng)論