優(yōu)步有開源光纖,一個新的庫,旨在授權用戶在計算機集群上實現(xiàn)大規(guī)模的機器學習計算。 庫的主要目標是利用異構計算硬件,動態(tài)規(guī)模算法,并減輕工程師在集群上實現(xiàn)復雜算法的負擔。.
對于機器學習框架來說,保持足夠的靈活性來支持強化學習(RL)和基于人口的算法以及其他啟發(fā)式算法(如深度學習)是一個挑戰(zhàn),因為需求可能會有很大的變化。
雖然TensorFlow和Py Torch等已建立的框架涵蓋了大多數(shù)常見機器學習方法的分布式培訓設置,但這些框架不太適合基于RL和基于人口的方法,這往往需要與模擬器頻繁交互以及復雜和動態(tài)的縮放策略。 光纖為其分布式計算框架提供了統(tǒng)一的Python用戶界面,以支持這些新需求。
與Fiber一起發(fā)表的研究論文詳細介紹了用于評估框架開銷、進化策略和近端策略優(yōu)化(PPO)庫的實驗。 研究人員比較了Fiber與IPy并行(iPython用于并行計算)、Spark和標準python多處理庫在框架開銷上的性能,發(fā)現(xiàn)Fiber在任務持續(xù)時間較短時優(yōu)于iPy并行和Spark,這是處理模擬器時要理解的重要指標。
與Atari基準中關于Breakout的多處理實現(xiàn)相比,F(xiàn)iber啟用的PPO分布式版本的性能表明,F(xiàn)iber可以將RL算法擴展到本地機器之外。
光纖分成API層,后端層,簇層。. API層與標準Python多處理模塊具有相似的要求和語義,但擴展到分布式環(huán)境中工作。
后端層可以處理多個不同集群管理器的任務通信。 最后,聚類層包含Kubernetes和Peloton等集群管理器。
光纖引入了一個新的概念,稱為工作支持過程。 當啟動其中一個進程時,將創(chuàng)建一個在當前集群上帶有Fiber后端的新作業(yè)。 父容器在使用相同的容器映像啟動子進程之前封裝所需的文件、輸入數(shù)據(jù)和該作業(yè)的任何其他依賴項,以保證一致的運行環(huán)境。 下圖更詳細地說明了這一架構:
纖維和谷歌新的分布式強化學習庫種子RL的發(fā)布表明,大科技公司的目標是既降低成本,又簡化培訓尖端機器學習算法的過程。
-
光纖
+關注
關注
20文章
4147瀏覽量
75246 -
算法
+關注
關注
23文章
4710瀏覽量
95403 -
機器學習
+關注
關注
66文章
8503瀏覽量
134630
發(fā)布評論請先 登錄
基于RV1126開發(fā)板移植NCNN部署庫方法

Open Echo:一個開源的聲納項目

沐曦GPU跑通DeepSeek開源代碼庫FlashMLA
AI開源模型庫有什么用
優(yōu)步革新服務:讓服務性動物乘車體驗再升級
開源AI模型庫是干嘛的
芯原股份與開源圖形庫LVGL達成戰(zhàn)略合作
PingCAP推出TiDB開源分布式數(shù)據(jù)庫

分享一個嵌入式通用FIFO環(huán)形緩沖區(qū)實現(xiàn)庫

評論