以下文章來源于模力方舟,作者馬建倉
模力方舟平臺(tái)現(xiàn)已上線來自月之暗面(Moonshot AI)發(fā)布的全新開源旗艦?zāi)P蚄imi K2.5。
Kimi K2.5在原有 Kimi K2 的基礎(chǔ)上,進(jìn)行了大規(guī)模繼續(xù)預(yù)訓(xùn)練,覆蓋約 15 萬億(15T)圖像和文本混合 token,構(gòu)建了一個(gè)原生多模態(tài)、具備智能體調(diào)度能力的基礎(chǔ)模型。
原生多模態(tài)架構(gòu):統(tǒng)一視覺與語言
K2.5 不再是單純的對(duì)話模型,它內(nèi)建視覺理解機(jī)制,能夠同時(shí)處理高精度圖像、視頻、布局、復(fù)雜文檔甚至 UI 截圖等輸入,并與語言編碼緊密交互。
K2.5 可將圖像或視頻內(nèi)容轉(zhuǎn)換為結(jié)構(gòu)化的代碼輸出,支持完整的前端生成、圖像調(diào)試與組件生成等任務(wù),是開源陣營中少數(shù)具備「視覺驅(qū)動(dòng)代碼生成」能力的模型之一。
Agent Swarm:自組織智能體集群并行執(zhí)行
Kimi K2.5引入了全新的 Agent Swarm(智能體集群)機(jī)制。不同于傳統(tǒng)單 Agent 或靜態(tài)拆分子任務(wù)的方法,K2.5 能夠:
自動(dòng)分析復(fù)雜指令并拆分成并行子任務(wù)
調(diào)度最多 100 個(gè)子智能體(sub?agents) 同時(shí)工作
在內(nèi)部管理最多 1500 次工具調(diào)用(tool calls)
與單一智能體執(zhí)行相比,整體執(zhí)行時(shí)間可縮短 約 4.5 倍

這一過程無需用戶手動(dòng)指定子智能體或完整流程,智能體集群在模型內(nèi)部自動(dòng)創(chuàng)建和協(xié)作調(diào)度,這是 K2.5 相較前代的關(guān)鍵架構(gòu)性突破之一。
Agent Swarm 是怎么訓(xùn)練出來的?
Kimi K2.5的 Agent Swarm 能力并非依賴固定規(guī)則或流程模板,而是通過一種名為 Parallel-Agent Reinforcement Learning(并行智能體強(qiáng)化學(xué)習(xí)) 的方式訓(xùn)練而成。
訓(xùn)練中,模型自身作為協(xié)調(diào)器,在模擬環(huán)境中動(dòng)態(tài)生成子智能體、執(zhí)行并發(fā)子任務(wù),并根據(jù)任務(wù)完成質(zhì)量與效率獲得獎(jiǎng)勵(lì)反饋。為避免退化為串行執(zhí)行,訓(xùn)練采用階段式獎(jiǎng)勵(lì)機(jī)制:早期鼓勵(lì)更高并發(fā),后期強(qiáng)調(diào)最終完成質(zhì)量。

隨著訓(xùn)練推進(jìn),模型能自主學(xué)會(huì)在準(zhǔn)確性和并發(fā)性之間動(dòng)態(tài)取舍,實(shí)現(xiàn)真正的任務(wù)分解與協(xié)作執(zhí)行。
編碼與視覺聯(lián)合能力明顯提升
K2.5 能根據(jù)簡(jiǎn)單自然語言指令生成完整前端界面,包括豐富布局和動(dòng)畫效果;能分析視頻或圖像內(nèi)容并自動(dòng)構(gòu)建對(duì)應(yīng)代碼實(shí)現(xiàn)。
這一協(xié)同能力源于大規(guī)模圖文聯(lián)合訓(xùn)練,使視覺理解和代碼生成過程語義一致、結(jié)構(gòu)對(duì)齊。這使得復(fù)雜軟件工程、UI 重構(gòu)、圖像到代碼等現(xiàn)實(shí)場(chǎng)景下的生產(chǎn)力提升更顯著。
向?qū)I(yè)級(jí)任務(wù)延伸:辦公與生產(chǎn)力場(chǎng)景
K2.5 的智能體群體機(jī)制和多模態(tài)理解能力也顯著擴(kuò)展了其在辦公場(chǎng)景的落地潛力:
支持在自然語言提示下自動(dòng)生成 Word、Excel、PDF、幻燈片等結(jié)構(gòu)化辦公成果
可完成從表格建模、公式書寫到長文寫作的完整鏈路
在官方內(nèi)部 Office Benchmark 與多步 Agent Benchmark 中,K2.5 相比前代模型分別提升 59.3%、24.3%

性能對(duì)比:Kimi K2.5 以更低成本實(shí)現(xiàn)更強(qiáng)表現(xiàn)
官方評(píng)測(cè)數(shù)據(jù)顯示,Kimi K2.5 在多個(gè)關(guān)鍵任務(wù)上已對(duì)標(biāo)甚至超越封閉模型,尤其在智能體調(diào)度、編碼任務(wù)、多模態(tài)理解等方面展現(xiàn)出極高性價(jià)比:
Agent 能力:在 HLE-Full、BrowseComp、DeepSearchQA 三項(xiàng) Agent benchmark 上大幅領(lǐng)先
多模態(tài)理解:在 MathVision、OmniDocBench、VideoMMMU 等任務(wù)中展現(xiàn)領(lǐng)先圖文理解與視頻分析能力
編碼能力:在 SWE-Bench Verified 和 Multilingual 雙任務(wù)中性能與 GPT-4 Turbo 接近

同時(shí),Kimi K2.5 的執(zhí)行成本遠(yuǎn)低于同類商用模型,結(jié)合「Agent Swarm」機(jī)制下的并發(fā)效率提升,在三項(xiàng)主力 benchmark 中分別實(shí)現(xiàn):
HLE:節(jié)省 10.1×
BrowseComp:節(jié)省 2.1×
SWE-Verified:節(jié)省 3.1×

即刻體驗(yàn) Kimi K2.5
Kimi K2.5已正式上線模力方舟,無論是探索前沿 Agent 技術(shù),還是在真實(shí)生產(chǎn)環(huán)境中部署高效多模態(tài)模型,模力方舟都提供了開箱即用的接口與多種資源支持。
訪問入口:
https://moark.com/serverless-api?model=Kimi-K2.5
-
開源
+關(guān)注
關(guān)注
3文章
4244瀏覽量
46271 -
模型
+關(guān)注
關(guān)注
1文章
3772瀏覽量
52168 -
智能體
+關(guān)注
關(guān)注
1文章
506瀏覽量
11616
原文標(biāo)題:Kimi K2.5 上線模力方舟:視覺驅(qū)動(dòng)代碼生成,支持百個(gè) Agent 并發(fā)
文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
中科曙光scaleX萬卡超集賦能中國大模型出海新篇章
模力方舟現(xiàn)已正式開源官方Skills倉庫Moark Skills
模力方舟與TorchV達(dá)成戰(zhàn)略合作
壁仞科技壁礪166系列產(chǎn)品深度適配MiniMax M2.5和智譜GLM-5模型
月之暗面全新開源旗艦?zāi)P蚄imi K2.5上線模力方舟
評(píng)論