近日,由盛大集團(tuán)全資孵化的AI技術(shù)團(tuán)隊(duì)EverMind,正式對(duì)外系統(tǒng)性地展示AI記憶操作系統(tǒng)——EverMemOS,最新版本在四大記憶基準(zhǔn)上實(shí)現(xiàn)了最先進(jìn)(SOTA)準(zhǔn)確率。
EverMemOS:打破行業(yè)基準(zhǔn),點(diǎn)擊即用
在EverMind最新發(fā)布的論文EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning中,團(tuán)隊(duì)對(duì)現(xiàn)有主流方案進(jìn)行了清晰區(qū)分。
EverMind詳細(xì)闡述了其技術(shù)提出的一套受engram啟發(fā)的生命周期機(jī)制,用以模擬生物認(rèn)知過程。與傳統(tǒng)RAG或成本高昂的超長(zhǎng)上下文窗口不同,EverMemOS能將經(jīng)驗(yàn)組織為連貫、可演化的結(jié)構(gòu)。
它試圖構(gòu)建的,是一個(gè)類似生物認(rèn)知系統(tǒng)的記憶生命周期,靈感直接來自神經(jīng)科學(xué)中的engram理論。
在這套架構(gòu)中,記憶不是靜態(tài)存儲(chǔ),而是會(huì)被不斷壓縮、重組、強(qiáng)化和遺忘的動(dòng)態(tài)系統(tǒng)。
EverMemOS的核心機(jī)制,被概括為三個(gè)連續(xù)但可循環(huán)的階段。
第一階段:情景痕跡形成(Episodic Trace Formation)。
將對(duì)話流轉(zhuǎn)換為MemCells,用于捕捉情景痕跡、原子事實(shí)以及有時(shí)間邊界的前瞻信息。
第二階段:語(yǔ)義鞏固(Semantic Consolidation)。
把MemCells動(dòng)態(tài)組織為主題化的MemScenes,提煉穩(wěn)定的語(yǔ)義結(jié)構(gòu),并持續(xù)更新持久化的用戶畫像。
第三階段:重建式回憶(Reconstructive Recollection)。
通過agentic檢索組合“必要且充分”的推理上下文,在優(yōu)化算力成本的同時(shí)保證高準(zhǔn)確率。
這也是EverMemOS能在大幅降低token消耗的同時(shí),維持甚至提升準(zhǔn)確率的關(guān)鍵。
基準(zhǔn)成績(jī),是硬指標(biāo)
在AI基礎(chǔ)設(shè)施領(lǐng)域,架構(gòu)是否成立,最終要看基準(zhǔn)測(cè)試。
EverMind在四個(gè)主流記憶評(píng)測(cè)基準(zhǔn)上,給出了極具說服力的數(shù)據(jù)。
LoCoMo(93.05%準(zhǔn)確率):超越全部現(xiàn)有記憶系統(tǒng)與全上下文模型;在多跳推理(+19.7%)與時(shí)序任務(wù)(+16.1%)上優(yōu)勢(shì)顯著,同時(shí)大幅降低token使用與計(jì)算成本。
LongMemEval(83.00%準(zhǔn)確率):在知識(shí)更新與時(shí)序推理方面位居第一;其中知識(shí)更新任務(wù)提升20.6%,體現(xiàn)出系統(tǒng)可通過持續(xù)語(yǔ)義鞏固不斷“進(jìn)化”的能力。
HaluMem(90.04%召回):在記憶完整性方面建立新的行業(yè)標(biāo)準(zhǔn),顯著減少長(zhǎng)時(shí)程任務(wù)中的幻覺。
PersonaMem v2:在9個(gè)復(fù)雜場(chǎng)景中,在深度個(gè)性化與行為一致性維度取得最佳綜合表現(xiàn)。
這說明EverMind不需要犧牲效率,去換取長(zhǎng)期記憶。結(jié)構(gòu)本身,就是效率。
從論文到云服務(wù):記憶能力的產(chǎn)品化
如果EverMemOS只停留在論文階段,它的意義仍然是學(xué)術(shù)層面的。
但是,EverMind顯然希望更快地進(jìn)入真實(shí)應(yīng)用場(chǎng)景。
此次同步推出的EverMemOS Cloud Service,正是為開發(fā)者和企業(yè)提供“即插即用”的記憶增強(qiáng)能力。通過簡(jiǎn)單API調(diào)用,原本無狀態(tài)的聊天機(jī)器人,可以在數(shù)分鐘內(nèi)升級(jí)為具備長(zhǎng)期上下文感知的智能體。
在設(shè)計(jì)上,該云服務(wù)強(qiáng)調(diào)三點(diǎn):
一是企業(yè)級(jí)數(shù)據(jù)安全與隱私隔離;
二是對(duì)底層記憶架構(gòu)的自動(dòng)迭代;
三是盡可能降低開發(fā)者的使用門檻。
目前,該服務(wù)已對(duì)候補(bǔ)名單(waitlist)用戶開放內(nèi)測(cè),也可以通過官網(wǎng)申請(qǐng)加入內(nèi)測(cè):console.evermind.ai。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
91文章
39706瀏覽量
301300
發(fā)布評(píng)論請(qǐng)先 登錄
OrangePi RV2 深度技術(shù)評(píng)測(cè):RISC-V AI融合架構(gòu)的先行者
未來工業(yè)AI發(fā)展的三個(gè)必然階段
曙光存儲(chǔ)推出面向金融的可信AI存儲(chǔ)
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件
AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?
【書籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》
關(guān)于AI工廠三階段模型
Evermind AI 研發(fā)三階段 AI 記憶存儲(chǔ)提取架構(gòu)
評(píng)論