近日,由盛大集團(tuán)全資孵化的AI技術(shù)團(tuán)隊EverMind,正式對外系統(tǒng)性地展示AI記憶操作系統(tǒng)——EverMemOS,最新版本在四大記憶基準(zhǔn)上實現(xiàn)了最先進(jìn)(SOTA)準(zhǔn)確率。
在產(chǎn)品發(fā)布之外,這也更像是一次針對“AI是否能真正成為長期智能體”的底層挑戰(zhàn)。
為什么Agent一定需要長期記憶?
在大模型能力突飛猛進(jìn)的這兩年里,行業(yè)幾乎把所有注意力都集中在參數(shù)規(guī)模、多模態(tài)、推理能力和算力效率上。
但在真實應(yīng)用中,開發(fā)者很快發(fā)現(xiàn)了一個殘酷事實:模型會“忘事”。
無論是對用戶偏好的理解、對歷史決策的追溯,還是跨時間跨度的復(fù)雜推理,只要上下文窗口結(jié)束,一切都得從頭來過。RAG可以緩解一部分問題,但它更像是“臨時查資料”,而不是“真正記住”。
如果說大模型負(fù)責(zé)“思考”,那么記憶系統(tǒng)決定的,其實是智能體是否具備連續(xù)自我。
鄧亞峰認(rèn)為,“如果模型每次會話后都會重置理解,真正的Agentic AI就無從談起。”
EverMind正在從靜態(tài)的上下文窗口邁向動態(tài)、自組織的記憶,借助EverMemOS,為智能體提供了一段“活的、會演化的歷史”。
基準(zhǔn)結(jié)果表明:EverMind能夠以遠(yuǎn)低于全上下文模型的算力成本,實現(xiàn)更高的準(zhǔn)確率。
正是在這一判斷下,EverMind把研發(fā)重心從模型能力本身,轉(zhuǎn)向了一個更底層,也更難的方向——AI Memory Infra。
EverMemOS:打破行業(yè)基準(zhǔn),點擊即用
在EverMind最新發(fā)布的論文EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning中,團(tuán)隊對現(xiàn)有主流方案進(jìn)行了清晰區(qū)分。

截圖來源:EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning
EverMind詳細(xì)闡述了其技術(shù)提出的一套受engram啟發(fā)的生命周期機(jī)制,用以模擬生物認(rèn)知過程。與傳統(tǒng)RAG或成本高昂的超長上下文窗口不同,EverMemOS能將經(jīng)驗組織為連貫、可演化的結(jié)構(gòu)。
它試圖構(gòu)建的,是一個類似生物認(rèn)知系統(tǒng)的記憶生命周期,靈感直接來自神經(jīng)科學(xué)中的engram理論。
在這套架構(gòu)中,記憶不是靜態(tài)存儲,而是會被不斷壓縮、重組、強(qiáng)化和遺忘的動態(tài)系統(tǒng)。
EverMemOS的核心機(jī)制,被概括為三個連續(xù)但可循環(huán)的階段。
第一階段:情景痕跡形成(Episodic Trace Formation)。
將對話流轉(zhuǎn)換為MemCells,用于捕捉情景痕跡、原子事實以及有時間邊界的前瞻信息。
第二階段:語義鞏固(Semantic Consolidation)。
把MemCells動態(tài)組織為主題化的MemScenes,提煉穩(wěn)定的語義結(jié)構(gòu),并持續(xù)更新持久化的用戶畫像。
第三階段:重建式回憶(Reconstructive Recollection)。
通過agentic檢索組合“必要且充分”的推理上下文,在優(yōu)化算力成本的同時保證高準(zhǔn)確率。
這也是EverMemOS能在大幅降低token消耗的同時,維持甚至提升準(zhǔn)確率的關(guān)鍵。
基準(zhǔn)成績,是硬指標(biāo)
在AI基礎(chǔ)設(shè)施領(lǐng)域,架構(gòu)是否成立,最終要看基準(zhǔn)測試。
EverMind在四個主流記憶評測基準(zhǔn)上,給出了極具說服力的數(shù)據(jù)。
LoCoMo(93.05%準(zhǔn)確率): 超越全部現(xiàn)有記憶系統(tǒng)與全上下文模型;在多跳推理(+19.7%)與時序任務(wù)(+16.1%)上優(yōu)勢顯著,同時大幅降低token使用與計算成本。
LongMemEval(83.00%準(zhǔn)確率): 在知識更新與時序推理方面位居第一;其中知識更新任務(wù)提升20.6%,體現(xiàn)出系統(tǒng)可通過持續(xù)語義鞏固不斷“進(jìn)化”的能力。
HaluMem(90.04%召回): 在記憶完整性方面建立新的行業(yè)標(biāo)準(zhǔn),顯著減少長時程任務(wù)中的幻覺。
PersonaMem v2: 在9個復(fù)雜場景中,在深度個性化與行為一致性維度取得最佳綜合表現(xiàn)。
這說明EverMind不需要犧牲效率,去換取長期記憶。結(jié)構(gòu)本身,就是效率。
從論文到云服務(wù):記憶能力的產(chǎn)品化
如果EverMemOS只停留在論文階段,它的意義仍然是學(xué)術(shù)層面的。
但是,EverMind顯然希望更快地進(jìn)入真實應(yīng)用場景。
此次同步推出的EverMemOS Cloud Service,正是為開發(fā)者和企業(yè)提供“即插即用”的記憶增強(qiáng)能力。通過簡單API調(diào)用,原本無狀態(tài)的聊天機(jī)器人,可以在數(shù)分鐘內(nèi)升級為具備長期上下文感知的智能體。
在設(shè)計上,該云服務(wù)強(qiáng)調(diào)三點:
一是企業(yè)級數(shù)據(jù)安全與隱私隔離;
二是對底層記憶架構(gòu)的自動迭代;
三是盡可能降低開發(fā)者的使用門檻。
目前,該服務(wù)已對候補(bǔ)名單(waitlist)用戶開放內(nèi)測,也可以通過官網(wǎng)申請加入內(nèi)測:console.evermind.ai。
從更大的時間尺度看,EverMemOS的出現(xiàn)并不偶然。
當(dāng)模型能力趨同、算力成本成為瓶頸,長期記憶正在成為Agent競爭的分水嶺。誰能讓AI “記得住、記得準(zhǔn)、記得久”,誰就更接近真正的智能體。
EverMind選擇在這個節(jié)點押注記憶基礎(chǔ)設(shè)施,既是技術(shù)判斷,也是戰(zhàn)略選擇。
多數(shù)AI應(yīng)用的失敗,也許并不是因為模型不夠聰明,而是因為系統(tǒng)不夠完整。
EverMemOS至少回答了一個長期被忽視的問題:如果AI沒有記憶,它到底是誰?
而這,或許正是下一階段智能競爭真正開始的地方。
【免責(zé)聲明:該文章系我網(wǎng)轉(zhuǎn)載,旨在為讀者提供更多信息資訊。所涉內(nèi)容不構(gòu)成投資、消費建議,僅供讀者參考。】
(新媒體責(zé)編:wa123)
聲明:
1、凡本網(wǎng)注明“人民交通雜志”/人民交通網(wǎng),所有自采新聞(含圖片),如需授權(quán)轉(zhuǎn)載應(yīng)在授權(quán)范圍內(nèi)使用,并注明來源。
2、部分內(nèi)容轉(zhuǎn)自其他媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
3、如因作品內(nèi)容、版權(quán)和其他問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進(jìn)行。電話:010-67683008
人民交通24小時值班手機(jī):17801261553 商務(wù)合作:010-67683008轉(zhuǎn)602
Copyright 人民交通雜志 All Rights Reserved 版權(quán)所有 復(fù)制必究 百度統(tǒng)計 地址:北京市豐臺區(qū)南三環(huán)東路6號A座四層
增值電信業(yè)務(wù)經(jīng)營許可證號:京B2-20201704 本刊法律顧問:北京京師(蘭州)律師事務(wù)所 李大偉
京公網(wǎng)安備 11010602130064號 京ICP備18014261號-2 廣播電視節(jié)目制作經(jīng)營許可證:(京)字第16597號