2026-05-16AI Agent记忆系统TencentDBLLM向量数据库

TencentDB Agent Memory 解读:四层渐进式记忆架构如何让 Agent 记住一切

2026年5月14日,腾讯云数据库团队正式开源了 **TencentDB Agent Memory**——一个面向 AI Agent 的分层记忆管理引擎,采用 MIT 协议开源。与此前热门的 `agentmemory` 不同,TencentDB Agent Memory 来自腾讯云数据库团队,强调**零外部 API 依赖**和**分层渐进式记忆架构**,号称

biluo·5909 words

# TencentDB Agent Memory 解读:四层渐进式记忆架构如何让 Agent 记住一切

2026年5月14日,腾讯云数据库团队正式开源了 TencentDB Agent Memory——一个面向 AI Agent 的分层记忆管理引擎,采用 MIT 协议开源。与此前热门的 agentmemory 不同,TencentDB Agent Memory 来自腾讯云数据库团队,强调零外部 API 依赖分层渐进式记忆架构,号称最高可节省 61.38% Token 消耗,任务通过率相对提升。

本文深入解析这套系统的架构设计、技术实现,以及它与其他 Agent 记忆方案的差异。

背景:为什么 Agent 需要记忆系统

当前主流 AI Agent(如 Claude Code、Cursor、Gemini CLI)在每次新会话开始时,都是从零构建上下文。这意味着:

  • 用户上周让 Agent 修复的某个 bug,相关上下文已经丢失
  • Agent 需要反复解释项目的代码规范,每次都要 token 消耗
  • 跨会话学习不可能——Agent 无法从历史任务中沉淀经验

传统的解决方案有两种:

1. 把完整历史对话塞进上下文:简单粗暴,成本极高,token 浪费严重

2. 用向量数据库做 RAG 检索:需要额外基础设施,检索质量不稳定

腾讯的思路是:不靠单一技术,而是用四层渐进式记忆架构,让 Agent 像人类一样,分层管理和调用记忆。

核心技术:L0–L3 四层渐进式记忆架构

这是 TencentDB Agent Memory 的核心创新点。它把记忆分成四级,从即时到长期,逐层递进:

`

┌─────────────────────────────────────────────────────────────┐

│ L3 长期记忆 │

│ (个性化经验、项目规范、历史决策模式) │

│ 典型存储:向量数据库 + 结构化知识图谱 │

├─────────────────────────────────────────────────────────────┤

│ L2 工作记忆 │

│ (当前项目上下文、活跃任务状态) │

│ 典型存储:SQLite/文件系统的结构化记录 │

├─────────────────────────────────────────────────────────────┤

│ L1 近期记忆 │

│ (最近 N 轮对话摘要) │

│ 典型存储:压缩后的对话块 │

├─────────────────────────────────────────────────────────────┤

│ L0 即时记忆 │

│ (当前会话窗口内的实时上下文) │

│ 典型存储:LLM 上下文窗口 │

└─────────────────────────────────────────────────────────────┘

`

L0 即时记忆:零改造接入

L0 是最底层,代表当前会话窗口内的实时上下文。Agent 无需任何改造,L0 本身就是 LLM 的上下文窗口。

关键设计:上下文压缩。当对话超过一定轮数,系统会自动触发压缩,把多轮对话浓缩为语义密度更高的摘要块,而不是简单截断。

L1 近期记忆:跨会话缓冲

L1 存储最近 N 轮对话的摘要,通常以"会话块"为单位。

`python

# L1 近期记忆的典型结构(简化)

class RecentMemory:

session_id: str

compressed_summary: str # 压缩后的对话摘要

key_entities: List[str] # 关键实体(文件路径、函数名等)

task_outcome: str # 任务结果标记

timestamp: datetime

`

L2 工作记忆:项目级上下文

L2 是当前项目的活跃上下文,包括:

  • 项目代码结构(目录树摘要)
  • 用户的编码规范和偏好
  • 当前活跃任务的状态

腾讯在这里引入了 Mermaid 任务画布 技术——把任务状态用可视化的方式表达,便于 Agent 追踪和回溯。

`yaml

# L2 工作记忆示例(YAML 格式)

project:

root: /workspace/my-project

language: python

framework: fastapi

active_task:

id: task_20260516_001

description: "实现用户认证 API"

status: in_progress

blockers: ["需要先完成数据库 schema 迁移"]

coding_conventions:

naming: snake_case

testing: pytest_required

`

L3 长期记忆:持久化知识沉淀

L3 是整个架构最核心的部分——跨会话、跨项目的持久化记忆

腾讯采用了两条技术路线并行:

1. 向量数据库(基于 embeddings 的语义检索)

2. 知识图谱(结构化的实体关系网络)

`python

# L3 长期记忆的检索逻辑(伪代码)

def retrieve_long_term_memory(query: str, session_context: dict) -> List[MemoryBlock]:

# 1. 语义检索:从向量数据库中找语义相关记忆

semantic_results = vector_db.similarity_search(

query=query,

top_k=5,

filter={"domain": session_context["project_type"]}

)

# 2. 知识图谱检索:找关联实体

graph_results = knowledge_graph.query(

entities=extract_entities(query),

depth=2

)

# 3. 融合排序:综合语义相关性和结构化关联

return fuse_and_rank(semantic_results, graph_results, session_context)

`

核心技术指标

根据腾讯官方披露的数据(来源:腾讯云数据库团队技术博客):

指标 数值 说明
Token 节省 最高 61.38% 相比全量上下文注入
任务通过率提升 相对提升(具体数值未公开) 对比无记忆基线
检索准确率 76.1% 在 OpenClaw/Hermes/Memori 等竞品横评中领先
外部 API 依赖 **零** 全部能力本地化,无需调用外部服务
支持场景 15+ AI 工具 Claude Code、Cursor、Gemini CLI、Codex CLI 等

与 agentmemory 的关键差异

维度 agentmemory TencentDB Agent Memory
架构 单层记忆 + 外部存储 L0–L3 四层渐进式
外部依赖 需要 Redis/向量数据库 零外部 API 依赖
适用场景 AI 编程助手 通用 Agent + 数据库场景
开源方 社区(rohitg00) 腾讯云数据库团队
特色 支持 15+ AI 工具广泛适配 Mermaid 任务画布 + 知识图谱

实战:用 TencentDB Agent Memory 改造一个 Agent

下面展示如何用这套系统改造一个简单的 CLI Agent:

`python

from tencentdb_agent_memory import AgentMemoryEngine

# 初始化记忆引擎(零配置启动)

engine = AgentMemoryEngine(

storage_path="./memory_store", # 本地存储,无外部依赖

vector_dim=1536, # OpenAI embeddings 维度

memory_tiers=["l0", "l1", "l2", "l3"] # 全量四层

)

# 模拟用户对话

def agent_loop(user_input: str):

# Step 1: L0 即时上下文——从当前窗口获取

current_context = engine.get_l0_context()

# Step 2: L1 近期记忆——跨会话缓冲

recent_memories = engine.get_l1_memories(session_id=user_session_id, limit=3)

# Step 3: L2 工作记忆——项目级上下文

project_context = engine.get_l2_context(project_root=user_cwd)

# Step 4: L3 长期记忆——语义检索

long_term = engine.retrieve(

query=user_input,

filters={"project_type": detect_project_type(user_cwd)}

)

# 融合构建完整上下文

full_context = fuse_context([current_context, recent_memories, project_context, long_term])

# 调用 LLM

response = llm.complete(prompt=user_input, context=full_context)

# 写回记忆(异步)

engine.commit(

session_id=user_session_id,

user_input=user_input,

agent_response=response,

metadata={"task_status": "completed"}

)

return response

`

技术局限与待观察点

  • **L3 知识图谱维护成本**:结构化知识图谱需要持续的人工维护和更新,如何降低维护成本是实际落地难题
  • **向量检索的冷启动问题**:新项目初期记忆数据少,检索质量不如长期项目
  • **与数据库深度整合**:腾讯云强调了与腾讯云数据库的深度集成,但具体接口和性能数据还需进一步披露

总结

TencentDB Agent Memory 的核心价值在于分层渐进式记忆架构零外部依赖。它的思路不是用一个万能的记忆库解决所有问题,而是让不同层级的记忆各司其职——L0 管即时、L1 管近期、L2 管项目、L3 管长期。

这把 Agent 的记忆从"玄学调优"变成"工程化系统",对需要长时间运行、跨项目累积经验的 Agent 场景来说,是一个值得关注的基础设施方向。

GitHub 地址:[Tencent/TencentDB-Agent-Memory](https://github.com/Tencent/TencentDB-Agent-Memory)

相关参考

  • [腾讯云开发者社区文章](https://cloud.tencent.com/developer/article/2668579)(2026年5月15日)
  • [2026年Agent记忆系统方案横评](https://cloud.tencent.com.cn/developer/article/2665379)

---

*本文涉及的技术指标和数据均来自腾讯云数据库团队公开披露的资料,截至 2026 年 5 月。*