GBrain – Y Combinator 总裁开源的个人生产级AI记忆系统

AI项目 2026-04-24

GBrain是什么

GBrain 是 Y Combinator 总裁 Garry Tan 开源的个人生产级AI记忆系统,专为 OpenClaw、Hermes Agent 等 AI Agent 平台设计。工具把散落的 Markdown 笔记转化为可搜索、可推理、持续增长的知识图谱,让 Agent 拥有长期记忆。Garry 本人用工具管理 10000+ 文件、3000+ 人脉、13 年日历数据,系统内已有 17888 个页面、4383 个人物、723 家公司、21 个定时任务全自动运转,12 天搭建完成。

GBrain

GBrain的主要功能

  • 自动信号捕获:每条消息触发便宜模型并行提取原创观点与实体提及,后台自动归档。
  • Brain-ops 优先查询:Agent 回答前先查大脑,查不到直接告知而非 hallucinate。
  • 多源内容摄入:支持会议、邮件、推特、PDF、视频、GitHub 仓库等全格式自动消化。
  • 实体自动丰富:人物/公司按提及次数自动升级(1 次 stub → 3 次联网补料 → 8 次/开会完整档案)。
  • Compiled Truth + Timeline:上层为可改写的当前最佳理解,下层为只追加的证据时间线。
  • 混合搜索:向量 + 关键词 + RRF 融合 + 多查询扩展 + 4 层去重,Recall@5 达 95%。
  • 知识图谱自连接:每次写入零 LLM 调用自动提取实体关系(attended/works_at/invested_in 等)。
  • Minions 后台队列:确定性任务走 Postgres 原生作业队列,753ms 完成、零 token 成本、100% 成功率。
  • Skillify 技能管理:自动生成 SKILL.md + 测试 + 评估 + 解析器触发器,防止技能树黑箱化。
  • 语音通话:接入 Twilio + OpenAI Realtime,来电自动拉取对方档案并生成通话脑页。
  • 每日简报:自动汇总会议上下文、活跃交易、引用追踪与待办事项。

GBrain的技术原理

  • 三层架构分离:GBrain 采用 Brain Repo(Git 托管的 Markdown 文件,人类可读可编辑的唯一数据源)→ GBrain 检索层(Postgres + pgvector 混合搜索引擎)→ AI Agent(26 个 Skill 定义读写逻辑)的分离架构。Agent 通过 BrainEngine 接口读写,底层支持 PGLite(嵌入式 Postgres,零配置)和 PostgresEngine(Supabase)双向热迁移。
  • Compiled Truth + Timeline 双层知识模型:每个 Markdown 页面以 --- 分隔为两层:上方是 Compiled Truth(当前最佳理解,随新证据持续改写),下方是 Timeline(只追加不删除的原始证据链)。这种设计让认知可以进化,同时保留完整审计轨迹,避免纯覆盖式更新丢失历史或纯追加导致查询噪音。
  • 零 LLM 调用知识图谱自连接:每次页面写入后,确定性正则管道自动提取实体引用(Markdown 链接 + bare slugs),推断类型化关系(attended/works_at/invested_in/founded/advises),并完成去重、失效链接清理、反向链接更新。整个过程零 LLM 调用,纯本地正则 + 优先级推断级联实现。

如何使用GBrain

  • Agent 自动安装(推荐):在 OpenClaw 或 Hermes Agent 中粘贴指令 Retrieve and follow the instructions at: https://raw.githubusercontent.com/garrytan/gbrain/master/INSTALL_FOR_AGENTS.md,Agent 自动克隆仓库、安装依赖、加载 26 个 Skill、配置定时任务,约 30 分钟完成。
  • 独立 CLIgit clone https://github.com/garrytan/gbrain.git && cd gbrain && bun install && bun link,然后 gbrain init 初始化本地大脑(PGLite,2 秒就绪),gbrain import ~/notes/ 导入笔记,gbrain query "..." 查询。
  • MCP Server:本地通过 gbrain serve 暴露 30+ MCP 工具,接入 Claude Code/Cursor/Windsurf;远程部署到 Supabase 后通过 ngrok 固定域名接入 Claude Desktop/Cowork/Perplexity。
  • 数据接入:运行 gbrain integrations 查看并配置 Gmail、日历、Twitter、会议转录等集成配方。

GBrain的关键信息和使用要求

  • 环境要求:Node.js + Bun(推荐),PGLite 零配置本地运行,或 Supabase Postgres($25/月)多设备同步。
  • API Key:需配置 OpenAI(嵌入)、Anthropic(可选,用于子 Agent)、Groq(语音转录)等。
  • 存储:Markdown 文件为唯一数据源,人类可直接编辑,gbrain sync 自动同步。
  • 与 GStack 关系:GStack(8 万+ Star)教 Agent 写代码,GBrain 教 Agent 记事和思考,通过 hosts/gbrain.ts 桥接可合体使用。
  • 许可:MIT 开源,可商用。

GBrain的核心优势

  • 生产级验证:YC 总裁亲自日用,非玩具级 Demo,是真刀真枪跑出来的工作流。
  • 自进化知识图谱:实体关系自动提取零 LLM 调用,搜索精度比纯向量提升 28.8 个百分点。
  • 确定性后台任务:Minions 将确定性工作与判断性工作分离,成本从 $0.03/次降至 $0,成功率从 0% 提至 100%。
  • 分层知识模型:Compiled Truth 保证认知实时进化,Timeline 保证证据链永不丢失。
  • Agent 原生设计:支持安装、运维、扩展全部面向 AI Agent 非人类手动操作。

GBrain的项目地址

  • 项目官网:https://github.com/garrytan/gbrain

GBrain的同类竞品对比

对比维度 GBrain Mem0 LlamaIndex Pinecone
定位 AI Agent 长期记忆系统 个性化 AI 记忆层 LLM 应用数据框架 向量数据库
知识图谱 原生自连接,零 LLM 调用 无原生图谱 需手动构建 RAG 图谱 无,纯向量存储
实体自动升级 按提及次数自动升级 基于用户交互记忆 需开发者配置 不涉及
搜索方式 向量+关键词+RRF+图谱遍历 向量搜索为主 多种检索器可选 纯向量/混合搜索
Agent 集成 OpenClaw/Hermes/MCP 原生 多框架 SDK LangChain/LlamaIndex 需自行封装
后台任务 Minions 原生队列,零 token 无原生队列
数据格式 Markdown 为唯一源 多格式 API 摄入 多格式节点 向量嵌入
开源协议 MIT Apache 2.0 MIT 商业/开源混合
生产验证 YC 总裁 1.7 万页生产环境 多家公司使用 广泛企业采用 广泛企业采用
安装方式 Agent 自装 30 分钟 / CLI pip 安装 SDK pip 安装 云托管/自托管

GBrain的应用场景

  • 投资人/创始人关系管理:自动归档会议、邮件、社交动态,会前 30 秒生成对方完整档案与历史互动。
  • 个人知识库:将多年笔记、文章、想法转化为可推理的知识图谱,支持”我半年前对某事的观点”类查询。
  • 研究自动化:摄入论文、报告、视频后自动提取实体、建立引用、生成时间线,辅助学术或行业研究。
  • 内容创作辅助:追踪灵感来源、自动补全引用、维护主题标签一致性,防止创作过程中的信息遗漏。
  • 智能日程与任务:每日自动准备会议简报、巡检过期页面、修复损坏引用、生成周期性报告。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。

相关文章