cognee

在与AI助手深度协作的过程中，一个根本性的瓶颈逐渐浮现：每次新对话，一切归零。昨天的讨论、上周的决策、上个月的项目背景，AI统统“失忆”，需要你反复重新灌输上下文。cognee的出现，正是为了打破这种“失忆症”。它是一个轻量级的AI记忆系统，用短短几行代码就能为你的AI代理构建动态、可查询的持久记忆，让每一次对话都站在历史的肩膀上。

项目基本信息

信息项	详情
项目名称	cognee
GitHub地址	https://github.com/topoteretes/cognee
项目描述	轻量级AI记忆系统，通过5行代码即可为AI代理构建动态记忆
作者	topoteretes
开源协议	Apache License 2.0
开源状态	公开状态
Languages	Python
支持平台	Windows / macOS / Linux
最后更新	持续更新中

一、项目介绍

cognee的核心使命是为AI代理赋予记忆。它并非一个简单的向量数据库，而是一个完整的数据处理管道，遵循ECL（提取、认知、加载） 三阶段流程：

提取 (Extract)：从多种数据源（文本、文档、图片转录、音频等）中摄取信息。
认知 (Cognify)：这是cognee的核心步骤。它利用大语言模型分析数据，提取实体、关系和概念，构建起一张知识图谱。这种结构化记忆比传统的文本块检索更能减少“幻觉”，因为它存储的是事实之间的逻辑关联。
加载 (Load)：将构建好的知识图谱存储在图形数据库和向量数据库中，以便后续高效检索。

最终，你的AI代理可以通过自然语言查询这张知识图谱，获取跨越多个历史会话的、上下文丰富的精准信息。

核心能力概览

多源数据整合：支持文本、文档、图片、音频转录等30多种数据源的统一接入。
知识图谱构建：自动将非结构化数据转化为结构化的实体关系网络，提升检索准确度。
Pydantic原生集成：使用Pydantic模型即可轻松将数据加载到图和向量数据库中，开发体验友好。
LLM兼容性：兼容主流大语言模型提供商。
可视化UI：提供Cognee UI，允许你通过图形界面探索和管理知识图谱。

二、核心优势

以知识图谱为核心的记忆模型

与传统RAG方案将文档切成片段并基于关键词相似度检索不同，cognee通过构建知识图谱来记忆信息。这意味着它记住的是“谁做了什么”、“什么是什么的一部分”这样的逻辑关系，而非单纯的关键词堆砌。当查询“NLP包含哪些子领域”时，它能沿着图中的边精准找到答案，而不是返回一堆包含“NLP”这个词的文档片段。

极简的开发体验

项目名“cognee”本身就暗示了“认知”只需短短几步。核心流程仅需三个步骤：add（添加数据）、cognify（生成记忆）、search（查询记忆），几乎没有学习曲线。

广泛的兼容性

cognee支持Python 3.8到3.12，可灵活搭配pip、poetry、uv等多种包管理工具。它兼容主流LLM提供商，也为Ollama等本地模型提供了支持，方便进行私有化部署。

社区与透明度

项目提供了Colab和Deepnote笔记本供快速体验，拥有自己的论文阐述架构理念，并且完全开源（Apache 2.0协议），适合商业使用。

三、适用场景

构建有记忆的AI助手

这是最直接的应用。你可以为你的客服机器人、个人知识管家或代码助手接入cognee，让它记住用户的偏好、历史问题和关键上下文，提供真正个性化的长期服务。

多源信息关联分析

当你需要从文档、会议录音、聊天记录等多个来源中找出内在联系时，cognee可以将这些异构数据融合为一张知识网络，帮助你发现隐藏的关联和洞察。

替换复杂的RAG系统

对于许多应用而言，搭建和维护一个包含文档解析、切片、向量化、检索和重排序的标准RAG流水线成本高昂。cognee提供了一种更简洁的替代方案：将数据直接摄入，让LLM在内部生成结构化的记忆索引。

教育与研究

通过将复杂学科的知识点构建成知识图谱，学习者可以通过提问的方式探索概念之间的联系，实现一种互动式的、基于追问的学习方式。

四、安装教程

环境要求

工具	用途	下载/安装方式
Python	运行环境	[https://python.org/] (版本要求：3.8 至 3.12)
LLM API Key	认知功能调用大模型所需	如 OpenAI API Key

安装步骤

1. 安装 cognee

最简单的方式是通过 pip 安装：

pip install cognee

你也可使用 poetry 或 uv 等其他包管理器。

2. 设置 LLM API 密钥

cognee的认知功能需要调用大语言模型。以使用OpenAI为例，设置环境变量：

import os
os.environ["LLM_API_KEY"] = "你的OpenAI_API_Key"

你也可以创建一个 .env 文件来管理这些密钥。要使用其他LLM提供商（如Ollama），请参考cognee的官方文档。

五、使用示例

以下是一个完整的“从记忆到查询”的典型流程：

import cognee
import asyncio

async def main():
    # 第一步：添加记忆内容
    await cognee.add("自然语言处理（NLP）是计算机科学和信息检索的跨学科子领域。")
    await cognee.add("我的名字叫张三，我最喜欢的编程语言是Python。")

    # 第二步：构建知识图谱
    await cognee.cognify()

    # 第三步：查询记忆
    result1 = await cognee.search("告诉我关于NLP的信息")
    print(result1)

    result2 = await cognee.search("我最喜欢的编程语言是什么？")
    print(result2)

if __name__ == '__main__':
    asyncio.run(main())

预期输出:

对于第一个查询，输出可能是：“自然语言处理（NLP）是一个跨学科领域，涉及计算机科学和信息检索...”
对于第二个查询，输出可能是关于“张三”和“Python”的信息。

这个例子展示了cognee如何处理多条独立信息并分别进行准确的上下文检索。你还可以通过Cognee UI以可视化的方式探索生成的知识图谱。

六、常见问题

问：cognee和传统的RAG（检索增强生成）有什么不同？

答：传统RAG通常将文档切片后向量化存储，检索时靠关键词或向量相似度匹配，容易丢失上下文关联。cognee在“认知”阶段会提取实体和关系构建知识图谱，检索时按照逻辑关系导航，因此能更精准地回答需要逻辑推理的问题，减少“幻觉”。

问：cognee支持哪些数据源？

答：它支持超过30种数据源，包括纯文本、PDF文档、图片（通过OCR或描述）、音频（通过转录）等。你可以将它们统一摄入，cognee会处理异构数据并构建统一的知识图谱。

问：我需要自己管理数据库吗？

答：cognee内部使用图和向量数据库来存储知识图谱，但它抽象了数据存储的复杂性。入门阶段你无需关心底层数据库细节。当然，对于生产级部署，你可以根据需要配置特定的存储后端。

问：除了OpenAI，还能用其他模型吗？

答：是的。cognee兼容主流LLM提供商，也支持通过Ollama等平台连接本地部署的模型。具体的配置方式请查阅官方文档。

七、总结

cognee为AI领域长期以来“记忆缺失”的痛点提供了一个优雅且简洁的解法。它用“5行代码”的承诺，降低了为AI代理赋予记忆的门槛，并用知识图谱提升了记忆的逻辑性和准确性。对于希望构建具备长期、深层理解能力的AI应用的开发者而言，cognee是一个值得深入探索和使用的强大工具。它不仅仅是一个库，更代表了一种让AI从“应答”走向“理解”的认知架构。

已有 34 条评论

RayZhao

做了一次小规模测试，10条笔记记忆约需3秒认知时间，检索几乎是即时的，性能符合预期。
SarahWu

已star并fork，准备给这个项目贡献一个MCP服务器接口，让更多AI客户端能直接调用。
TimChen

教程里的“多源信息关联分析”这个场景，对我来说是最大的使用动机，帮我发现了报表和会议录音之间隐藏的矛盾。
UlyssesWang

早期项目但理念很前卫，看好它未来的发展。AI记忆这个赛道，cognee走在了前面。
VeraJiang

用uv安装依赖的时候报了个错，后来发现是Python虚拟环境没激活，低级错误大家引以为戒。

登录

注册账号