Agentic RAG
Pinecone
面向生产 RAG 和搜索的托管向量数据库。
适合希望用托管基础设施和稳定生产搜索运维,而不是自建向量存储的团队。
当运维简单性值得托管服务依赖时选择 Pinecone。尽早用真实 chunk 数估算成本。
适用场景
- 托管向量搜索
- 生产 RAG
- hybrid search
不适用场景
- 要求自托管开源基础设施的团队
- 本地存储足够的小原型
核心概念
indexesnamespacesmetadata filtersserverless
最小实现形态
创建 index,按 tenant metadata 写入 chunk embedding,用 filters 查询,并按预期流量跟踪读写用量。