Langfuse
开源 LLM 工程平台,覆盖 tracing、评测与 prompt 工作流。
开源
适合需要可自托管可观测性,并希望在同一栈里管理 dataset、评分和 prompt 的团队。
选型建议
当你需要 MIT 许可的 tracing 和 eval 工作流,又不想绑定单一框架厂商时选 Langfuse。
适用场景
- 自托管 Agent tracing
- 生产 eval 闭环
- trace 关联的 prompt 版本管理
不适用场景
- 只需要 LangChain 托管工作流的团队
- 不愿运维可观测基础设施的项目
核心概念
tracesobservationsscoresdatasetsprompts
最小实现形态
给一个 Agent run 插桩,检查工具调用和检索 span,给失败打 score,再把重复问题导出成 dataset。