Agent TracingAgent Evaluation

Langfuse

开源 LLM 工程平台，覆盖 tracing、评测与 prompt 工作流。

开源

适合需要可自托管可观测性，并希望在同一栈里管理 dataset、评分和 prompt 的团队。

官方资源

选型建议

当你需要 MIT 许可的 tracing 和 eval 工作流，又不想绑定单一框架厂商时选 Langfuse。

适用场景

自托管 Agent tracing
生产 eval 闭环
trace 关联的 prompt 版本管理

不适用场景

只需要 LangChain 托管工作流的团队
不愿运维可观测基础设施的项目

核心概念

tracesobservationsscoresdatasetsprompts

最小实现形态

给一个 Agent run 插桩，检查工具调用和检索 span，给失败打 score，再把重复问题导出成 dataset。

来源