Agent TracingAgent Evaluation

Arize Phoenix

开源 LLM/Agent tracing，内置评测能力。

开源

适合需要把 prompt 调试、Agent trace 和评测串联在一个开源工具里的团队。

官方资源

选型建议

当你想要一个统一的 tracing 和评测开源面板时选 Arize Phoenix。它闭合了从观察到改进的循环。

适用场景

agent tracing
LLM 可观测性
评测

不适用场景

已有付费可观测合同的团队
trace 仅用于调试而非评测的场景

核心概念

tracesspansevaluationsdatasets

最小实现形态

用 Phoenix 的 OpenTelemetry 集成给 Agent 插桩，在 UI 查看 traces，然后从生产 run 创建 eval dataset。

来源