Arize Phoenix
开源 LLM/Agent tracing,内置评测能力。
开源
适合需要把 prompt 调试、Agent trace 和评测串联在一个开源工具里的团队。
选型建议
当你想要一个统一的 tracing 和评测开源面板时选 Arize Phoenix。它闭合了从观察到改进的循环。
适用场景
- agent tracing
- LLM 可观测性
- 评测
不适用场景
- 已有付费可观测合同的团队
- trace 仅用于调试而非评测的场景
核心概念
tracesspansevaluationsdatasets
最小实现形态
用 Phoenix 的 OpenTelemetry 集成给 Agent 插桩,在 UI 查看 traces,然后从生产 run 创建 eval dataset。