Traceloop
面向 LLM 与 Agent 工作负载的 OpenTelemetry 原生可观测性。
开源
适合平台团队已运行 OpenTelemetry,并希望把 LLM span 接入现有后端的情况。
选型建议
当你的 SRE 栈以 OpenTelemetry 为中心,且 LLM trace 应像普通服务 telemetry 时选 Traceloop。
适用场景
- OpenTelemetry 优先的 Agent tracing
- 导出 span 到 Datadog 或 Grafana
- 跨服务标准化插桩
不适用场景
- 没有可观测后端的团队
- 希望第一天就有一体化 eval UI 的项目
核心概念
spansOpenTelemetryinstrumentationexporters
最小实现形态
在 Agent 服务启用 OpenLLMetry,把 span 导出到 collector,并像普通微服务一样对工具调用错误率告警。