Helicone

开源 AI 网关与 LLM 可观测性，通过代理模式采集 trace。

开源

适合希望通过统一网关路由模型流量，并获得请求级成本、延迟和缓存指标的团队。

官方资源

选型建议

当你希望通过替换 model base URL 最快获得多厂商可观测性时选 Helicone。

适用场景

低侵入生产 tracing
LLM 成本与延迟看板
网关缓存与 failover

不适用场景

只需要深度 span 级 Agent 调试的团队
无法把模型流量路由到代理的架构

核心概念

proxyrequestscachingsessionsevals

最小实现形态

把 OpenAI client 指向 Helicone 网关，上线一个 Agent 端点，在看板审查每次请求的成本和工具调用延迟。

来源