Helicone
开源 AI 网关与 LLM 可观测性,通过代理模式采集 trace。
开源
适合希望通过统一网关路由模型流量,并获得请求级成本、延迟和缓存指标的团队。
选型建议
当你希望通过替换 model base URL 最快获得多厂商可观测性时选 Helicone。
适用场景
- 低侵入生产 tracing
- LLM 成本与延迟看板
- 网关缓存与 failover
不适用场景
- 只需要深度 span 级 Agent 调试的团队
- 无法把模型流量路由到代理的架构
核心概念
proxyrequestscachingsessionsevals
最小实现形态
把 OpenAI client 指向 Helicone 网关,上线一个 Agent 端点,在看板审查每次请求的成本和工具调用延迟。