phoenix: 它是什么，解决了什么问题以及为什么它正受到关注

phoenix: 它是什么，解决了什么问题以及为什么它正受到关注

它解决了什么问题

Phoenix 是一个开源的 AI 可观测性平台，旨在帮助开发者对 LLM 应用进行实验、评估和故障排除。它解决了理解 LLM 应用在运行时如何表现、基准测试其性能以及系统地迭代提示词（prompts）和模型的问题。

它是如何工作的

Phoenix 使用基于 OpenTelemetry 的插桩技术来追踪 LLM 应用的运行时。它提供了一套可观测性工具，包括：

Tracing（追踪）：捕获 LLM 调用的执行流。
Evaluation（评估）：使用 LLM 通过响应和检索评估来对性能进行基准测试。
Datasets & Experiments（数据集与实验）：允许创建版本化的数据集，以跟踪提示词、LLM 和检索方法的更改。
Playground（游乐场）：一个用于优化提示词、比较不同模型并重放追踪调用的空间。
Prompt Management（提示词管理）：为系统化的提示词测试提供版本控制和标签功能。
PXI (Phoenix Intelligence)：一个集成的 AI agent，可帮助用户调试追踪并迭代提示词。

适用对象

它专为构建 LLM 驱动应用的 AI 工程师和开发者设计，这些用户需要一个与供应商无关的工具来监控和优化其系统。它支持广泛的框架（如 LangGraph、LlamaIndex 和 CrewAI）以及 LLM 提供商（如 OpenAI、Anthropic 和 Google GenAI）。

亮点

供应商和语言无关：适用于各种框架和 LLM 提供商。
灵活的部署：可以在本地、Jupyter notebooks、容器或云端运行。
基于 OpenTelemetry：构建在用于追踪的开放标准之上。
全面的工具链：包括用于 OTEL、客户端和评估的专用 Python 和 TypeScript 子包。

Sources

undefinedArize-ai/phoenix