Kiln: 一個用於提示詞優化、評估與代理編排的本地優先 AI 開發工作台

它解決了什麼問題

Kiln 為整個 AI 開發生命週期提供了一個統一的工作台，消除了在提示詞工程、評估、RAG 和微調等碎片化工具之間切換的需求。它透過使用單一數據集在多個維度上追蹤品質，解決了 AI 產品中的「退化」問題，即改進提示詞的一部分或升級模型可能會意外破壞其他行為。

運作方式

Kiln 將面向非技術協作者（PM、QA 和領域專家）的桌面應用程式與面向工程師的 MIT-licensed Python library 結合在一起。它以本地優先的方式運作，允許使用者攜帶自己的 API keys 或透過 Ollama 完全離線執行模型。系統會同步到 Git 以進行團隊協作，並允許使用者定義一次任務，然後針對同一數據集應用各種優化技術——例如自動提示詞變異、RAG 集成或微調。

對象是誰

它是為 AI 產品團隊設計的，包括需要生產就緒 library 的工程師、在 notebook 中工作的數據科學家，以及需要能夠對輸出進行評分並在不寫代碼的情況下添加訓練數據的非技術利害關係人。

重點功能

Auto-Optimize: 自動搜尋提示詞變異與模型選擇，以找到特定任務的最佳配置。
Eval Builder: 快速生成合成評估數據集與裁判，以使 AI 輸出符合使用者偏好。
Multi-Agent Orchestration: 支援多代理層級結構的組合，其中每個代理都在其專注的上下文窗口中運行。
Zero-Code Fine-Tuning: 無需寫代碼即可在 Fireworks、Together 和 Vertex 等提供商上對 60 多個模型進行微調。
Local-First Privacy: 在使用者的機器上運行，確保數據控制與 Git-native 同步。

Kiln: 一個用於提示詞優化、評估與代理編排的本地優先 AI 開發工作台

Kiln: 一個用於提示詞優化、評估與代理編排的本地優先 AI 開發工作台

它解決了什麼問題

運作方式

對象是誰

重點功能

Sources