SearXNG: 為使用者與 AI Agent 設計的隱私導向元搜尋引擎
SearXNG: 為使用者與 AI Agent 設計的隱私導向元搜尋引擎
SearXNG 是一款免費的網路元搜尋引擎,它匯集了來自各種搜尋服務與資料庫的結果。透過在使用者與搜尋引擎之間充當代理(proxy),SearXNG 確保使用者不會被上游服務追蹤或建立使用者檔案。
核心功能與隱私模型
SearXNG 作為元搜尋引擎運作,這意味著它本身並不維護網路索引。相反地,它會同時查詢多個搜尋引擎並將結果合併到單一介面中。這種架構提供了兩個主要優點:隱私與結果多樣性。
隱私與匿名性
SearXNG 會移除追蹤識別碼並防止搜尋引擎對使用者建立檔案。然而,社群成員指出,隱私程度與流量大小有關。一位使用者警告說:
"if your user and traffic count is low, your traffic is still unique and able to be profiled."
結果匯集
透過從多個來源抓取資料,SearXNG 可以繞過單一引擎結果中常見的操縱行為。使用者回報,匯集多個引擎的結果通常比依賴單一供應商能獲得更相關的結果。
與 AI Agent 與在地 LLM 的整合
SearXNG 已成為提供即時網路存取給在地大型語言模型(LLMs)與 AI agent 透過工具呼叫(tool-calling)的一項關鍵工具。
為在地模型提供工具呼叫功能
開發者正使用 SearXNG 來讓在地模型(例如量化後的 24B 參數 Gemma 模型)執行網路搜尋。這項功能通常是讓在地 LLM 體驗在處理通用任務時變得實用的關鍵。
為 Agent 優化
雖然 SearXNG 為 agent 提供原生能力,但第三方封裝工具(如 TinySearch)被用於在內容傳遞給 agent 之前優化上下文(context),以減少 token 浪費。
部署與營運挑戰
SearXNG 可以自行託管或透過公開實例(instances)存取。自行託管允許使用者優先考慮特定的後端,例如內部文件搜尋或 RAG(Retrieval-Augmented Generation)應用程式,並利用 SearXNG 的 JSON 輸出。
可靠性與封鎖
使用者在將 SearXNG 作為爬蟲(scraper)使用時,指出了幾項營運障礙:
- Rate Limiting: 上游引擎如 DuckDuckGo 或 Brave 可能會封鎖請求或觸發 CAPTCHAs。
- Engine Stability: 部分使用者回報,某些引擎(例如 Google)在透過爬蟲存取時可能會間歇性地停止運作。
- Performance: 在速度與結果品質之間存在已知的權衡;部分使用者發現 SearXNG 比直接搜尋慢,但在結果品質上更優越。
技術專案-狀態
根據最近的儲存庫(repository)活動,SearXNG 維持著嚴謹的開發週期,並專注於現代化其工具鏈:
- Language Support: 該專案已將 Golang 生態系統整合到其工具鏈中,並使用 Python 3.10.18 作為最低支援版本。
- Static Analysis: 該專案已從
pyright轉換為basedpyright以進行靜態類型檢查。 - Infrastructure: 該專案支援容器化部署(Docker)並在近期更新了其 Web 客戶端依賴項,包括 Vite 與 Biomejs。
- Licensing: 該專案採用 AGPLv3+ 授權。
社群觀點與替代方案
雖然因其隱私與多功能性而受到許多人推薦,但部分使用者根據使用情境建議了替代方案:
- Hister: 由 Searx 的原作者開發,Hister 是一個針對網站與在地檔案的全文本索引器,可儲存渲染後的頁面以供離線預覽與 MCP (Model Context Protocol) 使用。
- 4get: 被提及為部分尋求隱私的使用者所偏好的替代方案。
- Degoog: 一種替代方案,部分使用者認為其速度較快,但結果品質可能較低。