UFO
UFO: 무엇인지, 어떤 문제를 해결하는지 & 왜 주목받고 있는지
해결하는 문제
UFO는 단일 또는 여러 장치에 걸친 사용자 인터페이스를 자동화하기 위한 프레임워크입니다. 이는 단순한 순차적 작업 실행을 넘어, 서로 다른 운영 체제(Windows, Linux, Android)와 애플리케이션에 걸친 복잡하고 다단계의 워크플로우를 실행하는 어려움을 해결하며, 조정된 "galaxy" 형태의 에이전트들을 구축합니다.
작동 방식
프로젝트는 두 가지 주요 구성 요소로 이루어져 있습니다:
- UFO³ Galaxy: 멀티 디바이스 오케스트레이션 프레임워크입니다. ConstellationAgent를 사용하여 사용자 요청을 작업의 유향 비순환 그래프(DAG)로 분해합니다. 그런 다음 TaskOrchestrator가 플랫폼 및 리소스 역량에 따라 가장 적합한 장치에 이러한 작업을 할당하고, 보안 WebSocket 기반의 **Agent Interaction Protocol (AIP)**를 통해 비동기적으로 실행합니다.
- UFO² Desktop AgentOS: Windows 자동화를 위한 특화된 에이전트입니다. Windows UIA, Win32, WinCOM과 깊이 통합되어 하이브리드 작업(GUI 클릭 및 API 호출)을 수행합니다. 독립형 도구 또는 Galaxy 프레임워크 내의 장치 에이전트로 작동할 수 있습니다.
대상 사용자
- Developers 크로스 플랫폼 자동화 워크플로우를 구축하는 개발자.
- Power users Windows, Linux, Android 장치에 걸친 복잡한 작업을 자동화하려는 파워 유저.
- AI researchers GUI 에이전트 및 멀티 에이전트 오케스트레이션에 집중하는 AI 연구원.
주요 특징
- Cross-Device Orchestration: 이기종 플랫폼(Windows, Linux, Android) 간의 작업을 조정합니다.
- Dynamic DAG Planning: 실행 피드백을 기반으로 진화할 수 있는 실행 가능한 그래프로 작업을 분해합니다.
- Deep Windows Integration: 강력한 Windows OS 제어를 위해 시각적 및 UIA 탐지를 하이브리드로 사용합니다.
- Efficiency: LLM 호출을 최대 51%까지 줄이기 위해 추측적 멀티 액션 예측 기능을 제공합니다.
- MCP Integration: 장치 에이전트의 신속한 도구 확장을 위해 Model Context Protocol (MCP)를 지원합니다.
Sources
- undefinedmicrosoft/UFO