TuriX-CUA: 특정 API 없이도 모든 애플리케이션의 데스크톱 GUI 작업을 자동화하는 컴퓨터 사용 에이전트
TuriX-CUA: 특정 API 없이도 모든 애플리케이션의 데스크톱 GUI 작업을 자동화하는 컴퓨터 사용 에이전트
해결하는 문제
TuriX는 사용자가 앱별 API 없이도 다양한 애플리케이션에서 데스크톱 작업을 자동화할 수 있게 해주는 컴퓨터 사용 에이전트입니다. 사용자는 "컴퓨터와 대화"하여 AI가 GUI 상에서 직접 비행기 예약, 정보 검색 및 문서 작성, 혹은 서로 다른 소프트웨어 간 데이터 이동과 같은 복잡한 작업을 수행하도록 할 수 있습니다.
작동 방식
이 시스템은 화면을 해석하고 행동을 계획하기 위해 Vision Language Model (VLM)을 "두뇌"로 사용합니다. config.json 파일을 통해 Turix API, Ollama, 기타 제공자를 이용해 다양한 모델을 구성할 수 있습니다. 에이전트는 특정 유형의 작업을 실행할 때 플래너가 따를 구체적인 지침을 제공하는 "Skills"(markdown 플레이북)로 확장할 수 있습니다. 또한 Model Context Protocol (MCP)을 지원하여 Claude for Desktop과 같은 다른 에이전트와 통합할 수 있습니다.
대상 사용자
개인 및 연구용으로 설계되었으며, macOS, Windows, Linux에서 반복적인 데스크톱 워크플로를 자동화하고자 하는 사용자를 대상으로 합니다.
주요 특징
- API 독립 자동화: GUI에서 작동하므로 인간이 클릭할 수 있는 모든 애플리케이션을 제어할 수 있습니다.
- 높은 성능: OSWorld 벤치마크에서 64.2% 성공률, macOS 전용 벤치마크에서 80% 이상을 달성했습니다.
- 핫스와핑 가능한 모델: 코드를 수정하지 않고도 기본 VLM 정책을 쉽게 교체할 수 있습니다.
- 확장 가능한 Skills: markdown 기반 플레이북을 사용해 에이전트의 계획 및 실행을 안내합니다.
- 크로스 플랫폼 지원: macOS, Windows, Linux에서 사용 가능합니다.
SUMMARY 특정 API 없이도 모든 애플리케이션의 데스크톱 GUI 작업을 자동화하는 오픈 소스 컴퓨터 사용 에이전트.
TITLE TuriX-CUA: 특정 API 없이도 모든 애플리케이션의 데스크톱 GUI 작업을 자동화하는 컴퓨터 사용 에이전트
Sources
- undefinedTurixAI/TuriX-CUA