oxylabs-ai-studio-py: 자연어 프롬프트를 통한 AI 기반 웹 데이터 추출 및 에이전트 브라우징을 위한 Python SDK
oxylabs-ai-studio-py: 자연어 프롬프트를 통한 AI 기반 웹 데이터 추출 및 에이전트 브라우징을 위한 Python SDK
해결하는 문제
이 SDK는 개발자가 AI 기반 웹 데이터 추출 및 브라우징 기능을 Python 애플리케이션에 손쉽게 통합할 수 있도록 간소화된 방법을 제공합니다. 복잡한 스크래핑 로직, 프록시 관리, JavaScript 렌더링을 직접 처리할 필요 없이, 자연어 프롬프트를 사용해 웹에서 구조화된 데이터를 추출할 수 있습니다.
작동 방식
SDK는 Oxylabs AI Studio API의 래퍼 역할을 하며, 다양한 데이터 추출 작업을 위한 전용 클래스를 제공합니다:
- AiCrawler: 자연어 프롬프트를 사용해 웹사이트 전반에 걸쳐 여러 페이지에서 데이터를 찾고 추출합니다.
- AiScraper: 단일 페이지에서 특정 데이터를 추출하며, 구조화된 출력을 위한 JSON 스키마를 생성할 수 있습니다.
- AiSearch: AI 강화 웹 검색을 수행하고 마크다운 형식으로 콘텐츠를 반환합니다.
- BrowserAgent: 검색창 사용 등 웹사이트와 상호작용하여 사용자 프롬프트에 기반한 특정 정보를 찾을 수 있는 에이전트 브라우저입니다.
- AiMap: 도메인을 매핑하여 키워드 또는 자연어 프롬프트를 기반으로 특정 유형의 URL을 식별합니다.
대상 사용자
대규모로 웹에서 구조화된 데이터를 수집하고, 웹 브라우징 작업을 자동화하며, AI 기반 검색 및 웹 콘텐츠 탐색을 소프트웨어에 통합하려는 개발자.
주요 특징
- 자연어 추출: 프롬프트를 사용해 AI가 특정 데이터 포인트를 찾고 추출하도록 안내합니다.
- 구조화된 출력: JSON, CSV, Markdown 등 다양한 형식을 지원하며, JSON 출력에 대한 스키마 생성 기능을 제공합니다.
- 에이전트 브라우징: 목표 달성을 위해 페이지에서 행동을 수행할 수 있는 Browser Agent를 포함합니다.
- 글로벌 프록시 지원: 지역 제한을 우회하기 위한 지리 위치 타깃팅을 기본 지원합니다.
- 비동기 지원: 모든 메서드에 고성능 애플리케이션을 위한 비동기 버전이 제공됩니다.
Sources
- undefinedoxylabs/oxylabs-ai-studio-py