Top Picks (추천 도구)

Genspark AI

웹 탐색, 상호작용, 자동화 기능이 고루 잘 구현된 대표적 browser-native LLM agent. 시각적으로도 정제되어 있어 사용자 접근성이 높고, 작업 지시(Task prompting) 구조가 안정적이다.

Chronology (간단 역사)

브라우저 자동화는 초기에는 Selenium, Playwrite, Puppeteer 등의 script 기반으로 이뤄졌으나, 2023년부터 Auto-GPT와 같은 LLM 기반 에이전트들이 등장하며 웹 자동화의 패러다임이 바뀌기 시작했다. 이후 ChatGPT plugin/browser tool 등장, AutoGen/MetaGPT/AgentScope 등 복수 에이전트 시스템 실험, 2024~2025년에는 Genspark, Manus AI, Skywork AI 등의 'Browser-native Agentic LLM' 도구들이 본격적으로 등장하였다. 2025년 8월에는 OpenAI의 Agent Mode가 등장하면서, 주요 LLM 공급자들이 자체 브라우저 기반 에이전트를 통합하려는 흐름이 강화되었다.

Alternative Comparison (유사제품 비교)

Name Key Features Stacks or Dependency Pricing
Genspark AI 실시간 브라우저 탐색, form 자동 입력, 멀티탭 제어, 자동화 pipeline 자체 웹앱 기반. GPT + 자체 Agent Runtime Free (기본) + Paid
ChatGPT Agent Mode LLM 기반 명령 수행 + 브라우저 탐색, 파일조작 기능 통합 OpenAI + GPT + WebUI ChatGPT Plus ($20/mo 이상)
Skyworks AI 협업 중심 agent system. 사용자와 LLM 에이전트 간 연속 작업 설계에 강점 자체 웹 IDE + 웹 자동화 Free (기본) + Paid
Manus AI 브라우저 자동화 중심의 일상 에이전트, Gmail, Jira, Google Docs와 연동 Chrome Extension + LLM API Free (기본) + Paid
OpenManus Manus 기반 오픈소스 프로젝트. MetaGPT 등 Agent 학습을 반영한 구조 Python 기반, GitHub 공개 무료 (MIT License)
MiniMax Agent 중국 기반, 다국어 대응, 브라우저 제어 포함 MiniMax LLM + Web UI 제한적 공개
Convergence AI Salesforce가 인수한 B2B 에이전트 솔루션. CRM 자동화 중심 Salesforce App Stack 기업형 유료 서비스
BrowserUse 초경량 웹브라우저에 LLM 연결. CLI 지향 구조. Rust 기반 경량 브라우저 + GPT API Free (기본) + Paid
NanoBrowser AI Chrome Extension 기반으로 실행. 유튜브 요약, 구글 검색 자동화 등 Chrome Extension + GPT API Freemium