Top Picks (추천 도구)
Genspark AI
웹 탐색, 상호작용, 자동화 기능이 고루 잘 구현된 대표적 browser-native LLM agent. 시각적으로도 정제되어 있어 사용자 접근성이 높고, 작업 지시(Task prompting) 구조가 안정적이다.
Chronology (간단 역사)
브라우저 자동화는 초기에는 Selenium, Playwrite, Puppeteer 등의 script 기반으로 이뤄졌으나, 2023년부터 Auto-GPT와 같은 LLM 기반 에이전트들이 등장하며 웹 자동화의 패러다임이 바뀌기 시작했다. 이후 ChatGPT plugin/browser tool 등장, AutoGen/MetaGPT/AgentScope 등 복수 에이전트 시스템 실험, 2024~2025년에는 Genspark, Manus AI, Skywork AI 등의 'Browser-native Agentic LLM' 도구들이 본격적으로 등장하였다. 2025년 8월에는 OpenAI의 Agent Mode가 등장하면서, 주요 LLM 공급자들이 자체 브라우저 기반 에이전트를 통합하려는 흐름이 강화되었다.
Alternative Comparison (유사제품 비교)
| Name | Key Features | Stacks or Dependency | Pricing |
|---|---|---|---|
| Genspark AI | 실시간 브라우저 탐색, form 자동 입력, 멀티탭 제어, 자동화 pipeline | 자체 웹앱 기반. GPT + 자체 Agent Runtime | Free (기본) + Paid |
| ChatGPT Agent Mode | LLM 기반 명령 수행 + 브라우저 탐색, 파일조작 기능 통합 | OpenAI + GPT + WebUI | ChatGPT Plus ($20/mo 이상) |
| Skyworks AI | 협업 중심 agent system. 사용자와 LLM 에이전트 간 연속 작업 설계에 강점 | 자체 웹 IDE + 웹 자동화 | Free (기본) + Paid |
| Manus AI | 브라우저 자동화 중심의 일상 에이전트, Gmail, Jira, Google Docs와 연동 | Chrome Extension + LLM API | Free (기본) + Paid |
| OpenManus | Manus 기반 오픈소스 프로젝트. MetaGPT 등 Agent 학습을 반영한 구조 | Python 기반, GitHub 공개 | 무료 (MIT License) |
| MiniMax Agent | 중국 기반, 다국어 대응, 브라우저 제어 포함 | MiniMax LLM + Web UI | 제한적 공개 |
| Convergence AI | Salesforce가 인수한 B2B 에이전트 솔루션. CRM 자동화 중심 | Salesforce App Stack | 기업형 유료 서비스 |
| BrowserUse | 초경량 웹브라우저에 LLM 연결. CLI 지향 구조. | Rust 기반 경량 브라우저 + GPT API | Free (기본) + Paid |
| NanoBrowser AI | Chrome Extension 기반으로 실행. 유튜브 요약, 구글 검색 자동화 등 | Chrome Extension + GPT API | Freemium |