원문: alibaba.github.io | 토론: GeekNews · 댓글 11개

핵심 요약 알리바바가 공개한 page-agent는 <script> 태그 한 줄만으로 기존 웹페이지에 AI 에이전트를 주입하는 라이브러리다. 브라우저 확장, Python, 헤드리스 브라우저 없이도 동작하며, 텍스트 기반 DOM 조작을 통해 자연어 명령으로 웹페이지를 제어한다. Playwright + AI 조합보다 속도가 빠르다는 평가가 나오며, bookmarklet 형태로 baseURL과 apiKey를 지정하면 로컬 LLM이나 OpenAI 등 원하는 엔드포인트로 연결할 수 있어 중국 서버 경유에 대한 우려도 해소 가능하다. SNS에서 큰 반향을 일으키고 있으며, 실제 토스증권 등 복잡한 웹앱에서도 자율적으로 페이지를 탐색하고 정보를 추출하는 데모가 확인되었다.

커뮤니티 의견

  • @limgk9: “기본 bookmarklet은 알리바바(중국)로 가는 것이 찜찜하신 분들은 baseURL과 apiKey를 넣어서 사용하시는 LLM Endpoint로 지정하실 수 있습니다.”
  • @act1000: “토스증권에서 soxl 30일 전 주가 가격알고싶다고 하니까 자기가 조작해서 들어가서 가격보고 알려주네요. Playwright와 AI 연결보다 훨씬 속도도 빠르네요.”
  • @princox: “이거 SNS 상에서 난리던데.. 함 해봐야겠네요”

💡 실무 포인트: 기존 웹앱에 AI 기능을 빠르게 프로토타이핑할 때 유용. bookmarklet 방식으로 로컬 LLM 연결 시 보안 우려 없이 사내 도구 자동화에 즉시 활용 가능.