자연어 명령으로 Civilization VI를 플레이하는 computer-use VLM 에이전트다. ‘동쪽으로 확장’, ‘과학 승리’ 등 고수준 의도를 입력하면 에이전트가 실제 게임 조작을 수행한다. Strategy/Action/HITL 3계층 구조로 전략과 실행을 분리했으며, Human-in-the-Loop 레이어를 통해 사용자 개입이 가능하다.

💡 실무 포인트: computer-use 에이전트의 3계층 아키텍처(전략-실행-인간개입)는 게임 외에도 GUI 자동화, RPA 등 다양한 분야에 적용 가능한 설계 패턴이다.