원문: github.com | 토론: GeekNews · 댓글 12개
핵심 요약 기존 음성 타이핑 도구(superwhisper, spokenly)의 네트워크 레이턴시 문제를 해결하기 위해 만들어진 macOS 전용 로컬 음성 인식 앱이다. Qwen3-ASR 모델을 채택해 온디바이스에서 빠른 속도와 높은 한국어 인식률을 달성했다. 네트워크 의존 없이 완전 로컬에서 동작하며, 8bitdo micro 게임패드와 연결해 핸즈프리 입력이 가능하다. 개발자가 아닌 사용자가 만든 프로젝트라는 점에서 AI 도구의 접근성 확대를 보여주는 사례이며, 커뮤니티에서 활발한 커스터마이징과 기여가 이루어지고 있다. Whisper large v3 turbo 대비 Qwen3-ASR의 성능 우위에 대한 논의도 진행 중이다.
커뮤니티 의견
- @0xvicky: “한글 음성인식 툴 쓰던게 거슬려서 써봤는데 괜찮아서 커스터마이징해서 쓰고 있습니다. 모델도 3개 더 추가하고 알림소리 조절하는거 넣고 몇가지 버그도 좀 잡고”
- @xguru: “와 써보니 빠르고 좋네요. 잘쓰겠습니다.”
- @jwseo: “Whisper large v3 turbo보다 좋나요? 저는 아직 이걸 쓰고 있는데, 혹시 비교해보셨는지 궁금합니다.”
💡 실무 포인트: Qwen3-ASR 모델을 활용한 로컬 음성 인식 파이프라인 구축 가능. 네트워크 레이턴시가 문제인 환경에서 온디바이스 STT 대안으로 검토할 만하다.