원문: github.com | 토론: GeekNews · 댓글 1개
핵심 요약 ONNX 기반의 경량 TTS 라이브러리로, CPU만으로 고품질 음성 합성을 수행한다. 모델 크기 15M
80M 파라미터(2580MB), 8가지 내장 음성과 속도 조절을 지원한다. GPU 없이도 효율적 실행이 가능하며, 의존성 체인 문제(torch, CUDA 패키지 불필요하게 설치)에 대한 커뮤니티 피드백이 있었다.
커뮤니티 의견
- @GN⁺(HN 요약): “CLI 래퍼인 purr을 만들었음. 설치 시 불필요한 torch/CUDA 의존성이 끌려오는 문제 있음”
💡 실무 포인트: 엣지 디바이스나 서버리스 환경에서 TTS가 필요한 경우 25MB급 KittenTTS를 검토하라. 설치 시 uv로 불필요한 의존성을 제거하는 것을 권장한다.