원문: github.com | 토론: GeekNews · 댓글 2개
핵심 요약 음성 복제·TTS·문서 낭독·오디오북 제작을 통합 제공하는 macOS 네이티브 오픈소스 도구다. MLX 기반 Metal 가속을 활용해 로컬에서 네이티브 성능으로 실행되며, 3초 샘플만으로 음성 복제가 가능한 Qwen3-TTS와 Chatterbox 모델을 지원한다. 윈도우 지원도 예정되어 있다.
커뮤니티 의견
- @jhk0530: “써봤는데 개쩌네요 진짜”
- @neocode24: “mlx-audio GUI 버전인가요? 품질은 확실히 좋네요.”
💡 실무 포인트: Apple Silicon Mac에서 로컬 TTS가 필요한 경우 클라우드 API 없이 프로덕션급 음성을 생성할 수 있다.