원문: github.com | 토론: GeekNews · 댓글 2개

핵심 요약 음성 복제·TTS·문서 낭독·오디오북 제작 기능을 통합 제공하는 macOS 네이티브 앱이다. MLX 기반 Metal 가속을 활용하며, 3초 샘플로 음성 복제가 가능한 Qwen3-TTS와 Chatterbox 모델을 탑재했다. 모델 크기 대비 높은 품질이 특징이다.

커뮤니티 의견

  • @jhk0530: “써봤는데 개쩌네요 진짜”
  • @neocode24: “mlx-audio GUI 버전인가요? 품질은 확실히 좋네요.”

💡 실무 포인트: macOS에서 로컬 TTS/음성 복제가 필요한 경우 MimikaStudio를 검토하라. MLX 가속으로 GPU 서버 없이도 실시간 음성 생성이 가능하다.