QwenVoice:macOS上离线运行的Qwen TTS AI语音生成工作室
QwenVoice 是一款专为 macOS 打造的原生应用,基于 Qwen3-TTS 技术,实现高质量文本转语音(TTS)。它最大的特点是 100% 本地运行,无需联网、无 API 成本,专为 Apple Silicon 芯片优化,带来高效、安全且私密的语音生成体验。

Screenshot
一、核心特点
🎙 完整的离线语音工作室
QwenVoice 不只是一个简单的语音生成工具,而是一整套本地语音创作解决方案,包括:
自定义语音(Custom Voice)
语音设计(Voice Design)
语音克隆(Voice Cloning)
本地语音库管理(Saved Voices)
所有内容都在一个应用内完成,无需切换工具。
📚 可复用的语音库(Saved Voices)
用户可以将设计好的声音保存到本地库中,随时复用:
快速调用已有声音
支持作为语音克隆的基础
所有数据本地存储,安全可控
🧪 语音设计(Voice Design)
通过简单的文本描述即可生成全新声音:
独立工作区设计语音风格
支持实时试听(Live Preview)
可保存为可复用声音
🧬 语音克隆(Voice Cloning)
通过参考音频快速生成相似声音:
导入短音频作为参考
搭配脚本生成语音
支持与已有语音库结合使用
二、工作流程
QwenVoice 的使用流程简单高效,几分钟即可上手:
1. 下载应用:下载对应版本 DMG 文件
2. 安装并启动:将应用拖入 Applications 文件夹并打开
3. 下载模型:在应用内安装所需模型(语音设计 / 克隆等)

Screenshot
4. 开始生成语音:选择模式并实时预览生成效果
三、模型与性能
QwenVoice 内置三种 1.7B 参数模型:
Custom Voice 模型
Voice Design 模型
Voice Cloning 模型
特点:全部本地运行、支持实时预览、无需额外环境(无需 Python / Homebrew)
四、技术架构
QwenVoice 采用现代 macOS 原生技术栈构建:前端:SwiftUI,后端:Python + MLX(Apple Silicon 优化),数据存储:SQLite(GRDB),音频处理:mlx-audio。
核心优势:🚀 高性能本地推理、🔒 数据完全私有、🎧 实时流式语音预览
五、系统要求
使用 QwenVoice 需要:macOS 15 或更高版本、Apple Silicon 芯片(M系列)、推荐 8GB 以上内存
六、安装与安全性
官方发布版本具备完整 macOS 安全认证:已签名(Developer ID)、已通过 Apple 公证(Notarized)、已嵌入公证票据(Stapled),用户可直接打开使用,无需额外配置。
QwenVoice 将语音生成、语音设计与语音克隆整合为一个完整的本地工作流工具。它无需联网、无需订阅费用,同时具备专业级功能,非常适合:内容创作者、开发者、AI 语音实验者、注重隐私的用户、如果你希望在本地构建属于自己的语音系统,QwenVoice 是一个值得尝试的强大工具。