[wideo]https://aiappku.com/wp-content/uploads/2024/04/Parler-TTS文本转语音模型:轻量级高质量语音模型.mp4[/wideo]
GitHub:
https://github.com/huggingface/parler-tts
模型下载:
https://huggingface.co/parler-tts
在线体验:
https://huggingface.co/spaces/parler-tts/parler_tts_mini
Parler-TTS 是 Hugging Face 开发的一款轻量级文本转语音(TTS)模型,它以卓越的表现脱颖而出。其独特的特性在于能够根据指定说话者的风格,包括性别、音调、说话方式等,生成高质量且听起来非常自然的语音。这一模型的研发工作主要基于 Dan Lyth 和 Simon King 在《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》这篇论文中的研究成果,其中 Dan Lyth 来自 Stability AI,而 Simon King 则来自爱丁堡大学。
Parler-TTS 的另一大亮点在于其完全开源的特性。与其他TTS模型不同,它不仅提供了模型权重,还公开了数据集、预处理和训练代码,为用户提供了极大的便利。用户可以通过简单的安装步骤,轻松地将模型集成到自己的项目中,并通过交互式演示和详细的训练指南快速上手。
值得一提的是,Parler-TTS 还提供了开源的注释语音数据集,其规模从1,000小时到即将达到的50,000小时不等。这一丰富的资源为训练和改进TTS模型提供了坚实的基础,使得 Parler-TTS 在生成高质量语音方面更具优势。
READ ME(使用方法):
评论0