Parler-TTS文本转语音模型

GitHub:

https://github.com/huggingface/parler-tts

模型下载:

https://huggingface.co/parler-tts

在线体验:

https://huggingface.co/spaces/parler-tts/parler_tts_mini

Parler-TTS 是 Hugging Face 开发的一款轻量级文本转语音(TTS)模型,它以卓越的表现脱颖而出。其独特的特性在于能够根据指定说话者的风格,包括性别、音调、说话方式等,生成高质量且听起来非常自然的语音。这一模型的研发工作主要基于 Dan Lyth 和 Simon King 在《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》这篇论文中的研究成果,其中 Dan Lyth 来自 Stability AI,而 Simon King 则来自爱丁堡大学。

Parler-TTS 的另一大亮点在于其完全开源的特性。与其他TTS模型不同,它不仅提供了模型权重,还公开了数据集、预处理和训练代码,为用户提供了极大的便利。用户可以通过简单的安装步骤,轻松地将模型集成到自己的项目中,并通过交互式演示和详细的训练指南快速上手。

值得一提的是,Parler-TTS 还提供了开源的注释语音数据集,其规模从1,000小时到即将达到的50,000小时不等。这一丰富的资源为训练和改进TTS模型提供了坚实的基础,使得 Parler-TTS 在生成高质量语音方面更具优势。

READ ME(使用方法):

下载地址此资源下载价格为6积分立即购买(VIP免费)
积分奖励:邀请注册1积分,新用户1积分,签到奖励0.5积分

发表评论

error: Content is protected !!