🎵 M2UGen融合音乐理解和多模态任务,支持文字、图像、视频生成音乐。
在非洲国家,我预计在三年左右的时间里会看到类似的使用水平。这其中仍然存在差距,但它比我们在其他创新中看到的滞后时间要短得多。”
该方法的贡献包括:
模型下载地址:https://huggingface.co/damo-vilab/dreamtalk
多种配音角色选择: 提供多种配音角色,包括edgeTTS以及支持openai的TTS模型,用户可以根据需求选择最合适的配音风格。
🎵 M2UGen融合音乐理解和多模态任务,支持文字、图像、视频生成音乐。
在非洲国家,我预计在三年左右的时间里会看到类似的使用水平。这其中仍然存在差距,但它比我们在其他创新中看到的滞后时间要短得多。”
该方法的贡献包括:
模型下载地址:https://huggingface.co/damo-vilab/dreamtalk
多种配音角色选择: 提供多种配音角色,包括edgeTTS以及支持openai的TTS模型,用户可以根据需求选择最合适的配音风格。