今天给大家介绍一个开源的AI工具:Amphion
它是一个用于音频、音乐和语音生成的工具包,它目标是提供一个平台来研究任何输入到音频的转换。Amphion 旨在支持单独的生成任务,包括但不限于
今天给大家介绍的是它的歌声转换功能,可以让不同的喜欢的歌手演唱任意歌曲!最重要的是,这个工具目前是开源!
先看一波官方示例
如果觉得示例看着不直接,可以自己去在线体验网址试一试!
技术上如何实现的?
歌声转换(SVC)是一种使任意歌手能够演唱任意歌曲的技术。
传统的 AI 歌手训练方法主要依赖音频特征,而忽视了文本和标签等其他内容特征。这导致 AI 歌手在演唱时可能会出现发音不准、感情表达不到位等问题。
这个项目调查了三种不同的内容特征,分别来自WeNet、Whisper和ContentVec。让他们在SVC中的互补作用。研究成果表明,多维度内容特征能够有效地提升 AI 歌手的表现。在实验中,使用多维度内容特征训练的 AI 歌手在发音准确度、情感表达等方面均优于使用单一音频特征训练的 AI 歌手。
体验网址:
https://huggingface.co/spaces/amphion/singing_voice_conversion
项目地址:
https://www.zhangxueyao.com/data/MultipleContentsSVC/index.html
代码地址:
https://github.com/open-mmlab/Amphion/tree/main
本文共 361 个字数,平均阅读时长 ≈ 1分钟
评论 (0)