大数跨境
0
0

GitHub黑科技: 5秒内克隆您的声音并生成任意语音内容! 谨防骗子呀

GitHub黑科技:  5秒内克隆您的声音并生成任意语音内容! 谨防骗子呀 GitHubTopp
2023-11-13
2
导读:大家好,我是GitHub TOP君,每天分享github上最优质的资源今天分享 MockingBird5

大家好,我是GitHub TOP君,每天分享github上最优质的资源

今天分享   MockingBird

5秒内克隆您的声音并生成任意语音内容!

https://github.com/babysor/MockingBird

MockingBird是专门针对 中文的!它可能被用于不法目的,如诈骗、伪装身份等

在享受技术带来的便利时,我们应保持警惕,并遵循相关法律法规。
在享受技术带来的便利时,我们应保持警惕,并遵循相关法律法规。

MockingBird 是一个实时中文语音克隆开源项目,它能够在短短的 5 秒内克隆您的声音并生成任意语音内容。该项目基于 SV2TTS 技术,已经在全球知名的代码托管平台 Github 上开源。据项目声称,只需提供您的 5 秒音频样本,MockingBird 便能够精确地模仿您的声音。


该项目采用 Python 开发,提供了提取、录制、调试和训练一体化的 GUI 操作。通过简单易用的界面,用户可以轻松地克隆目标声音并生成相应的语音内容。MockingBird 的实时语音克隆技术在语音识别、合成和转换方面具有较高的准确性和自然度,使得模仿出的声音与原声相近度较高。


然而,值得注意的是,开源项目 MockingBird 可能也存在一定的潜在风险。由于声音克隆技术的广泛应用,它可能被用于不法目的,如诈骗、伪装身份等。因此,在使用此类技术时,我们应谨慎对待并确保合法合规。


总之,MockingBird 是一个有趣且实用的实时声音克隆开源项目。它在短时间内即可克隆您的声音并生成任意语音内容,为人们带来了便利的同时,也提醒我们要关注潜在的安全风险。在享受技术带来的便利时,我们应保持警惕,并遵循相关法律法规。


特性

🌍 中文 支持普通话并使用多种中文数据集进行测试:aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell 等

🤩 PyTorch 适用于 pytorch,已在 1.9.0 版本(最新于 2021 年 8 月)中测试,GPU Tesla T4 和 GTX 2060

🌍 Windows + Linux 可在 Windows 操作系统和 linux 操作系统中运行(苹果系统M1版也有社区成功运行案例)

🤩 Easy & Awesome 仅需下载或新训练合成器(synthesizer)就有良好效果,复用预训练的编码器/声码器,或实时的HiFi-GAN作为vocoder

🌍 Webserver Ready 可伺服你的训练结果,供远程调用

开始

1. 安装要求

1.1 通用配置

按照原始存储库测试您是否已准备好所有环境。运行工具箱(demo_toolbox.py)需要 Python 3.7 或更高版本 。

  • 安装 PyTorch。

如果在用 pip 方式安装的时候出现 ERROR: Could not find a version that satisfies the requirement torch==1.9.0+cu102 (from versions: 0.1.2, 0.1.2.post1, 0.1.2.post2) 这个错误可能是 python 版本过低,3.9 可以安装成功

  • 安装 ffmpeg。

  • 运行pip install -r requirements.txt 来安装剩余的必要包。

  • 安装 webrtcvad pip install webrtcvad-wheels

或者

  • conda 或者 mamba 安装依赖

    conda env create -n env_name -f env.yml

    mamba env create -n env_name -f env.yml

    会创建新环境安装必须的依赖. 之后用 conda activate env_name 切换环境就完成了.

    env.yml只包含了运行时必要的依赖,暂时不包括monotonic-align,如果想要装GPU版本的pytorch可以查看官网教程。


3. 启动程序或工具箱

您可以尝试使用以下命令:

3.1 启动Web程序(v2):

python web.py 运行成功后在浏览器打开地址, 默认为 http://localhost:8080

  • 仅支持手动新录音(16khz), 不支持超过4MB的录音,最佳长度在5~15秒

3.2 启动工具箱:

python demo_toolbox.py -d <datasets_root>

请指定一个可用的数据集文件路径,如果有支持的数据集则会自动加载供调试,也同时会作为手动录制音频的存储目录。




MockingBird

5秒内克隆您的声音并生成任意语音内容!

https://github.com/babysor/MockingBird

MockingBird是专门针对 中文的!它可能被用于不法目的,如诈骗、伪装身份等

在享受技术带来的便利时,我们应保持警惕,并遵循相关法律法规。

我们收集了10000+ 开源项目 点击 阅读原文

【声明】内容源于网络
0
0
GitHubTopp
top开源系统分享
内容 444
粉丝 0
GitHubTopp top开源系统分享
总阅读124
粉丝0
内容444