文生音乐模型人人可发单曲,DiffRhythm本地部署全实录
lipiwang 2025-05-28 18:30 9 浏览 0 评论
一、前言
DiffRhythm(中文:谛韵,Dì Yùn)是第一个开源的基于扩散的音乐生成模型,能够创建完整的歌曲。该名称结合了 “Diff” (引用其扩散架构) 和 “Rhythm” (突出其对音乐和歌曲创作的关注)。中文名称 谛韵 (Dì Yùn) 在发音上反映了 “DiffRhythm”,其中 “谛” (专心聆听) 象征听觉感知,“韵” (旋律魅力) 代表音乐性。
主要有下面两个模型,base可以生成1分35秒的音乐,full版可以生成长音乐,按需选择,本次测试使用base版。
模型名称 | 下载地址 |
DiffRhythm-base (1 分 35 秒) | https://huggingface.co/ASLP-lab/DiffRhythm-base |
DiffRhythm-full (4 分 45 秒) | https://huggingface.co/ASLP-lab/DiffRhythm-full |
没有梯子把前端的域名换为https://hf-mirror.com
软硬件环境 :
名称 | 参数 |
显卡 | RTX 3090 24GB |
内存 | 64GB DDR5 |
系统 | windows11 wsl2 ubuntu24 |
二、部署
下载DiffRhythm
cd /data/
sudo git clone https://github.com/ASLP-lab/DiffRhythm.git
cd DiffRhythm
安装espeek-ng组件
## espeak-ng
# For Debian-like distribution (e.g. Ubuntu, Mint, etc.)
sudo apt-get install espeak-ng
# For RedHat-like distribution (e.g. CentOS, Fedora, etc.)
sudo yum install espeak-ng
# For MacOS
brew install espeak-ng
创建python运行虚拟环境,安装依赖
## 这里使用conda创建,如果不支持可以单独配置一下
conda create -n diffrhythm python=3.10
conda activate diffrhythm
#安装所需要的依赖,指定国内源就会秒成功
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
下载DiffRhythm-base模型
cd /data/DiffRhythm
sudo git clone https://hf-mirror.com/ASLP-lab/DiffRhythm-base ASLP-lab/DiffRhythm-base
生成音乐
python infer/infer.py --lrc-path infer/example/eg_cn.lrc --ref-audio-path infer/example/eg_cn.wav --audio-length 95 --repo_id ASLP-lab/DiffRhythm-base --output-dir infer/example/output --chunked
首先运行会很慢,要下载需要下载pytorch,还有可能报错,比如缺少模块,我这里缺少py3langid,使用下面命令安装即可。
pip install py3langid -i https://pypi.tuna.tsinghua.edu.cn/simple
还有可能无法下载,因为网络问题,报错如下:关键错是:network is unreachable
python infer/infer.py --lrc-path infer/example/eg_cn.lrc --ref-audio-path infer/example/eg_cn.wav --audio-length 95 --repo_id ASLP-lab/DiffRhythm-base --output-dir infer/example/output --chunked
Current working directory: /data/DiffRhythm-main
Traceback (most recent call last):
File "/home/chuan/miniconda3/envs/diffrhythm/lib/python3.10/site-packages/urllib3/connection.py", line 198, in _new_conn
sock = connection.create_connection(
File "/home/chuan/miniconda3/envs/diffrhythm/lib/python3.10/site-packages/urllib3/util/connection.py", line 85, in create_connection
raise err
File "/home/chuan/miniconda3/envs/diffrhythm/lib/python3.10/site-packages/urllib3/util/connection.py", line 73, in create_connection
sock.connect(sa)
OSError: [Errno 101] Network is unreachable
The above exception was the direct cause of the following exception:
Traceback (most recent call last):
File "/home/chuan/miniconda3/envs/diffrhythm/lib/python3.10/site-packages/urllib3/connectionpool.py", line 787, in urlopen
response = self._make_request(
File "/home/chuan/miniconda3/envs/diffrhythm/lib/python3.10/site-packages/urllib3/connectionpool.py", line 488, in _make_request
raise new_e
File "/home/chuan/miniconda3/envs/diffrhythm/lib/python3.10/site-packages/urllib3/connectionpool.py", line 464, in _make_request
self._validate_conn(conn)
File "/home/chuan/miniconda3/envs/diffrhythm/lib/python3.10/site-packages/urllib3/connectionpool.py", line 1093, in _validate_conn
conn.connect()
可以临时设置一下环境变量:
export HF_ENDPOINT=https://hf-mirror.com
#然后再执行生成音乐脚本
python infer/infer.py --lrc-path infer/example/eg_cn.lrc --ref-audio-path infer/example/eg_cn.wav --audio-length 95 --repo_id ASLP-lab/DiffRhythm-base --output-dir infer/example/output --chunked
参数解释:
--lrc-path lrc歌词的完整地址,你可以从网上下载lrc歌词或者使用模型生成lrc歌曲,放到指定的目录即可,这里有很多歌词https://www.wagequ.com/
--ref-audio-path 引用参考的音乐,生成的音乐会与这个参数音乐在旋律上有很大相同之处,具体自己可以测试,这个参考音乐可以从网上下载,我找到一个网站在这里分享一下。https://www.xmwav.com/
--audio-length 音乐的长度,base模型最大支持95秒,full最大支持285秒
--repo_id 指定模型,当前使用是base模型
--output-dir 生成的音乐输出的目录,在这个目录里会生成一个output.wav的文件,下载就可以播放了
在这里可以试用:
https://huggingface.co/spaces/ASLP-lab/DiffRhythm
如下我放了一个《下一个天亮》的歌词
三、后话
1、看试用地址里高级设置还能设置输出格式如mp3,还能配置seed、diffusion steps、CFG Strength等。
2、现在还不支持docker部署,从作者的TODO可以看出以后也会支持
TODOs
- Dynamic length control
- Vocals only
- Song extension
- Support Colab.
- Support Docker.
- Release DiffRhythm-full.
- Release training code.
- Support local deployment.
- Release paper to Arxiv.
- Online serving on Hugging Face Space.
创作不易 点赞 关注 收藏
- 上一篇:问题反馈:为什么Cydia加载出现那么多红色错误?
- 下一篇:Nmap 操作指南
相关推荐
- 《每日电讯报》研发数字工具,教你更有效率地报道新闻
-
为鼓励新闻编辑部持续创新,《每日电讯报》正在尝试有战略地研发数字工具。网站的数字媒体主任马尔科姆o科尔斯(MalcolmColes)表示,《每日电讯报》正试图去“创建一些可持续资产”,以便于让记者们...
- html5学得好不好,看掌握多少标签
-
html5你了解了多少?如果你还是入门阶段的话,或者还是一知半解的话,那么我们专门为你们收集的html5常用的标签大全对你就很有帮助了,你需要了解了html5有哪些标签你才能够更好的。驾驭html5...
- 前端分享-少年了解过iframe么(我想了解少年)
-
iframe就像是HTML的「内嵌画布」,允许在页面中加载独立网页,如同在画布上叠加另一幅动态画卷。核心特性包括:独立上下文:每个iframe都拥有独立的DOM/CSS/JS环境(类似浏...
- 做SEO要知道什么是AJAX(人能看到但搜索引擎看不到的内容)
-
一个明显的,人能看到但搜索引擎不能看到的内容是AJAX。那么什么是AJAX呢?其实,了解过的基本上也都清楚,AJAX不是新的编程语言,而是一种使用现有标准的新方法。AJAX最大的优点是在不重新加...
- 介绍最前沿的人工智能创新,‘无反向传播’神经网络训练方法?
-
图像由GoogleImageFX生成前言:本文整理自NoProp原始论文与实践代码,并结合多个公开实现细节进行了全流程复现。对神经网络训练机制的探索仍在不断演进,如果你也在研究反向传播之...
- 说说我们对HTML6的期许(对html的看法)
-
HTML5概述HTML5是HTML语言最受欢迎的版本之一,它支持音频和视频、离线存储、移动端、和标签属性等等。还提供了article,section,header这样的标签来帮助开发者更好...
- 浏览器中在线预览pdf文件,pdf.mjs插件实现web预览pdf
-
背景:本来只是淘宝上卖卖袜子,想着扩展一下业务,准备做同名“来家居”海外袜子馆外贸项目,碰到pdf在线预览的需求,就找了pdf.js插件进行实践后把此方法记录下来,可以通过多种方法来实现,每种方法都有...
- SVG 在前端的7种使用方法,你还知道哪几种?
-
本文简介点赞+关注+收藏=学会了技术一直在演变,在网页中使用SVG的方法也层出不穷。每个时期都有对应的最优解。所以我打算把我知道的7种SVG的使用方法列举出来,有备无患~如果你还...
- HTML5常用标签大全(html5em标签)
-
HTML前端开发最终取决于掌握标签的多少HTML大概有七八百个标签楼主这里给大家总结了下HTML常用标签标签描述<!--...-->定义注释。<!DOCTYPE>定义文档类型...
- "伪君子Snoop Dogg!"... WHAT?| MetroDaily 24/7
-
TUE.01-新作品-虽说年纪大了会有点糊涂,但是最近SnoopDogg的这波操作实在是让粉丝们有点迷,甚至有人表示没想到他是这样的"伪君子"......而这一切都源于他近日在IG上Po出的一...
- 莎夏·班克斯盼望表哥Snoop Dogg为其作出场曲
-
NXT女子冠军莎夏·班克斯(SashaBanks)近日接受了迈阿密先驱报采访,访谈纪要如下:关于她出众的形象:“我一向喜欢与众不同。为了能让人眼前一亮,我的装束总是非常前卫、非常抢眼,这样才能让观众...
- 喜欢Snoop!全球第一间「史努比博物馆」海外分馆在东京!
-
1950年起,由美國漫畫家CharlesM.Schulz創作的作品《Snoopy》史努比,其鮮明的可愛角色與幽默的劇情內容,至今仍成為許多大朋友與小朋友心中的最愛。為了紀念作者所設立的全球首...
- Vetements 推出 Snoop Dogg 肖像「天价」T-Shirt
-
Vetements的CEOGuramGvasalia早前才透露品牌经营策略的秘密–Vetements如何成为人人热议的话题品牌。但似乎他仍有更多需要解释的东西–这个法国奢侈品牌最新...
- 狗爷Snoop Dogg的《I Wanna Thank Me》巡回演唱会旧金山站
-
西海岸匪帮说唱歌手SnoopDogg在《IWannaThankMe》巡回演唱会旧金山站表演(图片来自ICphoto)西海岸匪帮说唱歌手SnoopDogg(图片来自ICphoto)西海...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- maven镜像 (69)
- undefined reference to (60)
- zip格式 (63)
- oracle over (62)
- date_format函数用法 (67)
- 在线代理服务器 (60)
- shell 字符串比较 (74)
- x509证书 (61)
- localhost (65)
- java.awt.headless (66)
- syn_sent (64)
- settings.xml (59)
- 弹出窗口 (56)
- applicationcontextaware (72)
- my.cnf (73)
- httpsession (62)
- pkcs7 (62)
- session cookie (63)
- java 生成uuid (58)
- could not initialize class (58)
- beanpropertyrowmapper (58)
- word空格下划线不显示 (73)
- jar文件 (60)
- jsp内置对象 (58)
- makefile编写规则 (58)