小杜
无界日报第2期,本期头条 - stable diffusion 微调模型 riff + diffusion 以生成频谱图图像来转换为音乐。
当用户输入新提示时,音频会平滑地过渡到新提示风格。如果没有新提示,应用程序将在同一提示的不同种子值之间进行音频生成。频谱图被可视化为沿时间线的 3D 波纹图,带有半透明的播放条提示播放进度。
1.带有爵士乐萨克斯管独奏的放克低音
- 微调后 -
2.放克钢琴
项目官网给出了详细的提示语建议与微调操作指南,感兴趣的朋友可以前往项目页体验一番~
......
www.riffusion.com/
项目解读:
www.riffusion.com/about
huggingface.co/spaces/fffiloni/whisper-to-stable-diffusion
本文来自微信公众号“无界社区mixlab”(ID:mix-lab)。大作社经授权转载,该文观点仅代表作者本人,大作社平台仅提供信息存储空间服务。