TangoFlux 是一款专注于通过文本提示词生成音效、背景音乐和其他声音片段的创新 AI 工具。由新加坡科技设计大学与 NVIDIA 联手推出,TangoFlux 不仅能快速生成音频,支持长时间音频,还能根据用户需求自适应调整,是音频生成技术的一项重要突破。
核心功能亮点
高效生成音频
TangoFlux 可以在几秒钟内生成最多 30 秒的 44.1kHz 音频,极大地提高了创作效率。
支持长音频生成
它能够生成时长长达 30 秒的音频,包括各种音乐片段、环境音效和特效音效,完美满足不同音频需求。
CRPO 优化
TangoFlux 引入了 CLAP-Ranked Preference Optimization (CRPO) 框架,根据用户的偏好对生成的音频进行优化,确保每个音效都达到更高质量的标准。
多样化的音效生成
从旋律、节奏、背景音乐到自然环境音效(如雨声、风声、海浪声等),再到爆炸、机械声等特效音效,TangoFlux 还支持自然语音合成,为各种场景提供丰富的音效支持。
应用场景
音乐与影视制作
TangoFlux 可以帮助快速生成背景音乐或音效,为创作提供灵感,显著缩短制作周期。
游戏开发
为游戏场景(如森林、战场等)提供背景音效,或者生成武器攻击、技能释放等特效音效,提升游戏体验。
播客与有声书
它能够生成转场音效或背景音,甚至可以创造情感化的语音,为故事增添更丰富的情感层次。
系统配置要求
为了确保 TangoFlux 的正常运行,请确保你的电脑符合以下配置要求:
- 操作系统:Windows 10/11 64位
- 显卡:至少 8GB 显存的 NVIDIA 显卡
- CUDA:版本 >= 12.4
- 硬盘空间:整个包解压后约 15.5GB,请留足空间
如何查看显卡型号和显存
- 打开任务管理器
- 点击“性能”
- 选择“GPU”选项卡
- 在右上角查看显卡型号,并在下方找到显存大小
使用教程
- 下载并解压整合包。
- 请确保文件夹路径和文件名称中不含中文字符,否则可能导致部分软件无法识别并报错。
- 双击“一键启动.bat”文件,稍等片刻,操作界面将在浏览器中自动打开。
- 输入文本提示词,您可以选择中文提示词并点击“翻译为英文”,系统会自动填充英文提示词框;或直接在英文提示框中输入提示词,调整音频时长和步数(最高支持 30 秒音频,推荐步数为 50 步),点击“生成音频”,音频将显示在右侧。
- 点击播放按钮试听音频,点击右上角的下载按钮保存至指定文件夹。
音频生成示例
- 雨声(The sound of rain.)
- 人的口哨声与自然鸟鸣声(The whistles of man and the birds of nature.)
- 钢琴弹奏声(The sound of piano playing.)