首页音视频类开源项目
AU

AudioX

免费

统一音频生成(T2A/T2M/V2A等)

高难度研究者、音频开发者开源免费

AudioX 是什么

AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压器模型,专门用于从任意内容生成音频和音乐。模型能处理多种输入模态,包括文本、视频、图像、音乐和音频,生成高质量的音频输出。核心创新在于多模态掩码训练策略,通过随机掩码输入模态,迫使模型从不完整的输入中学习,增强跨模态表示能力。

上手难度
适用人群
研究者、音频开发者
免费额度
开源免费
官方网址

核心功能

统一音频生成(T2A/T2M/V2A等)

统一音频生成(T2A/T2M/V2A等)

工具信息

分类音视频类
子分类开源项目
上手难度高难度
免费额度开源免费
访问官网