首页音视频类音频生成与编辑
SA

Step-Audio-EditX

免费

开源AI音频编辑、自然语言指令

中难度开发者、音频编辑开源免费

Step-Audio-EditX 是什么

Step-Audio-EditX 是阶跃星辰开源的全球首个 LLM 级音频编辑大模型,主打“情感、说话风格、副语言”三轴细粒度迭代控制,可把愤怒、开心、悲伤等情绪强度任意增减,能把撒娇、耳语、老人等风格叠加多次,能像字幕一样插入呼吸、笑声、叹气等 10 类自然副语言 token。自带零样本 TTS,无需目标人语音即可克隆音色,在文本前加“[四川话]”“[粤语]”等标签秒切方言。模型完全基于大间隔合成数据做 SFT+PPO,后训练阶段无需额外编码器或 adapter 能实现属性解耦与迭代控制。

上手难度
适用人群
开发者、音频编辑
免费额度
开源免费
官方网址

核心功能

开源AI音频编辑、自然语言指令

开源AI音频编辑自然语言指令

工具信息

分类音视频类
子分类音频生成与编辑
上手难度中难度
免费额度开源免费
访问官网