您现在的位置是:欧亿 > 热点

面壁智能 VoxCPM 1.5欧交易所app下载安卓 语音生成 AI 模型开源:高采样音频克隆,生成效率翻倍

欧亿2025-12-20 03:10:18【热点】4人已围观

简介IT之家 12 月 10 日消息,面壁智能今日官宣,VoxCPM 1.5 版本正式上线,在持续优化开发者开发体验的同时,也带来了多项核心能力升级。VoxCPM 是一个 0.5B 参数尺寸的语音生成基座 欧交易所app下载安卓

IT之家 12 月 10 日消息,面壁模型面壁智能今日官宣,语音样音VoxCPM 1.5 版本正式上线,生成欧交易所app下载安卓在持续优化开发者开发体验的开源同时,也带来了多项核心能力升级。高采

VoxCPM 是频克一个 0.5B 参数尺寸的语音生成基座模型,于今年 9 月首次发布。隆生率翻

IT之家附 VoxCPM 1.5 更新亮点:

  • 高采样音频克隆:AudioVAE 采样率从 16kHz 提升至 44.1kHz,成效模型可根据高质量音频,面壁模型克隆效果更佳、语音样音欧交易所app下载安卓细节更丰富的生成声音;

  • 生成效率翻倍:在模型参数有所增加的前提下,VoxCPM 1.5 仅需 6.25 个 token 即可生成 1 秒音频,开源较此前版本提高一倍,高采在保持速度的频克同时提升了音频生成质量;

  • 开发者友好:新增 LoRA 和全量微调脚本,支持深度定制;

  • 增强稳定性:减少音频伪影,隆生率翻优化长文本音频的生成效果。

目前,VoxCPM 1.5 模型已在 Github、Hugging Face 开源。

  • Huggingface:https://huggingface.co/openbmb/VoxCPM1.5

  • Github:https://github.com/OpenBMB/VoxCPM

很赞哦!(671)