You're looking at a specific version of this model. Jump to the model overview.
Input schema
The fields you can use to run this model with an API. If you don’t give a value for a field its default value will be used.
| Field | Type | Default value | Description |
|---|---|---|---|
| ref_text |
string
|
|
参考文本,用于提取语音特征(如果为空,将使用参考音频自动识别)
|
| ref_audio |
string
|
参考音频文件(WAV格式),用于语音克隆。如果 no_ref_audio=True,此参数将被忽略
|
|
| gen_text |
string
|
要生成的文本内容
|
|
| project |
None
|
multilingual_prosody
|
模型类型
|
| nfe_step |
integer
|
64
Min: 16 Max: 128 |
NFE 步数,控制生成质量(越大质量越好但速度越慢)
|
| use_ema |
boolean
|
True
|
是否使用 EMA(指数移动平均)模型
|
| separate_langs |
boolean
|
True
|
是否分离语言标记
|
| frontend |
None
|
phone
|
前端类型
|
| speed |
number
|
1
Min: 0.5 Max: 1.5 |
语速(0.5-1.5)
|
| cfg_strength |
number
|
5
Max: 10 |
CFG 强度(0-10),控制与参考音频的相似度
|
| use_acc_grl |
boolean
|
True
|
是否使用加速 GRL
|
| ref_ratio |
number
|
1
Max: 1 |
参考比例(0-1),控制参考音频的影响程度
|
| no_ref_audio |
boolean
|
False
|
是否不使用参考音频(仅使用文本)
|
| sway_sampling_coef |
number
|
3
Min: 2 Max: 5 |
采样系数(2-5)
|
| use_prosody_encoder |
boolean
|
False
|
是否使用韵律编码器(仅对 prosody 模型有效)
|
| seed |
integer
|
-1
|
随机种子(-1 表示随机)
|
| use_denoise |
boolean
|
False
|
是否对参考音频进行降噪处理
|
Output schema
The shape of the response you’ll get when you run this model with an API.
Schema
{'format': 'uri', 'title': 'Output', 'type': 'string'}