You're looking at a specific version of this model. Jump to the model overview.

aodianyun /lemas-tts:bb9c1ab6

Input schema

The fields you can use to run this model with an API. If you don’t give a value for a field its default value will be used.

Field Type Default value Description
ref_text
string
参考文本,用于提取语音特征(如果为空,将使用参考音频自动识别)
ref_audio
string
参考音频文件(WAV格式),用于语音克隆。如果 no_ref_audio=True,此参数将被忽略
gen_text
string
要生成的文本内容
project
None
multilingual_prosody
模型类型
nfe_step
integer
64

Min: 16

Max: 128

NFE 步数,控制生成质量(越大质量越好但速度越慢)
use_ema
boolean
True
是否使用 EMA(指数移动平均)模型
separate_langs
boolean
True
是否分离语言标记
frontend
None
phone
前端类型
speed
number
1

Min: 0.5

Max: 1.5

语速(0.5-1.5)
cfg_strength
number
5

Max: 10

CFG 强度(0-10),控制与参考音频的相似度
use_acc_grl
boolean
True
是否使用加速 GRL
ref_ratio
number
1

Max: 1

参考比例(0-1),控制参考音频的影响程度
no_ref_audio
boolean
False
是否不使用参考音频(仅使用文本)
sway_sampling_coef
number
3

Min: 2

Max: 5

采样系数(2-5)
use_prosody_encoder
boolean
False
是否使用韵律编码器(仅对 prosody 模型有效)
seed
integer
-1
随机种子(-1 表示随机)
use_denoise
boolean
False
是否对参考音频进行降噪处理

Output schema

The shape of the response you’ll get when you run this model with an API.

Schema
{'format': 'uri', 'title': 'Output', 'type': 'string'}