You're looking at a specific version of this model. Jump to the model overview.
lightweight-ai /w.2_s-v:67d1eddd
Input schema
The fields you can use to run this model with an API. If you don’t give a value for a field its default value will be used.
| Field | Type | Default value | Description |
|---|---|---|---|
| cond_video |
string
|
입력 이미지 또는 비디오 파일
|
|
| prompt |
string
|
A person is talking.
|
비디오 생성을 위한 프롬프트
|
| cond_audio_person1 |
string
|
첫 번째 사람의 오디오 파일 (.wav, .mp3 등)
|
|
| cond_audio_person2 |
string
|
두 번째 사람의 오디오 파일 (선택 사항)
|
|
| bbox_person1 |
string
|
0,0,512,512
|
첫 번째 사람의 바운딩 박스 (x1,y1,x2,y2 형식)
|
| bbox_person2 |
string
|
두 번째 사람의 바운딩 박스 (x1,y1,x2,y2 형식, 선택 사항)
|
|
| audio_type |
None
|
para
|
두 오디오를 결합하는 방식
|
| seed |
integer
|
42
|
랜덤 시드. -1로 설정 시 무작위 시드 사용
|
| frame_num |
integer
|
81
|
한 번에 생성할 클립의 프레임 수 (4n+1 형태여야 함)
|
| max_frame_num |
integer
|
1000
|
생성할 비디오의 최대 프레임 길이
|
| mode |
None
|
clip
|
생성 모드. 'clip'은 단일 청크, 'streaming'은 긴 비디오 생성
|
| sample_steps |
integer
|
40
|
샘플링 스텝 수
|
| sample_text_guide_scale |
number
|
5
|
텍스트 가이던스 스케일
|
| sample_audio_guide_scale |
number
|
4
|
오디오 가이던스 스케일
|
| color_correction_strength |
number
|
1
Max: 1 |
색상 보정 강도 (0.0 ~ 1.0)
|
| scene_seg |
boolean
|
False
|
입력 비디오에 대해 장면 분할을 활성화할지 여부
|
Output schema
The shape of the response you’ll get when you run this model with an API.
Schema
{'format': 'uri', 'title': 'Output', 'type': 'string'}