You're looking at a specific version of this model. Jump to the model overview.

csviverdeia /locateanything-3b-h100:47a1715c

Input schema

The fields you can use to run this model with an API. If you don’t give a value for a field its default value will be used.

Field Type Default value Description
image
string
Imagem RGB de entrada. Use ISTO para grounding em imagem.
video
string
Vídeo de entrada. Use ISTO para grounding em vídeo (amostrado em frames). Informe image OU video, não os dois.
prompt
string
Detect all the main objects and output their bounding boxes.
Instrução em linguagem natural do que localizar (ex: 'Detect the red car').
generation_mode
None
hybrid
Modo de decodificação. 'hybrid' equilibra velocidade e precisão.
tiles
integer
1

Min: 1.0

Max: 5.0

[Imagem] Tiling: divide a imagem em NxN pedaços e detecta cada um em resolução cheia (recupera objetos pequenos/ao fundo). 1 = desligado. Ex.: 3 = 3x3 = 9 inferências (mais lento). Ótimo para CONTAGEM densa.
verify
boolean
False
[Imagem] Verifica cada caixa com CLIP e descarta falso-positivo (ex.: pedra/mato marcado como objeto). Requer 'verify_object'.
verify_object
string
[Imagem] O que cada caixa DEVE ser, em inglês e no singular (ex.: 'cow', 'egg', 'box', 'person'). Usado pela verificação CLIP.
detect_fps
number
3.0

Min: 0.5

Max: 10.0

[Vídeo] Quantas vezes por segundo rodar a detecção. Mais alto = caixas acompanham melhor o movimento, porém mais lento.
max_detect_frames
integer
24

Min: 1.0

Max: 120.0

[Vídeo] Teto de frames detectados (distribuídos por todo o vídeo) p/ limitar o tempo de processamento.
tracker
None
none
[Vídeo] 'none' = só caixas por frame, SEM ID (estilo NVIDIA, sem renumeração). 'sort' = IDs por movimento (Kalman+Hungarian). 'reid' = SORT + aparência (ResNet18): IDs robustos em oclusão, mais lento.
max_new_tokens
integer
2048

Min: 64.0

Max: 8192.0

None
temperature
number
0.2

Max: 2.0

None
top_p
number
0.9

Max: 1.0

None
repetition_penalty
number
1.1

Min: 1.0

Max: 2.0

None

Output schema

The shape of the response you’ll get when you run this model with an API.

Schema
{'properties': {'detections': {'title': 'Detections', 'type': 'string'},
                'image': {'format': 'uri', 'title': 'Image', 'type': 'string'},
                'num_detections': {'title': 'Num Detections',
                                   'type': 'integer'},
                'video': {'format': 'uri', 'title': 'Video', 'type': 'string'}},
 'required': ['detections', 'num_detections'],
 'title': 'Output',
 'type': 'object'}