Busca Semântica Precisa de Gates de Confiança: Evidência de um Benchmark Rotulado no Sanity

O padrão maior por trás de um resultado estranho

Uma observação anterior era que alguns modelos atravessavam filtros de citação/sobreposição lexical quase sem impacto.

No começo parecia algo específico de modelo. Com benchmark rotulado mais amplo, o padrão ficou claro:

Não é um detalhe de um modelo. É problema de sistema.

Com controles negativos, a busca semântica frequentemente retorna contexto plausível mesmo quando a query está fora do escopo do corpus.

Se esses hits são sempre aceitos, a camada de resposta recebe contexto inadequado, aumentando risco de respostas confiantes e mal ancoradas.

Isso explica por que filtros leves baseados em sobreposição lexical parecem inconsistentes:

Para aceitação de retrieval, o gate precisa priorizar suporte semântico, não só similaridade de superfície.

Opções práticas (da mais simples à mais forte):

Na nossa ablação de políticas, uma política mista superou tanto o baseline de aceitação irrestrita quanto políticas rígidas de acordo lexical puro.

A recomendação atual:

Esse padrão preserva ganho de relevância e reduz falso positivo fora de domínio.

Sem gate de confiança, retrieval pode parecer ótimo em queries de demo e falhar com variação real de distribuição.

Com gate + seed com controles negativos, você passa a medir o tradeoff de forma explícita:

Isso é disciplina de produção, não preferência de modelo.