Ilao Dzindin

Docuvera: Documentos com IA que Tomam Decisões, Não Apenas Extraem

A ferramenta que extrai completou um de cinco passos.

  processamento de documento — cinco passos:

  passo 1: extração    ──  que texto há aqui?
  passo 2: contexto    ──  que tipo de documento é esse?
  passo 3: validação   ──  corresponde ao esperado?
  passo 4: sinalização ──  o que falta, o que está errado?
  passo 5: roteamento  ──  o que acontece a seguir?

  ferramentas genéricas de OCR param aqui
  e entregam o resto para você.

O texto está nas suas mãos. O significado ainda não.


Um formulário de admissão médica não é uma reclamação de seguro, mesmo que ambos sejam PDFs com checkboxes e assinaturas.

Uma ordem de compra não é um recibo de entrega, mesmo que ambos tenham valores e datas e carimbos.

Os campos que importam são diferentes. As regras de validação são diferentes. Os requisitos de conformidade são diferentes.

Extração genérica trata tudo igual. O sábio conhece a diferença.


  modelo genérico:          modelo de domínio:
  ─────────────────         ─────────────────
  PDF → texto               PDF → compreendido
        ↓                         ↓
  parede de dados           significado estruturado
        ↓                         ↓
  seu problema              decisão roteada

O trabalho após a extração é onde o custo real vive. O Docuvera move esse trabalho para dentro do modelo.


  números reais:

  ~95% de precisão      ──  extração em 12 verticais
  ~2 segundos por página ── tempo médio sob carga
  ~4,5 horas por semana ──  economizadas por pessoa

O número de precisão importa menos como manchete e mais como piso. A pontuação de confiança captura o que o modelo não sabe que errou. Dados ruins não passam silenciosamente adiante.


A trilha de auditoria não é o recurso. A trilha de auditoria é o pré-requisito.

Em indústrias reguladas, a pergunta não é “isso funcionou?” A pergunta é: você pode provar que funcionou corretamente, para quem, em que momento, com qual versão do modelo?

O log de conformidade não foi adicionado ao Docuvera. Foi construído como fundação.


Inteligência de domínio se acumula.

Cada vertical treinado aprofunda o entendimento dos adjacentes. O fosso não é o pipeline. O fosso são os anos de conhecimento de domínio codificado em doze modelos.

Isso não é uma lista de recursos. É o compromisso com o trabalho paciente de entender.

Ilao Dzindin