Protocolo Agent Smith & Arquitetura de Agentes de Inteligência Artificial
O Protocolo Agent Smith
O Protocolo Agent Smith (ou Smith Protocol) é uma arquitetura de referência de nível Enterprise para o desenvolvimento de Agentes de Inteligência Artificial Autônomos. Diferente de implementações básicas (como tutoriais simples de "Chat com PDF"), o Protocolo Smith foi desenhado para resolver as falhas críticas de sistemas em produção: alucinação, perda de contexto e falta de precisão.
Ele é composto por 5 pilares tecnológicos principais, identificados no código do SmithV2:
1. Busca Híbrida V8 (Hybrid Search)
O sistema não confia apenas na "ideia" do texto (Busca Semântica). Ele combina dois motores matemáticos:
Vetores Densos (OpenAI): Entendem o significado (ex: "dispositivo pifou" = "defeito técnico").
Vetores Esparsos (BM25): Encontram palavras-chave exatas com precisão cirúrgica (ex: "Erro 504", "Contrato #9981").
Fusão RRF: Um algoritmo (Reciprocal Rank Fusion) combina os resultados para entregar a resposta perfeita.

2. Ingestão Agêntica (Agentic Chunking)
Em vez de cortar documentos aleatoriamente a cada 1000 caracteres (o que quebra frases e perde o sentido), o Protocolo usa um Agente de Ingestão.
Uma IA lê o documento e segmenta o texto em tópicos lógicos e independentes, garantindo que cada pedaço de informação faça sentido sozinho antes de ser indexado.

3. Memória Persistente (Infinite Memory)
O agente não tem apenas "memória de peixinho" (RAM).
Utiliza LangGraph conectado a um banco PostgreSQL (Supabase) para salvar o estado completo de cada conversa.
Isso permite que o agente se lembre de contextos, preferências e dados do usuário dias ou semanas depois, mantendo o isolamento total entre empresas (Multi-Tenant).

4. Cascata de Decisão (Smart Retrieval)
O agente não aceita a primeira resposta que encontra. Ele segue um funil de qualidade:
Busca Híbrida: Tenta encontrar a resposta.
Reranking (Cohere): Um "Juiz" reordena os resultados para garantir relevância.
HyDE (Hypothetical Document Embeddings): Se a confiança for baixa (< 80%), a IA "alucina" a resposta ideal para tentar encontrar documentos que usem termos diferentes, mas tenham o mesmo sentido.

5. Auditoria Automatizada (LLM-as-a-Judge)
O sistema possui um módulo de Benchmark que cria provas automaticamente.
Ele gera perguntas baseadas nos seus documentos e testa se a IA consegue respondê-las corretamente, gerando uma nota de precisão (0 a 100%) antes mesmo de você colocar o agente para falar com clientes.

