Artigos
Notas de campo, séries e ensaios. Tudo escrito primeiro para mim - depois para você.
Sete frameworks para governar sistemas de LLM: o mapa antes do território
Antes de implementar controles, é preciso entender o terreno. Um panorama prático de NIST AI RMF, ISO/IEC 42001, OWASP LLM Top 10 e os outros frameworks que definem o que significa, hoje, governar IA generativa em produção.
QueryBuilder: como transformar um objeto Pydantic numa query FT.SEARCH segura
Construir queries FT.SEARCH manualmente é onde você descobre que o RediSearch interpreta '&' como AND silenciosamente, sem erro nem exception.
dspy.Refine: autocorreção em runtime sem recompilar o modelo
O DSPy fora do modo offline: gera, avalia contra função de recompensa, e se não passar, tenta de novo - antes do critique_node entrar.
Observabilidade num grafo LangGraph: o que o Langfuse vê que o log não vê
Logs cobrem o que aconteceu dentro de cada nó. Não respondem a 'a taxa de fallback subiu nos últimos 30 minutos?'. Para isso, o Langfuse.
Três routers, três problemas diferentes: DSPy, Semantic Router customizado e Aurélio AI
Antes de construir o customizado avaliei uma biblioteca open-source que quase entrou no projeto. Esse post é o comparativo que eu queria ter lido antes de tomar essas decisões.
DSPy na prática: o que muda quando o roteador já é LLM, mas ainda não é compilável
O problema que o DSPy resolve não é a ausência de IA no roteamento. É a ausência de contrato no output dessa IA.
Guardrails regulatórios em assistentes de investimentos: CVM, ANBIMA e o paradoxo da LGPD
Entre o LLM gerar a resposta e ela chegar ao cliente é onde a infração regulatória pode acontecer sem intenção, sem malícia, e sem possibilidade de reverter.
Memória em agentes: episódica, semântica e procedural
Confundir os três tipos de memória é onde projetos bancários com LLM erram estruturalmente. A psicologia cognitiva já tinha a taxonomia certa; faltava traduzir para infraestrutura.
DSPy, o framework que trata prompts como código compilável, não como strings
Em vez de escrever prompts, você programa módulos declarativos e deixa o framework compilar prompts otimizados - com base em dados, métricas e o modelo que você está usando.
Fat vs Slim vs Híbrido no Redis Stack: o modelo que mudou minha forma de pensar em retrieval para LLM
Quando o volume cresce e o LLM começa a se perder no contexto, a decisão de modelagem é tão importante quanto a escolha do banco. Fat, Slim ou Híbrido - qual ficou no final?
Você já usou Redis além de cache simples?
Cache miss virou consulta lenta na API, p95 subiu, custo de LLM subiu. Foi onde descobri o Redis Stack como camada de retrieval e análise determinística pra aplicações com LLM.
