Artigos

Notas de campo, séries e ensaios. Tudo escrito primeiro para mim - depois para você.

Todos Frameworks de Governança de IA Governança de IA, na prática Construindo um assistente conversacional em produção

Frameworks de Governança de IA · Parte 2Segurança de IAAgentes LLM

O que pode dar errado num agente LLM: OWASP, MITRE ATLAS e o que os frameworks não cobrem

Lendo a arquitetura de um agente conversacional pelos olhos de quem ataca: onde OWASP e MITRE ATLAS encostam direto no código, e onde a defesa precisa ser inventada pelo time.

9 MAI 2026 · 6 min de leitura

Governança de IA, na prática · Parte 1

Sete frameworks para governar sistemas de LLM: o mapa antes do território

Antes de implementar controles, é preciso entender o terreno. Um panorama prático de NIST AI RMF, ISO/IEC 42001, OWASP LLM Top 10 e os outros frameworks que definem o que significa, hoje, governar IA generativa em produção.

22 ABR 2026 · 14 min de leitura

Construindo um assistente conversacional em produção · Parte 10FT.SEARCH

QueryBuilder: como transformar um objeto Pydantic numa query FT.SEARCH segura

Construir queries FT.SEARCH manualmente é onde você descobre que o RediSearch interpreta '&' como AND silenciosamente, sem erro nem exception.

20 ABR 2026 · 4 min de leitura

Construindo um assistente conversacional em produção · Parte 9DSPy

dspy.Refine: autocorreção em runtime sem recompilar o modelo

O DSPy fora do modo offline: gera, avalia contra função de recompensa, e se não passar, tenta de novo - antes do critique_node entrar.

13 ABR 2026 · 4 min de leitura

Construindo um assistente conversacional em produção · Parte 8Observability

Observabilidade num grafo LangGraph: o que o Langfuse vê que o log não vê

Logs cobrem o que aconteceu dentro de cada nó. Não respondem a 'a taxa de fallback subiu nos últimos 30 minutos?'. Para isso, o Langfuse.

8 ABR 2026 · 4 min de leitura

Construindo um assistente conversacional em produção · Parte 7LLM Routing

Três routers, três problemas diferentes: DSPy, Semantic Router customizado e Aurélio AI

Antes de construir o customizado avaliei uma biblioteca open-source que quase entrou no projeto. Esse post é o comparativo que eu queria ter lido antes de tomar essas decisões.

1 ABR 2026 · 10 min de leitura

Construindo um assistente conversacional em produção · Parte 6DSPy

DSPy na prática: o que muda quando o roteador já é LLM, mas ainda não é compilável

O problema que o DSPy resolve não é a ausência de IA no roteamento. É a ausência de contrato no output dessa IA.

26 MAR 2026 · 7 min de leitura

Construindo um assistente conversacional em produção · Parte 5Compliance

Guardrails regulatórios em assistentes de investimentos: CVM, ANBIMA e o paradoxo da LGPD

Entre o LLM gerar a resposta e ela chegar ao cliente é onde a infração regulatória pode acontecer sem intenção, sem malícia, e sem possibilidade de reverter.

21 MAR 2026 · 5 min de leitura

Construindo um assistente conversacional em produção · Parte 4Memória

Memória em agentes: episódica, semântica e procedural

Confundir os três tipos de memória é onde projetos bancários com LLM erram estruturalmente. A psicologia cognitiva já tinha a taxonomia certa; faltava traduzir para infraestrutura.

16 MAR 2026 · 6 min de leitura

Construindo um assistente conversacional em produção · Parte 3DSPy

DSPy, o framework que trata prompts como código compilável, não como strings

Em vez de escrever prompts, você programa módulos declarativos e deixa o framework compilar prompts otimizados - com base em dados, métricas e o modelo que você está usando.

14 MAR 2026 · 6 min de leitura

Construindo um assistente conversacional em produção · Parte 2Redis Stack

Fat vs Slim vs Híbrido no Redis Stack: o modelo que mudou minha forma de pensar em retrieval para LLM

Quando o volume cresce e o LLM começa a se perder no contexto, a decisão de modelagem é tão importante quanto a escolha do banco. Fat, Slim ou Híbrido - qual ficou no final?

11 MAR 2026 · 4 min de leitura

Construindo um assistente conversacional em produção · Parte 1Redis

Você já usou Redis além de cache simples?

Cache miss virou consulta lenta na API, p95 subiu, custo de LLM subiu. Foi onde descobri o Redis Stack como camada de retrieval e análise determinística pra aplicações com LLM.

4 MAR 2026 · 3 min de leitura