Articles tagged “ab-testing”
2 articles

Testing & Evaluation·12 min read
Every Conversation Is an Experiment You Didn't Run
Your agent already ran the A/B test you're scoping. Here's how to read the results in your logs with propensity matching, synthetic control, and diff-in-diff.
Read More

Testing & Evaluation·19 min read
Tu agente de IA, esta realmente listo para produccion? Las 3 pruebas que la mayoria de los equipos se saltan
La mayoria de las fallas en agentes de IA no ocurren porque el agente sea malo, sino porque nunca fue probado correctamente. Aqui esta el framework de pruebas (unit, A/B y en vivo) que detecta lo que las demos no muestran.
Read More
The Signal Briefing
Un email por semana. Cómo los equipos líderes de CS, ingresos e IA están convirtiendo conversaciones en decisiones. Benchmarks, playbooks y lo que funciona en producción.