Dejá de leer. Empezá a publicar.
Hace veintitrés posts largos que empezamos a escribir sobre el stack agéntico. El post de proyecciones de la semana pasada anticipó que este iba a ser un manifiesto corto, y le debemos al campo un manifiesto corto. Si has estado leyendo esta serie esperando la semana correcta para lanzar tu primer agente, la semana correcta es esta. No después del próximo release de un protocolo, no después de un post más sobre oficio de evaluación, no después de que termines el libro en tu mesita de luz. Esta.
La lectura está haciendo menos trabajo del que piensas. Veintitrés posts te van a enseñar a reconocer un MCP server cuando lo veas, a esbozar un threat model en una servilleta, a hablar del EU AI Act en una cena. Nada de eso es lo mismo que haber lanzado un agente que le facturó a un cliente. La brecha entre el operador que leyó los veintitrés posts y el operador que lanzó un agente malo es más grande que la brecha entre el operador que lanzó un agente malo y el operador que lanzó diez agentes buenos. El primer cruce es el difícil. Todo lo demás compone después.
La trampa que te mantiene del lado de la lectura
La trampa es la sensación de que no estás listo. Leíste sobre evaluación pero no construiste una suite. Leíste sobre higiene de scopes en MCP pero no conectaste un OAuth real. Tienes un nicho en mente del post de nichos pero no abriste LinkedIn para confirmar que alguien que conoces trabaja en él. La incomodidad de moverte de leer a construir se siente como una señal de que tienes que seguir leyendo. No lo es. Es la señal de que llegaste al límite de lo que la lectura te puede enseñar.
El costo de oportunidad es real. Cada semana que te quedas del lado de la lectura, otro lector del otro lado está lanzando un primer agente peor que el que tú lanzarías si empezaras hoy, hablando con clientes con los que tú hablarías mejor, y aprendiendo cosas de esas conversaciones que ningún post de este blog te puede enseñar. Esos están componiendo. Tú estás acumulando bookmarks.
Cinco cosas chicas que realmente necesitas antes del lunes
Más chicas de lo que piensas.
Una. Un nicho del que tengas contexto profesional. No un nicho que te resulte interesante. Un nicho en cuyo trabajo pasaste suficiente tiempo como para reconocer cómo se ve un mal output. El post de nichos lista diez; elige uno en los próximos veinte minutos y cierra la pestaña.
Dos. Cinco personas en tu red de primer grado que plausiblemente necesiten que se resuelva esa carga de trabajo. Desconocidos no. "El mercado" no. Cinco nombres a los que podrías mandar un DM mañana sin tener que explicar quién eres. Anótalos en papel, no en una herramienta.
Tres. Una lista corta de comportamientos que el agente nunca debe hacer, escrita antes de que el agente exista. Dos o tres líneas. "Nunca enviar mail en mi nombre. Nunca contestar a nadie un domingo. Nunca referirse a un ex-cliente por nombre." La lista va a crecer durante la primera conversación con el cliente. El punto es que exista desde el día uno.
Cuatro. Un tope de presupuesto. Un número en dólares por día, lo suficientemente bajo como para que un loop que se descontrola no te lastime. Cinco dólares por agente por día alcanzan para el primer mes. Lo subes después, cuando hayas leído tus primeros transcripts y entiendas la forma del costo.
Cinco. Dos horas bloqueadas un lunes a la tarde. Bloque de calendario, teléfono en otra habitación, una sola ventana de navegador. Esa es toda la lista de pre-requisitos.
Tres cosas grandes que no necesitas
La forma de las cosas que no necesitas es lo suficientemente grande como para que generalmente sean la razón real por la que la gente se queda del lado de la lectura. Parecen estructurales. No lo son.
No necesitas un entendimiento completo del stack. Escribimos el post de síntesis del stack precisamente para que no tengas que hacerlo. La plataforma que hospeda tu agente ya habla MCP, A2A, AP2 y ERC-8004. La capa donde tienes que tomar decisiones de protocolo está dos capas debajo de donde operas. Puedes lanzar un agente funcional sin saber cómo el validation registry guarda attestations en Base, y el operador que espera entender eso antes de lanzar es el operador que nunca lanza.
No necesitas una suite de evaluación perfecta. Necesitas una suite de quince casos el día uno. Cinco fáciles, cinco difíciles, cinco adversariales, todos sacados de ejemplos reales de tu dominio. Vas a reescribir la mitad en la primera semana y la mayoría en el segundo mes. Eso está bien. La suite es un objeto vivo y la v1 solo tiene que ser honesta sobre los modos de falla que ya puedes imaginar. La honestidad sobre tu propia ignorancia es la propiedad estructural, no la cobertura.
No necesitas tener resuelto el cumplimiento del EU AI Act antes del primer cliente. El post de compliance explicó el calendario; el primer mes de operación no es el momento para escribir el Technical File. El primer mes es el momento para averiguar si el agente hace algo por lo que un cliente real paga. Compliance lo puedes resolver en un fin de semana cuando hay revenue en juego; la ausencia de cualquier cliente no es un problema de compliance.
El agente que toma una tarde de lunes
La versión de tu primer agente que entra en dos horas se ve así. Un nicho de la lista. Una cuenta en la plataforma. Cuatro MCP servers del catálogo, todos con scopes mínimos. Un system prompt, escrito en inglés llano, con los comportamientos prohibidos listados al final. Quince casos de eval sacados de ejemplos reales de tu dominio. Un tope de presupuesto diario de cinco dólares. Dos alertas activadas por defecto. Botón de deploy apretado. Te vas a dormir el lunes a la noche con un agente que existe, que tiene endpoint, que tiene identidad, y que está esperando la llamada con el prospect que todavía no hiciste.
Eso es lo que el walkthrough del primer agente cubrió en doce mil palabras y lo que este párrafo cubre en siete oraciones. El post largo existe para el operador que quiere ver cada decisión en detalle. Este existe para el operador que ya leyó el largo dos veces y todavía no está lanzando. Usa el empujón que te funcione.
En qué se va a equivocar el primer agente
Se va a equivocar en muchas cosas. Las categorías van a estar mal calibradas. Los drafts van a usar una palabra que el usuario no usa. La lógica de escalamiento se va a disparar con demasiada agresividad. La curva de costo a escala te va a sorprender la primera vez que un cliente conecte un segundo inbox. Todos los operadores que lanzaron descubrieron estas cosas dentro del primer mes, no antes. Los descubrimientos son el trabajo. No se vuelven más baratos por demorarlos.
El instinto de lanzar una primera versión más pulida no es protección. Es el mismo instinto que el instinto de la lectura, vestido de oficio. El agente que lanza en la semana uno con tres modos de falla conocidos no es peor que el agente que lanza en la semana ocho con los mismos tres modos de falla y siete semanas de tiempo perdido. Es estrictamente mejor. El reloj arranca el día que lanzas.
Cierre
Este post es el más corto del blog porque no necesita ser más largo. Veintitrés posts de teoría más un post de ejecución más este alcanzan. Si no estás construyendo esta semana, ningún post número veinticuatro va a cambiar eso. La carpeta de bookmarks no es el cuello de botella. La pestaña del navegador no es el cuello de botella. El cuello de botella es la tarde de lunes que todavía no bloqueaste.
Bloquéala ahora. Las cinco cosas de la lista de arriba toman menos tiempo en juntarse del que tomó leer este post. Todo lo que viene después es del tipo de trabajo que compone, y nos vemos del otro lado.
Bloquea un lunes. Lanza el agente.
El tier gratuito cubre el primer agente. El catálogo tiene los MCP servers. El dashboard tiene el template de eval y las alertas. Lo que falta es el bloque de calendario.
Registrar un agente