Los próximos doce meses en el stack agéntico: catorce predicciones falsables para junio 2026 a junio 2027
Los posts de forecast usualmente fallan de una de dos formas. O se cubren tanto que nada de lo que predicen puede estar mal, o hacen predicciones audaces sin fechas que permitan a alguien chequear. Este post intenta no fallar de ninguna manera. Catorce predicciones para el stack agéntico entre junio de 2026 y junio de 2027, cada una lo suficientemente específica para ser falsable, fechada a un trimestre o mes, etiquetada con un nivel de confianza (alta, media, baja), y acompañada por la evidencia observable que probaría que estamos equivocados. La meta es equivocarse en un número específico de ellas y acertar el resto, de formas que puedan medirse. Vamos a publicar una retrospectiva en junio de 2027 puntuando este post contra la realidad.
Cómo leer este post
Cada predicción tiene cuatro partes. Fecha nos compromete a una ventana en la que el evento debe ocurrir para que la predicción cuente como correcta. Claim declara la predicción de forma lo suficientemente concreta como para que ningún lector razonable pueda discrepar sobre si se cumplió. Confianza es nuestra propia estimación de qué tan probable es la predicción — alta (apostaríamos al 70%+), media (50-70%), baja (bajo 50% pero vale la pena declararla porque el upside o downside es grande). Evidencia disconfirmatoria describe la observación que nos diría que estamos equivocados, para que la retrospectiva dentro de doce meses sea estructurada en lugar de narrativa.
Capa de protocolo
1. MCP 2026-07-28 GA, con seis semanas de shakeout por breaking changes
Fecha: spec final el 28 de julio de 2026; incidentes de breaking-change pico desde agosto hasta mediados de septiembre.
Claim: La spec MCP 2026-07-28 lanza a tiempo como prometió el release candidate cerrado el 21 de mayo de 2026. El núcleo de protocolo stateless (cubierto en nuestro deep-dive de MCP) rompe al menos el 15% de los servers MCP de producción que estaban corriendo la spec 2025-11-25 sin actualizar. Los inventarios de servers funcionando bajan visiblemente a lo largo de agosto antes de estabilizarse para fines de septiembre.
Confianza: Alta sobre la fecha (el working group fue disciplinado); media sobre la tasa de breakage (podría ser menor si el tooling de migración aterriza primero).
Evidencia disconfirmatoria: la spec se corre a Q4 2026, o la tasa de breakage es menor al 5% (los servers manejaron la migración limpiamente). Cualquiera invalida la predicción.
2. AP2 v1.0 final en la FIDO Alliance para fin de Q4 2026
Fecha: Entre el 1 de octubre y el 31 de diciembre de 2026.
Claim: El Agent Payments Protocol (nuestro post de AP2) alcanza v1.0 final bajo gobernanza FIDO, con al menos una extensión oficial nueva cubriendo registries de revocación (cerrando uno de los cuatro gaps de madurez que marcamos).
Confianza: Media-alta. La trayectoria del release v0.2 en abril de 2026 y el compromiso de gobernanza FIDO hacen v1.0 en la ventana plausible.
Evidencia disconfirmatoria: v1.0 se corre a 2027, o lanza sin primitivas de revocación (en cuyo caso los operadores siguen necesitando workarounds para uno de los gaps core).
3. A2A v1.1 lanza una primitiva estructurada de negociación
Fecha: Q3 o Q4 2026.
Claim: A2A v1.1 (o release de punto equivalente) agrega un tipo de Part estructurado de negociación con semántica de oferta/contraoferta/settle/rechazar. El post de la asimetría de Project Deal hizo el gap lo suficientemente concreto como para que el working group lo haya reconocido; esperamos que un draft lance dentro de dos trimestres.
Confianza: Media. El working group reconoció el gap pero no comprometió scope.
Evidencia disconfirmatoria: El roadmap de releases 2026 lanza sin primitivas de negociación.
4. El volumen de attestations ERC-8004 cruza 1M por mes en Base
Fecha: Para fin de Q1 2027.
Claim: El volumen de escritura de la Validation Registry solo en Base pasa un millón de attestations por mes. Esto es aproximadamente 30x la tasa de junio de 2026 y requiere que la adopción del marketplace componga a la tasa que vemos dentro de los clientes de Agent Builder generalizada a través del ecosistema.
Confianza: Media. La trayectoria de crecimiento lo soporta pero el volumen on-chain es sensible a eventos de gas-price fuera del control del estándar.
Evidencia disconfirmatoria: El volumen en Base se plancha por debajo de 200K attestations por mes, sugiriendo que la adopción está concentrada en uno o dos clientes grandes en lugar de ampliamente distribuida.
Regulación
5. Primeras acciones administrativas del EU AI Act en septiembre de 2026
Fecha: Dentro de las seis semanas del deadline de enforcement del 2 de agosto de 2026 (cubierto en nuestro post del AI Act).
Claim: Al menos tres autoridades de estados miembro UE emiten acciones administrativas formales contra operadores de sistemas IA high-risk para el 15 de septiembre de 2026. La primera ola va a ser educativa en lugar de punitiva — pedidos de investigación, demandas de technical-file, advertencias públicas — pero van a nombrar operadores específicos, lo que las vuelve eventos concretos.
Confianza: Alta. La presión política sobre las autoridades para ser visibles después del deadline es sustancial.
Evidencia disconfirmatoria: Sin acciones administrativas públicas para mediados de septiembre.
6. Primer colapso mediático de operador por falla de compliance para noviembre de 2026
Fecha: Entre el 1 de agosto y el 30 de noviembre de 2026.
Claim: Al menos un operador de agentes de tamaño medio (Series A-B fondeado, 50+ empleados) falla públicamente — cierra operaciones, despide staff significativo, o pivota dramáticamente — citando non-compliance del AI Act, una multa relacionada, o fallout relacionado de asegurador/cliente. La historia va a estar en la portada de al menos dos publicaciones tech principales.
Confianza: Media. La forma económica del deadline casi garantiza una o dos fallas pero el timing de cuándo la falla se vuelve "mediática" varía.
Evidencia disconfirmatoria: Sin falla pública de operador de tamaño medio atribuible a compliance para fin de noviembre.
7. Primer regulador estatal de US sigue el template UE para Q1 2027
Fecha: Antes del 31 de marzo de 2027.
Claim: O California (el más probable), Nueva York, o Colorado publica draft de regulaciones modeladas en la estructura de tiers de riesgo del EU AI Act, aplicando a agentes IA específicamente. El nivel federal sigue paralizado; los estados se mueven primero, como hicieron con privacidad.
Confianza: Media. La coalición política está ahí pero los ciclos regulatorios estatales son lentos.
Evidencia disconfirmatoria: Los tres estados se limitan a guía no-vinculante en lugar de draft de regulación.
Seguridad y ataques
8. Primer ataque long-con documentado contra una flota de agentes para Q1 2027
Fecha: Antes del 31 de marzo de 2027.
Claim: Un reporte público de incidente — de un vendor, un investigador de seguridad, o un operador víctima — documenta el patrón de social-engineering de largo plazo que describimos en el post de threat model: una contraparte adversarial construyendo confianza con un agente objetivo a través de semanas o meses, después disparando una sola request de alto valor dentro del envelope de confianza acumulado. El incidente va a involucrar al menos $100K en outflow fraudulento.
Confianza: Alta. La superficie de ataque es real, la economía underground está productificando la técnica, y la detección es difícil. Esperamos que esto pase antes de que el entrenamiento formal lo alcance.
Evidencia disconfirmatoria: Sin incidente long-con público para Q1 2027 — o porque los ataques están pasando pero nadie está publicando (posible pero improbable pasado Q1) o porque las defensas están funcionando mejor de lo que predijimos.
9. El primer compromiso cross-flota vía un server MCP envenenado
Fecha: Q3 o Q4 2026.
Claim: Un server MCP ampliamente usado (uno con 1.000+ deployments en producción) es comprometido vía el patrón de rug-pull que documentamos (originalmente benigno, update malicioso colado meses después). El incidente afecta al menos 100 flotas distintas de operadores y fuerza una respuesta coordinada pública. CVE asignado, security advisories de vendors, todo.
Confianza: Alta. La superficie de ataque de supply-chain es la parte menos defendida del stack ahora mismo.
Evidencia disconfirmatoria: Sin incidente grado-CVE en el ecosistema de servers MCP en la ventana.
10. Plataforma SaaS de agentes ofensivos llega a infamia pública para mediados de 2027
Fecha: Entre enero y junio de 2027.
Claim: Al menos una plataforma de fraud-as-a-service de agentes ofensivos — corriendo en infraestructura cloud legítima bajo un nombre fronting — es nombrada en una investigación periodística importante o indictment del DOJ. La plataforma va a haber procesado al menos $50M en transacciones fraudulentas antes del takedown.
Confianza: Media. La economía soporta su existencia pero el timing de visibilidad es impredecible.
Evidencia disconfirmatoria: Sin operación de escala-plataforma de agentes ofensivos nombrada públicamente en la ventana.
Estructura de mercado
11. Consolidación de frameworks: uno de los cinco open-source se deprecia o es adquirido
Fecha: Antes del 31 de diciembre de 2026.
Claim: Pydantic AI, Letta, CrewAI, AutoGen, o LangGraph — uno de ellos o deprecia su rama pública mantenida, es adquirido por una empresa más grande de una forma que absorba al equipo lejos del framework, o visiblemente se estanca (sin release significativo por dos trimestres consecutivos). Tenemos un candidato específico (Pydantic AI es el más expuesto) pero el claim solo requiere uno de los cinco.
Confianza: Media-alta. Cinco frameworks open-source maduros haciendo trabajo similar no es estable; la consolidación es el outcome esperado.
Evidencia disconfirmatoria: Los cinco siguen activamente mantenidos con releases significativos a lo largo de 2026.
12. La bifurcación de marketplaces se vuelve explícita para Q1 2027
Fecha: Para fin de Q1 2027.
Claim: La categoría de marketplace de agentes cara al consumidor (forma Agent.ai) y la categoría de economía-de-agentes B2B (cohort ERC-8004 nativo) se desarrollan lo suficientemente por separado como para que ningún comprador único esté comprando en ambos, y la prensa empieza a tratarlos como categorías distintas con nombres distintos. La bifurcación va a ser visible en fundraising — los marketplaces consumer van a levantar de inversores consumer-tech, los B2B de inversores crypto / B2B SaaS.
Confianza: Media. El patrón ya está empezando pero la bifurcación explícita requiere que la prensa siga el ritmo.
Evidencia disconfirmatoria: Emerge un marketplace dominante único que sirve a ambos tipos de comprador exitosamente.
13. Primer IPO de una empresa agent-native antes de junio de 2027
Fecha: Antes del 30 de junio de 2027.
Claim: Al menos una empresa cuyo producto primario es agent-native (no una empresa "le agregamos IA a nuestro producto existente") presenta para IPO en un exchange importante. Los candidatos más probables están en el segmento customer-success / sales-automation donde el agente es el producto end-to-end. El IPO no necesita pricing; el filing del S-1 es el evento.
Confianza: Baja-media. La ventana es ajustada; el camino requiere que la empresa agent-native haya golpeado el bar financiero de empresa pública más que el mercado IPO esté abierto en el momento correcto.
Evidencia disconfirmatoria: Sin S-1 agent-native presentado para el deadline.
Dinámica de operadores
14. Segunda ola de despidos por IA empuja 50% más trabajadores del conocimiento a caminos de operador
Fecha: Acumulativo hasta junio de 2027.
Claim: La ola de despidos de 2026 cubierta en nuestro editorial (113K trabajadores tech en cinco meses al momento de escribir) se vuelve un total de 12 meses de 400K+ trabajadores del conocimiento desplazados y al menos 30K de ellos pivotan a correr sus propias flotas de agentes (vs. buscar roles salariados). Esto es "operador de agentes" como categoría laboral volviéndose estadísticamente visible — las encuestas de empleo gubernamentales empiezan a trackearla.
Confianza: Media. La ola de desplazamiento es alta-confianza; la tasa de pivote a caminos de operador es más incierta porque los caminos de carrera alternativos siguen existiendo.
Evidencia disconfirmatoria: El total de despidos cae bajo 250K, o los pivotes a camino de operador se mantienen bajo 5K (es decir, los caminos de operador fallan en absorber una porción significativa de los desplazados).
La meta-predicción: en qué nos vamos a equivocar más
Todo autor de forecast que lanza catorce predicciones específicas termina equivocado en tres o cuatro de ellas de formas que son obvias en retrospectiva. El ejercicio honesto es nombrar de antemano las categorías donde esperamos equivocarnos más.
Es más probable que nos equivoquemos en timing que en dirección. Los eventos que predijimos probablemente van a pasar; si pasan para la fecha que comprometimos es la parte volátil. Específicamente, los timelines regulatorios e IPO son los items donde nuestra confianza es más frágil, y donde la retrospectiva es más probable que necesite un footnote.
También es probable que estemos equivocados en al menos una predicción en el sentido de dirección — una categoría donde genuinamente nos perdimos algo viniendo. El miss más probable en nuestro juicio está en la categoría de modelo fundacional: un cambio de capacidad en la capa de modelo que obsoleta una capa del stack agéntico sobre la que escribimos. La memoria estilo Titans es la versión predecible de esto; la versión impredecible es la que no podemos nombrar todavía porque el paper no se publicó.
La categoría en la que estamos más confiados es la sección de seguridad y ataques. La economía de agentes ofensivos es lo suficientemente clara, la supply chain underground es lo suficientemente madura, y la capa defensiva es lo suficientemente inmadura como para que los incidentes pasen. La única pregunta es quién aparece nombrado en el comunicado de prensa.
Por qué publicamos esto
Tres razones para comprometer predicciones por escrito en lugar de mantenerlas privadas.
Primero, accountability. Una plataforma que pasó veinticinco posts diciéndoles a los operadores cómo pensar sobre el stack debería estar dispuesta a equivocarse públicamente sobre cómo evoluciona el stack. La retrospectiva en junio de 2027 va a ser incómoda de formas que las predicciones originales no, que es el punto.
Segundo, calibración. Las predicciones que escribes son predicciones que tienes que puntuar contra la realidad, y el puntaje es lo que mejora tu juicio con el tiempo. La mayoría del "thought leadership" en este espacio evita escribir cualquier cosa que pueda ser verificada, que es lo que les permite a los mismos autores reciclar los mismos claims vagos año tras año.
Tercero, planificación. Los operadores leyendo este post tienen que tomar decisiones de stack hoy que van a verse correctas o incorrectas dentro de doce meses. Nuestras predicciones son el input que les permite stress-testear sus decisiones: si estás apostando contra una predicción que marcamos "alta confianza", eso es información; si estás apostando con una que marcamos "baja", eso también es información.
Cómo se ven los próximos doce meses si las catorce son correctas
Compón las predicciones en una sola trayectoria.
Para el otoño de 2026, el stack de protocolos es maduro-GA en las capas operacionales (MCP, A2A, AP2 cerca) y las primeras acciones de enforcement UE están reformando cómo los operadores de tamaño medio piensan sobre compliance. Un framework se consolidó, un server MCP importante fue comprometido, el operador que escaló responsablemente no es afectado y el operador que salteó la higiene de seguridad está en control de daños. El primer colapso mediático de operador se vuelve el cuento de advertencia que tira al resto del campo a adoptar las disciplinas sobre las que venimos escribiendo.
Para la primavera de 2027, el primer incidente long-con pasó, la economía SaaS de agentes ofensivos tiene cara pública, y al menos uno de los tres frameworks principales se fue o fue absorbido. La bifurcación del marketplace es tratada por la prensa como obvia. Un estado de US siguió a la UE. El primer S-1 agent-native golpeó el wire. La categoría laboral "operador de agentes" aparece en datos del BLS.
Para junio de 2027, los operadores que arrancaron a mediados de 2026 — los que estaban leyendo el editorial sobre despidos cuando se publicó — están corriendo negocios generando ingreso real. Los operadores que esperaron están alcanzando pero componiendo un año atrás. La categoría maduró a algo que la economía más amplia tiene que tomar en serio, y las predicciones de este post que resultaron equivocadas son las que ojalá hubiéramos hecho distinto.
Cierre
Los próximos doce meses van a ser los más consecuentes desde que las APIs de modelos se lanzaron en 2022. El stack de protocolo madura, la regulación llega, los ataques aterrizan, el mercado se consolida, y la categoría laboral de operador se vuelve visible. Algunas de las catorce predicciones de arriba van a estar equivocadas; ese es el costo de poner números en la página. La retrospectiva en junio de 2027 va a ser honesta sobre cuáles, por qué, y qué nos dicen los misses sobre el próximo forecast.
Si eres un operador leyendo esto y tratando de averiguar dónde asignar la atención del próximo trimestre, la guía práctica: no apuestes a las predicciones que marcamos baja-confianza, cubre las de media-confianza, y trata las de alta-confianza como inputs de planificación contra los que puedes construir. Los items del roadmap de protocolo son los más accionables hoy; los items regulatorios y de seguridad van a volverse accionables a medida que se materialicen.
El próximo post de esta serie da un paso atrás del forecasting y entra en un solo manifesto corto: el caso para lanzar, antes de que el lector que viene leyendo este blog por seis meses gaste otros seis meses leyendo. Fuimos culpables de escribir la teoría de forma larga; debemos el empuje de forma corta que completa la imagen. Nos vemos allá.