
Cursor amplía el alcance de la IA en el desarrollo con agentes cloud autónomos
La startup de inteligencia artificial Cursor, valorada en 29.300 millones de dólares, ha dado un paso más en la integración de agentes basados en IA dentro del desarrollo de software. El 24 de febrero anunció el lanzamiento de sus Cloud Agents, dotados de “uso de ordenador”: agentes autónomos que operan en máquinas virtuales aisladas y con completos entornos de desarrollo. Gracias a esta innovación, un 35% de las pull requests internas fusionadas en producción son generadas actualmente por estos agentes, que validan y testean sus propios cambios antes de entregar código listo para despliegue.
La evolución de los agentes de IA: más allá de generar código
Tradicionalmente, los agentes de IA para desarrollo dependían de recursos locales, compitiendo por la capacidad de hardware con los propios desarrolladores y dificultando la ejecución paralela a gran escala. Los nuevos cloud agents de Cursor eliminan esta limitación al ejecutar cada agente en su propia sandbox en la nube, permitiendo escalar decenas de procesos simultáneos.
Sin embargo, el avance realmente significativo reside en la capacidad de estos agentes para interactuar de forma autónoma con la interfaz de usuario: abren navegadores, navegan por aplicaciones web, pulsan botones y validan visualmente el funcionamiento del código. Cuando encuentran un error, lo corrigen, vuelven a testear y dejan evidencia en vídeo, capturas de pantalla y logs, todo como parte de la pull request.
Según Alexi Robbins, co-líder de ingeniería en Cursor, esto permite multiplicar la productividad: “en vez de estar limitado a uno o dos procesos, ahora puedes tener 10 o 20 agentes actuando en paralelo”. Este flujo redefine la revisión de código, ya que se sustituye la inspección manual del diff por el visionado de una demo en vídeo del cambio implementado.
Casos de uso internos de Cursor: de la funcionalidad al control de calidad
En el último mes, Cursor ha estado utilizando internamente estos agentes en diferentes escenarios:
- Desarrollo de nuevas funciones: por ejemplo, un agente añadió enlaces al código fuente en el marketplace de Cursor, comprobando de forma autónoma que cada enlace dirigido a GitHub funcionaba, resolviendo conflictos y fusionando todo en un único commit.
- Seguridad: desde Slack, un agente fue activado para analizar una vulnerabilidad de exfiltración vía portapapeles. Construyó un exploit, ejecutó un servidor backend, probó el ataque en un navegador y resumió el reporte de riesgos directamente en Slack.
- Testing de interfaz de usuario: agentes han validado la web de documentación (cursor.com/docs), navegando durante 45 minutos por componentes clave y elaborando un resumen detallado de la verificación.
Para Mitch Ashley, VP de The Futurum Group, la clave está en el cambio de rol: “ya no se trata sólo de escribir código, sino de orquestar el trabajo de los agentes, supervisar y gobernar su output”. Ashley remarca que ahora los equipos DevOps deben tratar a los agentes como actores de primera clase dentro del ciclo de entrega y que la capacidad de escalar el desarrollo orquestando agentes marcará las diferencias competitivas.
Contexto competitivo: ¿qué diferencia a Cursor de otras plataformas?
El mercado de agentes de IA para programación es cada vez más concurrido, con actores como:
- Claude Code (Anthropic), con un run rate anual de 2.500 millones de dólares.
- OpenAI Codex, con más de 1,5 millones de usuarios activos semanales.
- GitHub Copilot, que ya supera los 26 millones de usuarios.
La diferencia fundamental, según Cursor, está en el circuito de auto-verificación de sus agentes: a diferencia de otras herramientas, los cloud agents pueden observar y validar la aplicación en funcionamiento desde la propia interfaz gráfica, detectando regresiones visuales y bugs de UI fuera del alcance de tests automatizados tradicionales.
Los datos internos de Cursor lo respaldan: los agentes cloud en sandbox fallan un 40% menos que aquellos que operan sin aislamiento y sin capacidad de verificación real previa a la entrega del código.
Implicaciones para los equipos DevOps
La introducción de estos agentes autónomos tiene tres impactos clave:
- Revisión de código como cuello de botella: poder lanzar 10 o 20 agentes a la vez dispara el volumen de PRs en revisión. Los vídeos resumen agilizan el proceso, pero los equipos deberán repensar sus flujos de validación.
- CI/CD y calidad: aunque los agentes entregan código validado en sus sandboxes, los pipelines de la empresa deberán seguir ejecutando sus propias suites y enforcing de estándares. Los equipos con buenas prácticas CI/CD sacarán ventaja rápidamente.
- El rol del desarrollador: la tendencia se orienta al concepto de «self-driving codebases«, donde los desarrolladores pasan de escribir código a dirigir y supervisar la producción autónoma de los agentes, así como su despliegue y monitorización.
Actualmente, los cloud agents están disponibles también en las interfaces web, escritorio y móvil de Cursor, e integrados en plataformas como Slack y GitHub. La hoja de ruta de la compañía apunta a coordinar múltiples agentes y a construir modelos de IA que aprendan de ejecuciones anteriores.
La transición desde el “agente que ayuda a crear diffs” hacia el “agente que entrega funcionalidades de extremo a extremo, probadas y listas para producción”, es ya una realidad cuantificable: el 35% de las PRs internas de Cursor se fusionan hoy gracias a agentes IA autónomos. Un indicio de que el futuro del desarrollo de software puede depender más de la orquestación inteligente que de la programación manual lineal.
Para más detalles sobre la tecnología de Cursor Cloud Agents y su funcionamiento en entornos reales, se puede consultar la noticia original en DevOps.com.

