Varios agentes de Cursor con tecnología OpenAI crearon e iniciaron el navegador en una semana sin asistencia humana. He aquí por qué es importante | Suerte

Fecha:

Compartir publicación:

Si un equipo de ingenieros creara un navegador web que sólo funcionara a medias, la gente no hablaría. Pero cuando Michael Truell, director ejecutivo de la startup de software Cursor, publicó en X la semana pasada que un grupo de agentes de inteligencia artificial había creado un navegador que, según él, “en cierto modo funciona” (funciona continuamente durante una semana sin ninguna intervención humana), se volvió viral en todo el mundo de la tecnología, acumulando más de seis millones de visitas.

¿Por qué tanto ruido? Dos razones importantes: primero, la capacidad de atención de la IA ha sido históricamente corta. En los primeros días de ChatGPT, los modelos solo podían dedicar unos segundos a una tarea. Este horizonte se extendió a minutos para los mejores modelos, y luego a horas. El Proyecto Cursor afirma que esta es una de las primeras veces que un sistema de inteligencia artificial respalda un proyecto complejo de software de código abierto durante una semana entera sin guía humana.

Además, los agentes de IA individuales están limitados a tareas pequeñas y enfocadas. Pero conseguir que cientos de agentes coordinen el trabajo en un gran proyecto todavía parece una tarea futurista. Es por eso que Cursor quería ver hasta dónde podían impulsar la codificación fuera de línea (en un proyecto que podría llevar meses para un equipo humano) al tener una “orquesta” de agentes de IA trabajando en equipo. ¿Puede un sistema de IA ser lo suficientemente resistente y funcionar lo suficientemente bien en conjunto como para examinar el código, dividir el trabajo, depurarse y seguir avanzando durante días sin distraerse de la tarea en cuestión?

La “orquesta” del agente de IA

Los investigadores han descubierto que la respuesta es en gran medida positiva. El experimento Cursor unió a cientos de agentes en algo así como un equipo de desarrollo de software. Tenía “planificadores”, “trabajadores” y “jueces” que coordinaban el trabajo de millones de líneas de código. Esto insinúa lo que Cursor y OpenAI creen que es un futuro cercano en el que la IA no sólo ayudará a los empleados, sino que se hará cargo de proyectos completos. Esto cambiará fundamentalmente la forma en que se realiza el trabajo complejo, primero en el desarrollo de software y luego en otras profesiones.

Desde hace un par de años se llevan a cabo experimentos enjambres con inteligencia artificial. Pero hoy, dice Cursor, los modelos son más inteligentes y pueden permanecer consistentes por mucho más tiempo. Los modelos se pueden ejecutar a una escala mucho mayor utilizando una capa especial que gestiona cientos de agentes y evita que caigan en el caos.

Jonas Nelle, un ingeniero de Cursor que trabaja con agentes de IA de larga duración, dijo a Fortune que a medida que los modelos de IA mejoran, los ingenieros e investigadores deben revisar sus suposiciones sobre lo que los modelos de IA pueden hacer cada pocos meses. Si bien admitió que “no lo descargaría ni desinstalaría Chrome hoy”, el proyecto del navegador era “definitivamente mejor que cualquier cosa que los modelos anteriores pudieran hacer”.

“Estos agentes de larga duración son un hito importante”, añadió Bill Chen, un ingeniero de OpenAI que realiza pruebas de estrés y evalúa el comportamiento en el mundo real de los modelos de la empresa. La duración de una tarea y el hecho de que un sistema de IA pueda realizar una tarea de forma autónoma y coordinada es “un muy buen indicador de cuán inteligente y versátil es el sistema”, dijo. El proyecto Cursor, basado en OpenAI GPT-5.2, es “un resultado directo de que superemos constantemente los límites de lo que el modelo puede hacer”. En el futuro, afirmó, las pruebas serán aún más largas.

Los enjambres de IA no están preparados para su uso empresarial

Sin embargo, estos no son sistemas listos para producción. Además de tener errores y estar incompleto, un proyecto que involucra a varios agentes trabajando durante un período de días o semanas es costoso. Aunque los precios han caído drásticamente durante el año pasado, trabajar con cientos de agentes de IA durante un largo período de tiempo aún puede aumentar los costos.

También existen preocupaciones de seguridad. Un sistema autónomo genera preocupaciones sobre vulnerabilidades, fugas de datos y más, y requiere muchas capas nuevas de control y auditoría.

Pero Chen dijo que imagina un futuro cercano en el que algo similar podría estar listo “para un consumo generalizado y a bajo costo. Hasta ahora el progreso ha sido continuo”, explicó, con importantes descubrimientos en cada paso del camino. Por ahora, dijo, el entusiasmo proviene del hecho de que este es un ejemplo real y práctico de las capacidades del modelo, “en comparación con cómo se desempeña el modelo según evaluaciones y criterios académicos y públicos”.

El cambio sorprendió incluso a los observadores más veteranos de la inteligencia artificial. En una publicación reciente, el investigador independiente Simon Willison predijo que para 2029 alguien creará un navegador web completo impulsado principalmente por IA, y eso ni siquiera es sorprendente. “Lanzar un nuevo navegador web es uno de los proyectos de software más complejos que puedo imaginar”, escribió. Es posible que el cursor haya acelerado esta línea de tiempo. “Probablemente llego tres años tarde”, dijo Willison. “Tengo que admitir que estoy bastante sorprendido de ver que algo tan capaz surja tan rápido”.

Esto habla de lo que OpenAI y otros llaman “sobrecapacidad”: la idea de que los modelos de IA más sofisticados pueden hacer mucho más que los de uso público, pero la combinación correcta de herramientas, diseño de productos y reducción de costos puede de repente hacerlos utilizables a escala. Entonces, si bien herramientas como el navegador Cursor aún no están listas para el horario de máxima audiencia, la trayectoria es clara.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

spot_img

Artículos relacionados

La Corte Suprema limita los aranceles de Trump, pero los directores financieros aún enfrentan una situación comercial volátil | Suerte

Buen día. La decisión de la Corte Suprema sobre los poderes arancelarios del presidente Trump no solo cambió...

Las acciones de la aviación asiática caen mientras el conflicto con Irán obliga a las aerolíneas a cancelar vuelos en el espacio aéreo de...

Las acciones de las aerolíneas asiáticas cayeron el lunes, como parte de una reacción más amplia del mercado...

Al menos 22 personas murieron y más de 120 resultaron heridas en Pakistán después de que partidarios iraníes intentaran asaltar el consulado de Estados...

Los violentos enfrentamientos entre manifestantes y fuerzas de seguridad en la ciudad portuaria de Karachi, en el sur...