Anthropic publica el código fuente de su propia herramienta de codificación de inteligencia artificial en la segunda gran violación de seguridad | Suerte

Anthropic publicó accidentalmente el código fuente de su popular herramienta de codificación Claude Code.

La filtración se produce pocos días después de que Fortune informara que la compañía publicó accidentalmente cerca de 3.000 archivos, incluido un borrador de publicación de blog que detallaba un futuro modelo poderoso que plantea riesgos de ciberseguridad sin precedentes. El modelo se conoce internamente como “Mythos” y “Capybara”, según una publicación de blog filtrada obtenida por Fortune.

La filtración del código fuente reveló aproximadamente 500.000 líneas de código en aproximadamente 1.900 archivos. Cuando se le contactó para hacer comentarios, Anthropic confirmó que la “liberación del Código Claude” había filtrado “algo de código fuente interno”.

Un portavoz dijo: “No hubo datos confidenciales ni credenciales de clientes involucrados ni expuestos. Este es un problema del paquete de lanzamiento causado por un error humano y no una violación de seguridad. Estamos tomando medidas para evitar que esto vuelva a suceder”.

La última filtración de datos podría causar más daño a Anthropic que la publicación accidental anterior de un borrador de la publicación del blog de la compañía sobre su próximo modelo. Si bien la última falla de seguridad no reveló el peso del modelo de Claude en sí, sí permitió que personas con conocimientos técnicos extrajeran información interna adicional del código base de la compañía, según un especialista en ciberseguridad al que Fortune pidió que investigara la filtración.

Claude Code es quizás el producto más popular de Anthropic y su popularidad está creciendo rápidamente en las grandes empresas. Al menos algunas de las capacidades de Claude Code no provienen del gran modelo de lenguaje subyacente en el que se ejecuta el producto, sino de un “sistema” de software que rodea el modelo de IA subyacente y le indica cómo utilizar otras herramientas de software, además de proporcionar importantes barreras de seguridad e instrucciones que gobiernan su comportamiento. Este es el código fuente de este agente, que ahora se ha filtrado en línea.

La filtración potencialmente permite a un competidor realizar ingeniería inversa sobre cómo funciona el sistema de agentes de Claude Code y utilizar ese conocimiento para mejorar sus propios productos. Algunos desarrolladores también pueden intentar crear versiones de código abierto de los agentes de Claude Code basadas en el código filtrado.

El código filtrado también proporcionó más evidencia de que Anthropic tiene un nuevo modelo, llamado internamente Capybara, que la compañía se está preparando activamente para lanzar, según Roy Paz, investigador senior de seguridad de IA en LayerX Security. Paz dijo que es probable que la compañía lance versiones “rápidas” y “lentas” del nuevo modelo, basándose en la ventana de contexto aparentemente más grande del modelo, y que será el modelo más avanzado del mercado.

Anthropic vende actualmente cada uno de sus modelos en tres tamaños diferentes. Las versiones más grandes y potentes de los modelos tienen la marca Opus; versiones de la marca Sonnet ligeramente más rápidas y económicas pero menos potentes; y el más pequeño, barato y rápido se llama Haiku. En un borrador de blog obtenido por Fortune la semana pasada, Anthropic describe el Capybara como un modelo de siguiente nivel que es incluso más grande y más poderoso que el Opus, pero también más caro.

La última filtración, revelada por primera vez en Post X, parece haber ocurrido después de que Anthropic cargara todo el código fuente de Claude Code en NPM, una plataforma que los desarrolladores de plataformas utilizan para compartir y actualizar software, no solo la versión final en la que realmente se ejecutan las computadoras. Según Paz, el error parece ser un “error humano” después de que alguien usó el acceso directo para eludir las garantías de liberación normales. Anthropic dijo a Fortune que no se eludieron las protecciones normales.

“Por lo general, las grandes empresas tienen procesos estrictos y múltiples controles antes de que el código entre en producción, como una bóveda que requiere varias claves para abrirse”, dijo a Fortune. “En Anthropic, parece que este proceso no se configuró y una sola configuración incorrecta o un clic incorrecto expuso de repente el código fuente completo”.

Paz también planteó preguntas sobre cómo la herramienta podría conectarse potencialmente a los sistemas internos de Anthropic. Dijo que la mayor preocupación puede no ser el acceso directo a los modelos backend, sino que el código filtrado podría revelar detalles de propiedad sobre cómo funcionan los sistemas, como las API y los procesos internos. Añadió que este tipo de información podría ayudar a los participantes avanzados a comprender mejor la arquitectura de los modelos de Anthropic y cómo se utilizan, lo que a su vez podría ayudar en los intentos de eludir las medidas de seguridad existentes.

El modelo más potente de Anthropic hasta la fecha, el Claude 4.6 Opus, ya está clasificado por la empresa como modelo peligroso en lo que a riesgos de ciberseguridad se refiere. Anthropic dijo que sus modelos Opus actuales son capaces de identificar de forma autónoma vulnerabilidades de día cero en el software. Si bien estas capacidades están destinadas a ayudar a las empresas a descubrir y corregir debilidades, los piratas informáticos, incluidos los Estados-nación, también pueden utilizarlas como arma para encontrar y explotar vulnerabilidades.

Esta no es la primera vez que Anthropic revela accidentalmente detalles sobre su popular herramienta Claude Code. En febrero de 2025, una versión anterior de Claude Code descubrió accidentalmente su código fuente en una infracción similar. La exhibición mostró cómo funcionaba la herramienta detrás de escena, así como también cómo se conectaba a los sistemas internos de Anthropic. Posteriormente, Anthropic eliminó el software y eliminó el código disponible públicamente.

NOTA DEL EDITOR: Este artículo se actualizó para incluir comentarios adicionales de Anthropic y aclaraciones de algunos detalles técnicos de una de las fuentes.

Admin

Website | + posts

Anthropic publica el código fuente de su propia herramienta de codificación de inteligencia artificial en la segunda gran violación de seguridad | Suerte

Admin

Se celebraron los primeros juegos de atletismo interuniversitarios de toda Rusia.

Centros de datos en el mar: Panthalassa, con sede en Oregón, recauda 140 millones de dólares bajo la dirección de Peter Thiel para construir...

Cogent Communications Holdings informa una pérdida menor en el primer trimestre; Los ingresos cayeron un 3% – Alphastreet

Meta enfrenta juicio en Nuevo México con participaciones multimillonarias

Dogecoin ve mucho interés: las ballenas acumulan 160 millones de DOGE

Artículos relacionados

Britney Spears se declara culpable de un cargo menor de “imprudencia húmeda” en un caso de DUI para evitar la cárcel | Suerte

Los mercados en alerta mientras Trump promete el ‘Proyecto Libertad’ para Ormuz, lo que genera una posible confrontación tras nuevos ataques a barcos |...

Trump promete reducir las tropas estadounidenses en Alemania “mucho más” que 5.000 mientras un funcionario de Defensa dice que el ejército fue sorprendido por...

Trump dice que se está considerando la ‘propuesta final’ para la adquisición de Spirit Airlines financiada por los contribuyentes | Suerte

Sobre nosotras

Compañía

Últimas noticias

Britney Spears se declara culpable de un cargo menor de “imprudencia húmeda” en un caso de DUI para evitar la cárcel | Suerte

Se celebraron los primeros juegos de atletismo interuniversitarios de toda Rusia.

Centros de datos en el mar: Panthalassa, con sede en Oregón, recauda 140 millones de dólares bajo la dirección de Peter Thiel para construir...

Noticias populares

El primer ministro danés rechaza a Trump por Groenlandia | Suerte

Los superricos ya no buscan casa. Se suscriben | Suerte

Por qué Levi’s convirtió la idea de un hackathon en una herramienta de inteligencia artificial para que los empleados de las tiendas facilitaran la...