Meta presenta Muse Spark, su primer modelo nuevo desde el decepcionante debut del Llama 4. Pero, ¿estará Muse Spark a la altura de las expectativas? | Suerte

Fecha:

Compartir publicación:

Meta presenta Muse Spark, su primer modelo nuevo desde el decepcionante debut del Llama 4. Pero, ¿estará Muse Spark a la altura de las expectativas? | Suerte

Meta presentó Muse Spark, el primer modelo de inteligencia artificial creado por Meta Superintelligence Labs, una nueva división de investigación de inteligencia artificial que creó el año pasado y ha gastado miles de millones de dólares en personal y equipos.

Según los resultados de referencia publicados por Meta, el modelo compite con los principales modelos de IA de OpenAI, Anthropic y Google en muchas tareas, aunque no los supera en todos los ámbitos. Sin embargo, si los resultados de las pruebas comparativas se confirman cuando los prueban expertos independientes, Muse Spark parece estar devolviendo a Meta a la carrera de la IA después de que su último modelo de IA, Llama 4, lanzado en abril de 2025, fuera ampliamente criticado como un fracaso.

Sin embargo, en el pasado, Meta fue sorprendida manipulando los resultados de las pruebas publicadas de un modelo de IA para que pareciera más capaz de lo que realmente era la versión disponible para la mayoría de los usuarios. Este fue el caso de las pruebas Llama 4 de Meta, en las que la compañía admitió más tarde haber utilizado versiones especializadas e inéditas del modelo, ajustadas para tareas específicas, para mejorar los puntajes de las pruebas en esas áreas, mientras que la versión general disponible para todos los usuarios no funcionó tan bien.

Y hay una trampa más. Pocos podrán utilizar el nuevo metamodelo fuera del propio ecosistema de productos de la empresa. A diferencia de los modelos de IA anteriores de Meta, que se lanzaron como modelos de “peso abierto”, lo que significa que cualquiera podía descargar los modelos de forma gratuita y ejecutarlos en su propio hardware, y modificarlos y personalizarlos a voluntad, Muse Spark es, al menos por ahora, principalmente la propia herramienta de Meta.

El modelo se utiliza actualmente como asistente de Meta AI en la aplicación Meta AI independiente de la empresa y en el sitio web Meta.ai. La compañía dijo que lo implementará en WhatsApp, Instagram, Facebook, Messenger y las gafas Ray-Ban AI de Meta en las próximas semanas. La compañía también dijo que ofrecerá el modelo en una “vista previa privada” para la selección de socios a través de una interfaz de programación de aplicaciones (API). Esto hace que Muse Spark sea aún más propietario que los modelos propietarios pagados que ofrecen los competidores de Meta. (Meta dijo en una publicación de blog que espera abrir futuras versiones del modelo de código abierto).

Muse Spark es el primer modelo de razonamiento de Meta, lo que significa que puede realizar un proceso paso a paso utilizando diferentes estrategias si su planteamiento inicial no funciona. Todos los modelos anteriores de la empresa fueron diseñados para producir respuestas instantáneas basadas en el entrenamiento de modelos. Muse Spark también es un modelo multimodal que puede aceptar y generar texto e imágenes. Según una publicación de blog técnica publicada por Meta, el modelo también admite el uso de otras herramientas de software y puede ayudar a orquestar múltiples subagentes.

En su blog que anuncia el nuevo modelo, Meta describe a Muse Spark como “pequeño y de diseño rápido, pero lo suficientemente potente como para resolver preguntas complejas en ciencias, matemáticas y salud”. Describe el modelo como el primero de una serie de nuevos modelos, que utilizan Muse Spark para probar la arquitectura y el régimen de entrenamiento que utiliza Meta antes de que la empresa lo amplíe a modelos más grandes e incluso más potentes de la misma familia.

El modelo también tiene un modo “pensamiento” o “pensamiento” en el que puede lanzar subagentes para considerar diferentes partes del problema en paralelo. En un blog de tecnología que anuncia el nuevo modelo, Meta dijo que el modo permite a Muse Spark “competir con los modos de razonamiento extremos de modelos de vanguardia como Gemini Deep Think y GPT Pro”.

Los resultados de las pruebas publicados junto con el lanzamiento muestran una imagen de un modelo que es competitivo pero no dominante. Por ejemplo, en la prueba GPQA Diamond, que se supone que evalúa las habilidades de razonamiento a nivel de doctorado, Muse Spark obtuvo una puntuación del 89,5%, ligeramente por detrás del 94,3% de Gemini 3.1 Pro, así como del 92,7% y 92,8% de Claude Opus 4.6 de Anthropic y GPT-5.4 de OpenAI, respectivamente. En la prueba de salud líder HealthBench Hard, Muse Spark superó a todos los modelos de la competencia con una puntuación del 42,8%, que es mucho mejor que Opus 4.6 o Gemini 3.1 Pro y ligeramente mejor que GPT-5.4.

Meta reconoció deficiencias en el desempeño. Una publicación de blog de tecnología decía que la compañía continúa “invirtiendo en áreas con brechas de rendimiento actuales, particularmente sistemas de agentes a largo plazo y flujos de trabajo de codificación”.

El lanzamiento de Muse Spark es el resultado más tangible de la reorganización masiva que Meta ha emprendido desde el fiasco de Llama 4. En junio de 2025, Meta gastó 14.300 millones de dólares para adquirir una participación sin derecho a voto del 49% en Scale AI y nombró al cofundador y director ejecutivo Alexander Wang como el primer director de inteligencia artificial de Meta.

A Wang se le asignó la tarea de liderar la recién creada división Meta Superintelligence Laboratories. Wang y Zuckerberg comenzaron a atraer talento activamente, ofreciendo a los investigadores de inteligencia artificial de laboratorios de inteligencia artificial rivales una compensación que, según se informa, alcanzó cientos de millones de dólares si se incluía el capital social. La compañía también ha comprometido cientos de miles de millones de dólares para construir una infraestructura informática de inteligencia artificial para respaldar su nuevo motor de inteligencia artificial.

Desde entonces, se han producido más reorganizaciones, incluso mientras Muse Spark estaba en desarrollo. En marzo de 2026, Meta creó una nueva organización de inteligencia artificial aplicada dirigida por Maher Saba, un vicepresidente que anteriormente trabajó en la división de realidad virtual y aumentada de Meta Reality Labs. Saba depende directamente del director de tecnología de Meta, Andrew Bosworth. La unidad de Saba está trabajando con el Laboratorio de Superinteligencia de Wang para crear lo que un memorando interno describe como “un sistema de procesamiento de datos que ayuda a que nuestros modelos sean mejores y más rápidos”. La medida fue ampliamente interpretada como que Zuckerberg cubrió sus apuestas asegurando el desarrollo continuo de la IA centrada en productos, incluso mientras Wang realiza investigaciones a largo plazo sobre superinteligencia.

En una publicación de blog técnico, Meta dijo que durante los últimos nueve meses, su equipo ha reconstruido su pila de IA desde cero, incluidas mejoras en la arquitectura del modelo, la optimización y la curación de datos. La compañía dice que estos avances le permiten lograr las mismas capacidades con “más de un orden de magnitud menos de potencia informática” que Llama 4 Maverick, el modelo anterior de Meta. Meta también dice que su canal de aprendizaje por refuerzo ahora permite un “crecimiento fluido y predecible” y que Muse Spark es el primer paso en una “escalera de escala” deliberada donde cada generación prueba la última antes de que la compañía entrene modelos más grandes.

En el frente de la seguridad, Meta dice que Muse Spark fue evaluado exhaustivamente con el marco de seguridad actualizado de la compañía antes de su implementación. El modelo tiene un historial impresionante de desempeño en materia de seguridad en el desarrollo de posibles armas biológicas: en una prueba, rechazó el 98% de las solicitudes que los desarrolladores de la prueba consideraron que tenían el potencial de ayudar a alguien a desarrollar un arma biológica.

Sin embargo, la publicación del blog también afirma que el evaluador externo Apollo Research descubrió que Muse Spark demostró el nivel más alto de “conciencia de evaluación” de cualquier modelo observado por Apollo, identificando a menudo escenarios de prueba como “trampas de negociación”. Meta afirma que su propia investigación de seguimiento encontró evidencia inicial de que esta conciencia puede influir en el comportamiento del modelo en un pequeño subconjunto de puntuaciones de consistencia, pero concluyó que “no era un problema que impidiera la liberación”.

En 2001, Fortune convocó por primera vez a las “personas más inteligentes que conocemos”, reuniendo a directores ejecutivos y fundadores, constructores e inversores, pensadores y emprendedores. Desde entonces, Fortune Brainstorm Tech se ha convertido en un lugar donde chocan ideas audaces. Del 8 al 10 de junio regresaremos a Aspen, donde comenzó todo, para celebrar el 25 aniversario de Brainstorm. Regístrese ahora.

Website |  + posts
spot_img

Artículos relacionados

Britney Spears se declara culpable de un cargo menor de “imprudencia húmeda” en un caso de DUI para evitar la cárcel | Suerte

Britney Spears se declaró culpable el lunes a través de su abogado de un cargo menor que le...

Los mercados en alerta mientras Trump promete el ‘Proyecto Libertad’ para Ormuz, lo que genera una posible confrontación tras nuevos ataques a barcos |...

Los mercados financieros estaban en silencio el domingo, ya que los inversores se mostraban reacios a reaccionar ante...

Trump promete reducir las tropas estadounidenses en Alemania “mucho más” que 5.000 mientras un funcionario de Defensa dice que el ejército fue sorprendido por...

El presidente Donald Trump dijo el sábado que Estados Unidos reducirá significativamente su presencia militar en Alemania, intensificando...

Trump dice que se está considerando la ‘propuesta final’ para la adquisición de Spirit Airlines financiada por los contribuyentes | Suerte

El presidente Donald Trump dijo el viernes que su administración todavía está considerando una adquisición de Spirit Airlines...