Anthropic enfrenta reacciones negativas de los usuarios por informes de problemas de rendimiento con su chatbot Claude AI | Suerte

Fecha:

Compartir publicación:

Anthropic enfrenta reacciones negativas de los usuarios por informes de problemas de rendimiento con su chatbot Claude AI | Suerte

Anthropic, una ambiciosa empresa de inteligencia artificial, se enfrenta a reacciones negativas de algunos de sus usuarios más prolíficos por la supuesta degradación del rendimiento de sus modelos Claude AI.

Esos desafíos han obligado a la compañía, valorada recientemente en 380 mil millones de dólares y supuestamente en camino a una oferta pública inicial, a responder a las protestas de los usuarios y a la especulación en línea sobre sus motivos y su capacidad para atender a una nueva ola de clientes.

Según muchos desarrolladores y usuarios activos, el popular modelo de inteligencia artificial de Anthropic, Claude, ha experimentado recientemente una disminución significativa en su rendimiento. El modelo no sigue cada vez más las instrucciones, a veces selecciona atajos inapropiados y comete más errores en flujos de trabajo complejos.

Las quejas parecen surgir de cambios recientes que Anthropic ha realizado silenciosamente en la operación de Claude, reduciendo el nivel de “esfuerzo” predeterminado del modelo para ahorrar en la cantidad de tokens, o unidades de datos, que el modelo procesa en respuesta a cada solicitud. (Un portavoz de Anthropic declaró públicamente que este cambio se anotó en el registro de cambios, una lista permanente de actualizaciones disponibles para los usuarios).

Cuantos más tokens se procesen por tarea, más potencia informática consumirá esa tarea. Ha habido una especulación generalizada de que Anthropic, que ha anunciado menos acuerdos de capacidad de centros de datos multimillonarios que algunos de sus competidores, puede estar quedándose sin recursos informáticos después de que sus productos hayan ganado popularidad en los últimos meses.

La insatisfacción de los usuarios con la repentina caída en el rendimiento de Claude y el enojo por la supuesta falta de transparencia de Anthropic podrían descarrilar el rápido crecimiento de la compañía justo cuando espera atraer inversionistas a una potencial IPO. Las afirmaciones de que Anthropic no ha sido transparente sobre los cambios que ha realizado en la forma en que opera Claude, o cómo esos cambios podrían aumentar el costo de usar Claude, son especialmente amenazantes para Anthropic porque, más que cualquier otra empresa de inteligencia artificial, ha intentado construir una reputación de marca siendo más transparente que otras empresas de inteligencia artificial y más alineada con los intereses de sus usuarios.

Anthropic se negó a responder las preguntas específicas de Fortune sobre la queja del usuario de Claude. Boris Cherny, el ejecutivo de Anthropic que lidera el producto Claude Code, respondió a las quejas de los usuarios en línea diciendo que Anthropic había reducido el “esfuerzo” predeterminado que Claude pone al responder a las consultas de los usuarios a “promedio” en respuesta a los comentarios de los usuarios de que Claude había consumido previamente demasiados tokens por tarea. Pero muchos usuarios se quejaron de que la empresa no informó a los usuarios sobre este cambio.

La situación ha provocado muchas especulaciones y acusaciones (incluso de algunos competidores) de que la empresa está reduciendo deliberadamente la productividad debido a la falta de potencia informática.

En toda la industria, las empresas de IA se enfrentan a costos crecientes de GPU, una expansión limitada de los centros de datos y compensaciones difíciles sobre qué productos priorizar a medida que la demanda de sistemas de IA “basados ​​en agentes” crece más rápido que la escala de la infraestructura. Si bien un portavoz de Anthropic ha declarado públicamente que el laboratorio de IA no compromete la calidad de sus modelos para satisfacer mejor la demanda, hay razones para creer que la empresa enfrenta mayores limitaciones que algunos competidores.

Anthropic ha experimentado una serie de cortes recientemente debido a que el uso aumentó y se introdujeron restricciones de uso más estrictas durante las horas pico, lo que generó quejas de algunos usuarios. En un memorando interno publicado por CNBC, el director de ingresos de OpenAI también dijo que Anthropic cometió un “error estratégico” al no asegurar suficiente potencia informática y estaba “operando en una curva significativamente más baja” que sus competidores. (Anthropic se negó a responder las preguntas de CNBC sobre estas acusaciones).

Mientras tanto, Anthropic también anunció la semana pasada que había entrenado un modelo nuevo e inédito llamado Mythos, que es significativamente más eficiente que su modelo Opus AI, pero que también es más grande y más costoso de operar, lo que significa que probablemente consume más potencia informática que los modelos anteriores. Anthropic ha enfatizado que aún no está lanzando el modelo al público en general debido a preocupaciones de seguridad, pero algunos han cuestionado si Anthropic carece de suficiente potencia informática para soportar el despliegue generalizado de Mythos.

Víctima de mi propio éxito

El análisis de Anthropic destaca la naturaleza rápidamente cambiante del mercado de la inteligencia artificial y lo que está en juego. La semana pasada, Anthropic sorprendió a la industria al anunciar que sus ingresos recurrentes anuales, o ARR, son ahora de 30 mil millones de dólares, frente a los 9 mil millones de dólares a fines de 2025. OpenAI dijo el mes pasado que genera ingresos de 2 mil millones de dólares al mes, o 24 mil millones de dólares al año, aunque las dos compañías no reportan ingresos de la misma manera, lo que hace que las comparaciones directas sean problemáticas.

Anthropic se ha beneficiado recientemente de una avalancha de nuevos usuarios, principalmente debido a la popularidad de su herramienta de codificación de inteligencia artificial Claude Code, y luego gracias a una ola de apoyo de los consumidores tras su disputa con el Departamento de Defensa de EE. UU. Muchos usuarios cambiaron a Claude desde competidores como ChatGPT de OpenAI después de que la administración Trump calificara a Anthropic como un “riesgo para la cadena de suministro”. Anthropic dijo que la disputa surgió porque insistió en que el gobierno de Estados Unidos aceptara en su contrato no utilizar la tecnología de la compañía en armas letales autónomas o para la vigilancia masiva de ciudadanos estadounidenses.

En los últimos años, Anthropic ha logrado avances significativos en la carrera de la IA, convirtiéndose en un líder en IA empresarial y forjándose una reputación significativa entre los desarrolladores y usuarios empresariales. Pero si persiste el enojo por los problemas de desempeño de Claude, se corre el riesgo de erosionar parte de esa buena voluntad y podría hacer que la empresa tropiece en un momento crítico.

En respuesta a parte de la controversia en torno a los recientes problemas de rendimiento, Claude Cherny, jefe de Claude Code, dijo que Claude Opus 4.6, el modelo insignia de Anthropic, introdujo un “razonamiento adaptativo” a principios de febrero, que permite al modelo decidir cuánto razonamiento es aplicable a un problema determinado en lugar de utilizar un presupuesto fijo. A principios de marzo, Anthropic también redujo la configuración predeterminada a “esfuerzo medio”, dijo Cherney. Si bien los usuarios de Claude Code pueden cambiar manualmente los niveles de esfuerzo de la herramienta, los usuarios que pagan por las versiones Pro de Cowork o la versión de escritorio de Claude actualmente no pueden cambiar la configuración predeterminada.

Para abordar algunas preocupaciones de los usuarios, en el futuro la compañía validará “los usuarios de Teams y Enterprise de forma predeterminada, haciendo un gran esfuerzo para beneficiarse del pensamiento extendido, incluso si esto conlleva el costo de tokens y latencia adicionales”, dijo Cherney.

También descartó los rumores de que el modelo se simplificó deliberadamente, así como las quejas de los usuarios de que el cambio se implementó con falta de transparencia, afirmando que los cambios se realizaron en respuesta a los comentarios de los usuarios y fueron marcados por los usuarios a través de una ventana emergente en la interfaz de Claude Code.

“No apto para problemas de ingeniería complejos”

La mayoría de las quejas de los usuarios se centran en Claude Code, la herramienta de codificación basada en inteligencia artificial de Anthropic que se ha convertido en uno de los productos más populares y de más rápido crecimiento de la compañía.

Lanzado a principios de 2025, Claude Code funciona como un agente de línea de comandos que puede leer, escribir y ejecutar código de forma autónoma en un entorno de desarrollador. Desde su debut, ha sido ampliamente adoptado por desarrolladores individuales y equipos de ingeniería de grandes empresas, que lo utilizan para resolver problemas complejos de codificación de varios pasos.

Los recientes cambios de rendimiento de Claude Code han recibido amplia atención en las redes sociales gracias a un análisis de GitHub que parece haber sido realizado por Stella Laurenzo, directora senior de inteligencia artificial de AMD. En un análisis que circuló ampliamente, Laurenzo dijo que los cambios hicieron que Claude fuera “inadecuado para resolver problemas de ingeniería complejos”.

En su análisis, descubrió que desde finales de febrero hasta principios de marzo, Claude pasó de un enfoque de “investigación primero” (leer varios archivos y recopilar contexto antes de realizar cambios) a un estilo más sencillo de “editar primero”. Según el análisis, el modelo lee menos contexto antes de actuar, comete más errores y requiere mucha más intervención del usuario. El análisis también apunta a un aumento de comportamientos como detenerse demasiado pronto, evitar responsabilidades o pedir permiso innecesario, lo que sugiere que está relacionado con una disminución en la profundidad del “pensamiento” durante el mismo período.

“Claude ha retrocedido hasta el punto de que no se puede confiar en él para realizar trabajos de ingeniería complejos”, escribió.

En un comentario sobre el análisis, Cherny de Anthropic dice que el análisis probablemente malinterpreta al menos algunos de los datos, argumentando que el razonamiento del modelo no se ha acortado, pero Anthropic ha realizado cambios para que el “rastro de razonamiento” completo del modelo ya no sea visible para el usuario.

Pero Laurenzo no es el único que tiene problemas con esta herramienta.

“He tenido sesiones increíblemente frustrantes con Claude Code durante las últimas dos semanas”, escribió Dimitris Papaliopoulos, gerente senior de investigación de Microsoft, sobre X. “Puse mi esfuerzo al máximo, pero es muy descuidado, ignora instrucciones y repite errores”.

Website |  + posts
spot_img

Artículos relacionados

Britney Spears se declara culpable de un cargo menor de “imprudencia húmeda” en un caso de DUI para evitar la cárcel | Suerte

Britney Spears se declaró culpable el lunes a través de su abogado de un cargo menor que le...

Los mercados en alerta mientras Trump promete el ‘Proyecto Libertad’ para Ormuz, lo que genera una posible confrontación tras nuevos ataques a barcos |...

Los mercados financieros estaban en silencio el domingo, ya que los inversores se mostraban reacios a reaccionar ante...

Trump promete reducir las tropas estadounidenses en Alemania “mucho más” que 5.000 mientras un funcionario de Defensa dice que el ejército fue sorprendido por...

El presidente Donald Trump dijo el sábado que Estados Unidos reducirá significativamente su presencia militar en Alemania, intensificando...

Trump dice que se está considerando la ‘propuesta final’ para la adquisición de Spirit Airlines financiada por los contribuyentes | Suerte

El presidente Donald Trump dijo el viernes que su administración todavía está considerando una adquisición de Spirit Airlines...