Una proporción cada vez mayor de oficinistas estadounidenses que han experimentado con inteligencia artificial en su trabajo diario probablemente hayan tenido algunas dudas sobre la estabilidad a largo plazo de sus empleos.
Pero a pesar de todas las mejoras en inteligencia artificial en los últimos años, la tecnología todavía solo es capaz de funcionar mal en tareas específicas en el lugar de trabajo, según los últimos datos publicados por el Instituto de Tecnología de Massachusetts. Incluso entonces, es posible que cometa errores graves.
Los trabajadores preocupados por ser reemplazados pronto por la IA probablemente se sentirán tranquilizados por una nueva investigación del Instituto de Tecnología de Massachusetts que describe la narrativa de la toma de empleos por parte de la IA como menos una película de acción de ritmo rápido y más como un análisis lento.
La inteligencia artificial está mejorando gradualmente en una variedad de tareas en una variedad de profesiones, según un estudio de hallazgos preliminares publicado el jueves. Pero en la mayoría de los casos, el desempeño de los modelos actualmente disponibles es similar al de un aprendiz frustrado: logra un desempeño mínimo, pero generalmente lucha por producir un trabajo de calidad sin aporte humano para mejorarlo.
limpieza de bares
Los investigadores del MIT utilizaron 41 programas LLM diferentes, incluidas versiones de Claude, Gemini y ChatGPT, para analizar el desempeño en más de 11.000 tareas basadas principalmente en palabras para una variedad de trabajos enumerados por el Departamento de Trabajo. Luego, sus resultados fueron evaluados por personas con experiencia real en estas áreas. El objetivo era ver con qué frecuencia reemplazar a un trabajador con IA podía producir un resultado que el gerente consideraría aceptable sin ninguna edición humana, y luego evaluar su calidad.
Los investigadores han descubierto que la IA se ha vuelto más confiable para muchos tipos de trabajos a lo largo de los años, pero aún se queda corta cuando se elevan los riesgos o los estándares. El estudio del MIT utilizó una escala del 1 al 9 para calificar el rendimiento de la IA, con una puntuación de 7 definida como “mínimamente adecuada”, lo que significa que el rendimiento es útil en sí mismo y no requiere ningún cambio. A finales de 2025, los modelos de IA recibieron una puntuación de 7 en aproximadamente el 65% de las tareas.
Los datos del MIT sugieren que la IA tiene dificultades para hacer frente a tareas más complejas. No importa cuánto tiempo tardó el modelo de IA en completar una tarea, la tasa de éxito de una calificación de calidad de 9 o “superior” nunca superó el 50%. En otras palabras, cuando un trabajo requiere múltiples pasos, creatividad o precisión, es más probable que un reemplazo de IA fracase que tenga éxito.
El estudio se ajusta a varios aspectos de la narrativa actual sobre la adopción de la IA en las empresas estadounidenses. Las empresas que utilizan IA tienen más probabilidades de automatizar tareas y roles rutinarios cuando son retenidas en puestos de nivel inicial, mientras que algunas habilidades de alta tecnología, especialmente las digitales, en realidad tienen un costo muy alto.
Esto se refleja en datos del Instituto de Tecnología de Massachusetts, que encontró que las tasas promedio de éxito son más bajas para trabajos calificados en ocupaciones legales y de TI, mientras que los modelos de IA tienden a tener más facilidad con los problemas planteados asociados con ocupaciones de construcción y mantenimiento.
Las empresas que han experimentado con la automatización total de ciertas partes de su carga de trabajo se han topado con dificultades cada vez mayores. El año pasado, Deloitte produjo dos informes para clientes gubernamentales en Australia y Canadá, ambos plagados de fraude. Se ha descubierto que medios de comunicación como CNET y Sports Illustrated utilizan inteligencia artificial para crear historias inexactas con autores ficticios. Los abogados también han recurrido a la inteligencia artificial para preparar sus informes, y un bufete de abogados se disculpó públicamente el año pasado después de que se reveló que la declaración de quiebra de uno de sus casos incluía citaciones falsas generadas por inteligencia artificial.
La evidencia anecdótica y los datos del MIT sugieren que la IA todavía requiere una mano humana para maximizar sus beneficios, aunque la tecnología está mejorando rápidamente. Los investigadores del MIT estiman que la tasa de éxito de la IA en las tareas que analizan aumenta en 11 puntos porcentuales cada año gracias a mejores modelos.
Los autores estiman que para 2029, la mayoría de los modelos de IA podrán realizar entre el 80% y el 95% de las tareas de texto a un nivel mínimamente suficiente.
Aún se desconoce si la IA podrá alcanzar algún día un rendimiento superior o incluso ideal.
“La automatización generalizada, especialmente en áreas con baja tolerancia a errores, aún puede estar muy lejos”, escriben los investigadores.
