
Si bien los videos virales de robots realizando parkour y volteretas hacia atrás dominan las redes sociales, los expertos de la industria sugieren que estas hazañas acrobáticas son indicadores engañosos de progreso. Los ejecutivos de la industria en la conferencia Fortune Brainstorm AI, celebrada a principios de diciembre en San Francisco, argumentaron que la verdadera revolución en la robótica no es la destreza física, sino la capacidad de los robots de “pensar” por sí mismos, una habilidad que finalmente los acerca a resolver una tarea mundana pero engañosamente compleja como abrir una puerta o subir escaleras.
Durante los últimos 70 años, la robótica se ha basado en un paradigma particular: los humanos inteligentes preprograman máquinas utilizando matemáticas complejas para realizar tareas específicas. Ese enfoque está desactualizado, dijeron a Ellie Garfinkle de Fortune, Stephanie Jean, socia de Sequoia Capital, y Deepak Pathak, director ejecutivo de Skild AI. La industria está experimentando un cambio masivo: los robots, como los modelos de lenguaje grande (LLM) detrás de herramientas como ChatGPT, están aprendiendo directamente de los datos y la experiencia en lugar de seguir un código rígido.
“El cambio es que la robótica solía estar más impulsada por la inteligencia humana”, dijo Pathak, señalando que la nueva ola está impulsada por modelos que pueden generalizar y aprender. “Lo que ha cambiado ahora es que estos modelos o estos robots ahora pueden aprender de los datos”.
En julio de 2024, Jean escribió para el blog Sequoia sobre el profundo conocimiento de Patak en el campo y lo que lo distingue como director ejecutivo de robótica: su visión por computadora y sus habilidades de aprendizaje profundo. En comparación, la robótica tradicional se centra en recopilar datos específicos para entrenar robots para tareas específicas. Pathak y su socio Abhinav Gupta utilizaron datos a gran escala para construir un modelo básico. Originario de un pequeño pueblo de la India, Pathak llegó a los titulares nacionales al inscribirse en el Instituto Indio de Tecnología de Kanpur sin salir de su ciudad natal, escribió Jean. Aprendió a programar por sí mismo escribiendo código a mano en casa y utilizó minutos limitados en una cafetería local para ejecutar sus programas. Posteriormente recibió su doctorado. en Berkeley cuando se unió a Facebook AI Research y cofundó Skild.
La conversación de Jean y Patak con Garfinkle abordó una paradoja de la inteligencia artificial conocida como la paradoja de Moravec: lo que parece difícil suele ser simple, y lo que parece fácil es increíblemente difícil.
Por qué los backflips son más fáciles que las puertas
Un robot que realiza una voltereta hacia atrás esencialmente necesita controlar su cuerpo en el espacio libre, un problema de física que las computadoras han resuelto con éxito durante décadas. “En realidad, es mucho más fácil programar un robot para que haga una voltereta hacia atrás que hacerlo subir un tramo de escaleras”, señaló Garfinkle, con el acuerdo de ambos panelistas.
El verdadero desafío (y el Santo Grial de la “inteligencia física”) radica en interactuar con el caótico mundo real. Subir escaleras o coger un vaso requiere que el robot utilice constantemente su visión para ajustar sus movimientos en respuesta a un entorno cambiante. Este “sentido común sensoriomotor” es la raíz de la inteligencia humana general y la barrera que el nuevo software “cerebro” está tratando de superar.
Los inversores y ejecutivos ven esto como una oportunidad de mercado comparable a la reciente explosión de la inteligencia artificial generativa. Zhang señaló que así como OpenAI abrió el mercado para el trabajo del conocimiento digital, empresas como Skild de Pathak apuntan a abrir el mercado para todo el trabajo manual. El objetivo es crear “software generalmente inteligente” que pueda actuar como el cerebro de cualquier hardware de robot, reduciendo los costos en un orden de magnitud.
Sin embargo, a diferencia del mundo del software, la robótica enfrenta un obstáculo único: la falta de datos. Aunque los LLM se han formado a través de Internet, no existe una base de datos equivalente de interacciones físicas de robots. Pathak dice que la empresa que implemente el sistema primero ganará al crear un “volante de datos” en el que los robots de campo generan los datos necesarios para hacer que el sistema sea más inteligente.
Para los consumidores que se preguntan cuándo lavará la ropa el robot, el momento sigue siendo predeterminado. Pathak y Jean predicen que los robots proliferarán primero en entornos industriales y entornos “semiestructurados” como hoteles y hospitales, antes de entrar en el entorno más caótico del hogar privado.
A pesar de las preocupaciones sobre los despidos, argumentaron que se necesitaba tecnología para abordar las “tres S” del futuro: seguridad, escasez y evolución social. Los robots están preparados para asumir trabajos que actualmente obligan a las personas a arriesgar sus vidas y sus extremidades. Además, con millones de puestos vacantes actualmente sin cubrir debido a la escasez de mano de obra, los robots podrían llenar el vacío en empleos esenciales. En última instancia, la esperanza es un cambio social en el que el trabajo peligroso o difícil se vuelva opcional, permitiendo a las personas concentrarse en las tareas que disfrutan.
