
Una startup con sede en Londres fundada por dos neurocientíficos formados en Cambridge ha recaudado 10,25 millones de dólares para su startup Callosum, que está creando software que ejecuta cargas de trabajo de inteligencia artificial en diferentes tipos de chips, desafiando la dependencia de la industria de ejecutar modelos cada vez más grandes en bancos de GPU Nvidia idénticas.
La compañía también anunció que está recibiendo financiación para investigación del gobierno del Reino Unido, que está buscando formas de crear una infraestructura llamada “nube soberana” para inteligencia artificial que sea independiente, o al menos no dependiente únicamente de los proveedores de tecnología estadounidenses.
Los cofundadores de Callosum, Danial Akarka y Jascha Achterberg, que se conocieron durante su doctorado en Cambridge alrededor de 2019, tienen software que puede distribuir tareas de IA entre chips de diferentes fabricantes, ya sean GPU Nvidia, procesadores AMD, chips Trainium e Inferentia personalizados de Amazon Web Services, o nuevos diseños de nuevas empresas como Cerebras y SambaNova, extrayendo ventajas de rendimiento de cada uno.
La ronda de financiación fue liderada por Plural, un fondo de riesgo europeo de fase inicial cofundado por Taavet Hinrikus de Wise e Ian Hogarth, quien también fue el primer presidente del Instituto para la Seguridad de la Inteligencia Artificial del Reino Unido. También participaron inversores ángeles como Charlie Songhurst, Stan Boland de FiveAI y John Lazar de la Real Academia de Ingeniería. Además, la Agencia de Invenciones e Investigación Avanzada (ARIA) del gobierno del Reino Unido está proporcionando subvenciones a la empresa para acelerar la investigación y el desarrollo para integrar nuevas tecnologías de chips en su plataforma, aunque ARIA en sí no es un inversor en esta ronda, dijo Akarka a Fortune.
La tesis de la empresa se basa en la investigación académica de los cofundadores sobre la intersección de la neurociencia y la informática: el cerebro humano no alcanza la inteligencia copiando un tipo de neurona miles de millones de veces, sino combinando muchos tipos diferentes de células especializadas y circuitos que trabajan juntos. Creen que la informática que utiliza inteligencia artificial debería seguir el mismo principio.
“Los grandes laboratorios ahora apuestan a que un modelo los dominará a todos. Creemos que eso está mal y nuestro trabajo lo demuestra”, afirmó Akarka. “La naturaleza muestra que la verdadera inteligencia proviene de muchos sistemas que trabajan juntos”.
Callosum ingresa a un mercado que está experimentando profundos cambios estructurales. Después de años de que el gasto en IA estuviera dominado por el entrenamiento de modelos base masivos en bastidores de GPU Nvidia idénticas, la industria ahora está recurriendo a la inferencia: el proceso de ejecutar modelos entrenados para producir resultados. Deloitte estima que las cargas de trabajo de inferencia representarán aproximadamente dos tercios de toda la informática de IA en 2026, frente a un tercio en 2023, y el mercado de chips optimizados para inferencia crecerá a más de 50 mil millones de dólares este año. Este cambio abre la puerta a que una amplia gama de fabricantes de chips desafíen el dominio de Nvidia.
Callosum apuesta a que puede ser la capa de software que une este panorama de hardware cada vez más fragmentado. Su plataforma funciona con múltiples proveedores de nube, incluidos AWS, Google Cloud y Microsoft Azure, y está diseñada para que los clientes no tengan que rediseñar sus configuraciones de nube existentes para usarla. “Es un producto de software que toma su carga de trabajo de IA y la distribuye entre diferentes instalaciones de múltiples nubes que puede usar”, dijo Acarca.
Los cofundadores dicen que este enfoque ofrece grandes beneficios a la hora de resolver problemas complejos del mundo real que requieren muchos tipos diferentes de decisiones, como la automatización del uso de computadoras o el manejo de flujos de trabajo empresariales. Para este tipo de tareas, Callosum dice que su sistema puede ofrecer el doble de precisión, siete veces el rendimiento y cuatro veces el costo en comparación con ejecutar las mismas cargas de trabajo en hardware idéntico.
Achterberg explicó que el aumento de la precisión se debe a la naturaleza de los problemas que se resuelven. “Los problemas simples, los modelos individuales están bien”, dijo. Pero los complejos problemas corporativos son un asunto diferente. “La automatización del uso de ordenadores, la automatización de pagos, por ejemplo, son los problemas en los que nos centramos. Son inherentemente heterogéneos”, afirmó Achterberg. “En realidad, se necesitan muchos, muchos, muchos pasos para resolver un problema, y un modelo no siempre es óptimo”.
Las diferentes partes de un flujo de trabajo complejo pueden requerir cosas diferentes: algunos pasos requieren modelos muy rápidos y de bajo costo que puedan iterarse rápidamente mediante prueba y error, mientras que otros requieren un razonamiento más amplio y eficiente. Al asignar cada subproblema al modelo correcto que se ejecuta en el hardware correcto, Callosum afirma que puede superar el enfoque tradicional de utilizar un modelo potente para resolver todo el problema.
Callosum se dirige a dos tipos de clientes: empresas que crean sistemas de inteligencia artificial multiagente que requieren un rendimiento superior en flujos de trabajo complejos y fabricantes de chips emergentes que desean demostrar las capacidades de su hardware a escala. “Queremos que todas estas nuevas tecnologías de chips que son sorprendentes y tienen un rendimiento sorprendente y beneficios sorprendentes encuentren una manera de llegar a un mercado donde realmente podamos implementarlas”, dijo Achterberg.
La compañía también está trabajando con empresas que trabajan en nuevas formas de conectar racks de chips de inteligencia artificial en centros de datos (llamados “interconexión”), incluidas aquellas que desarrollan redes basadas en fotónica, una tecnología que transmite datos utilizando luz en lugar de impulsos eléctricos. Estas tecnologías están diseñadas para eliminar los cuellos de botella creados por la necesidad de mezclar datos dentro de un centro de datos, una tarea que se ha vuelto cada vez más compleja a medida que diferentes tipos de chips deben comunicarse entre sí.
De cara al futuro, los cofundadores dicen que planean utilizar los fondos para expandir su equipo de Londres, comenzar a escalar en los EE. UU. y construir su propia infraestructura de hardware adicional. Sus ambiciones a largo plazo se extienden más allá del software y llegan a repensar fundamentalmente el diseño mismo de los centros de datos.
“Todo el mundo pensaba que la diversidad de chips era una desventaja que había que gestionar. Nosotros vimos lo contrario: era una ventaja que había que explotar”, dijo Achterberg. “No optimizamos un algoritmo sobre una pila existente. Usamos software para controlar todas las palancas de todo el sistema, beneficiándonos de la diversidad que otros rechazan”.
Ian Hogarth, socio de Plural, dijo en un comunicado: “La visión (de Callosum) de un futuro multimodelo y multichip tiene el potencial de ser transformadora y permitirles competir con los mayores fabricantes de chips y modelos del mundo. Estos son fundadores serios con una misión seria”.
