No confíe en ‘GEO’ para proteger la reputación de su marca en el mundo de la IA basada en agentes, advierte un experto | Suerte

Fecha:

Compartir publicación:

El problema, como me dijo De Rosen en una conversación telefónica la semana pasada, es que si bien los diversos modelos de IA tienden a ser consistentes en cómo caracterizan las ofertas de productos de una marca (generalmente informan correctamente la naturaleza del producto, sus características y cómo esas características se comparan con los productos de la competencia, y citan las fuentes de esa información), son inconsistentes y propensos a errores cuando se les hacen preguntas sobre la estabilidad financiera, la gobernanza y las certificaciones técnicas de una empresa. Sin embargo, esta información puede desempeñar un papel importante en la toma de decisiones de compra importantes.

Los modelos de IA son menos fiables en cuestiones financieras y de gestión.

En un ejemplo, AIVO Standard evaluó cómo los modelos avanzados de inteligencia artificial respondieron preguntas sobre Ramp, una empresa de software de gestión de gastos de rápido crecimiento. AIVO Standard descubrió que los modelos no podían responder de manera confiable preguntas sobre los estándares de gobernanza y certificación de ciberseguridad de Ramp. En algunos casos, dijo de Rosen, esto probablemente estaba empujando silenciosamente a las empresas a tomar decisiones de compra que involucraban empresas más grandes, que cotizan en bolsa y establecidas (incluso en casos en los que la empresa privada advenediza también cumplía con los mismos estándares) simplemente porque los modelos de IA no podían responder con precisión preguntas sobre la gestión y la idoneidad financiera de la empresa privada más joven o citar las fuentes de la información que proporcionaban.

En otro ejemplo, la empresa estudió lo que decían los modelos de inteligencia artificial sobre los factores de riesgo de los medicamentos de la competencia para bajar de peso. Resulta que los modelos de IA no solo enumeran los factores de riesgo, sino que también hacen recomendaciones y juicios sobre qué medicamento tiene más probabilidades de ser una “opción más segura” para un paciente. “Los resultados se basaron en gran medida en evidencia y fueron medidos, con descargos de responsabilidad incluidos, pero aun así determinaron la elegibilidad, la percepción de riesgo y las preferencias”, dijo de Rosen.

AIVO Standard descubrió que estos problemas se observan en todos los principales modelos de IA y en muchas consultas diferentes, y persisten incluso cuando se pide a los modelos que verifiquen sus respuestas. De hecho, en algunos casos, los modelos tienden a duplicar información inexacta e insisten en que es correcta.

GEO sigue siendo más arte que ciencia

Hay varias consecuencias. En primer lugar, para todas las empresas que venden servicios GEO, es posible que GEO no funcione bien con diversos aspectos de la información de marca. Las empresas no necesariamente necesitan confiar en una empresa de tecnología de marketing que afirma que puede mostrarles cómo aparece su marca en las respuestas del chatbot, y mucho menos confiar en que la empresa de tecnología de marketing tenga alguna fórmula mágica para generar de manera confiable esas respuestas de IA. Los resultados operativos pueden variar significativamente, incluso en un solo minuto, dependiendo del tipo de información de marca que se evalúe. Y todavía no hay muchos datos sobre cómo gestionar exactamente las respuestas del chatbot a información que no sea del producto.

Pero un problema mucho mayor es que en muchos flujos de trabajo de agentes (incluso aquellos que involucran a humanos) llega un punto en el que la información proporcionada por la IA se convierte en la base para la toma de decisiones. Y como dice de Rosen, la mayoría de las empresas actualmente no controlan realmente los límites entre la información, el juicio y la toma de decisiones. No tienen forma de rastrear qué mensaje se utilizó, qué devolvió el modelo en respuesta y cómo influyó eso exactamente en la recomendación o decisión final. En sectores regulados como el financiero o el sanitario, si algo sale mal, estos son los detalles que pedirán los reguladores. Y si las empresas reguladas no implementan sistemas para recopilar todos estos datos, estarán en problemas.

SUERTE CON LA IA

Anthropic lanza Claude Cowork, un agente de inteligencia artificial para la gestión de archivos que podría amenazar a decenas de startups – Beatrice Nolan, Reino Unido. La investigación X sobre deepfakes supuestamente ilegales corre el riesgo de desencadenar una batalla por la libertad de expresión con EE. UU. – Beatrice NolanMalasia e Indonesia proponen prohibir la inteligencia artificial Grok Mask por deepfakes sexualmente explícitos – Angelica Ang

Anthropic presenta Claude for Healthcare, amplía las capacidades de ciencias biológicas y se asocia con HealthEx para permitir a los usuarios conectar registros médicos – Jeremy Kahn

IA EN LAS NOTICIAS

Apple elige la inteligencia artificial de Google para Siri actualizada. Apple firmó una asociación de varios años con Google para incorporar funciones clave de inteligencia artificial a sus productos, incluida una actualización tan esperada de Siri, anunciaron las compañías el lunes. El acuerdo subraya el resurgimiento de Google en inteligencia artificial y ha ayudado a elevar el valor de mercado de Alphabet, matriz de Google, por encima del umbral de los 4 billones de dólares. Apple dijo que el acuerdo no cambia su asociación existente con OpenAI, bajo la cual Siri actualmente pasa algunas solicitudes a ChatGPT, aunque no está claro cómo la asociación con Google afectará la futura integración de Siri con la inteligencia artificial. Los términos financieros del acuerdo tampoco fueron revelados, aunque Bloomberg informó anteriormente que Apple estaba considerando pagar a Google hasta mil millones de dólares al año por el acceso a sus modelos de inteligencia artificial para Siri.

UNA MIRADA A LA INVESTIGACIÓN EN IA

Microsoft, Nvidia y la startup británica Basecamp Research están logrando avances en la edición de genes utilizando inteligencia artificial. Un equipo de investigación internacional, que incluía científicos de Nvidia y Microsoft, utilizó IA para recopilar datos evolutivos de más de un millón de especies para desarrollar nuevas herramientas potenciales de edición genética y terapias farmacológicas. El equipo desarrolló un conjunto de modelos de inteligencia artificial llamado Eden, que fueron entrenados en un extenso conjunto de datos biológicos inéditos recopilados por Basecamp. La división de capital riesgo de Nvidia es inversor en Basecamp.

¿TIENES UN CALENDARIO?

19 al 23 de enero: Foro Económico Mundial, Davos, Suiza.

20 al 27 de enero: Conferencia AAAI sobre Inteligencia Artificial, Singapur.

10 y 11 de febrero: Cumbre de Acción de AI, Nueva Delhi, India.

2 al 5 de marzo: Mobile World Congress, Barcelona, ​​España.

16 al 19 de marzo: Nvidia GTC, San José, California.

NUTRICIÓN PARA EL CEREBRO

¿Qué pasa si la gente prefiere la ficción escrita por inteligencia artificial o simplemente no ve la diferencia? Ésa es la pregunta que se hace el escritor neoyorquino Vodini Vara en un provocativo ensayo publicado en el sitio web de la revista llamado “Weekend Essay” hace unas semanas. Si bien los modelos de IA disponibles en el mercado siguen teniendo dificultades para producir historias tan convincentes como las de los graduados de los mejores programas de maestría en Bellas Artes y los escritores experimentados, resulta que cuando se sintonizan estos modelos con el trabajo de un autor existente, pueden producir una prosa que a menudo es indistinguible de lo que el autor original podría haber producido. Desafortunadamente, en una prueba realizada por el investigador Tuhin Chakrabarti, que ha realizado algunos de los mejores experimentos hasta la fecha sobre las capacidades de escritura creativa de los modelos de IA, y que Vara repite de una forma ligeramente diferente, incluso los lectores con un sentido literario bien desarrollado (como los estudiantes de maestría en Bellas Artes) prefieren las versiones escritas por IA a la prosa escrita por humanos. Si esto es cierto, ¿qué esperanza hay entonces para los autores de ficción de género o novelas románticas? Hace unos meses estaba hablando con un amigo que es un escritor famoso. Se mostró pesimista sobre si las generaciones futuras valorarían la literatura escrita por humanos. Intenté demostrar que a los lectores siempre les conmoverá la idea de que se están comunicando con un autor humano, que detrás de las palabras hay una mente con experiencia de vida. No estaba convencido. Y cada vez me preocupa más que su pesimismo esté bien fundamentado. En última instancia, Vara llega a la conclusión de que la única forma de preservar la idea de la literatura como transmisión de experiencias de vida a través de una página es exigirla colectivamente (y tal vez incluso prohibir el ajuste de los modelos de IA en las obras de los escritores existentes). No estoy seguro de si esto es realista. Pero puede que sea la única opción que nos queda.

FORTUNE AIQ: UN AÑO EN IA… Y LO QUE VIENE

En 2025, las empresas habrán dado grandes pasos hacia el desarrollo de la IA, desde la contratación de ejecutivos de IA hasta la experimentación con agentes de IA. Las lecciones aprendidas, tanto buenas como malas, combinadas con las últimas innovaciones tecnológicas harán de 2026 otro año decisivo. Explore todas las funciones de Fortune AIQ y lea el libro más reciente a continuación:

– 3 tendencias que dominaron la adopción de la IA por parte de las empresas en 2025.

–2025 se ha convertido en el año de la IA basada en agentes. ¿Cómo nos las arreglamos?

– Las herramientas de codificación de IA se generalizarán en 2025. Los primeros exploits de seguridad muestran lo que puede salir mal.

– El gran propósito de Año Nuevo de la IA para las empresas en 2026: el retorno de la inversión (ROI).

– Las empresas se enfrentan a un confuso mosaico de políticas y regulaciones de IA. ¿Hay claridad en el horizonte?

Website |  + posts
spot_img

Artículos relacionados

Los federales arrestan a una mujer de Los Ángeles en Los Ángeles bajo sospecha de ayudar a Irán a contrabandear armas a Sudán |...

Una mujer de 44 años de Los Ángeles fue arrestada el sábado por la noche en el Aeropuerto...

A partir del lunes, las empresas pueden solicitar el reembolso de los aranceles inconstitucionales de Trump. Pero el pago tardará entre 60 y 90...

Está previsto que el lunes se lance un sistema de reembolso para las empresas que pagaron los aranceles,...

Los Emiratos Árabes Unidos están en conversaciones con Estados Unidos sobre un posible rescate financiero, informa el WSJ | Suerte

Los Emiratos Árabes Unidos han iniciado conversaciones con Estados Unidos sobre apoyo financiero en caso de que una...

Ocho niños, de entre 1 y 14 años, murieron en un tiroteo en Luisiana que “no se parece a nada que la mayoría de...

Un hombre armado en Luisiana mató a ocho niños y disparó a otros dos la madrugada del domingo...