Lo que algunos consideran la biblioteca digital de Alejandría corre peligro de perder valiosos pergaminos. Los principales medios de comunicación están bloqueando la capacidad de guardar páginas web utilizando Wayback Machine de Internet Archive para evitar que los gigantes de la inteligencia artificial entrenen modelos a partir de instantáneas de artículos antiguos.
Las empresas de tecnología pueden eludir las leyes de derechos de autor utilizando Wayback Machine como solución alternativa para aprender modelos de lenguaje para su contenido (incluidas, potencialmente, recetas). Mark Graham, director de Wayback Machine, enfatiza que el archivo digital cuenta con controles para limitar el abuso de la automatización de la IA y evitar la extracción de datos a gran escala.
Los editores pueden archivar su material, pero un tercero mantiene una versión más incorruptible de los artículos, lo que podría responsabilizar a los medios si se verifica después de la publicación.
Nada nuevo: el año pasado, Reddit prohibió a Wayback Machine recopilar datos debido a problemas similares con la inteligencia artificial. El archivo también perdió mucha información cuando se eliminaron los sitios web del gobierno federal.
Aún en ejecución: se informa que Graham está en conversaciones para restaurar el acceso al material, y más de 100 trabajadores de los medios han firmado una carta de apoyo a Wayback. —D.L.
Este informe fue publicado originalmente por Morning Brew.
En 2001, Fortune convocó por primera vez a las “personas más inteligentes que conocemos”, reuniendo a directores ejecutivos y fundadores, constructores e inversores, pensadores y emprendedores. Desde entonces, Fortune Brainstorm Tech se ha convertido en un lugar donde chocan ideas audaces. Del 8 al 10 de junio regresaremos a Aspen, donde comenzó todo, para celebrar el 25 aniversario de Brainstorm. Regístrese ahora.
