Resumen objetivo y detallado del artículo: "La IA Anthropic escanea y destruye libros"

>>  martes, 26 de mayo de 2026

Resumen objetivo y detallado del artículo: "La IA antrópica escanea y destruye libros" https://www.washingtonpost.com/technology/2026/01/27/anthropic-ai-scan-destroy-books/
Por: Lic. Carmen Marín con la colaboración de GROK




Título y contexto principal

El artículo, titulado "Inside an AI start-up’s plan to scan and dispose of millions of books" (o "Anthropic ‘destructively’ scanned millions of books to build Claude"), revela detalles del Project Panama, una iniciativa confidencial de Anthropic para adquirir, escanear y desechar de forma destructiva millones de libros físicos con el fin de obtener datos de entrenamiento para sus modelos de IA, como Claude. washingtonpost.com

Los detalles surgieron de más de 4.000 páginas de documentos judiciales desclasificados en una demanda por infracción de derechos de autor presentada por autores contra Anthropic. 
washingtonpost.com


¿En qué consistió el Project Panama?

Inicio y objetivo:


A inicios de 2024, ejecutivos de Anthropic impulsaron el proyecto, descrito internamente como “nuestro esfuerzo para escanear destructivamente todos los libros del mundo”. La empresa quería mantenerlo en secreto: “No queremos que se sepa que estamos trabajando en esto”. timesofindia.indiatimes.com

Proceso:

Compra masiva de libros usados (de librerías de segunda mano como The Strand, tiendas en línea, bibliotecas y posiblemente bibliotecas con problemas de financiación).
  • Corte de los lomos (guillotina o “destructive scanning”) para separar las páginas y permitir un escaneo rápido y masivo.
  • Escaneo de alta velocidad de las páginas.
  • Reciclaje o disposición de los restos físicos (el papel se reciclaba). lithub.com
Escala:

En aproximadamente un año, Anthropic gastó decenas de millones de dólares y procesó potencialmente millones de libros (una propuesta a proveedores hablaba de 500.000 a 2 millones de libros en un período de seis meses). Almacenaban libros en grandes almacenes. infodocket.com

El objetivo era enriquecer los modelos de IA con conocimiento amplio y diverso contenido en libros, más allá de lo disponible en internet o datos digitales.

Aspecto legal

Anthropic se basó en la doctrina de la primera venta (first-sale doctrine): una vez comprado un libro físico legalmente, el propietario puede hacer con él lo que quiera (incluyendo destruirlo para escanearlo), siempre que no distribuya copias infractoras. futurism.com

Un juez falló que esta práctica constituía uso justo (fair use) en el contexto del entrenamiento de IA. 
washingtonpost.com

La empresa también usó otras fuentes como sitios de piratería (según los documentos), lo que forma parte de las acusaciones más amplias en demandas de copyright contra compañías de IA.

Reacciones y contexto más amplio

El artículo destaca la carrera de las empresas de IA por obtener más datos de libros para mejorar sus chatbots, en un momento de litigios intensos sobre derechos de autor. Anthropic buscó discreción porque sabía que la imagen de “destruir millones de libros” sería controvertida públicamente, a pesar de ser legal. futurism.com

Este reportaje se enmarca en el debate ético y legal más grande sobre el uso de obras protegidas para entrenar IA: autores argumentan pérdida de ingresos y control; las compañías defienden que es necesario para el avance tecnológico y que se trata de uso transformador. Aunque el artículo es neutral en tono, resalta el contraste entre las prácticas secretas de la industria y el impacto cultural de destruir ejemplares físicos de libros para crear “conocimiento” digital en IA. Incluye ilustraciones y referencias a imágenes de almacenes llenos de libros. lithub.com

Nota:

El artículo completo está detrás de paywall de The Washington Post, pero los documentos judiciales y coberturas posteriores (podcasts, otros medios) confirman y amplían estos hechos.

En el resumen se colocan los sitios o referencias de donde se obtuvo la información, se basa en extractos directos y reportes derivados confiables.

Análisis del fallo judicial del juez William Alsup en el caso Bartz v. Anthropic (junio de 2025). 
techpolicy.press

El juez William Alsup (Tribunal de Distrito del Norte de California) emitió una orden de sentencia sumaria parcial el 23 de junio de 2025 en el caso presentado por los autores Andrea Bartz, Charles Graeber y Kirk Wallace Johnson contra Anthropic. Este es uno de los primeros fallos sustantivos sobre el uso de libros con derechos de autor para entrenar modelos de IA generativa (LLM como Claude). 
goodwinlaw.com

El fallo es mixto (parcialmente favorable a Anthropic y parcialmente a los autores) y se centra en la doctrina de uso justo (fair use) bajo la Sección 107 de la Ley de Derechos de Autor de EE.UU.

Analiza tres usos distintos de las obras:

1. Uso de libros para entrenar los LLM (el núcleo del caso)
 
Decisión: 

Es uso justo (fair use). Alsup concedió sentencia sumaria a favor de Anthropic. goodwinlaw.com

Razones principales (análisis de los 4 factores de fair use):
 
Factor 1 (propósito y carácter del uso): 

Muy a favor de Anthropic. El entrenamiento es "exceedingly transformative" (extremadamente transformador). El juez comparó el proceso con un lector humano que lee libros para aprender a escribir algo nuevo y diferente, no para copiar o reemplazar las obras originales: “no para competir o desplazar, sino para dar un giro y crear algo distinto”. Lo describió como “uno de los usos más transformadores que veremos en nuestra vida”.
 
Factor 2 (naturaleza de la obra): 

En contra (las obras son creativas y expresivas).
 
Factor 3 (cantidad y sustancialidad): 

A favor. Usar obras completas era “razonablemente necesario” para el entrenamiento transformador. No hay evidencia de que el modelo generara copias exactas o knockoffs para el público.
 
Factor 4 (efecto en el mercado): 

A favor. No desplaza la demanda de los libros originales (no genera copias exactas ni competidores directos que sustituyan la compra de libros). goodwinlaw.com

Conclusión de este punto:

El entrenamiento en sí de IA generativa sobre obras adquiridas legalmente es fair use, siempre que no produzca outputs infractores directos.

2. Conversión de libros físicos comprados a formato digital (Project Panama)
 
Decisión:

También fair use. Anthropic podía comprar libros físicos, cortarlos, escanearlos y destruir los originales para crear copias digitales internas. techpolicy.press

Razonamiento:

Es un mero cambio de formato (print-to-digital) para mayor comodidad, ahorro de espacio y búsqueda. Se destruye el original físico, no se distribuye ni comparte fuera de la empresa. No añade copias nuevas al mercado.

Esto valida legalmente el enfoque de “escaneo destructivo” cuando se parte de compras legítimas (doctrina de primera venta).

3. Uso de copias piratas (descargadas de sitios como LibGen o PiLiMi)

Decisión:

No es fair use. Se denegó la sentencia sumaria a Anthropic y se ordenó ir a juicio por estos hechos. 
goodwinlaw.com

Razones:

Crear y mantener una “biblioteca central” con millones de copias piratas (incluso si algunas se usaban para entrenamiento) no es transformador. Es una infracción independiente: “piratear para construir una biblioteca de investigación sin pagar” no se salva por el propósito final. El juez fue muy crítico: dudaba que descargar de fuentes piratas (cuando se podían comprar legalmente) fuera nunca “razonablemente necesario”.

Este punto es clave: el método de adquisición importa. El entrenamiento puede ser fair use, pero obtener los datos ilegalmente genera responsabilidad.

Implicaciones y limitaciones del fallo

Victoria parcial para la industria IA:

Establece que el entrenamiento de LLM con obras con copyright (adquiridas legalmente) puede calificarse como fair use transformador. Es un precedente útil, pero estrecho (aplica específicamente a los hechos del caso y a los tres autores demandantes en ese momento). techpolicy.press

Advertencia clara: 

La piratería no se tolera. Las empresas deben adquirir legalmente los datos (compra, licencias, etc.).
 
No resuelve todo: 

No aborda si los outputs generados por la IA infringen derechos de autor (casos futuros podrían enfocarse ahí). Tampoco es una autorización general para todas las compañías o todos los escenarios.
 
Consecuencias posteriores: 

El caso avanzó a juicio por las copias piratas, pero Anthropic llegó a un acuerdo de $1.5 mil millones con autores y editores (uno de los mayores en la historia del copyright). El fallo de fair use sobre el entrenamiento se mantiene. washingtonpost.com

En resumen: 

El juez Alsup trazó una línea clara: el entrenamiento transformador de IA es protegido si se hace con copias legítimas, pero la adquisición ilícita (piratería) no se justifica. Es un fallo equilibrado que favorece la innovación tecnológica sin ignorar completamente los derechos de los creadores, aunque muchos autores lo critican por subestimar el impacto en el mercado de la escritura profesional. 

Referencias:

washingtonpost.com
timesofindia.indiatimes.com
lithub.com
futurism.com
techpolicy.press
goodwinlaw.com



0 comentarios :

Snap Shots

Get Free Shots from Snap.com

  © Free Blogger Templates Autumn Leaves by Ourblogtemplates.com 2008

Back to TOP