Archivólogo - blog de archivo - Lic. Carmen Marín: 26 may 2026

Resumen objetivo y detallado del artículo: "La IA antrópica escanea y destruye libros" https://www.washingtonpost.com/technology/2026/01/27/anthropic-ai-scan-destroy-books/
Por: Lic. Carmen Marín con la colaboración de GROK

Título y contexto principal

El artículo, titulado "Inside an AI start-up’s plan to scan and dispose of millions of books" (o "Anthropic ‘destructively’ scanned millions of books to build Claude"), revela detalles del Project Panama, una iniciativa confidencial de Anthropic para adquirir, escanear y desechar de forma destructiva millones de libros físicos con el fin de obtener datos de entrenamiento para sus modelos de IA, como Claude. washingtonpost.com

Los detalles surgieron de más de 4.000 páginas de documentos judiciales desclasificados en una demanda por infracción de derechos de autor presentada por autores contra Anthropic.
washingtonpost.com

¿En qué consistió el Project Panama?

Inicio y objetivo:

A inicios de 2024, ejecutivos de Anthropic impulsaron el proyecto, descrito internamente como “nuestro esfuerzo para escanear destructivamente todos los libros del mundo”. La empresa quería mantenerlo en secreto: “No queremos que se sepa que estamos trabajando en esto”. timesofindia.indiatimes.com

Proceso:

Compra masiva de libros usados (de librerías de segunda mano como The Strand, tiendas en línea, bibliotecas y posiblemente bibliotecas con problemas de financiación).

Corte de los lomos (guillotina o “destructive scanning”) para separar las páginas y permitir un escaneo rápido y masivo.
Escaneo de alta velocidad de las páginas.
Reciclaje o disposición de los restos físicos (el papel se reciclaba). lithub.com

Escala:

En aproximadamente un año, Anthropic gastó decenas de millones de dólares y procesó potencialmente millones de libros (una propuesta a proveedores hablaba de 500.000 a 2 millones de libros en un período de seis meses). Almacenaban libros en grandes almacenes. infodocket.com

El objetivo era enriquecer los modelos de IA con conocimiento amplio y diverso contenido en libros, más allá de lo disponible en internet o datos digitales.

Aspecto legal

Anthropic se basó en la doctrina de la primera venta (first-sale doctrine): una vez comprado un libro físico legalmente, el propietario puede hacer con él lo que quiera (incluyendo destruirlo para escanearlo), siempre que no distribuya copias infractoras. futurism.com

Un juez falló que esta práctica constituía uso justo (fair use) en el contexto del entrenamiento de IA.
washingtonpost.com

La empresa también usó otras fuentes como sitios de piratería (según los documentos), lo que forma parte de las acusaciones más amplias en demandas de copyright contra compañías de IA.

Reacciones y contexto más amplio

El artículo destaca la carrera de las empresas de IA por obtener más datos de libros para mejorar sus chatbots, en un momento de litigios intensos sobre derechos de autor. Anthropic buscó discreción porque sabía que la imagen de “destruir millones de libros” sería controvertida públicamente, a pesar de ser legal. futurism.com

Este reportaje se enmarca en el debate ético y legal más grande sobre el uso de obras protegidas para entrenar IA: autores argumentan pérdida de ingresos y control; las compañías defienden que es necesario para el avance tecnológico y que se trata de uso transformador. Aunque el artículo es neutral en tono, resalta el contraste entre las prácticas secretas de la industria y el impacto cultural de destruir ejemplares físicos de libros para crear “conocimiento” digital en IA. Incluye ilustraciones y referencias a imágenes de almacenes llenos de libros. lithub.com

Nota:

El artículo completo está detrás de paywall de The Washington Post, pero los documentos judiciales y coberturas posteriores (podcasts, otros medios) confirman y amplían estos hechos.

En el resumen se colocan los sitios o referencias de donde se obtuvo la información, se basa en extractos directos y reportes derivados confiables.

Análisis del fallo judicial del juez William Alsup en el caso Bartz v. Anthropic (junio de 2025).
techpolicy.press

El juez William Alsup (Tribunal de Distrito del Norte de California) emitió una orden de sentencia sumaria parcial el 23 de junio de 2025 en el caso presentado por los autores Andrea Bartz, Charles Graeber y Kirk Wallace Johnson contra Anthropic. Este es uno de los primeros fallos sustantivos sobre el uso de libros con derechos de autor para entrenar modelos de IA generativa (LLM como Claude).
goodwinlaw.com

El fallo es mixto (parcialmente favorable a Anthropic y parcialmente a los autores) y se centra en la doctrina de uso justo (fair use) bajo la Sección 107 de la Ley de Derechos de Autor de EE.UU.

Analiza tres usos distintos de las obras:

1. Uso de libros para entrenar los LLM (el núcleo del caso)

Decisión:

Es uso justo (fair use). Alsup concedió sentencia sumaria a favor de Anthropic. goodwinlaw.com

Razones principales (análisis de los 4 factores de fair use):

Factor 1 (propósito y carácter del uso):

Muy a favor de Anthropic. El entrenamiento es "exceedingly transformative" (extremadamente transformador). El juez comparó el proceso con un lector humano que lee libros para aprender a escribir algo nuevo y diferente, no para copiar o reemplazar las obras originales: “no para competir o desplazar, sino para dar un giro y crear algo distinto”. Lo describió como “uno de los usos más transformadores que veremos en nuestra vida”.

Factor 2 (naturaleza de la obra):

En contra (las obras son creativas y expresivas).

Factor 3 (cantidad y sustancialidad):

A favor. Usar obras completas era “razonablemente necesario” para el entrenamiento transformador. No hay evidencia de que el modelo generara copias exactas o knockoffs para el público.

Factor 4 (efecto en el mercado):

A favor. No desplaza la demanda de los libros originales (no genera copias exactas ni competidores directos que sustituyan la compra de libros). goodwinlaw.com

Conclusión de este punto:

El entrenamiento en sí de IA generativa sobre obras adquiridas legalmente es fair use, siempre que no produzca outputs infractores directos.

2. Conversión de libros físicos comprados a formato digital (Project Panama)

Decisión:

También fair use. Anthropic podía comprar libros físicos, cortarlos, escanearlos y destruir los originales para crear copias digitales internas. techpolicy.press

Razonamiento:

Es un mero cambio de formato (print-to-digital) para mayor comodidad, ahorro de espacio y búsqueda. Se destruye el original físico, no se distribuye ni comparte fuera de la empresa. No añade copias nuevas al mercado.

Esto valida legalmente el enfoque de “escaneo destructivo” cuando se parte de compras legítimas (doctrina de primera venta).

3. Uso de copias piratas (descargadas de sitios como LibGen o PiLiMi)

Decisión:

No es fair use. Se denegó la sentencia sumaria a Anthropic y se ordenó ir a juicio por estos hechos.
goodwinlaw.com

Razones:

Crear y mantener una “biblioteca central” con millones de copias piratas (incluso si algunas se usaban para entrenamiento) no es transformador. Es una infracción independiente: “piratear para construir una biblioteca de investigación sin pagar” no se salva por el propósito final. El juez fue muy crítico: dudaba que descargar de fuentes piratas (cuando se podían comprar legalmente) fuera nunca “razonablemente necesario”.

Este punto es clave: el método de adquisición importa. El entrenamiento puede ser fair use, pero obtener los datos ilegalmente genera responsabilidad.

Implicaciones y limitaciones del fallo

Victoria parcial para la industria IA:

Establece que el entrenamiento de LLM con obras con copyright (adquiridas legalmente) puede calificarse como fair use transformador. Es un precedente útil, pero estrecho (aplica específicamente a los hechos del caso y a los tres autores demandantes en ese momento). techpolicy.press

Advertencia clara:

La piratería no se tolera. Las empresas deben adquirir legalmente los datos (compra, licencias, etc.).

No resuelve todo:

No aborda si los outputs generados por la IA infringen derechos de autor (casos futuros podrían enfocarse ahí). Tampoco es una autorización general para todas las compañías o todos los escenarios.

Consecuencias posteriores:

El caso avanzó a juicio por las copias piratas, pero Anthropic llegó a un acuerdo de $1.5 mil millones con autores y editores (uno de los mayores en la historia del copyright). El fallo de fair use sobre el entrenamiento se mantiene. washingtonpost.com

En resumen:

El juez Alsup trazó una línea clara: el entrenamiento transformador de IA es protegido si se hace con copias legítimas, pero la adquisición ilícita (piratería) no se justifica. Es un fallo equilibrado que favorece la innovación tecnológica sin ignorar completamente los derechos de los creadores, aunque muchos autores lo critican por subestimar el impacto en el mercado de la escritura profesional.

Referencias:

washingtonpost.com

timesofindia.indiatimes.com

lithub.com

futurism.com

techpolicy.press

goodwinlaw.com

La misteriosa empresa que compra libros viejos para entrenar a la IA y los destruye: “Es un expolio literario”

https://www.eldiario.es/
Pol Pareja

El librero Marçal Font, en su almacén de Badalona el pasado viernes. Kike Rincón

El primer pedido le pareció normal, el segundo ya le hizo sospechar. Marçal Font, propietario de la librería de viejo Fènix de Badalona, lleva semanas viendo cómo una misteriosa empresa canadiense le compra libros extraños: principalmente ejemplares en catalán que llevan años en su almacén, todos de no ficción y sin apenas salida comercial.

“Me pueden llegar siete pedidos seguidos del mismo comprador, con un minuto de diferencia entre ellos”, apunta este librero, que sospecha que quien hace las compras es un robot.

No es el único al que le ha ocurrido. Hay una veintena de librerías de viejo en España que también han vendido ejemplares a esta compañía desde finales de abril. Algunas incluso han recibido pedidos de más de mil libros, muchos de ellos descatalogados. Lo mismo está ocurriendo en tiendas de Alemania, EEUU, Nueva Zelanda, Australia…

Los libros elegidos van desde una edición sobre el mundo de los castellers en Granollers (Barcelona) en los años 70, hasta un manual técnico sobre cómo hacer vino, actas de congresos celebrados hace 50 años o dietarios de la Guerra Civil.

“De media suelen ser libros de unos cinco o diez euros, con poco valor”, apunta Font, “y muchos son prácticamente imposibles de encontrar”.

El sector está desconcertado. ¿Para quién está comprando esta empresa decenas de miles de libros y los hace mandar a un centro logístico de EEUU? ¿Para qué quiere estos ejemplares que llevan años pillando polvo?

Este viernes, otra compañía de Silicon Valley (EEUU) vinculada a la IA ha contactado con una librería de viejo española, que prefiere no revelar su nombre, y le ha planteado un pedido de más de 3.000 libros.

El objetivo, según apuntan diversas fuentes, es entrenar modelos de Inteligencia Artificial (IA) antes de destruir estos volúmenes y reciclar su papel.

La apuesta no es nueva. Una investigación de The Washington Post desveló en enero un proyecto secreto de la startup Anthropic, que opera la herramienta de IA Claude, para “escanear y destruir todos los libros del mundo”, según señalaba un informe interno de la compañía.

“No queremos que se sepa que estamos trabajando en esto”, remachaba el documento.

La estrategia se enmarca en la necesidad de seguir alimentando esta tecnología una vez ya se ha nutrido de toda la información disponible en Internet.

“Cuando el conocimiento gratuito se agotó, las empresas corrieron a repositorios piratas de e-books para seguir alimentando sus modelos”, explica Xavier Vinaixa, experto en IA y una de las personas que han tirado del hilo de este caso. “El uso de estos recursos desencadenó demandas millonarias por violación de derechos de autor”, añade.

Las tecnológicas se enfrentaron entonces, explica Vinaixa, a lo que se conoce como el “data wall”: sin textos nuevos, inéditos y largos para entrenar el algoritmo, la IA corría el riesgo de sufrir un estancamiento cognitivo y acabar incluso alimentándose de documentos creados por su propia tecnología.

La solución que encontraron estas compañías fue comprar en librerías de segunda mano de todo el mundo, normalmente ejemplares totalmente marginales de no ficción.

Un juez federal de EEUU dictaminó que la práctica es legal porque el uso que se hace de los libros es “transformativo”. Es decir, que no sustituye a las obras originales, sino que las emplea para crear algo nuevo: en este caso, un modelo de inteligencia artificial. El magistrado llegó a comparar el entrenamiento del algoritmo con “enseñar a escribir a estudiantes”.

La práctica, sin embargo, genera rechazo en parte del sector porque implica la destrucción física de los ejemplares para optimizar el proceso: cuando los libros llegan a la planta de procesamiento, se les corta el lomo, las páginas se escanean de forma automatizada y, posteriormente, los volúmenes se trituran para convertirlos en pasta de papel.
Contradicciones en el sector

Los libreros de viejo llevan semanas inmersos en una profunda contradicción: por un lado, nunca habían vendido tantos libros. Por otro, tienen serias dudas sobre el destino de estos ejemplares. Hasta el punto de que han alertado al Ministerio de Cultura de lo que está ocurriendo.

“No somos sólo comerciantes sino que tenemos funciones de preservación, conservación y restauración del patrimonio bibliográfico”, apunta Miguel Ángel Ortega, librero y presidente de la Asociación Profesional del Libro y Coleccionismo Antiguos (UNILIBER). “Resultaría muy contradictorio que estuviéramos vendiendo libros con la finalidad de destruirlos”.

“Estamos ante una forma de expolio literario”, opina Font, el librero de Badalona, que mientras habla con este periódico recibe otro pedido de la empresa canadiense. “Estamos viendo el tsunami que viene, creo que las instituciones deben intervenir”.

Font explica que con estas prácticas no se perderá, por ejemplo, lo que publicó Mercè Rodoreda. “Lo que está en riesgo es el libro que explica qué hizo Rodoreda el día que fue a algún lugar”, precisa. “De lo que se alimenta esta IA es de esta literatura secundaria”.

En foros especializados de todo el mundo hay cientos de mensajes de libreros asustados ante un aumento inusual de los pedidos. Los mensajes en Reddit, de libreros americanos, empezaron en enero. Al principal foro de Alemania las dudas llegaron a finales de abril.

“Ayer recibí un pedido (un libro). Lo envié. Durante la noche, recibí diez pedidos distintos, cada uno de un libro, algunos de los cuales eran consecutivos y estaban relacionados temáticamente”, escribe un librero alemán en un foro especializado.

Las primeras publicaciones versaban sobre si las compras podían ser un timo. Pasadas unas semanas y tras constatar que el dinero llegaba a los vendedores, el debate se ha centrado en quién está comprando miles de volúmenes sin recorrido comercial y por qué lo hace de una manera tan extraña: de manera escalonada y con costes de envío que en ocasiones triplican el precio de un ejemplar.

“Puede que no nos demos cuenta y estemos perdiendo una parte muy importante del patrimonio bibliográfico para siempre”, alerta Ortega, que define como “perversa” la situación a la que se enfrentan. “Te entran escalofríos si te hacen un gran pedido y no sabes qué ocurrirá con los libros”.

Carlos Hernández, propietario de la librería de viejo Mautalos en Madrid, ha vendido a esta empresa unos 200 libros en el último mes y no es tan pesimista. “Mucha parte de nuestro stock son libros que la gente quiere tirar”, explica por teléfono. “Incluso muchos de los que vendo los recoge gente en los contenedores”.

Puede que no nos demos cuenta y estemos perdiendo una parte muy importante del patrimonio bibliográfico para siempre
La compañía no responde a las preguntas

La empresa que está adquiriendo de forma masiva estos libros, Zoom Books, tampoco explica abiertamente cuál es el destino final de estos ejemplares que, en muchos casos, carecen de salida comercial.

Formalmente, Zoom Books se dedica al reciclaje y la compraventa de libros, pero la empresa tenía hasta cinco publicaciones en su web sobre comprar ejemplares de segunda mano para alimentar algoritmos de IA y después destruirlos. Los posts también recordaban que a través de su plataforma se cumplían los requisitos legales para hacerlo.

Ninguna de estas publicaciones está ya disponible en la web de Zoom Books, pero esta redacción ha podido acceder a su contenido tras introducir las direcciones en tres modelos de IA —Gemini, ChatGPT y Claude: todos coinciden a la hora de describir el contenido eliminado.

“Zoom Books es una librería de segunda mano; compramos excedentes y existencias usadas y las revendemos”, explica la empresa en un comunicado remitido a elDiario.es, en el que niega colaborar directamente con Anthropic.

Este periódico preguntó a la compañía si podía confirmar que sus libros no se destruían o se utilizaban para entrenar modelos de IA. También preguntó por las publicaciones eliminadas de la web en las que defendían estas prácticas.

“No hacemos comentarios sobre nuestros clientes ni sobre nuestros acuerdos comerciales, que están sujetos a acuerdos de confidencialidad”, se ha limitado a responder la compañía.

Archivologo Curriculum Vite

Resumen objetivo y detallado del artículo: "La IA Anthropic escanea y destruye libros"

>> martes, 26 de mayo de 2026

Proyecto para escanear todos los libros del mundo alimentar la IA y luego destruirlos

Seguidores

About

Archivo del blog

El Archivologo

UNESCO

Siguenos en X

Sigueme en Facebook

Mis Favoritos

Mis Enlaces

MIS TWITTERS

Etiquetas

USUARIOS SEGUIDORES

archivologo.blogspot.com

Snap Shots