Resumen objetivo y detallado del artículo: "La IA Anthropic escanea y destruye libros"
>> martes, 26 de mayo de 2026
Resumen objetivo y detallado del artículo: "La IA antrópica escanea y destruye libros" https://www.washingtonpost.com/technology/2026/01/27/anthropic-ai-scan-destroy-books/
Por: Lic. Carmen Marín con la colaboración de GROK

Título y contexto principal
El artículo, titulado "Inside an AI start-up’s plan to scan and dispose of millions of books" (o "Anthropic ‘destructively’ scanned millions of books to build Claude"), revela detalles del Project Panama, una iniciativa confidencial de Anthropic para adquirir, escanear y desechar de forma destructiva millones de libros físicos con el fin de obtener datos de entrenamiento para sus modelos de IA, como Claude. washingtonpost.com
Los detalles surgieron de más de 4.000 páginas de documentos judiciales desclasificados en una demanda por infracción de derechos de autor presentada por autores contra Anthropic.
washingtonpost.com
¿En qué consistió el Project Panama?
Inicio y objetivo:
A inicios de 2024, ejecutivos de Anthropic impulsaron el proyecto, descrito internamente como “nuestro esfuerzo para escanear destructivamente todos los libros del mundo”. La empresa quería mantenerlo en secreto: “No queremos que se sepa que estamos trabajando en esto”. timesofindia.indiatimes.com
Proceso:
Decisión:
Factor 1 (propósito y carácter del uso):
Factor 2 (naturaleza de la obra):
Factor 3 (cantidad y sustancialidad):
Factor 4 (efecto en el mercado):
Decisión:
También fair use. Anthropic podía comprar libros físicos, cortarlos, escanearlos y destruir los originales para crear copias digitales internas. techpolicy.press
Razonamiento:
Es un mero cambio de formato (print-to-digital) para mayor comodidad, ahorro de espacio y búsqueda. Se destruye el original físico, no se distribuye ni comparte fuera de la empresa. No añade copias nuevas al mercado.
Esto valida legalmente el enfoque de “escaneo destructivo” cuando se parte de compras legítimas (doctrina de primera venta).
3. Uso de copias piratas (descargadas de sitios como LibGen o PiLiMi)
Decisión:
No es fair use. Se denegó la sentencia sumaria a Anthropic y se ordenó ir a juicio por estos hechos.
goodwinlaw.com
Razones:
Crear y mantener una “biblioteca central” con millones de copias piratas (incluso si algunas se usaban para entrenamiento) no es transformador. Es una infracción independiente: “piratear para construir una biblioteca de investigación sin pagar” no se salva por el propósito final. El juez fue muy crítico: dudaba que descargar de fuentes piratas (cuando se podían comprar legalmente) fuera nunca “razonablemente necesario”.
Este punto es clave: el método de adquisición importa. El entrenamiento puede ser fair use, pero obtener los datos ilegalmente genera responsabilidad.
Implicaciones y limitaciones del fallo
No resuelve todo:
Consecuencias posteriores:
El artículo, titulado "Inside an AI start-up’s plan to scan and dispose of millions of books" (o "Anthropic ‘destructively’ scanned millions of books to build Claude"), revela detalles del Project Panama, una iniciativa confidencial de Anthropic para adquirir, escanear y desechar de forma destructiva millones de libros físicos con el fin de obtener datos de entrenamiento para sus modelos de IA, como Claude. washingtonpost.com
Los detalles surgieron de más de 4.000 páginas de documentos judiciales desclasificados en una demanda por infracción de derechos de autor presentada por autores contra Anthropic.
washingtonpost.com
¿En qué consistió el Project Panama?
Inicio y objetivo:
A inicios de 2024, ejecutivos de Anthropic impulsaron el proyecto, descrito internamente como “nuestro esfuerzo para escanear destructivamente todos los libros del mundo”. La empresa quería mantenerlo en secreto: “No queremos que se sepa que estamos trabajando en esto”. timesofindia.indiatimes.com
Proceso:
Compra masiva de libros usados (de librerías de segunda mano como The Strand, tiendas en línea, bibliotecas y posiblemente bibliotecas con problemas de financiación).
En aproximadamente un año, Anthropic gastó decenas de millones de dólares y procesó potencialmente millones de libros (una propuesta a proveedores hablaba de 500.000 a 2 millones de libros en un período de seis meses). Almacenaban libros en grandes almacenes. infodocket.com
El objetivo era enriquecer los modelos de IA con conocimiento amplio y diverso contenido en libros, más allá de lo disponible en internet o datos digitales.
Aspecto legal
Anthropic se basó en la doctrina de la primera venta (first-sale doctrine): una vez comprado un libro físico legalmente, el propietario puede hacer con él lo que quiera (incluyendo destruirlo para escanearlo), siempre que no distribuya copias infractoras. futurism.com
Un juez falló que esta práctica constituía uso justo (fair use) en el contexto del entrenamiento de IA.
washingtonpost.com
La empresa también usó otras fuentes como sitios de piratería (según los documentos), lo que forma parte de las acusaciones más amplias en demandas de copyright contra compañías de IA.
Reacciones y contexto más amplio
El artículo destaca la carrera de las empresas de IA por obtener más datos de libros para mejorar sus chatbots, en un momento de litigios intensos sobre derechos de autor. Anthropic buscó discreción porque sabía que la imagen de “destruir millones de libros” sería controvertida públicamente, a pesar de ser legal. futurism.com
Este reportaje se enmarca en el debate ético y legal más grande sobre el uso de obras protegidas para entrenar IA: autores argumentan pérdida de ingresos y control; las compañías defienden que es necesario para el avance tecnológico y que se trata de uso transformador. Aunque el artículo es neutral en tono, resalta el contraste entre las prácticas secretas de la industria y el impacto cultural de destruir ejemplares físicos de libros para crear “conocimiento” digital en IA. Incluye ilustraciones y referencias a imágenes de almacenes llenos de libros. lithub.com
Nota:
El artículo completo está detrás de paywall de The Washington Post, pero los documentos judiciales y coberturas posteriores (podcasts, otros medios) confirman y amplían estos hechos.
En el resumen se colocan los sitios o referencias de donde se obtuvo la información, se basa en extractos directos y reportes derivados confiables.
Análisis del fallo judicial del juez William Alsup en el caso Bartz v. Anthropic (junio de 2025).
techpolicy.press
El juez William Alsup (Tribunal de Distrito del Norte de California) emitió una orden de sentencia sumaria parcial el 23 de junio de 2025 en el caso presentado por los autores Andrea Bartz, Charles Graeber y Kirk Wallace Johnson contra Anthropic. Este es uno de los primeros fallos sustantivos sobre el uso de libros con derechos de autor para entrenar modelos de IA generativa (LLM como Claude).
goodwinlaw.com
El fallo es mixto (parcialmente favorable a Anthropic y parcialmente a los autores) y se centra en la doctrina de uso justo (fair use) bajo la Sección 107 de la Ley de Derechos de Autor de EE.UU.
Analiza tres usos distintos de las obras:
1. Uso de libros para entrenar los LLM (el núcleo del caso)
- Corte de los lomos (guillotina o “destructive scanning”) para separar las páginas y permitir un escaneo rápido y masivo.
- Escaneo de alta velocidad de las páginas.
- Reciclaje o disposición de los restos físicos (el papel se reciclaba). lithub.com
En aproximadamente un año, Anthropic gastó decenas de millones de dólares y procesó potencialmente millones de libros (una propuesta a proveedores hablaba de 500.000 a 2 millones de libros en un período de seis meses). Almacenaban libros en grandes almacenes. infodocket.com
El objetivo era enriquecer los modelos de IA con conocimiento amplio y diverso contenido en libros, más allá de lo disponible en internet o datos digitales.
Aspecto legal
Anthropic se basó en la doctrina de la primera venta (first-sale doctrine): una vez comprado un libro físico legalmente, el propietario puede hacer con él lo que quiera (incluyendo destruirlo para escanearlo), siempre que no distribuya copias infractoras. futurism.com
Un juez falló que esta práctica constituía uso justo (fair use) en el contexto del entrenamiento de IA.
washingtonpost.com
La empresa también usó otras fuentes como sitios de piratería (según los documentos), lo que forma parte de las acusaciones más amplias en demandas de copyright contra compañías de IA.
Reacciones y contexto más amplio
El artículo destaca la carrera de las empresas de IA por obtener más datos de libros para mejorar sus chatbots, en un momento de litigios intensos sobre derechos de autor. Anthropic buscó discreción porque sabía que la imagen de “destruir millones de libros” sería controvertida públicamente, a pesar de ser legal. futurism.com
Este reportaje se enmarca en el debate ético y legal más grande sobre el uso de obras protegidas para entrenar IA: autores argumentan pérdida de ingresos y control; las compañías defienden que es necesario para el avance tecnológico y que se trata de uso transformador. Aunque el artículo es neutral en tono, resalta el contraste entre las prácticas secretas de la industria y el impacto cultural de destruir ejemplares físicos de libros para crear “conocimiento” digital en IA. Incluye ilustraciones y referencias a imágenes de almacenes llenos de libros. lithub.com
Nota:
El artículo completo está detrás de paywall de The Washington Post, pero los documentos judiciales y coberturas posteriores (podcasts, otros medios) confirman y amplían estos hechos.
En el resumen se colocan los sitios o referencias de donde se obtuvo la información, se basa en extractos directos y reportes derivados confiables.
Análisis del fallo judicial del juez William Alsup en el caso Bartz v. Anthropic (junio de 2025).
techpolicy.press
El juez William Alsup (Tribunal de Distrito del Norte de California) emitió una orden de sentencia sumaria parcial el 23 de junio de 2025 en el caso presentado por los autores Andrea Bartz, Charles Graeber y Kirk Wallace Johnson contra Anthropic. Este es uno de los primeros fallos sustantivos sobre el uso de libros con derechos de autor para entrenar modelos de IA generativa (LLM como Claude).
goodwinlaw.com
El fallo es mixto (parcialmente favorable a Anthropic y parcialmente a los autores) y se centra en la doctrina de uso justo (fair use) bajo la Sección 107 de la Ley de Derechos de Autor de EE.UU.
Analiza tres usos distintos de las obras:
1. Uso de libros para entrenar los LLM (el núcleo del caso)
Decisión:
Es uso justo (fair use). Alsup concedió sentencia sumaria a favor de Anthropic. goodwinlaw.com
Razones principales (análisis de los 4 factores de fair use):
Razones principales (análisis de los 4 factores de fair use):
Factor 1 (propósito y carácter del uso):
Muy a favor de Anthropic. El entrenamiento es "exceedingly transformative" (extremadamente transformador). El juez comparó el proceso con un lector humano que lee libros para aprender a escribir algo nuevo y diferente, no para copiar o reemplazar las obras originales: “no para competir o desplazar, sino para dar un giro y crear algo distinto”. Lo describió como “uno de los usos más transformadores que veremos en nuestra vida”.
Factor 2 (naturaleza de la obra):
En contra (las obras son creativas y expresivas).
Factor 3 (cantidad y sustancialidad):
A favor. Usar obras completas era “razonablemente necesario” para el entrenamiento transformador. No hay evidencia de que el modelo generara copias exactas o knockoffs para el público.
Factor 4 (efecto en el mercado):
A favor. No desplaza la demanda de los libros originales (no genera copias exactas ni competidores directos que sustituyan la compra de libros). goodwinlaw.com
Conclusión de este punto:
El entrenamiento en sí de IA generativa sobre obras adquiridas legalmente es fair use, siempre que no produzca outputs infractores directos.
2. Conversión de libros físicos comprados a formato digital (Project Panama)
Conclusión de este punto:
El entrenamiento en sí de IA generativa sobre obras adquiridas legalmente es fair use, siempre que no produzca outputs infractores directos.
2. Conversión de libros físicos comprados a formato digital (Project Panama)
Decisión:
También fair use. Anthropic podía comprar libros físicos, cortarlos, escanearlos y destruir los originales para crear copias digitales internas. techpolicy.press
Razonamiento:
Es un mero cambio de formato (print-to-digital) para mayor comodidad, ahorro de espacio y búsqueda. Se destruye el original físico, no se distribuye ni comparte fuera de la empresa. No añade copias nuevas al mercado.
Esto valida legalmente el enfoque de “escaneo destructivo” cuando se parte de compras legítimas (doctrina de primera venta).
3. Uso de copias piratas (descargadas de sitios como LibGen o PiLiMi)
Decisión:
No es fair use. Se denegó la sentencia sumaria a Anthropic y se ordenó ir a juicio por estos hechos.
goodwinlaw.com
Razones:
Crear y mantener una “biblioteca central” con millones de copias piratas (incluso si algunas se usaban para entrenamiento) no es transformador. Es una infracción independiente: “piratear para construir una biblioteca de investigación sin pagar” no se salva por el propósito final. El juez fue muy crítico: dudaba que descargar de fuentes piratas (cuando se podían comprar legalmente) fuera nunca “razonablemente necesario”.
Este punto es clave: el método de adquisición importa. El entrenamiento puede ser fair use, pero obtener los datos ilegalmente genera responsabilidad.
Implicaciones y limitaciones del fallo
Victoria parcial para la industria IA:
Establece que el entrenamiento de LLM con obras con copyright (adquiridas legalmente) puede calificarse como fair use transformador. Es un precedente útil, pero estrecho (aplica específicamente a los hechos del caso y a los tres autores demandantes en ese momento). techpolicy.press
Advertencia clara:
Establece que el entrenamiento de LLM con obras con copyright (adquiridas legalmente) puede calificarse como fair use transformador. Es un precedente útil, pero estrecho (aplica específicamente a los hechos del caso y a los tres autores demandantes en ese momento). techpolicy.press
Advertencia clara:
La piratería no se tolera. Las empresas deben adquirir legalmente los datos (compra, licencias, etc.).
No resuelve todo:
No aborda si los outputs generados por la IA infringen derechos de autor (casos futuros podrían enfocarse ahí). Tampoco es una autorización general para todas las compañías o todos los escenarios.
Consecuencias posteriores:
El caso avanzó a juicio por las copias piratas, pero Anthropic llegó a un acuerdo de $1.5 mil millones con autores y editores (uno de los mayores en la historia del copyright). El fallo de fair use sobre el entrenamiento se mantiene. washingtonpost.com
En resumen:
En resumen:
El juez Alsup trazó una línea clara: el entrenamiento transformador de IA es protegido si se hace con copias legítimas, pero la adquisición ilícita (piratería) no se justifica. Es un fallo equilibrado que favorece la innovación tecnológica sin ignorar completamente los derechos de los creadores, aunque muchos autores lo critican por subestimar el impacto en el mercado de la escritura profesional.
Referencias:
washingtonpost.com
timesofindia.indiatimes.com
lithub.com
futurism.com
techpolicy.press
goodwinlaw.com
0 comentarios :
Publicar un comentario