Contenido Fantasma o datos no estructurados: el Criterio Archivístico como Motor de la Inteligencia Empresarial

>>  jueves, 5 de febrero de 2026

Gobernanza de la Información no Estructurada
Por: Lic. carmen Marín con apoyo de Gemini




El Criterio Archivístico como Motor de la Inteligencia Empresarial
 
1. El Diagnóstico: La Trampa de la Automatización sin Control


Tras una investigación de las tendencias actuales en gestión de contenidos, se observa que muchas organizaciones cometen el error de implementar soluciones de Inteligencia Artificial (IA) bajo una visión puramente tecnológica. El resultado suele ser la creación de silos digitales más rápidos, pero igual de caóticos.

El 90% de los datos no estructurados no se resuelve con más almacenamiento, sino con valoración y clasificación, procesos que pertenecen estrictamente a la ciencia archivística.
 
2. El Criterio Archivístico en la Implementación de IA

El rol del profesional de la archivología, en la implementación de tecnologías de captura inteligente no es operativo, sino estratégico y prescriptivo. La IA es el "músculo", pero el archivólogo es el "cerebro" que dicta las reglas:

  • Entrenamiento Semántico: La IA clasifica mediante lenguaje natural, pero es el archivólogo quien define el tesauro y el vocabulario controlado para que la máquina no confunda una "factura de servicios" con un "contrato de consultoría".
  • Determinación de Metadatos Críticos: El archivólogo investiga qué datos son necesarios para la trazabilidad legal y administrativa, instruyendo a los sistemas sobre qué extraer para que el documento tenga valor probatorio.
  • Gobernanza del Ciclo de Vida: Un sistema de IA puede etiquetar un documento, pero solo el criterio archivístico determina, basándose en la normativa vigente, si ese documento debe conservarse 5, 20 años o de forma permanente.


3. Modelo de Colaboración Interdisciplinaria

Para enfrentar el "Contenido Fantasma", es imperativo diferenciar las esferas de actuación para evitar el desplazamiento de competencias:

Área de Investigación

Responsabilidad de Sistemas (IT)

Responsabilidad de Archivología

Infraestructura

Mantener los servidores y la conectividad del motor de IA.

Definir la arquitectura de la información y la jerarquía de fondos.

Captura de Datos

Asegurar que la herramienta de extracción funcione técnicamente.

Validar la integridad y autenticidad del dato extraído.

Seguridad

Cifrado de datos y control de perímetros (Firewalls).

Clasificación de seguridad basada en la sensibilidad del contenido.

Eliminación

Borrado físico de los datos en los discos.

Dictamen de valoración para la eliminación legalmente segura.



4. Conclusión 

La investigación demuestra que el éxito de la transformación digital no reside en el software, sino en la metodología. El profesional de sistemas garantiza que el software corra; el profesional de la archivología garantiza que la información sirva.

Sin la intervención del archivólogo, la empresa corre el riesgo de automatizar la obsolescencia y perder el control sobre su responsabilidad legal. Mi propuesta es liderar la configuración de estas herramientas desde el diseño (Privacy and Archiving by Design), asegurando que el contenido deje de ser "fantasma" para convertirse en un activo auditable.


El archivólogo no no es un "organizador de papeles", es el Arquitecto de Reglas de Negocio esenciales para que cualquier IA empresarial pueda operar sin riesgos legales.

Read more...

El Contenido fantasma o datos no estructurados desde la perspectiva profesional de un archivólogo

El Contenido fantasma o datos no estructurados desde la perspectiva profesional de un archivólogo
Autor: Licenciada Carmen Marín, con apoyo de Grok




El enfoque resalta la vital importancia de organizarlos mediante procesos archivísticos especializados, y pone de manifiesto el error común de delegar esta responsabilidad exclusivamente a profesionales de sistemas de información o TI, sin tomar en cuenta al experto en archivología.

El "contenido fantasma" empresarial

Por qué es vital organizar los datos no estructurados desde la archivología

En el entorno empresarial actual, se estima que aproximadamente el 90% de los datos generados por las organizaciones son no estructurados. Estos datos —que incluyen correos electrónicos, documentos en PDF o Word, presentaciones, informes, contratos, imágenes, videos, mensajes en plataformas colaborativas y otros formatos dispersos— carecen de una estructura predefinida, se encuentran en silos desconectados y resultan difíciles, cuando no imposibles, de localizar, recuperar o utilizar de manera eficaz.

Como bien se describe, representan el "contenido fantasma" de la organización: un vasto volumen de información valiosa que permanece invisible, infrautilizada y expuesta a riesgos.

Organizar estos datos no es un mero ejercicio técnico de almacenamiento o indexación informática; es una necesidad estratégica que garantiza la autenticidad, integridad, fiabilidad y disponibilidad de la información a lo largo del tiempo.

Desde la visión de la archivología, estos datos son documentos de archivo en sentido amplio: evidencias de las actividades, decisiones y obligaciones de la empresa.

Su desorganización genera
  • pérdidas económicas (por duplicidad de esfuerzos,
  • tiempos de búsqueda excesivos o decisiones basadas en información incompleta),
  • riesgos legales (incumplimiento de normativas de retención, protección de datos o auditorías),
  • vulnerabilidades de seguridad (exposición de información sensible) y, sobre todo,
  • la imposibilidad de transformar ese "fantasma" en un activo real para la toma de decisiones, la innovación y la competitividad.
La mayoría de las empresas cometen un error conceptual grave al asumir que este problema corresponde exclusivamente a los profesionales de sistemas o tecnologías de la información. Si bien los expertos en TI son esenciales para la infraestructura técnica (almacenamiento en la nube, bases de datos no relacionales o herramientas de IA para procesamiento), la gestión eficaz de datos no estructurados requiere el enfoque archivístico profesional.

El archivólogo aporta el conocimiento teórico-metodológico específico para:
  • Clasificación archivística: Identificar las series documentales, funciones y actividades que generan estos datos, estableciendo esquemas de clasificación funcionales que reflejen el contexto orgánico de la empresa (no solo por tipo de archivo o fecha).
  • Ordenación y descripción: Aplicar métodos de ordenación (cronológica, alfabética, numérica o combinada) y descripción normalizada, incorporando metadatos que capturen el contexto, contenido y estructura de los documentos, asegurando su trazabilidad y recuperación eficiente.
  • Valoración y selección: Evaluar el valor administrativo, legal, fiscal y probatorio de los documentos para definir tablas de retención y disposición final, evitando la acumulación innecesaria y garantizando el cumplimiento normativo.
  • Preservación y conservación: Implementar estrategias para mantener la autenticidad e integridad a largo plazo, incluyendo migración de formatos y planes de preservación digital.
  • Gestión del ciclo de vida documental: Desde la creación/captura hasta la disposición, integrando los datos no estructurados en sistemas de gestión documental que respeten principios archivísticos.
Estos procesos están alineados con estándares internacionales como la ISO 15489 (Gestión de documentos de archivo), que enfatiza un control sistemático y responsable de la información como evidencia organizacional.

Delegar esta responsabilidad solo a TI suele resultar en soluciones parciales: repositorios masivos sin contexto archivístico, búsquedas ineficaces o falta de control sobre la vida útil de los documentos.

El archivólogo, como especialista en la gestión de la memoria organizacional, es el profesional idóneo para liderar o colaborar estrechamente en estas iniciativas, integrando la perspectiva técnica con la archivística. Solo así el "contenido fantasma" deja de ser un lastre y se convierte en un recurso estratégico, accesible y confiable.

En resumen, organizar los datos no estructurados no es un problema tecnológico puro, sino un desafío archivístico. Las empresas que reconozcan el rol central del archivólogo en esta tarea no solo mitigan riesgos, sino que liberan el verdadero valor oculto de su información.

Las diferencias entre archivología (o archivística, según el término usado en diferentes contextos hispanohablantes) y TI (Tecnologías de la Información) son fundamentales, especialmente en la gestión de documentos y datos en organizaciones. Aunque ambas disciplinas interactúan cada vez más en entornos digitales, sus enfoques, objetivos, principios y competencias son distintos. A continuación, se presenta una comparación clara y estructurada.

1. Definición y objeto de estudio

Archivología / Archivística: Es la disciplina científica y profesional que estudia los archivos como conjuntos orgánicos de documentos generados por una persona, entidad o actividad (pública o privada). Se centra en la gestión del ciclo de vida documental completo: desde la creación, captura, clasificación, valoración, conservación, descripción, acceso y disposición final (incluyendo eliminación o transferencia a archivo histórico). El documento de archivo se entiende como evidencia y memoria de las actividades, con énfasis en su autenticidad, integridad, fiabilidad y contexto orgánico.

TI (Tecnologías de la Información): Es el conjunto de disciplinas y prácticas relacionadas con el desarrollo, implementación, mantenimiento y uso de sistemas informáticos, redes, software, hardware y datos. Se enfoca en la tecnología como herramienta para procesar, almacenar, transmitir y proteger información en general (datos estructurados, no estructurados, transaccionales, big data, etc.).

2. Enfoque principal

Archivología: Contextual y probatorio. Prioriza el porqué y el para qué de los documentos: su valor administrativo, legal, fiscal, probatorio e histórico. Busca preservar el contexto de creación (quién, cuándo, por qué y en qué función se generó el documento) para garantizar su valor como prueba.

TI: Técnico y operativo. Se centra en el cómo: eficiencia, rendimiento, escalabilidad, seguridad informática, accesibilidad rápida, automatización, análisis de datos y soporte tecnológico.

3. Principios y normas claves

Archivología: Se rige por principios archivísticos como procedencia, orden original, ciclo de vida documental, valoración y estándares como ISO 15489 (Gestión de documentos), ISO 30300 (Sistemas de gestión de documentos) y normativas nacionales de archivos (ej. tablas de retención documental).

TI: Se basa en estándares técnicos como ISO/IEC 27001 (seguridad de la información), ITIL (gestión de servicios TI), frameworks de desarrollo (Agile, DevOps), ciberseguridad, cloud computing y bases de datos.

4. Competencias y roles típicos

Archivólogo:
  • Clasificación funcional y por series documentales.
  • Valoración y elaboración de tablas de retención y disposición.
  • Descripción archivística (metadatos contextuales, ISAD(G), NORMAS).
  • Preservación a largo plazo (autenticidad digital, migración de formatos).
  • Gestión de riesgos legales y cumplimiento normativo (acceso a información pública, protección de datos personales).
Profesional de TI:
  • Diseño e implementación de infraestructuras (servidores, redes, cloud).
  • Desarrollo de software y aplicaciones.
  • Gestión de bases de datos y big data.
  • Ciberseguridad, backups y recuperación de desastres.
  • Soporte técnico y optimización de rendimiento.
5. Relación y complementariedad

La archivología no sustituye a TI, ni TI a la archivología. En la era digital, ambas son complementarias:
  • TI proporciona las herramientas tecnológicas (sistemas de gestión documental electrónica - SGDE, ECM, repositorios digitales, IA para OCR o clasificación automática).
  • La archivología aporta el marco conceptual y metodológico para que esos sistemas respeten los principios archivísticos y eviten perder el valor probatorio de los documentos (ej. un sistema tecnológico puede almacenar millones de archivos, pero sin clasificación archivística y metadatos adecuados, no se garantiza su fiabilidad como evidencia legal).

Muchas empresas cometen el error de pensar que un proyecto de gestión documental es "solo TI", cuando en realidad requiere liderazgo archivístico para definir procesos, políticas y controles. Tabla comparativa resumida 

 

Categoría

Archivología / Archivística

Tecnologías de la Información (TI)

Objeto principal

Documentos de archivo como evidencia orgánica.

Información y datos en sistemas tecnológicos.

Enfoque

Contextual, probatorio e histórico-legal.

Técnico, operativo y eficiente.

Ciclo de interés

Todo el ciclo de vida (creación $\rightarrow$ disposición).

Principalmente creación, almacenamiento y acceso.

Principios clave

Procedencia, orden original y valoración.

Escalabilidad, seguridad y rendimiento.

Normas representativas

ISO 15489, ISAD(G), Cuadros de Clasificación.

ISO 27001, ITIL, COBIT.

Riesgo si se ignora

Pérdida de valor probatorio y del contexto.

Fallos técnicos y brechas de seguridad.

Rol organizacional

Memoria institucional y cumplimiento legal.

Infraestructura y herramientas digitales.


En conclusión, mientras TI construye y mantiene el "cómo" digital, la archivología asegura el "qué", "por qué" y "para qué" de la información como patrimonio y evidencia confiable. Su colaboración es esencial para una gestión documental efectiva en el siglo XXI


Referencias bibliográficas

ISO 15489-1:2016. Información y documentación — Gestión de documentos de archivo — Parte 1: Conceptos y principios. International Organization for Standardization.

Box Blog / IDC (2023). "90% of your data is unstructured — and it's full of untapped value". Disponible en: https://blog.box.com/90-your-data-unstructured-and-its-full-untapped-value

IBM (s.f.). "Conquering the 3 core challenges of unstructured data". Disponible en: https://www.ibm.com/think/insights/conquering-3-core-challenges-unstructured-data

Pure Storage (s.f.). "¿Qué es la gestión de datos no estructurados? Herramientas, bases de datos y análisis". Disponible en: https://www.purestorage.com/es/knowledge/what-is-unstructured-data-management.html

Archivo General de la Nación (Colombia). Cartilla de Ordenación Documental. Disponible en: https://www.archivogeneral.gov.co/caja_de_herramientas/docs/5.%20organizacion/DOCUMENTOS%20TECNICOS/CARTILLA%20DE%20ORDENACION%20DOCUMENTAL.pdf

Athento (2025). "Información no estructurada: el gran desafío (y oportunidad) de las empresas en 2025". Disponible en: https://www.athento.com/es/informacion-no-estructurada-el-gran-desafio-y-oportunidad-de-las-empresas-en-2025

Read more...

Desclasificación de los Archivos Epstein se menciona a Costa Rica 324 veces en correos electrónicos, conversaciones telefónicas y expedientes judiciales

>>  miércoles, 4 de febrero de 2026

Costa Rica aparece citada 324 veces en los archivos Epstein: Lea lo que dicen

https://crhoy.com/
Álvaro Sánchez



Las desclasificación de los Archivos Epstein que hizo el Departamento de Justicia de los Estados Unidos dejó al descubierto decenas de documentos donde se menciona a Costa Rica 324 veces en correos electrónicos, conversaciones telefónicas y expedientes judiciales, según una búsqueda que realizó CR Hoy.

Gran parte de esas comunicaciones están relacionadas con la búsqueda de niñas de entre los 14 y 16 años para mantener relaciones sexuales, situación que fue confirmada por la Agencia de Investigaciones Federales de los Estados Unidos (FBI), que realizó una operación encubierta utilizando una falsa agencia de viajes llamada Costa Rica Taboo Vacations.

En varias de esas comunicaciones que, además, forman parte de varios expedientes judiciales en una Corte de La Florida, en Estados Unidos, se relata lo siguiente:

"D (persona que envía el correo) respondió a un anuncio en un periódico de Costa Rica Taboo Vacations, una agencia de viajes falsa dirigida por investigadores federales. D negoció y pagó un viaje a Costa Rica en el que planeaba tener relaciones sexuales con menores de 16 años. Hizo arreglos para que Taboo Vacations le proporcionara sexo con menores de edad con chicas costarricenses en EE. UU. D. organizó una reunión en un hotel. D. fue arrestado en el hotel", relata el archivo.

Los correos electrónicos desclasificados tienen fechas de entre el 2012 y 2015, según la documentación liberada por el Departamento de Justicia de los Estados Unidos.

Los Archivos Epstein (o Epstein files, en inglés) son una enorme colección de documentos, imágenes y vídeos relacionados con las investigaciones federales y judiciales del estadounidense Jeffrey Epstein, un financiero que fue condenado por delitos sexuales y murió en prisión en 2019 mientras esperaba un nuevo juicio por tráfico sexual de menores.

Los archivos incluyen materiales recopilados por el Departamento de Justicia de Estados Unidos y otras agencias durante décadas de investigaciones criminales. Entre ellos están: documentos de casos judiciales, registros de vuelo y listas de contactos, correos electrónicos y comunicaciones, fotografías e imágenes confiscadas de propiedades y vídeos relacionados con las investigaciones.

En total, la colección que se ha hecho pública hasta ahora supera 3 millones de páginas, con miles de imágenes y vídeos, aunque muchos siguen en el anonimato por razones legales y para proteger a las víctimas.

El viernes 30 de enero, elDepartamento de Justicia divulgó aproximadamente 3,5 millones de páginas de registros, lo que significa la liberación más grande de material hasta ahora conforme a la ley de transparencia. Los archivos se hicieron públicos principalmente por presión política y legal para aumentar la transparencia sobre los crímenes de Epstein y sus posibles conexiones con personas de alto perfil. El objetivo es que el público y los investigadores puedan revisar evidencia que anteriormente estaba sellada o inaccesible.

Menores en Costa Rica

Los documentos donde se menciona a Costa Rica contienen numerosos correos electrónicos sobre visitas de conocidos de Epstein al país, incluso, con quien fue su pareja, Ghislaine Maxwell, señalada como parte de la organización criminal que conseguía menores de edad en varias partes del mundo.

"El segundo caso se refiere a operaciones encubiertas de turismo sexual en las que los acusados ​​se inscribieron en unas Vacaciones Tabú, generalmente para ir a Costa Rica a tener relaciones sexuales con menores. Llamadas telefónicas a Costa Rica Taboo Vacations para organizar un viaje a Costa Rica con el fin de reunirse con prostitutas menores de edad es suficiente para demostrar violaciones. D llamó a una agencia de viajes para organizar un viaje a Costa Rica para tener relaciones sexuales con menores. D (quien se comunica con Epstein) mantuvo varias conversaciones telefónicas con la agencia de viajes. D compró boletos e hizo reservas en el hotel. D fue arrestado en el aeropuerto. D intentó concertar una cita para tener relaciones sexuales con menores de edad en Costa Rica a través de una falsa agencia de viajes", añaden los documentos.

El documento federal señala que el intercambio de comunicaciones se hizo con sujetos identificados como Derek, Wallace Strevell y Clarke. Alguno de ellos pudo ser agente federal de los Estados Unidos, ya que la agencia de viajes fue parte del engaño para la investigación.


Entre los documentos hay un correo electrónico, con fecha del 23 de junio del 2012, en el que una persona identificada como Danielsiad le envía a Epstein comentándole que se encuentra participando en el Miss Costa Rica:

"Estoy aquí participando para miss … Costa – Rica, disfruten París, ya saben mi posición, muy decepcionada. Les deseo todo lo mejor. Saludos cordiales Daniel", dice el correo.

Sin embargo, la fecha no coincide con la realización del concurso de belleza durante ese año. Según los reporte oficiales, la Gala de Coronación se llevó a cabo el 13 de abril del 2012.

Los archivos Epstein sí pueden tener repercusiones judiciales, pero no de forma automática ni inmediata. Depende mucho de qué contengan exactamente y cómo se usen. Según explica el Departamento de Justicia de los Estados Unidos, depende de la obtención de prueba que permita confirmar contactos de alto perfil e identificación de víctimas.

Read more...

Gestión responsable de documentos y residuos electrónicos en desuso

Economía avanza en la gestión responsable de documentos y residuos electrónicos en desuso

https://sisanjuan.gob.ar/
Prensa Ministerio de Economía, Finanzas y Hacienda

La iniciativa incluyó la desafectación documental de la Dirección de Recursos Humanos y el retiro de más de 200 kilos de residuos electrónicos, en articulación con el área ambiental de la provincia.


El Ministerio de Economía, Finanzas y Hacienda de la provincia de San Juan, a través de la Dirección de Recursos Humanos, llevó adelante un importante proceso de organización, clasificación y desafectación de documentación y equipamiento en desuso perteneciente a la Dirección, en el marco de una política integral de modernización administrativa y gestión ambiental responsable.

Como parte de este trabajo, el jueves 8 de enero se concretó el retiro de 208,3 kilogramos de Residuos de Aparatos Eléctricos y Electrónicos (RAEE), correspondientes a material de hardware de PC fuera de uso. La acción se realizó de manera conjunta con la Secretaría de Ambiente y Desarrollo Sustentable de San Juan, a través de la Subsecretaría de Residuos.

El procedimiento se desarrolló luego de un exhaustivo relevamiento del archivo de la Dirección de Recursos Humanos y Organización del Empleo Público, que incluyó tareas de clasificación, descripción, elaboración de bases de datos y evaluación del valor administrativo, contable y jurídico del material, conforme a la normativa vigente y a las tablas de retención documental aprobadas por el Sistema Provincial de Archivos (SIPAR).

El material electrónico retirado fue recibido por el área ambiental para su tratamiento adecuado en el Parque de Tecnologías Ambientales, donde se aplican procesos específicos para la gestión sustentable de este tipo de residuos, evitando su impacto negativo en el ambiente.

En paralelo, se avanzó en el proceso de transferencia de legajos y fichas a las reparticiones de origen, como el Ministerio de Educación, la Secretaría General de la Gobernación y el Ministerio de Salud, garantizando la correcta trazabilidad de la información y fortaleciendo el orden administrativo del Estado provincial.

Estas acciones reflejan el compromiso del Ministerio con una gestión documental eficiente, transparente y moderna, que no solo mejora la organización interna y la calidad del servicio público, sino que también incorpora criterios de sustentabilidad ambiental, alineados con las políticas provinciales de cuidado del entorno y uso responsable de los recursos.

Read more...

La seguridad documental se ha convertido en una preocupación de primer orden

La seguridad documental: un pilar esencial para las organizaciones modernas

https://www.muycomputerpro.com/
Marcos Sagrado


En la actualidad, las empresas operan inmersas en un entorno cada vez más digitalizado, donde los documentos electrónicos y la información digital constituyen activos estratégicos. En este contexto, la seguridad documental se ha convertido en una preocupación de primer orden. Los ciberataques, las filtraciones de datos o los accesos indebidos ya no son riesgos aislados, sino amenazas cotidianas capaces de afectar la reputación, la rentabilidad e incluso la continuidad de un negocio.

Garantizar la protección y la integridad de los datos ya no es una opción: es una necesidad operativa y competitiva. Las organizaciones que no implementan estrategias sólidas de seguridad documental quedan expuestas a consecuencias graves, desde sanciones legales hasta pérdida de confianza por parte de clientes y socios. Por ello, las soluciones de gestión documental moderna asumen la seguridad como un componente central de su diseño y funcionamiento, integrando medidas avanzadas de control, cifrado, auditoría y cumplimiento normativo.

La importancia estratégica de la seguridad en la gestión documental

La seguridad en la gestión documental abarca más que la simple protección de archivos frente a accesos no autorizados. Implica garantizar la confidencialidad, la integridad y la disponibilidad de la información a lo largo de su ciclo de vida. En otras palabras, asegurar que los datos estén protegidos, permanezcan inalterables y estén disponibles cuando se los necesite.

En los entornos empresariales actuales, la información es uno de los mayores activos de valor. La pérdida, corrupción o exposición de datos sensibles puede acarrear impactos severos: interrupciones operativas, pérdida de oportunidades comerciales, sanciones regulatorias y daños irreparables a la imagen corporativa. Implementar un sistema de gestión documental seguro permite mitigar estos riesgos y establecer una base sólida para la innovación y la eficiencia.

Características clave de los sistemas de gestión documental seguros

A continuación se enumeran las principales características que debe tener un sistema de gestión documental moderno y seguro: 

  • Cifrado avanzado de datos: Los sistemas modernos utilizan algoritmos de cifrado robustos que aseguran que, incluso si los datos son interceptados, permanezcan inaccesibles. Este tipo de protección se aplica tanto a los archivos almacenados como a los datos en tránsito, garantizando seguridad de extremo a extremo.
  • Gestión rigurosa de accesos: La administración de permisos es una de las claves de la seguridad documental. Los sistemas permiten definir roles y niveles de acceso para cada usuario o grupo, estableciendo quién puede ver, modificar, aprobar o compartir determinados documentos. Esto reduce al mínimo el riesgo de fugas internas o manipulación indebida.
  • Auditoría y trazabilidad: Una buena solución de gestión documental incluye herramientas que registran cada acción realizada sobre un documento: quién accedió, cuándo lo hizo y qué cambios efectuó. Estos registros son esenciales para detectar comportamientos sospechosos, cumplir con normativas y garantizar procesos transparentes y verificables.
  • Cumplimiento normativo y regulatorio: En muchos sectores —como el financiero, sanitario o legal—, existen estrictas regulaciones sobre cómo debe gestionarse la información. Los sistemas documentales seguros ayudan a cumplir con estándares internacionales como GDPR, ISO?27001 o ENS, protegiendo a las organizaciones frente a sanciones y auditorías.
  • Protección contra amenazas internas y externas: Las amenazas no siempre provienen de agentes externos. El error humano, la negligencia o incluso el acceso deliberado a información sensible por parte de empleados pueden representar un riesgo significativo. Por ello, las plataformas seguras combinan tecnologías de detección con políticas claras de uso y control.
¿Qué beneficios tiene para la organización una gestión documental segura?

La implementación de un sistema de gestión documental seguro aporta beneficios que van más allá de la simple protección de datos, entre los más relevantes destacan estos:

  • Prevención de ciberataques y fugas de información, que protege la continuidad operativa y evita pérdidas económicas.
  • Cumplimiento normativo eficiente, reduciendo el riesgo de sanciones por incumplimiento legal.
  • Optimización de procesos internos, gracias al acceso rápido, controlado y centralizado a la información relevante.
  • Reducción de costes, al minimizar incidencias de recuperación de datos y simplificar la gestión de archivos.
  • Refuerzo de la reputación corporativa, proyectando una imagen de empresa confiable, responsable y comprometida con la seguridad.
  • Aumento de la confianza de clientes, socios y proveedores, fortaleciendo las relaciones comerciales a largo plazo.
En suma, un entorno documental seguro no solo protege los activos digitales, sino que contribuye directamente a la eficiencia, productividad y sostenibilidad corporativa.

Desafíos y estrategias de implementación

Adoptar un sistema de gestión documental seguro requiere planificación y compromiso organizativo. Entre los principales retos se encuentran la resistencia al cambio, la inversión inicial y la complejidad de integración con otras plataformas o sistemas heredados.

Para superar estos desafíos, se recomienda seguir una estrategia progresiva que incluya:Un análisis profundo de necesidades y riesgos específicos de la organización.

  • La selección de una solución escalable y compatible con la infraestructura existente.
  • La formación y sensibilización del personal sobre buenas prácticas en seguridad de la información.
  • Un enfoque gradual de implementación, con fases de prueba, despliegue y mejora continua.
  • El apoyo activo de la alta dirección, que refuerce la cultura de protección de datos como valor corporativo.
Las empresas que integran la seguridad documental dentro de su estrategia digital no solo reducen riesgos, sino que aumentan su capacidad de adaptación ante los cambios tecnológicos y regulatorios del mercado.

En un entorno donde la información digital crece exponencialmente y las amenazas evolucionan con rapidez, invertir en seguridad documental ya no es una medida preventiva, sino una estrategia clave de negocio. Las organizaciones que adoptan soluciones seguras de gestión documental disfrutan de una protección más sólida, procesos más eficientes y una ventaja competitiva basada en la confianza. La seguridad de los documentos digitales es hoy un pilar esencial de la gestión empresarial moderna.

Proteger la información es proteger el valor, la continuidad y el futuro de la empresa.

Read more...

CUIDADO: Generalitat separa archivos históricos y patrimonino documental de archivos administrativos y gestión documental

Rovira se lleva a Hacienda la gestión de los archivos administrativos que hasta ahora gestionaba Cultura

https://www.levante-emv.com
Voro Contreras

Compromís critica que se cambie el enfoque histórico por criterios de eficiencia y economía en la gestión de los documentos que genera la Generalitat

La consellera de Cultura, Carmen Ortí, y el conseller de Hacienda, José Antonio Rovira. / Manuel Bruque


El nuevo Decreto-ley 14/2025, de simplificación administrativa, aprobado por el Consell del PP, supone un reordenamiento del sistema archivístico y de bibliotecas valenciano, parte del cual pasa a estar bajo el control de la conselleria de Hacienda y no, como hasta ahora, de la de Cultura. Un cambio que, según ha denunciado Compromís, convertirá la “memoria colectiva” en “un mero expediente administrativo”.

Con este decreto, la Generalitat separa de forma expresa dos ámbitos que hasta ahora dependían íntegramente de Cultura: los archivos históricos y patrimonino documental, que siguen bajo la tutela de esta conselleria, y los archivos administrativos y gestión documental, que pasan a depender del área que ahora gestiona el conseller José Antonio Rovira, quien precisamente fue hasta hace unos meses titular de Cultura. Esto supone que los documentos generados por la Administración -expedientes, series documentales, archivos intermedios, documentación electrónica- dejan de gestionarse desde una lógica cultural y pasan a integrarse plenamente en el ámbito administrativo y económico.

Las razones del cambio

El propio decreto justifica el traslado de los archivos administrativos a Hacienda partiendo de la idea de que estos archivos no son una institución cultural, sino una herramienta interna de la gestión pública. El texto sostiene que los archivos deben responder a las necesidades informativas de la Administración, facilitar la rapidez en la toma de decisiones y garantizar una conexión permanente entre las unidades que producen los documentos y los órganos que los gestionan.

Además, el texto argumenta que el modelo anterior, con Cultura gestionando todo el sistema archivístico, no se adapta a las exigencias actuales de una Administración digitalizada, compleja y sometida a crecientes obligaciones de control, eficiencia y simplificación. Hacienda se presenta como el “órgano natural” para asumir estas funciones porque ya ejerce competencias transversales en organización administrativa, procedimientos, gestión económica, tecnologías corporativas y racionalización de recursos.

Eficiencia y coste

Desde el punto de vista jurídico, el decreto no elimina la conservación del patrimonio documental, pero sí desplaza el centro de gravedad de las decisiones hacia criterios administrativos, de eficiencia y coste. De este traslado funcional de competencias, con capacidad normativa y decisoria, Compromís ha criticado especialmente la decisión de situar la Junta Calificadora de Documentos Administrativos en el ámbito de Hacienda.

Este órgano es clave en cualquier sistema archivístico ya que es quien emite los dictámenes vinculantes sobre las tablas de valoración documental. Así pues, será Hacienda y no Cultura quién decida qué documentos se conservan de forma permanente, cuáles se eliminan y cuándo un documento deja de tener valor administrativo y pasa a histórico.

Para Compromís, este cambio no es neutro. Tal como ha señalado su portavoz de Cultura en Les Corts, Verónica Ruiz, “es la primera vez que la decisión sobre la conservación de documentos públicos deja de estar en manos de Cultura. Quien controla el presupuesto pasa a decidir qué recordamos y qué se olvida”.

Compromís también sostiene que este cambio implica además que la memoria administrativa deja de ser considerada patrimonio cultural -es decir, un derecho cultural y ciudadano- para pasar a tratarse como un simple recurso interno de gestión. Según Ruiz, el decreto no refuerza el acceso público a los archivos, no mejora la participación ciudadana, no incorpora una perspectiva de derechos culturales ni de memoria democrática, y se ampara exclusivamente en la “simplificación administrativa”.

Hacienda interviene en las bibliotecas

Desde esta óptica, el riesgo, según Compromís, no estaría tanto en una censura directa, sino en la priorización sistemática de criterios económicos, de espacio o de rapidez frente a la transparencia, la rendición de cuentas y el acceso a la información pública. “Gobernar no puede ser borrar”, ha advertido Ruiz,

En el caso de las bibliotecas, el decreto no realiza un traspaso tan claro como en los archivos administrativos, pero sí introduce una novedad relevante: la tutela, inspección y coordinación de bibliotecas pasa a corresponder a las consellerias competentes “en particular a las de Hacienda y Cultura, en el ámbito de sus respectivas atribuciones”.

De esta forma, Cultura sigue siendo la conselleria responsable de la política bibliotecaria, los servicios, las colecciones y la función cultural. Sin embargo, Compromís alerta de que esta redacción del decreto ley abre la puerta a una intervención creciente de Hacienda en aspectos que hasta ahora eran exclusivamente culturales: inspección, tutela, edificios, conservación y condiciones de funcionamiento. Para Ruiz, esto supone “una invasión competencial y un riesgo de mercantilización del patrimonio bibliográfico”.

Read more...

El contenido fantasma de su organización

>>  martes, 3 de febrero de 2026

¿Qué es el contenido fantasma y por qué es un riesgo oculto en tu estrategia de datos?https://www.laserfiche.com/



En el entorno de trabajo digital actual, los datos se generan a una velocidad que supera la capacidad de las organizaciones, y fluyen desde correos electrónicos, documentos, mensajes de chat, unidades en la nube, proveedores, herramientas de colaboración y más. Si bien esta información debería ser un activo estratégico, se convierte en una carga. El gran volumen, la variedad y la velocidad de creación de datos pueden dejar a muchos sumidos en el desorden digital.

Gestionar esta pila de datos cada vez mayor es como intentar cerrar un cajón de basura digital gigante que está desbordado, desorganizado y es casi imposible de controlar.

La raíz de este desafío es que el 90 % de los datos empresariales no están estructurados . Esto significa que se encuentran en formatos inconsistentes, dispersos en sistemas desconectados, y a menudo es difícil, si no imposible, encontrarlos o utilizarlos eficazmente. Estos datos son el contenido fantasma de su organización .
 
¿Qué es el contenido fantasma y por qué es importante para su organización?

El contenido fantasma se refiere a los datos que su organización técnicamente posee, pero que no puede encontrar ni utilizar eficazmente, o que ni siquiera sabe que existen. A menudo se oculta en recursos compartidos de archivos olvidados, sistemas heredados aislados, hilos de correo electrónico obsoletos, archivos en papel e incluso en ordenadores personales. También puede estar bloqueado en formatos no compatibles o enterrado en flujos de trabajo obsoletos, lo que lo hace invisible para la empresa, la escuela o el municipio e inaccesible para quienes más lo necesitan.

Si no se gestiona, el contenido fantasma reduce silenciosamente la productividad, aumenta los riesgos de incumplimiento y mantiene información valiosa fuera del alcance. Los empleados pierden tiempo valioso buscando información extraviada o mal etiquetada y, con frecuencia, terminan recreando contenido existente, lo que genera duplicación de esfuerzos y mayor probabilidad de errores.

Además de las ineficiencias operativas, el contenido fantasma supone graves amenazas para el cumplimiento normativo. Sin una visibilidad y gobernanza adecuadas, datos confidenciales como la información de identificación personal (PII) pueden almacenarse sin los controles de acceso ni las pistas de auditoría adecuados, lo que expone a las organizaciones a responsabilidades legales e infracciones regulatorias.

Las leyes de privacidad de datos, como el Reglamento General de Protección de Datos (GDPR), junto con las regulaciones estatales como la Ley de Privacidad del Consumidor de California (CCPA) y otros mandatos de retención, aumentan aún más las apuestas, al requerir que las empresas no solo protejan sus datos, sino también que sepan exactamente dónde se encuentran y cómo se utilizan.
 
Las tres categorías de contenido fantasma

El contenido fantasma se divide en tres categorías, cada una de las cuales presenta desafíos únicos en cuanto a descubrimiento, acceso y usabilidad.
 
1. Datos perdidos o difíciles de encontrar

Documentos empresariales cruciales, como facturas, órdenes de compra y contratos, suelen quedar ocultos debido a una nomenclatura de archivos inconsistente o una categorización deficiente. Los registros en papel, como expedientes académicos, permisos de construcción o estados financieros, que se guardan en un almacenamiento físico también entran en esta categoría, lo que dificulta su recuperación cuando se necesitan.
 
2. Datos aislados

Los registros de clientes, archivos de proveedores, perfiles de estudiantes y datos financieros suelen residir en sistemas aislados, como plataformas de Gestión de Relaciones con Clientes (CRM), Planificación de Recursos Empresariales (ERP) o Sistemas de Información Estudiantil (SIS), que rara vez se integran fluidamente debido a las diferencias en los formatos de datos y la limitada interoperabilidad de los sistemas. Esta compartimentación dificulta el acceso, requiriendo a menudo esfuerzo manual o conocimiento interno. Además, los documentos almacenados localmente en ordenadores de escritorio, unidades compartidas o bandejas de entrada de correo electrónico, limitan aún más la visibilidad e impiden la colaboración interdepartamental.
 
3. Datos no estructurados

Esto incluye grabaciones de reuniones (con clientes, ayuntamientos, etc.), archivos de imágenes como planos de edificios o escáneres médicos, y datos textuales libres como correos electrónicos y notas. Si bien esta información suele ser muy valiosa, suele infrautilizarse porque las herramientas tradicionales no pueden analizarla fácilmente y el procesamiento manual es demasiado lento y laborioso.
 
Cómo convertir contenido fantasma en información procesable

He aquí una regla sencilla: si pasas más de cinco minutos buscando un dato, es hora de repensar tu proceso.

La buena noticia es que resolver el problema del contenido fantasma no requiere una reestructuración masiva del sistema. Con herramientas basadas en IA, las organizaciones pueden descubrir, organizar y liberar el valor del contenido oculto que ya existe en sus sistemas.

Las plataformas modernas están transformando la gestión de datos, permitiendo a los usuarios de todos los departamentos —no solo a los de TI o expertos en datos— encontrar y utilizar el contenido con mayor rapidez y eficacia. Por ejemplo, el Chat Inteligente de Laserfiche permite a los usuarios hacer preguntas en lenguaje natural como "¿Cuáles son los riesgos clave de este contrato?" o "Resuma el informe financiero de este trimestre" y obtener respuestas claras en segundos, en lugar de horas.

Herramientas como Smart Fields de Laserfiche llevan la gestión de datos a un nuevo nivel al extraer, clasificar, etiquetar y organizar automáticamente la información en metadatos con capacidad de búsqueda. Por ejemplo, Smart Fields puede capturar detalles cruciales de cheques de pago manuscritos en múltiples formatos, lo que permite un seguimiento preciso de los ingresos por proyecto, mejora la previsión del flujo de caja, crea registros de auditoría con capacidad de búsqueda y simplifica la resolución de disputas. Smart Fields también puede detectar si un documento contiene información personal identificable e identificar el tipo, ya sea para su revisión manual o para su eliminación automática mediante los flujos de trabajo de Laserfiche.

El Resumen de Documentos con IA acelera aún más la productividad al condensar contenido no estructurado, como actas de reuniones o transcripciones de video, en resúmenes rápidos y precisos, lo que libera tiempo valioso para iniciativas más estratégicas. Al combinar el Resumen de Documentos y el Chat Inteligente, el texto de cualquier longitud, complejidad o formato se convierte rápidamente en información útil.

A medida que estas herramientas siguen evolucionando, hacen más que simplemente mejorar la eficiencia. Preparan el terreno para la automatización inteligente de procesos en toda la organización. Al convertir el contenido fantasma en información estructurada y práctica, las empresas pueden optimizar sus operaciones, impulsar una toma de decisiones más inteligente y alcanzar nuevos niveles de innovación a gran escala.
El camino a seguir: recuperar el poder del contenido

Al descubrir contenido fantasma y convertirlo en información procesable, las organizaciones pueden pasar de la sobrecarga de datos a una toma de decisiones basada en conocimiento. Con las herramientas adecuadas basadas en IA, lo que antes parecía un caos digital puede convertirse en una ventaja estratégica para impulsar la automatización, acelerar los flujos de trabajo y capacitar a los equipos para centrarse en lo que realmente importa.

¿Quieres saber más sobre cómo gestionar tu contenido fantasma para procesar datos más rápido, generar contenido y extraer información para una mejor toma de decisiones? Sigue leyendo.

Publicado: 21 de octubre de 2025

Read more...

Clasificación y etiquetado automatizado de documentos, se pasa de contenido no estructurado a decisiones en segundos.

Laserfiche amplía la captura de datos con IA mediante la clasificación automática para transformar los datos en inteligencia empresarial
https://www.businesswire.com/



Nuevas funciones inteligentes organizan y clasifican documentos automáticamente, lo que transforma la manera en que las organizaciones gestionan la información a gran escala.

Los campos inteligentes impulsados ​​por inteligencia artificial de Laserfiche ayudan a los clientes a capturar metadatos de contenido como documentos financieros, formularios de proveedores y contratos legales, reduciendo los procesos de gestión de documentos de meses a segundos.

LONG BEACH, California--( BUSINESS WIRE )-- Laserfiche , proveedor líder de SaaS en gestión inteligente de contenidos, anunció hoy importantes mejoras en su herramienta de extracción de datos impulsada por IA, Smart Fields . La actualización incorpora la clasificación y el etiquetado automatizados de documentos, lo que permite a las organizaciones pasar de contenido no estructurado a decisiones informadas en cuestión de segundos.

Mediante el uso de indicaciones en lenguaje natural en lugar de un OCR rígido basado en reglas, Smart Fields ahora puede identificar el tipo de documento (como facturas, formularios de identificación fiscal o certificados académicos) y aplicar automáticamente la plantilla de metadatos correctos mediante IA. Además, los usuarios pueden utilizar Smart Fields para añadir de forma automática etiquetas informativas y de seguridad a los archivos que cumplan determinados criterios, definidos mediante indicaciones en lenguaje natural. De este modo, los usuarios pueden capturar información clave, enrutar documentos y aplicar los metadatos adecuados de forma instantánea ya gran escala.

“El éxito en el panorama actual impulsado por la IA se define por la velocidad para obtener perspectivas”, afirmó Michael Allen, director de Tecnología de Laserfiche. "Al incorporar IA en la gestión de contenidos de Laserfiche, estamos transformando los repositorios digitales de las organizaciones en motores activos de inteligencia empresarial. Smart Fields permite a los usuarios eliminar la fricción de la carga manual de datos, y así libera tiempo para una toma de decisiones de mayor valor".

Redefinir la captura de documentos para la era de la IA

Los métodos tradicionales de captura suelen requerir conocimientos técnicos especializados y configuraciones complejas. Laserfiche Smart Fields, lanzado por primera vez en 2025, elimina esta barrera al permitir que los usuarios describan los datos que necesitan utilizando lenguaje natural.

Las principales actualizaciones incluyen:

  • Clasificación automática: Smart Fields reconoce los tipos de documentos y los vincula con la plantilla correspondiente.
  • Etiquetado inteligente automático: los administradores definen las etiquetas una sola vez y Smart Fields las aplicaciones durante la ingesta, lo que ayuda a las organizaciones a mantener la coherencia en cuanto a seguridad y facilidad de búsqueda.

Smart Fields ha ayudado a los clientes a capturar metadatos de contenidos como documentos financieros, formularios de proveedores y contratos legales, lo que reduce los procesos de gestión documental de meses a segundos. Estas mejoras disminuyen los costos operativos y los errores humanos, y sostienen la coherencia de los datos en toda la empresa, al tiempo que liberan recursos técnicos.

Entre los principales beneficios se incluyen:

  • Organización automatizada: Smart Fields elimina la clasificación manual al organizar los documentos desde el momento de su ingreso.
  • Controles de seguridad dinámicos: el etiquetado automático respalda tanto información informativa como de seguridad, lo que permite proteger el contenido sensible de manera automática.
  • Automatización simplificada: los datos de clasificación pueden activar flujos de trabajo (como aprobaciones o calendarios de retención) sin necesidad de programación compleja.

“El verdadero valor de la IA en la empresa radica en su capacidad para arrojar luz sobre los datos ocultos o lo que Laserfiche denomina 'contenido fantasma'”, señaló Andrea Malick, directora principal de asesoría en Info-Tech Research Group. “Al automatizar el trabajo fundamental de organización documental, las organizaciones pueden finalmente cerrar la brecha entre los silos de contenido y las perspectivas accionables, lo que garantiza que la información no solo se almacene, sino que esté sistemáticamente preparada para la era de la IA”.

Acerca de Laserfiche

Laserfiche es la plataforma empresarial líder que ayuda a las organizaciones a transformar digitalmente sus operaciones y gestionar su contenido mediante soluciones impulsadas por IA. A través de flujos de trabajo escalables, formularios personalizables, plantillas sin código y capacidades habilitadas por IA, la plataforma de gestión documental Laserfiche® acelera la forma en que se realizan los procesos empresariales. Con la confianza de organizaciones de todos los tamaños (desde startups hasta empresas Fortune 500), Laserfiche permite a los equipos aumentar la productividad, fomentar la colaboración y ofrecer una experiencia superior al cliente a gran escala. Con sede en Long Beach, California, Laserfiche opera a nivel global, con oficinas en América del Norte, Europa y Asia.

El texto original en el idioma fuente de este comunicado es la versión oficial autorizada. Las traducciones solo se suministran como adaptación y deben cotejarse con el texto en el idioma fuente, que es la única versión del texto que tendrá un efecto legal.

Linda Domingo
Directora de Comunicaciones, Laserfiche
Linda.domingo@laserfiche.com




Read more...

😱 El sistema de Open AI se entrena para sustituir a empleados en proyectos y trabajos de oficina

>>  jueves, 29 de enero de 2026

OpenAI pide a freelancers que usen documentos de sus antiguos empleos para entrenar a su IA

https://es.wired.com/

Para preparar a los agentes de IA para el trabajo de oficina, la empresa pide a los contratistas que carguen proyectos de trabajos anteriores, dejando que sean ellos quienes eliminen la información confidencial y de identificación personal.


Fotoilustración: WIRED; Getty Images

OpenAI está pidiendo a contratistas externos que carguen tareas reales de sus lugares de trabajo actuales o anteriores para poder utilizar los datos en la evaluación del rendimiento de sus modelos de IA de próxima generación, según los registros de OpenAI y la empresa de datos de formación Handshake AI obtenidos por WIRED.

El proyecto parece formar parte de los esfuerzos de OpenAI por establecer una línea de base humana para diferentes tareas que luego pueda compararse con los modelos de IA. En septiembre, la empresa puso en marcha un nuevo proceso de evaluación para medir el rendimiento de sus modelos de IA frente a profesionales humanos de diversos sectores. OpenAI afirma que este es un indicador clave de su progreso hacia la consecución de la IAG, o un sistema de IA que supere a los humanos en la mayoría de las tareas económicamente valiosas.

"Hemos contratado a personas de distintas profesiones para que nos ayuden a recopilar tareas del mundo real que se asemejen a las que realizan en sus trabajos a tiempo completo, de modo que podamos medir el rendimiento de los modelos de IA en esas tareas", se lee en un documento confidencial de OpenAI. "Toma piezas existentes de trabajo a largo plazo o complejas (horas o días) que hayas hecho en tu ocupación y convierte cada una en una tarea".

OpenAI está pidiendo a los contratistas que describan las tareas que han realizado en su trabajo actual o en el pasado y que suban ejemplos reales del trabajo que hicieron, según una presentación de OpenAI sobre el proyecto vista por WIRED. Cada uno de los ejemplos debe ser "un resultado concreto (no un resumen del archivo, sino el archivo real), por ejemplo, documento de Word, PDF, Powerpoint, Excel, imagen, repo", señala la presentación. OpenAI asegura que la gente también puede compartir ejemplos de trabajo inventados y creados para demostrar cómo responderían de forma realista en escenarios específicos.

OpenAI y Handshake AI declinaron hacer comentarios.

Las tareas del mundo real tienen dos componentes, según la presentación de OpenAI. Está la solicitud de la tarea (lo que el jefe o colega de una persona le dice que haga) y la entrega de la tarea (el trabajo real que produce en respuesta a esa solicitud). La empresa insiste varias veces en las instrucciones de que los ejemplos que compartan los contratistas deben reflejar "trabajo real en el puesto de trabajo" que la persona haya "realizado realmente".

Uno de los ejemplos de la presentación de OpenAI describe una tarea de un "director de estilo de vida de una empresa de conserjería de lujo para personas de alto poder adquisitivo". El objetivo es "preparar un breve borrador en PDF de 2 páginas de una descripción general de un viaje en yate de 7 días a las Bahamas para una familia que viajará allí por primera vez". Incluye detalles adicionales sobre los intereses de la familia y cómo debería ser el itinerario. A continuación, el "entregable humano experimentado" muestra lo que subiría el contratista en este caso: un itinerario real por las Bahamas creado para un cliente.

Un riesgo para la privacidad

OpenAI da instrucciones a los contratistas para que eliminen la propiedad intelectual de la empresa y la información de identificación personal de los archivos de trabajo que suben. En una sección titulada "Recordatorios importantes", OpenAI expresa a los trabajadores que "eliminen o anonimicen cualquier: información personal, datos de propiedad o confidenciales, información material no pública (por ejemplo, estrategia interna, detalles de productos no publicados)".

Uno de los archivos vistos por el documento de WIRED menciona una herramienta de ChatGPT llamada "Superstar Scrubbing" que ofrece consejos sobre cómo eliminar información confidencial.

Evan Brown, abogado especializado en propiedad intelectual de Neal & McDevitt, explica a WIRED que los laboratorios de IA que reciben información confidencial de contratistas a esta escala podrían ser objeto de demandas por apropiación indebida de secretos comerciales. Los contratistas que ofrecen documentos de sus lugares de trabajo anteriores a una empresa de IA, incluso depurados, podrían correr el riesgo de violar los acuerdos de confidencialidad de sus empleadores anteriores o exponer secretos comerciales.

"El laboratorio de IA confía mucho en sus contratistas para decidir qué es confidencial y qué no", indica Brown. "Si se les escapa algo, ¿se toman realmente tiempo los laboratorios de IA para determinar qué es y qué no es un secreto comercial? Me parece que los laboratorios de IA se están poniendo en grave peligro".

Los documentos revelan una estrategia que los laboratorios de IA están utilizando para preparar sus modelos para que sobresalgan en tareas del mundo real. Empresas como OpenAI, Anthropic y Google están contratando ejércitos de contratistas que pueden generar datos de entrenamiento de alta calidad para desarrollar agentes de IA capaces de automatizar el trabajo empresarial.

Los laboratorios de IA han confiado durante mucho tiempo en empresas de contratación de terceros como Surge, Mercor y Scale AI para contratar y gestionar redes de contratistas de datos. En los últimos años, sin embargo, los laboratorios de IA han necesitado datos de mayor calidad para mejorar sus modelos, lo que les ha obligado a pagar más por el talento cualificado capaz de producirlos. Esto ha creado una lucrativa subindustria dentro del mundo de la formación en IA. Handshake señaló que estaba valorada en 3,500 millones de dólares en 2022, mientras que Surge se valoró en 25,000 millones de dólares en conversaciones para recaudar fondos el verano pasado.

OpenAI parece haber explorado otras formas de obtener datos reales de empresas. Una persona que ayuda a las compañías a vender activos después de que cierren comentó a WIRED que un representante de OpenAI preguntó sobre la obtención de datos de estas empresas, siempre que la información de identificación personal pudiera ser eliminada. La fuente, que habló con WIRED bajo condición de anonimato porque no quería agriar ninguna relación comercial, contó que los datos habrían incluido documentos, correos electrónicos y otras comunicaciones internas. La fuente resaltó que decidieron no seguir adelante con la idea porque no estaban seguros de que la información personal pudiera eliminarse por completo.

Artículo originalmente publicado en WIRED. Adaptado por Mauricio Serfatty Godoy.

Read more...

Factify: nueva infraestructura de documentos digitales busca reemplazar a los documentos PDF

Una startup israelí de IA quiere poner fin al reinado del PDF
https://www.israeleconomico.com/




En la era de la inteligencia artificial, los documentos que circulan sin control se convirtieron en un riesgo. Una startup israelí propone un formato vivo, trazable y gestionable, pensado para organizaciones y máquinas

Una startup israelí de inteligencia artificial (IA) recolectó 73 millones de dólares para avanzar con su proyecto de nuevo estándar de documentación online que ponga fin a las décadas de reinado absoluto del PDF creado por Adobe.

La operación de captación de capital semilla se convirtió en una de las más grandes completadas por una empresa emergente israelí en esa etapa, y detrás de la confianza de los inversores está un ingeniero graduado en la Universidad Hebrea de Jerusalén, el profesor Matan Gavish.

Entrevistado por el sitio israelí de noticias económicas Globes, Gavish afirmó que el PDF es «un objeto cerrado e ineficiente, no adecuado para la era de la automatización de la IA».

El PDF (la sigla en inglés de Portable Document Format, o formato de documento portátil) fue creado por Adobe Systems en 1992 y lanzado al mercado al año siguiente. A mediados del 2008 fue reconocido por la Organización Internacional de Estandarización (ISO).

Un estándar difícil de mover

Desde su lanzamiento, este formato se fue imponiendo como el más elegido para crear y compartir documentos online, desde simples textos a contratos multimillonarios, pero muchos expertos creen que ya es tiempo de una opción más sofisticada y user-friendly.

En ese sentido, Gavish dijo que las limitaciones de formatos como el PDF obligaron al sector a producir incontables actualizaciones, desde sistemas de firma electrónica a reconocimiento de texto.

«Toda esa industria se basa en infraestructuras obsoletas y, en efecto, perpetúa un problema crítico: los propios documentos carecen de una forma estructurada de saber cuál es la versión más reciente, quién accedió a ellos y cuál es la fuente fidedigna de confianza», afirmó.

Pero «lo que antes era principalmente una molestia operativa se convirtió en los últimos años», con la llegada de la IA, en «un riesgo significativo» para empresas y organizaciones.

«Creo que en el futuro, trabajar con documentos será más sencillo y permitirá no solo la colaboración entre personas, sino también entre ordenadores, por lo que las máquinas también necesitarán acceso a los documentos contractuales», apuntó el profesor israelí.

Documentos que viven en las redes

Globes contó que Gavish formó a finales del 2023 un equipo de ingenieros y presentó a sus inversores un sistema que ahora está empezando a comercializar en organizaciones medianas de cientos o miles de empleados en Estados Unidos.

El sistema, llamado Factify, «genera un documento digital que reside en la red, está diseñado principalmente para agentes de IA y contiene contenido dinámico, permisos de acceso y contexto que se puede modificar o editar», explicó el reporte.

A diferencia de un PDF, que básicamente queda fuera de la supervisión de la organización una vez que se comparte, el nuevo documento «permanece gestionado y controlado dondequiera que vaya -añadió la publicación-, de modo que el acceso a parte o a la totalidad del mismo se puede aprobar o bloquear incluso después de su envío».

Factify emplea unas cincuenta personas en sus oficinas de Tel Aviv y Pittsburgh. La ronda de financiación para la startup que quiere poner fin al PDF fue liderada por Valley Capital Partners, con la participación de importantes líderes empresariales y tecnológicos de Silicon Valley.


Startup israelí recauda 63 millones de dólares para reemplazar el PDF con un nuevo estándar de documentos para la era de la IA
https://itongadol.com/



Itongadol/Agencia AJN.- La startup israelí Factify, dedicada al desarrollo de una nueva infraestructura de documentos digitales diseñada específicamente para la era de la inteligencia artificial, anunció que recaudó 63 millones de dólares en una ronda de financiamiento Seed.

La ronda fue liderada por Valley Capital Partners y contó con la participación de figuras destacadas del sector tecnológico y financiero, entre ellas John Giannandrea, ex jefe de IA en Google y ex vicepresidente senior de inteligencia artificial en Apple; Ken Moelis, fundador del banco de inversión Moelis & Co.; Peter Brown, CEO del fondo de cobertura Renaissance; y Shai Wininger, cofundador de Lemonade y Fiverr.

La compañía ya había levantado previamente 10,3 millones de dólares en una ronda pre-Seed liderada por Sage.

Factify fue fundada a fines de 2023 por el profesor Matan Gavish, docente de la Escuela de Ingeniería y Ciencias de la Computación de la Universidad Hebrea de Jerusalem. El proyecto busca reemplazar el modelo tradicional de documentos basado en PDF por un formato digital nativo de red, diseñado para interactuar de forma directa y segura con sistemas de inteligencia artificial.

Gavish lleva más de una década trabajando en este concepto y comenzó a publicar investigaciones relacionadas durante su doctorado en la Universidad de Stanford, ya en 2012. En una entrevista con el medio económico Calcalist, explicó que el problema central es estructural: “El archivo PDF es, en esencia, una versión digital de la imprenta de Gutenberg. No entiende el mundo digital y todo lo que lo rodea se maneja de forma manual. Para reemplazarlo hay que reconstruir la infraestructura de aplicaciones, la interfaz de usuario y los sistemas subyacentes. Eso requiere un desarrollo significativo”.

La plataforma de Factify permite que los documentos digitales mantengan control y gestión sin importar dónde circulen, incorporando identidad, permisos de acceso y contexto directamente en el archivo. A diferencia de los PDFs estáticos, estos documentos están diseñados para funcionar de manera fluida con agentes de inteligencia artificial, generando flujos de trabajo directos, seguros y auditables dentro de las organizaciones.

La empresa ya está ejecutando proyectos piloto pagos en sectores altamente regulados como banca, seguros, servicios legales, recursos humanos y operaciones. En el ámbito legal, los equipos utilizan documentos de Factify para administrar acuerdos de confidencialidad, restringir el acceso a información sensible y rastrear versiones oficiales. En operaciones, la plataforma se emplea para procesos como la incorporación de proveedores y aprobaciones, reemplazando flujos fragmentados basados en correos electrónicos, carpetas compartidas y sistemas desconectados.

“El panorama de gestión de documentos digitales no ha cambiado en décadas”, afirmó Gavish. “Hoy existen alrededor de tres billones de archivos PDF en el mundo, pero la infraestructura sigue siendo obsoleta. Soluciones puntuales como firmas electrónicas o control de versiones no resuelven el problema de fondo: el documento no sabe cuál es la versión vigente, quién accedió a él o cuál es la fuente autorizada. En un mundo impulsado por inteligencia artificial, eso representa un riesgo significativo”.

Gavish remarcó que el enfoque de Factify está puesto en el mercado corporativo y no en productos de consumo masivo. “Vendemos a organizaciones, no ofrecemos el producto de forma gratuita. Estamos concentrando la oferta en lo que permitirá el verdadero salto tecnológico. Nuestro objetivo es convertirnos en el estándar de la industria, siguiendo el camino del PDF, pero con un sistema diseñado para agentes de inteligencia artificial y no para humanos”, concluyó.

Fuente: CTech

Read more...

Snap Shots

Get Free Shots from Snap.com

  © Free Blogger Templates Autumn Leaves by Ourblogtemplates.com 2008

Back to TOP