Resumen de la Ponencia; Aplicación de la Inteligencia Artificial en los Archivos

>>  lunes, 1 de junio de 2026

Ponencia; Aplicación de la Inteligencia Artificial en los Archivos https://youtu.be/f0vukr5IsxQ
Por: Profesor David Ruiz

Resumen realizado por la Lic. Carmen Marín con la colaboración de Gemini


La inteligencia artificial enfocada específicamente en los archivos.

Lo primero es una nota de advertencia: desafortunadamente —o quizás afortunadamente— lo que diga en este momento puede ser real y verídico hoy, pero cambiar por completo en unas cuantas semanas. Esto ocurre porque las empresas de inteligencia artificial modifican sus modelos constantemente, lo que nos lleva a tener desde versiones muy sencillas y básicas hasta sistemas sumamente avanzados.

Si le preguntamos a la propia IA cuál es el rango de sus modelos, la respuesta casi siempre será la misma. De hecho, las pequeñas diferencias en las evaluaciones anuales y mensuales que realiza la Universidad de Stanford sobre el avance de las inteligencias artificiales a veces se mueven apenas por décimas; unos modelos suben al primer nivel, luego bajan al segundo o al tercero, manteniéndose en un constante movimiento.

De los bots básicos a la IA generativa

Existen diferentes tecnologías en este campo. Están las más simples, que son una especie de bots diseñados para responder y dar atención al cliente en los call centers. Por ejemplo, cuando entras al sistema de Amazon para rastrear un envío, colocas los datos de tu compra y el sistema te responde automáticamente. Esas son inteligencias artificiales muy básicas.

Lo que nos interesa trabajar aquí es la inteligencia artificial generativa, es decir, aquella donde el usuario introduce información y el sistema genera un producto completamente nuevo a partir de esos datos. Esto, por supuesto, tiene sus ventajas y desventajas.

El problema de las «alucinaciones» y el valor del entrenamiento

La primera gran desventaja es que no se le puede preguntar cualquier cosa a una IA si no está previamente entrenada. Habrá temas que responderá bien, pero en su mayoría cometerá errores y dará respuestas incorrectas. En nuestro ámbito, solemos decir que la IA comienza a "alucinar" porque inventa datos, afirma cosas sin fundamento e incluso cita fuentes y documentos que ni siquiera existen.

Para evitar esto y lograr que el sistema dé respuestas muy acertadas, es obligatorio dedicarle muchas horas de trabajo a su entrenamiento. Las herramientas que yo utilizo constantemente y que verán en mi pantalla ya están entrenadas por mí, por lo que sus respuestas siempre están enfocadas de manera precisa en el ámbito de la archivística.

La importancia del contexto normativo local

Si ustedes le piden a una IA genérica (sin entrenar) que elabore una tabla de retención documental, el sistema la desarrollará arrastrando lo que encuentre en páginas web. ¿Cuál será el resultado? Una tabla mal elaborada que probablemente no se ajuste a la metodología, la teoría archivística ni a la normativa de su país.

Por ello, para alimentar y entrenar a la IA, debemos saber con precisión qué documentos le vamos a suministrar como referencia para que construya lo que necesitamos. Esto abarca desde la ley general de archivos de la nación, hasta las normativas internas y las leyes orgánicas que regulan a la institución donde organizamos el archivo.

El uso de la IA en el ámbito académico

Como profesor en la licenciatura en Administración de Archivos y Gestión Documental de la UNAM, y en la Universidad Michoacana, noto de inmediato cuándo los alumnos han utilizado la IA para resolver sus tareas. Al revisar los trabajos, es evidente que no leyeron la teoría ni el material de lectura obligatorio; simplemente le pidieron al sistema que desarrollara el texto y me lo entregaron con muchísimos errores.

Es muy fácil detectar estos trabajos porque emplean un lenguaje mecánico, artificial y excesivamente técnico, pero con graves errores conceptuales y metodológicos que cualquier archivólogo nota al instante, aunque para una persona ajena al área el texto parezca "perfecto".

La IA como potenciadora del ciclo vital del documento

La inteligencia artificial no es más que una herramienta; no viene a reemplazarnos, sino a potenciar el trabajo que los archivólogos realizamos en todo el ciclo vital del documento, desde que la información ingresa por las unidades de correspondencia (archivos de trámite y concentración) hasta su destino final, ya sea su transferencia a un archivo histórico o su depuración y destrucción (bajas documentales) cuando carece de valores legales o testimoniales.

Para realizar esta gestión, primero analizamos los reglamentos y leyes orgánicas institucionales para extraer las funciones comunes y sustantivas. A partir de ahí, desglosamos el primer instrumento de control: el Cuadro General de Clasificación Archivística, y posteriormente el catálogo de disposición documental (o tabla de retención). A la par, elaboramos los inventarios, las guías de archivos documentales y los índices de expedientes clasificados como reservados por razones de seguridad de Estado, o confidenciales por contener datos personales sensibles (como expedientes de personal con cédulas, teléfonos o direcciones).

Un riesgo crítico: la confidencialidad

Este análisis humano es vital porque la IA, por error, podría indicarnos que ciertos documentos son públicos y que deben enviarse al archivo histórico. Debemos recordar que, una vez que la documentación ingresa al archivo histórico, se convierte en información de libre acceso para cualquier ciudadano. Si enviamos datos confidenciales o sensibles allí porque "la IA nos dijo que se podía", estaríamos vulnerando la ley y podríamos ser sancionados legalmente.

Revisión de herramientas del mercado

Actualmente, las tres herramientas de IA generativa que se disputan los primeros lugares en las evaluaciones de Stanford son Gemini (de Google), ChatGPT y Claude.
 
Gemini (Google): Para mí es una de las opciones más interesantes y la que más utilizo, ya que se integra perfectamente con todo el entorno empresarial de Google (Gmail, Drive, Docs, Meet y Fotos). En la universidad utilizo la versión Pro, que amplía la capacidad de almacenamiento y permite grabar videoconferencias.
 
ChatGPT: Es la herramienta más famosa, aunque su versión gratuita cuenta con limitaciones de tokens (que funcionan como el límite de palabras o volumen de datos que el sistema puede procesar antes de bloquearse temporalmente por unas horas). Para desbloquear modelos avanzados, creación de imágenes y mayor carga de archivos, se requiere el plan de pago.
 
Grok: Aunque en su versión gratuita no es la más avanzada en la escala de Stanford, en archivología funciona bastante bien y es muy eficiente convirtiendo archivos PDF.

Otras herramientas y soluciones locales

NotebookLM:
Es una excelente aplicación enlazada a Google. Permite "alimentar" el sistema con documentos de texto propios y, a partir de ellos, genera automáticamente resúmenes de audio, mapas conceptuales, presentaciones, infografías o cuestionarios de evaluación.
 
Perplexity: Funciona como un buscador tradicional, pero potenciado con IA en tiempo real. Realiza búsquedas en la web, redacta un resumen y detalla con precisión las fuentes y enlaces de donde extrajo la información.
 
DeepSeek (u opciones de IA locales): Son alternativas muy útiles cuando se requiere el manejo de IA locales o cerradas. Esto es fundamental si queremos que la información sensible con la que alimentamos al sistema se quede estrictamente dentro de nuestras computadoras y servidores, evitando que viaje a servidores externos en Estados Unidos o China. El único inconveniente es que instalar una IA local exige computadoras con alta potencia de hardware (procesadores rápidos, amplia memoria RAM y tarjetas gráficas potentes con chips Nvidia); de lo contrario, el procesamiento de texto será sumamente lento.

El punto de partida: El Prompt

Para trabajar con cualquier IA, la clave absoluta es el prompt (el comando o instrucción de partida). El prompt es la indicación que le damos al sistema informático para que ejecute una acción. De la calidad y precisión de nuestra pregunta dependerá el éxito de la respuesta; si no sabemos estructurar el prompt correctamente, el sistema nos devolverá cualquier cosa.»

0 comentarios :

Snap Shots

Get Free Shots from Snap.com

  © Free Blogger Templates Autumn Leaves by Ourblogtemplates.com 2008

Back to TOP