Mostrando entradas con la etiqueta Gestión de datos. Mostrar todas las entradas
Mostrando entradas con la etiqueta Gestión de datos. Mostrar todas las entradas

La profesión archivística asume un papel clave en la “gobernanza del dato”

>>  jueves, 15 de mayo de 2025

GESTIÓN DOCUMENTAL ORIENTADA A DATOS: NUEVOS DESAFÍOS DE LA TRANSFORMACIÓN DIGITAL

https://noticias.unsam.edu.ar/
Por Federico Brugaletta, estudiante de la 5ª cohorte de la Diplomatura



Como parte de la Diplomatura en Estudios Avanzados en Gestión Documental y Administración de Archivos Públicos, el especialista catalán Jordi Serra brindó una conferencia magistral sobre los desafíos y oportunidades que plantea la revolución de los datos masivos en el ámbito archivístico. Si te interesa esta temática, anotate a la Diplomatura hasta el 21 de febrero.

En el marco del Ciclo de Charlas de Café, que organiza la Diplomatura en Gestión Documental y Administración de Archivos Públicos de la Escuela de Política y Gobierno de la UNSAM, se realizó el webinar titulado “Gestión documental orientada a datos” a cargo del especialista catalán Jordi Serra. Como el objetivo del ciclo es presentar temáticas vinculadas a la gestión de los archivos de una manera articulada con la reflexión en torno al desarrollo de políticas públicas, se organiza en colaboración con Archivistas en la Función Pública Argentina (AFPA) y contó con la participación de Cecilia García Novarini y Andrés Pak Linares, docentes del módulo de Principios Básicos para la Gestión de Documentos Electrónicos, que acompañaron la exposición del Dr. Serra con reflexiones sobre el caso argentino.

Jordi Serra es doctor en información y documentación por la Universidad de Barcelona. Profesor de la Escuela Superior de Archivística i Gestión de Documentos (ESAGED), ha sido también profesor de la Facultad de Biblioteconomía y Documentación de la Universidad de Barcelona (UB), donde ha dirigido el Máster de Gestión Documental e Información en las Empresas. Ha impartido docencia en másteres y estudios de postgrado, y ha publicado numerosos artículos y monografías sobre gestión documental, gobierno de la información y preservación digital. Tiene más de treinta años de experiencia como responsable de gestión documental, procesos, sistemas y administración electrónica en diferentes organismos de la Administración pública, y como experto asesor en proyectos de administración electrónica y preservación digital en el ámbito público y privado. Ha colaborado con el DLM-Forum de la Unión Europea, y ha participado en otros proyectos internacionales. Actualmente es Director de Atención a la Comunidad Educativa en el Consorcio de Educación de Barcelona, donde lidera un proyecto de integración y gobierno del dato, y es también director de la revista Lligall.

La exposición giró en torno a tres preguntas que organizaron la conversación y el intercambio. En primer lugar, El dato, ¿enemigo del documento?; en segundo lugar, La gestión documental electrónica, ¿en una crisis de identidad?; finalmente, Reformulando conceptos: ¿podemos datificar sin perder identidad?

El dato, ¿enemigo del documento?

La respuesta a la primera pregunta sobre El dato, ¿enemigo del documento? se inició contextualizando el escenario de la revolución de los Big Data que atraviesa actualmente a la gestión documental en todo el planeta. Esta revolución se caracteriza por el incremento en la capacidad de almacenamiento y procesamiento masivo de datos, interpelando de modo directo el rol del archivista y a una disciplina acostumbrada a la gestión analógica. Sin embargo, no supone solo riesgos para el devenir del oficio, sino que -tal como propone Serra- podría constituirse en una posibilidad de recreación profesional. Los desafíos que plantea la gestión de datos implican, sobre todo la “capacidad de captura”, es decir, de qué modo es factible hacer un uso de modo masivo de datos que se encuentran disponibles. La importancia entonces no está meramente en el volumen de datos sino en la capacidad de identificar y diseñar su producción: importa sobre todo cómo se consume el dato (cómo llega al usuario), cuándo se consume el dato (procurando la disminución del tiempo entre la captura y la disponibilidad analítica) y con qué nivel de esfuerzo se accede (necesidad de automatización). En todas estas tareas, el rol del archivista resulta fundamental porque un dato solo sirve como evidencia de algo cuando es de calidad. Y los archivistas pueden constituirse en especialistas en la determinación del carácter fiable y auténtico de los datos. Se estima que el 80% de los datos disponibles son de baja calidad en la medida que no tienen una intervención de estas características. La analítica de datos requiere entonces un enfoque desde la perspectiva archivística que asegure disponibilidad, fiabilidad y consistencia de los datos y que trabaje en estrecha colaboración con el personal informático presente en las organizaciones.

De todos modos, esta iniciativa de articulación no deja de tener algunos dilemas conceptuales ya que las nociones clásicas de documento de archivo parecen redefinirse. Si bien dato no es lo mismo que documento, Serra sostiene que son conceptos consustanciales. Los documentos electrónicos, los objetos digitales, son entendidos entonces como conjunto de datos. Todo documento es, para esta perspectiva, una serie, una manifestación o representación de datos. Los datos en bruto o en crudo son estructuras puramente tecnológicas, el “dato instanciado” -en cambio- constituye ya un documento en la medida que representan un conjunto de datos de modo particular. Ante la pregunta de Cecilia García Novarini respecto a ¿qué pueden ofrecer los archivistas ante estas transformaciones? Jordi Serra respondió que es una oportunidad para revalorizar fuertemente la etapa de identificación en las tareas de archivo en la medida que permite “poner en relación” y “mapear” los datos, en sus palabras: “gobernar del dato”.

La gestión documental electrónica, ¿en una crisis de identidad?

A partir de la segunda pregunta, La gestión documental electrónica, ¿en una crisis de identidad?, la respuesta versó sobre los desafíos que presenta la revolución del dato en la gestión de documentos electrónicos. Las tareas de clasificación, control de acceso y uso, conservación preventiva de documentos electrónicos; se encuentran en profunda reversión. Según el expositor, está desapareciendo el trabajo administrativo clásico en la medida que todo tiende a ser pasible de informatización y automatización. En este sentido, sostiene Serra que “migrar hacia el gobierno del dato” es quizás ya una opción de supervivencia para la profesión de archivista. La gestión documental ya no supone “meter cosas en cajas” sino poder diseñar, producir, capturar y dar accesibilidad a datos. Por ejemplo, en el ámbito empresarial, hay una demanda cada vez más fuerte por datos de calidad, entonces surge una necesidad corporativa de comenzar a reclutar profesionales que acrediten habilidades para dar cuenta de la fiabilidad y la autenticidad de los datos. En relación con la administración pública, Mariana Nazar -en diálogo con Serra- aportó en el intercambio que la digitalización no supone necesariamente transparencia o gobierno abierto, por lo tanto, se precisa profesionales capaces de determinar la “trazabilidad de los datos”. Por su parte, Andrés Pak Linares reforzó argumentando que al igual que las empresas del sector privado, el Estado tiene que tener la misma preocupación por la calidad de los datos que gestiona.

Reformulando conceptos: ¿podemos datificar sin perder identidad?

Finalmente, la respuesta a la pregunta Reformulando conceptos: ¿podemos datificar sin perder identidad?, apostó a proponer pasar de la reacción ante la novedad a la preocupación y acción por dar acceso. Según Serra, en esta coyuntura se abre un conjunto de tareas archivísticas asociadas al denominado “proceso de datificación”. Esto supone atender a la producción de “matriz de datos” que reemplazaría a los conjuntos documentales electrónicos. El proceso de datificación equivale a la producción de un expediente en la archivística clásica, al que ahora se sumaría un segundo paso donde el archivero que se dedica al gobierno del dato aporta determinadas acciones: da soporte a los proyectos informáticos, facilita identificación de series y producción de inventarios, asegura la calidad de la fuente (asociado a la autenticación) y brinda servicios a usuarios.

En síntesis, la charla “Gestión documental orientada a datos”, a cargo de Jordi Serra, abordó los desafíos y oportunidades que plantea la revolución de los datos masivos en el ámbito archivístico, destacando la necesidad de integrar el rol del archivista con el de los especialistas en tecnología. El expositor reflexionó sobre cómo los datos, lejos de ser supletorios del documento, pueden ser gestionados para garantizar su autenticidad, fiabilidad y trazabilidad, redefiniendo conceptos clásicos de documento de archivo. En este contexto, la profesión archivística asume un papel clave en la “gobernanza del dato”, asegurando la calidad de la información y adaptándose a un entorno cada vez más automatizado. La transición desde la gestión documental clásica hacia la producción de matrices de datos demanda nuevas competencias tanto para responder a las exigencias empresariales como a la eficiencia de la administración pública.

Read more...

CRECIMIENTO DE DATOS SOBREPASA LA TECNOLOGIA PARA GESTIONARLOS

>>  jueves, 14 de febrero de 2013

En la Bolsa de Nueva York, el diluvio de datos abruma bases de datos tradicionales
http://www.forbes.com/ 14/02/2013

NYSE y Tecnologías de la Bolsa de Nueva York, su filial tecnológica, encontró que el crecimiento continuo de los datos del mercado de valores, la demanda de más análisis, y, gracias a los reguladores, mucho más informes, fueron demasiado para su base de datos Oracle.

NYSE Technologies recibe cuatro-cinco terabytes de una base de datos al día y lo utiliza para hacer análisis complejos, la vigilancia del mercado, la capacidad de planificación y seguimiento.

La compañía había estado utilizando una base de datos Oracle, dijo Emile Werr, jefe de desarrollo de productos, NYSE Big Data Group y director global de Arquitectura Empresarial y Gestión de Datos de Identidad Acceso para NYSE Euronext. Oracle no puede manejar la carga de trabajo - tomó horas para la carga y velocidad de las consultas tuvieron pobres.

Bolsa de Nueva York volvió a la plataforma IBM Netezza porque no pudo lograr sus objetivos con la tecnología de base de datos tradicional, Werr dijo.

"Empezamos a ir cinco años y ahora somos más maduros en la industria con el uso de MPP (procesamiento masivamente paralelo) de sistemas, y hemos demostrado ROI significativo, en ser capaces de hacer análisis complejos, mientras que la gestión de la huella", dijo Werr.

"NYSE necesita almacenar y analizar los siete años de datos históricos y ser capaz de buscar a través de aproximadamente un terabyte de datos por día, lo que equivale a cientos de personas en total", agregó Werr. "El Sistema de PureData Analytics powered by Netezza proporciona la escalabilidad, simplicidad y desempeño crítico en la capacidad de analizar nuestros datos importantes para obtener resultados más rápido que ocho horas en la solución anterior, que en nuestro mundo es un cambiador de juego".

Enfoque inicial NYSE era de la vigilancia de comercio de los creadores de mercado y las plataformas de los corredores-distribuidores comerciales. Una segunda preocupación fue la planificación de la capacidad.

"The New York Stock Exchange SLAs (acuerdos de nivel de servicio) son muy estrictos", dijo Werr. "El sistema debe ser del 100 por ciento culpa tolerante.Cuando los sistemas de cruzar umbrales de capacidad, la capacidad adicional se activa automáticamente y de comercio continuaría fluyendo sin interrupciones. "

Werr dijo que quedó claro que la tecnología de base de datos tradicional no haría lo que sea necesario NYSE.

"Los volúmenes de datos extremadamente grandes, las complejidades de integración de datos, vigilancia del mercado y ad hoc de análisis de requisitos tomó una gran cantidad de recursos de TI para cuidar el medio ambiente y constantemente afinar. Los sistemas se hizo demasiado lento y complejo ", agregó Werr.

Para ejecutar análisis, los datos tuvieron que ser extraídos de la base de datos en aplicaciones como SAS y de propiedad NYSE aplicaciones para realizar el análisis necesario.

Werr dijo NYSE Technologies ha descubierto la manera de utilizar todos sus activos de información de una manera eficiente y rentable. La firma ha ampliado su almacén de datos con una fuente de archivos distribuido, agregó.

"Los datos importante para nosotros es el aumento entre sistemas como Netezza y un conjunto de tecnologías como Hadoop y un sistema de archivos distribuidos y los niveles de identificación que orquestan acceso a datos.NYSE grande de datos es todo acerca de tomar que a un nivel superior y el embalaje que lo que se puede caer en una organización y ha movilizado para que pudieran seguir apoyando las innovaciones en grandes datos ".

Phil Francisco, vicepresidente de gestión de producto de datos grande de IBM, dijo Werr había desarrollado algunas maneras interesantes para cargar los datos de archivo en Netezza muy rápidamente para NYSE puede ejecutar análisis de vigilancia contra los registros de hace unos meses o unos pocos años atrás.

"Por lo general ellos tienen menos de un año de datos de Netezza pero siempre se puede cargar datos desde un archivo." Con los métodos Werr desarrollado, NYSE puede buscar patrones de larga duración. Emile fue el artífice para que -. Cómo utilizar un alto rendimiento de almacenamiento de datos en torno a la retención de datos "

"NYSE continúa empujando el sobre para un alto rendimiento, escalabilidad y confiabilidad", dijo Werr. "NYSE ha implementado grandes tuberías de la red a través de los centros de datos y sistemas de negociación. Podemos mover datos rápidamente. Los datos tienen que moverse dentro y fuera de los sistemas de análisis (como Netezza) rápido.

NYSE Technologies hace que sus sistemas disponibles para la compra e instalación de un cortafuegos o como un servicio. El sistema es rápido - en términos de análisis, no está diseñado para el comercio de alta frecuencia.Refresca a intervalos de un minuto, casi en tiempo real en el mundo de la analítica.

Algunos agentes de bolsa pedir datos en un punto específico en el tiempo, como el Flash Crash para que puedan probar sus algoritmos en contra. Mover los datos a una empresa puede ser costoso, así NYSE Technologies deja en su centro de datos y las empresas pueden probar en contra de ella sin mover los datos del día.

"Muchas empresas quieren obtener datos sobre la demanda al tiempo que deja en nuestra empresa", explicó. Los datos pueden ser ofrecidos en forma cruda o personalizado para que sea más fácil de usar.

Read more...

LA GESTION DEL CICLO DE VIDA DE DATOS DOCUMENTOS

>>  lunes, 21 de enero de 2013

Gestión del ciclo de vida de datos documentos: acercando posiciones
http://www.thinkepi.net/gestion-ciclo-vida-datos-documentos-acercando-posiciones/ 21/01/2013


Recomendamos muy especialmente este artículo que trata sobre dos planteamientos encontrados: los propuestos desde la gestión documental o records management y los impulsados desde la gestión de los datos o data management.
_________________________________________
La separación entre los ámbitos de la información estructurada y no estructurada es un hecho muy común en empresas y organizaciones. Se considera información no estructurada a toda aquella información electrónica creada u obtenida por los usuarios finales que no es almacenada en tablas de bases de datos relacionales: puede incluir e-mails, documentos ofimáticos, pdf, hojas de cálculo, presentaciones, documentos gráficos, audiovisuales, etc. Por exclusión, la información estructurada consiste en datos almacenados en campos y registros dentro de bases de datos relacionales.

El crecimiento del volumen de información en soporte electrónico que generan y manejan las organizaciones en el desarrollo de sus actividades, y el aumento de los riesgos asociados con la misma, hace imperativo el gobierno de la información. Y al abordar éste en la práctica, es cuando nos encontramos con dos planteamientos diferenciados: los que se propugnan desde la gestión documental o records management y los impulsados desde la gestión de los datos o data management.

Ver el artículo completo en: http://www.thinkepi.net/gestion-ciclo-vida-datos-documentos-acercando-posiciones
Por Elisa García-Morales
en Notas ThinkEPI 2013

Read more...

Snap Shots

Get Free Shots from Snap.com

  © Free Blogger Templates Autumn Leaves by Ourblogtemplates.com 2008

Back to TOP