XML: RECORRIDO EN EL TIEMPO Y SU POSICION ACTUAL

La batalla por la supremacía de los datos: el costo de ignorar XML
http://www.cmswire.com/ 18/10/2012
Por Barry Schaeffer

Aunque a menudo se pasa por alto, no hay en el mundo de la información de hoy una batalla en curso entre dos puntos de vista de contenido. Los aspirantes que podría llamarse la vista "rectangular" o base de datos y la vista "jerárquica" o XML, e influyen en casi todas las decisiones relacionadas con la informatización de la información en la sociedad. En lo que sigue, vamos a tratar de arrojar algo de luz sobre esta batalla, su origen y sus efectos reales en la vida de nuestra información.

Las raíces de la relación, a menudo torturadas entre la base de datos XML y los mundos se remontan al menos a 1884 cuando Herman Hollerith tarjetas perforadas fundó lo que se convertiría datos de IBM y de negocios de procesamiento con sus filas y columnas en todas partes. Algún tiempo antes de que, el código Morse telegrafía había establecido comunicaciones en serie con la información de identificación incorporado en el flujo de datos.

El resultado fue caminos paralelos pero separados: uno, la fila y la columna mundo de los negocios de procesamiento de datos y la otra grabación, serial de lo que más tarde se convirtió en el texto - y la palabra - la transformación. Hasta la introducción de la primera relativamente asequible equipo de negocios en el año 1959estas dos vías se mantuvo separada con negocio de procesamiento de datos usando una variedad cada vez mayor de máquinas de tarjetas perforadas mientras que el texto se trasladó a teletipo y cinta de papel.

Como potencia de los ordenadores creció a través de la década de 1960, el uso de las computadoras en los negocios crecieron con ella como máquinas, aunque sigue siendo caro, vino al alcance incluso de las medianas empresas.

En los últimos 60 años, los fabricantes de hardware, centrado hasta entonces en la informática empresarial, comenzó a ver el procesamiento de textos, así como un mercado potencialmente fértil, la introducción de dispositivos magnéticos de teclado de cinta , sistemas de video de composición tipográfica y software capaz de componer texto con códigos incrustados para indicar cómo el contenido debe ser prestado. En 1964, por ejemplo, el primero dirigido por ordenador phototypesetter fue entregado a la Biblioteca Nacional de Medicina
El origen del Sistema de Gestión de Base de Datos

Durante ese tiempo, los datos de proceso de negocio, luchando con la necesidad de diseñar y desarrollar un software único para cada aplicación, comenzó el desarrollo de enfoques de software estándar a los datos, en particular la "base de datos del sistema de gestión." En un principio, había tres entradas principales de esta raza : los enfoques jerárquicos, de red y relacional, pero por mediados de los 80, Oracle Corp y su Relational DBMS ganó en una batalla no todo vale para controlar la mayoría de los datos se almacenan y se accede.
Texto Finalmente despide a plomo Tipo

En gran parte desapercibido por la comunidad de base de datos, el mundo texto había sido ocupado también, con Charles de IBM Goldfarb trabajando en un plan de marcado para identificar la estructura lógica de los contenidos, además de su procesamiento visual como había sido el caso con GML de IBM y RCA Page- 1.

En 1974, Goldfarb y su equipo se le ocurrió "Standard Generalized Markup Language" o SGML, permitiendo el desarrollo de complejos mapas lógicos de datos jerárquicos mediante etiquetas incrustadas para definir y hacer cumplir sus estructuras lógicas.SGML se convirtió en un estándar internacional en 1986 ( ISO 8879-1986 ), después de varios años de crecimiento informal en la defensa y aeroespaciales comunidades.
El texto hace sentir su presencia: el Sistema de Gestión de Contenidos

A principios de 1980, en respuesta a la creciente cantidad de contenido de texto que necesitaba de gestión, una nueva herramienta de vino en el mercado: el Sistema de Gestión de Contenidos o CMS. Con XyVision la venta su primer "Document Manager lenguaje" (PDM) en 1983 y con otras empresas que saltan a bordo, el mercado de CMS creció rápidamente en respuesta a la cantidad de inflamación contenido jerárquico está creado y publicado. En su mayor parte, estos sistemas consistía en una base de datos relacional con una capa de aplicación diseñado para realizar un seguimiento de objetos del documento.

Algunos sistemas, como el PDM, incluidas aplicaciones específicas para manejar contenido SGML basado en una DTD SGML mapa o documento, permitiendo a los usuarios frente a los contenidos de una manera jerárquica por lo menos cerca de su estructura original. Todo el software CMS, sin embargo, BLOB utilizados (grandes objetos binarios) para almacenar contenido SGML debajo del nivel en el que podría ser fragmentado, "fragmentada", como lo llamó XyVision. A pesar de la mejora de la gestión de contenidos jerárquica y ayudar a crecer el mercado de texto, CMS arquitectura todavía tendían a enmascarar el hecho de que nadie estaba tratando directamente con los matices y la complejidad del material del texto.

Subrayando la importancia creciente de texto en los años 80 a mediados de la base de datos del mundo, Oracle, en particular, se trasladó a cooptar SGML (y tal vez dirigir a los competidores de la CMS con otras bases de datos) al afirmar que la versión que se lanzará pronto base de datos sería "manejar" contenido SGML. Eso no funcionó bien, en parte porque, con toda su brillantez SGML era demasiado pesado para la verdadera eficacia de los recursos informáticos de la época.

Parecía que Goldfarb probable que haya hecho un buen trabajo de la inclusión de todas las eventualidades posibles en el estándar SGML.
New Kid on the Block ... XML

El desarrollo de XML, impulsado en parte por la frustración sobre el peso y la complejidad de SGML, liberada datos etiquetados de los gastos generales de la norma SGML y dramáticamente acelerado el crecimiento de texto al hacer el procesamiento de contenido etiquetado como sea posible en los navegadores web y los más pequeños, menos costosos locales dispositivos.

Teniendo en cuenta que lo que el mundo había etiquetado la base de datos "no estructurados" constituye una mayoría de todos los datos accesibles por computadora , las fuerzas del mercado exigió que la comunidad de la información finalmente tomar nota de esa gente loca en el mundo del texto. De repente, los presupuestos para hardware y software, anteriormente la bailía casi exclusivo de la base de datos mundial, eran conducidos al menos parcialmente, por las necesidades de texto, Web y los usuarios indisciplinados, ninguna de las cuales el modelo relacional puro maneja muy bien.

No se puede continuar con su política de ignorar el texto y el contenido jerárquico, y con el "no estructurados" apodo cada vez menos creíble, el mundo de base de datos tácitamente acordado iniciar llamando contenido XML "semi-estructurada", sostiene que debido a que su contenido no puede ser fácilmente importados en tablas relacionales y filas, XML no puede ser llamado verdaderamente estructurado.

Cualquiera que sea verdad que la posición puede contener desde un punto de vista puramente tecnológico, su impacto en el mundo de los contenidos y su gestión fue mucho más allá, que promulga el supuesto implícito de que XML, ya que no se podría llamar estructurado, en realidad debe ser estructurada.

El "semi-estructurada" etiqueta también da la impresión de que, si bien XML puede ser valioso, puede ser realmente útil sólo cuando se importa a una base de datos relacional para "real" de procesamiento. "Haz lo que quieras con XML", el mensaje indica, "pero comprar un RDBMS de todos modos, si usted es serio." No es una mala posición en el mercado, si usted está vendiendo software de base de datos relacional, sino una pesada carga si está desarrollando o vendiendo software XML y que compiten por el presupuesto con el RDBMS su cliente potencial piensa que debe tener si quiere dar el paso XML.
¿Qué camino seguir?

Desde el nivel proverbial cincuenta mil infantes, esto era todo puede ser visto como golpes simples en la evolución de los enfoques nuevos e innovadores para los datos, pero en el mundo real de las personas, las organizaciones y el contenido, el texto y el estado de XML como "semi-estructurado "retrasa nuestra capacidad para aprovechar el contenido jerárquico que constituyen una mayoría significativa y creciente de todos los datos informatizados, y con ello nuestra capacidad de aprovechar al máximo la mejor obra de nuestras dos comunidades tecnológicas y la creación de contenido. Al obligar a prácticamente todo el contenido a través del pensamiento RDBMS y tamices de software, este punto de vista limita lo que podemos esperar de contenido, y hace lo que hacemos lograr más complejo y costoso.

Una cosa es segura: no tuvimos aquí una noche, y no vamos a llegar a un estado mejor en lo referente a contenido textual día para otro. Mucha agua ha pasado bajo el puente y con él gran impacto en lo que la gente cree - y asumir - sobre la mejor manera de manejar el contenido. La adopción de un entorno tecnológico que aprovecha plenamente el contenido jerárquico en el mundo de hoy, es un paso arriesgado, tanto para la organización y la toma de decisiones.

Sin embargo, hay algunos aspectos positivos: mientras que durante algún tiempo ha habido un desarrollo activo de las "bases de datos nativas XML" en el código abierto y el mercado de segundo nivel, en los últimos años los dos principales proveedores de CMS,EMC 2 Documentum y XyEnterprise (ahora SDL) , ha añadido el procesamiento de XML nativo a sus ofertas de la CMS, y sus narraciones de marketing.

Movimientos como este, aunque todavía muy lejos de amenazar la supremacía percibida de la base de datos relacional para el contenido jerárquico, indican una evolución en el pensamiento que augura un camino alternativo para las organizaciones que se ocupan de contenido jerárquico sin obligarlos a abandonar la relativa seguridad de las empresas líderes en la industria.

Todo esto puede no algo demasiado pronto. Si la sociedad es realizar plenamente un destino en el que la información está totalmente cada participante potencial y toda forma de contenido apoyado en su forma mejor y más flexible, hay que reconocer que desde sus inicios en el siglo 19, tanto rectangular (de negocios) y en serie / jerárquica (texto) los medios de grabación de contenido tenían sus objetivos, su genio y su derecho a la plenitud de la creatividad humana.

Si bien la evolución desigual de la tecnología, especialmente la potencia del hardware, temporalmente favorecido uno u otro de estos modos, el pensamiento de la información actual debe empezar de cero, al menos conceptualmente, permitiendo que cada uno valerse por sí misma y recibir la plenitud de la innovación y la inversión para lo que hace bien. Mientras que el lado jerárquico está detrás en reclamar su lugar en el podio, tiene la teoría y la tecnología para alcanzar rápidamente la oportunidad y el apoyo.

Si fallamos en esto, el mundo de la información no va a terminar con seguridad, pero vamos a seguir para manejar la información, nuestro recurso más potente, con un brazo menos parcialmente atadas detrás de nosotros.

Archivologo Curriculum Vite

XML: RECORRIDO EN EL TIEMPO Y SU POSICION ACTUAL

>> viernes, 19 de octubre de 2012

0 comentarios :

Seguidores

About

Archivo del blog

El Archivologo

UNESCO

Siguenos en X

Sigueme en Facebook

Mis Favoritos

Mis Enlaces

MIS TWITTERS

Etiquetas

USUARIOS SEGUIDORES

archivologo.blogspot.com

Snap Shots