Capitulo 1: Exploración breve del contenido estructurado (conocido también como XML)

Cuando hablamos del Lenguaje de Marcado Extensible (XML, por sus siglas en inglés), nos referimos a un tipo de contenido estructurado. Si aún no estás familiarizado con estos conceptos, te ofreceremos una breve introducción antes de profundizar en XML e InDesign.

El primer concepto clave de XML es la estructura, a veces denominada "jerarquía". Esta se refiere a la organización de piezas de información en agrupaciones que resultan lógicas para los seres humanos. Por ejemplo, al describir un curso dentro de un catálogo de cursos universitarios, como mínimo deberías proporcionar el nombre del curso y una descripción breve. Para vincular este curso al objetivo más amplio de obtener un título, deberías incluir datos sobre la carrera a la que pertenece el curso, cuántas horas crédito suma y los prerrequisitos necesarios, si los hay.

Desde una perspectiva más general, una universidad ofrece programas de estudio que consisten en secuencias de cursos. Los créditos de los cursos deben sumar el total requerido para el programa de grado.

Si visualizas las relaciones en forma de diagrama con cajas que contienen información, podrías ver que un programa de estudio contiene un conjunto de bloques de información que se repiten, cada uno con nombres y descripciones de cursos, tal como se muestra en la Figura 1-1.

Figura 1-1. Diagrama de una posible estructura de catálogo de cursos.

Cada pieza de información que deseamos identificar y manejar recibe un nombre de elemento. El elemento de nivel superior (raíz) mostrado a la izquierda en la Figura 1-1 se denomina <Programs of Study> y consta de varios elementos <ProgramOfStudy>. Los bloques de elementos que se repiten conforman el elemento <CourseSequence>.

Los nombres de los elementos pueden ser extensos para asegurar que los humanos puedan leerlos y comprender su significado, o pueden ser breves, como Prg, Crs y TCrd, si principalmente los utilizan programas informáticos. La denominación de elementos XML depende de quién y cómo se trabaje con el XML, ya sea una persona o una máquina. Aquí hay algunas reglas generales de nomenclatura: los nombres de los elementos no pueden comenzar con un número, no pueden contener espacios ni caracteres "ilegales" como ?, >, &, y /.

El segundo concepto en XML es la semántica, que implica asignar nombres a las cosas de manera que tengan significado para ti y para otros. Así, en lugar de usar nombres como Titlemain, Titlesub y List, se utilizan denominaciones que se relacionan con el tipo de información que se está organizando: ProgramName, ProgramDescription, ProgramRequirements, CourseName, CourseDescription, Credits, etc.

La jerarquía y la semántica se combinan en el contenido estructurado y pueden traducirse en un modelo abstracto de elementos XML, como se muestra en el Ejemplo 1-1.

Example 1-1. A tree diagram of possible course catalog structure

ProgramsOfStudy

↳ ProgramOfStudy

↳ ProgramName

↳ ProgramDescription

↳ CourseSequence

↳ CourseDescriptions

↳ CourseDescription_Major

↳ CourseDescription_Name

↳ CourseCreditsHrs

↳ CourseDescription_Text

↳ CourseDescription_Fotnote

↳ CourseDescription_Minor

↳ CourseDescription_Name

↳ CourseCreditsHrs

↳ CourseDescription_Text

↳ CourseDescription_Fotnote

↳ ProgramRequirements

↳ TotalProgramCredits

↳ CumulativeGradePointAverage

Si una estructura de componentes significativos será utilizada por más de una persona u organización, se puede formalizar mediante un conjunto de reglas, como las siguientes:

Cada programa de estudio debe constar de una secuencia que incluya al menos un curso obligatorio de la especialidad principal, un curso obligatorio de la especialidad secundaria y cursos electivos. Además, las horas crédito de los cursos deben sumar el total de horas crédito requeridas para completar el programa de estudio, y las calificaciones obtenidas deben acumular un promedio mínimo para que el estudiante se gradúe.

Un conjunto de reglas para el contenido estructurado se denomina esquema o Definición de Tipo de Documento (DTD, por sus siglas en inglés). Las reglas pueden ser simples o complejas, dependiendo del número de elementos y de cómo se utilizan (si son obligatorios u opcionales, cuántas veces puede aparecer el elemento y en qué contextos, etc.).

En lugar de dedicar mucho tiempo a explorar XML y DTDs en este momento, consideraré que son parte del proceso de resolución de problemas para crear un flujo de trabajo de creación y publicación de contenido. Existen numerosos recursos en línea para aprender sobre XML y DTDs.

Los puntos clave a tener en cuenta son cómo se llaman los fragmentos de contenido (los nombres de los elementos) y cómo están organizados (la estructura). Estos aspectos son factores en la configuración de tus procesos de importación y exportación en InDesign. Los nombres de tus elementos pueden ser iguales o diferentes a los nombres de los estilos de párrafo que utilizas en InDesign.

Los atributos de los elementos XML proporcionan información adicional, típicamente para permitir distinciones más finas entre contenido que es básicamente el mismo. Por ejemplo, en un directorio de personal, un atributo podría utilizarse para indicar un jefe de departamento, de modo que cuando se muestre el nombre de la persona, reciba un tratamiento tipográfico especial en InDesign.

A menos que estés utilizando un DTD o esquema desarrollado por alguien más, puedes nombrar elementos y atributos de maneras que sean significativas para tu organización. Por eso se dice que XML es "extensible": no estás limitado a un conjunto definido de elementos como lo estarías con HTML para páginas web.

Si utilizas un DTD o esquema proporcionado por otra organización, tendrás que aprender cómo los elementos y atributos que incluye forman la estructura con la que trabajarás en InDesign. Profundizaré en el estudio de los elementos, atributos y su nomenclatura en capítulos posteriores.

Comentarios

Entradas populares de este blog

Efecto Agua con Adobe Photoshop

Efecto código binario en Adobe Photoshop

Tutorial: Introducción a la Terminología y Sintaxis Básica de JavaScript en Adobe Acrobat