Jul 24 2010

¿Cómo preservar documentos digitales?

Amigos de Genya,

En esta oportunidad trataremos un tema que suele ser recurrente en nuestros lectores y en los visitantes: “La preservación documental de los archivos digitales“.

Los que nos dedicamos a la investigación en Genealogía e historia sabemos que es frecuente encontrarse con documentos de papel que están en un estado de deterioro importante, y que en ocasiones se dificulta la lectura de su información. Esto suele suceder principalmente a causa de un mal archivado de los documentos de papel (la humedad es uno de los principales enemigos). De todos modos, puede ocurrir que haya manchas en el papel y que con un poco más de paciencia, la ayuda de una lupa y mucho esmero se pueda descubrir el contenido de las escrituras. Esto es gracias a que en general varias letras son visibles y que el lenguaje humano es redundante (escribimos más símbolos de los que necesitaríamos para comunicar la misma información). El ojo humano tiene la capacidad de reconstruir los trazos de tinta y letras faltantes.

En el caso de las computadoras las cosas son bien distintas. Para que la computadora pueda interpretar la información  que se almacena en ella, se definen formatos de archivos almacenamiento. Existen varios formatos para el almacenamiento de textos, uno de los más conocidos es el formato .doc de Microsoft Word. El formato define reglas estrictas que sigue la computadora al momento de guardar y leer el archivo. Existen diversos productos de software para la redacción de textos, que guardan la información estructurada en diferentes formatos de archivos.

En este escenario hay varios problemas que surgen:

  • Los archivos digitales tienen menos redundancia que los textos escritos: Si falta una parte de un archivo (por ejemplo, porque se dañó una disco y sólo se lee un sector de un archivo), es muy probable que la computadora no pueda interpretar la totalidad del archivo. Malogrando todo el contenido. La computadora no puede reconstruir “lo que falta”, como lo hace el ojo (o el cerebro) humano.
  • El software evoluciona en el tiempo y aparecen varias versiones de los formatos de archivos: Una nueva versión de una aplicación de software puede tomar como formato de archivo una versión que no es compatible con la versión anterior del mismo software. Ejemplos de este problema existen varios a lo largo de los años, tanto en productos de oficina, como de CAD (dibujo de planos), manipulación y edición de imágenes e incluso en software de genealogía. Este problema se conoce como preservación en el tiempo, y es la que corresponde a la analogía de los papeles atacados por la humedad, que comentamos al comienzo.
  • Los archivos deben ser universales: Distintos softwares, en última instancia distintas personas, deben ser capaces de leer un mismo archivo. Este problema se conoce como preservación en el espacio, el archivo debe trascender las fronteras de la computadora que lo originó. La analogía de este problema corresponde a la existencia de varios idiomas en la escritura del ser humano (una persona que no conoce el idioma francés no podrá, o se le dificultará, interpretar un documento de una parroquia de Francia).

Estos dos últimos problemas se mitiga utilizando formatos de almacenamiento estándar. Esto es: archivos cuyo formato sea un estándar conocido, público. Para archivar documentos que no se deben editar, el formato que reúne estos requisitos es el PDF, diseñado por la empresa Adobe. Existe una variación del formato PDF, que contempla el archivado a largo plazo de documentos electrónicos, se denomina PDF/A. Invitamos a los interesados a leer más información, sobre archivística con PDF, escrita por Adobe (en inglés).

Con respecto al almacenamiento de un archivo genealógico, el formato es el denominado GEDCOM, diseñado por la Iglesia de Jesucristo de los Santos de los Últimos Días. Del mismo modo, recomendamos conservar a largo plazo los archivos genealógicos en este formato.

Con anterioridad hemos conversado en este blog acerca del formato GEDCOM, para la exportación y almacenamiento de archivos genealógicos, que es considerado un estándar de la sociedad de genealogía.

En Genya mantenemos especial cuidado con el respeto por los estándares. En el caso de Genya Pro, es posible exportar todos los reportes a formato PDF. Además, realizamos grandes esfuerzos por mantener amplia compatibilidad con el formato GEDCOM.

Animamos a nuestros lectores a prestar atención acerca de la forma de conservación de sus archivos digitales.

Quedará para otra oportunidad conversar acerca de cómo almacenar de forma física los archivos digitales (en CD, en un disco rígido, etc.), que corresponde al problema del primer ítem.

Agradecemos los comentarios recibidos.

Hasta la próxima!


Dec 16 2008

Compartir información

La genealogía es una actividad social, en la cual es muy importante y provechoso compartir información.

La posibilidad de compartir información permite explorar nuevas ramas de descendientes hasta el momento desconocidas, ahorra mucho trabajo de investigación, evitando realizar un relevamiento, o consulta a algún archivo de datos que ya ha sido consultado por otro investigador. Esto toma importancia cuando se debe viajar para poder investigar.

Internet y las comunicaciones actuales han facilitado enormemente la posibilidad de compartir información. Para comunicar datos genealógicos construidos con distintos softwares, la Iglesia de Jesucristo de los Santos de los Últimos Días ha diseñado un estándard de comunicación denominado GEDCOM. De esta manera, todos los software de PC que sean capaces de escribir y leer archivos en formato GEDCOM podrán intercambiar información entre sí.

Genya interpreta archivos en formato GEDCOM y es capaz de exportar el contenido de un árbol genealógico a este formato para que pueda ser procesado por otro software. Además, Genya interpreta las particularidades que los softwares más conocidos del mercado le adicionan a sus archivos GEDCOM, de modo de asegurar la exactitud de los datos comunicados.

En futuros atículos comentaremos algo más sobre el formato GEDCOM.