Jul 24 2010

¿Cómo preservar documentos digitales?

Amigos de Genya,

En esta oportunidad trataremos un tema que suele ser recurrente en nuestros lectores y en los visitantes: “La preservación documental de los archivos digitales“.

Los que nos dedicamos a la investigación en Genealogía e historia sabemos que es frecuente encontrarse con documentos de papel que están en un estado de deterioro importante, y que en ocasiones se dificulta la lectura de su información. Esto suele suceder principalmente a causa de un mal archivado de los documentos de papel (la humedad es uno de los principales enemigos). De todos modos, puede ocurrir que haya manchas en el papel y que con un poco más de paciencia, la ayuda de una lupa y mucho esmero se pueda descubrir el contenido de las escrituras. Esto es gracias a que en general varias letras son visibles y que el lenguaje humano es redundante (escribimos más símbolos de los que necesitaríamos para comunicar la misma información). El ojo humano tiene la capacidad de reconstruir los trazos de tinta y letras faltantes.

En el caso de las computadoras las cosas son bien distintas. Para que la computadora pueda interpretar la información  que se almacena en ella, se definen formatos de archivos almacenamiento. Existen varios formatos para el almacenamiento de textos, uno de los más conocidos es el formato .doc de Microsoft Word. El formato define reglas estrictas que sigue la computadora al momento de guardar y leer el archivo. Existen diversos productos de software para la redacción de textos, que guardan la información estructurada en diferentes formatos de archivos.

En este escenario hay varios problemas que surgen:

  • Los archivos digitales tienen menos redundancia que los textos escritos: Si falta una parte de un archivo (por ejemplo, porque se dañó una disco y sólo se lee un sector de un archivo), es muy probable que la computadora no pueda interpretar la totalidad del archivo. Malogrando todo el contenido. La computadora no puede reconstruir “lo que falta”, como lo hace el ojo (o el cerebro) humano.
  • El software evoluciona en el tiempo y aparecen varias versiones de los formatos de archivos: Una nueva versión de una aplicación de software puede tomar como formato de archivo una versión que no es compatible con la versión anterior del mismo software. Ejemplos de este problema existen varios a lo largo de los años, tanto en productos de oficina, como de CAD (dibujo de planos), manipulación y edición de imágenes e incluso en software de genealogía. Este problema se conoce como preservación en el tiempo, y es la que corresponde a la analogía de los papeles atacados por la humedad, que comentamos al comienzo.
  • Los archivos deben ser universales: Distintos softwares, en última instancia distintas personas, deben ser capaces de leer un mismo archivo. Este problema se conoce como preservación en el espacio, el archivo debe trascender las fronteras de la computadora que lo originó. La analogía de este problema corresponde a la existencia de varios idiomas en la escritura del ser humano (una persona que no conoce el idioma francés no podrá, o se le dificultará, interpretar un documento de una parroquia de Francia).

Estos dos últimos problemas se mitiga utilizando formatos de almacenamiento estándar. Esto es: archivos cuyo formato sea un estándar conocido, público. Para archivar documentos que no se deben editar, el formato que reúne estos requisitos es el PDF, diseñado por la empresa Adobe. Existe una variación del formato PDF, que contempla el archivado a largo plazo de documentos electrónicos, se denomina PDF/A. Invitamos a los interesados a leer más información, sobre archivística con PDF, escrita por Adobe (en inglés).

Con respecto al almacenamiento de un archivo genealógico, el formato es el denominado GEDCOM, diseñado por la Iglesia de Jesucristo de los Santos de los Últimos Días. Del mismo modo, recomendamos conservar a largo plazo los archivos genealógicos en este formato.

Con anterioridad hemos conversado en este blog acerca del formato GEDCOM, para la exportación y almacenamiento de archivos genealógicos, que es considerado un estándar de la sociedad de genealogía.

En Genya mantenemos especial cuidado con el respeto por los estándares. En el caso de Genya Pro, es posible exportar todos los reportes a formato PDF. Además, realizamos grandes esfuerzos por mantener amplia compatibilidad con el formato GEDCOM.

Animamos a nuestros lectores a prestar atención acerca de la forma de conservación de sus archivos digitales.

Quedará para otra oportunidad conversar acerca de cómo almacenar de forma física los archivos digitales (en CD, en un disco rígido, etc.), que corresponde al problema del primer ítem.

Agradecemos los comentarios recibidos.

Hasta la próxima!