TAI 2 - Estrategias de Preservación Digital - Térmens

 



Capítulo IV Las estrategias de la preservación

 

En el capítulo anterior se han presentado los riesgos a que están expuestos los recursos digitales. En éste se repasan las acciones paliativas para contrarrestar algunos de los peligros descritos. El estado de la cuestión sobre cómo debe plantearse la preservación de documentos digitales revela varias tendencias, aunque ninguna de ellas resuelva totalmente el problema. A continuación se examinan las principales opciones con sus ventajas e inconvenientes. Las estrategias no se suelen aplicar en exclusiva, ya que los centros emplearán una variedad de acciones, atendiendo a factores ya introducidos anteriormente, tales como: • el formato de los recursos, • los usos previstos para ellos, • la capacidad técnica institucional disponible.

 

Además, hay que recordar que las soluciones definitivas se desarrollarán paralelamente con: • la evolución de la tecnología que ofrecerá más alternativas aún desconocidas; • la coordinación de todas las entidades implicadas (stakeholders) que aportará una mejor utilización de los recursos existentes; • el desarrollo y la aplicación de normas para señalar el camino.

Antes de hablar de los métodos empleados para evitar la obsolescencia tecnoló-gica y asegurar que los recursos sean accesibles y utilizables en el futuro, se comenta a continuación otra acción necesaria para preservar la vida de los recursos digitales: la renovación o "refresco" de los soportes para evitar que la información se pierda por el deterioro de éstos.

1. La renovación de los soportes: el refresco

 

La transferencia de los datos de un soporte a otro nuevo -conocida como "refresco" o refreshing- sirve para reducir el riesgo de la pérdida de datos debida al deterioro que sufre todo soporte, tal y como se ha explicado en el capítulo anterior. En realidad no debería considerarse una estrategia, ya que no es una opción a ele-gir sino una acción imprescindible, igual que las recomendadas para el manejo físico de los soportes. El refresco está incluido en este capítulo porque muchas fuen-tes lo tratan junto a las principales estrategias. Además, necesita una programación rigurosa, parecida a la que se tendrá que implementar para los demás procesos de preservación. La transferencia de los datos de un soporte a otro se efectúa sin causar cam-bio alguno en el software o el formato; es decir, se "refresca" el entorno. El con-tinente se renueva sin alterar el contenido. En ocasiones, el refresco coincide con un cambio generacional del soporte, como cuando se pasa información de cin-tas o discos originales a modelos actuales. La frecuencia con la que se realiza el refresco varía según la política institucio-nal y el tipo de soporte, pero siempre debería realizarse dentro del plazo recomen-dado por el fabricante. Los factores institucionales que determinarán el calenda-rio exacto de las actualizaciones incluyen, por ejemplo, el tipo de uso y las condiciones de almacenamiento. Como queda patente en el cuadro sobre la expectativa de vida de los soportes digitales, elaborado por Jones y Beagrie y expuesto en el capítulo anterior, la degradación puede ocurrir a un ritmo acele-rado si las condiciones ambientales no son las adecuadas. En resumen, el refresco no ofrece ninguna solución para proteger los datos del riesgo de la obsolescencia tecnológica ya que permanecen en su formato original. Pero es un paso -repetible e imprescindible- en el proceso de la preservación. No implica una gran inversión en equipos ni un alto grado de conocimientos técnicos por parte del personal. En cambio requiere una gestión activa: la programación del refresco según las indicaciones de los fabricantes y las mejores prácticas

 

De hecho este proceso es parecido al utilizado para la creación periódica de copias de seguridad y, por ello, a menudo se confunden los conceptos. A diferencia del refresco, las copias de seguridad no están pensadas para la preservación, sino para la recuperación en caso de pérdida de datos. Los soportes donde se graban las copias de seguridad suelen reutilizarse para la grabación de nuevas actualizaciones. Es decir, la información se actualiza en vez de los soportes, como en el caso del refresco.

 

 

identificadas por la profesión, el seguimiento del calendario establecido y la descripción mediante los metadatos técnicos de las acciones realizadas. También es importante que se observe la evolución del mercado para elegir siempre los sopor-tes que ofrezcan una vida más larga.

 

2. Cambios de los datos y de su entorno: la migración y la emulación

Como ya se ha comentado, son dos las principales amenazas para los recursos digitales: la fragilidad de los soportes y la obsolescencia del entorno informático original. En la sección anterior se ha demostrado como el acto de "refrescar" el soporte es necesario para combatir la pérdida de información debida al deterioro de las unidades de almacenamiento, tanto magnéticas como ópticas. En esta sección el enfoque se orienta hacia las medidas que toman las insti-tuciones para intentar prevenir la pérdida de la información debido al desfase del entorno digital -hardware, software, soportes y formatos- evitando así que el recurso quede inaccesible o, en otras palabras, "huérfano"2. Hoy día se suelen emplear dos estrategias principales: la migración y la emulación. Cada una tiene ventajas e inconvenientes y puede adaptarse con mayor o menor éxito a diferentes tipos de fondos digitales. Actualmente, las dos son empleadas tanto por centros que preservan sus propios documentos como por otros que asumen la responsabilidad de preservar recursos ajenos.

 

Estos últimos incluyen tanto las bibliotecas nacionales y las empresas de servicios contratadas por instituciones que carecen de una infraestructura técnica adecuada. Además de estos dos métodos, también hay una serie de prácticas que, si no llegan a ser consideradas por todos como estrategias, sí representan una forma de actuar, aunque sea por defecto. Estos incluyen: • el mantenimiento de los museos informáticos, • la reproducción en papel o en microformas, • la arqueología digital.

 

También se utiliza la palabra "huérfano" (orphan) para referirse a documentos sin el titular localizable. Ver capítulo 9: Aspectos legales.

 

2.1 La migración de los datos

 

La estrategia de "migración" tiene como función principal la conversión del docu-mento creado en un determinado entorno y codificado en un determinado formato, a otro formato para que funcione en una nueva plataforma informática: una más actual o más estandarizada. Es decir, el documento se adapta a los nuevos entornos a diferencia de lo que ocurre en la otra estrategia principal —la emu-lación (comentada en la próxima sección)— en que el entorno informático actual intenta reproducir la funcionalidad del original, sin que se efectúen cambios en el mismo documento. La siguiente definición de migración es la ofrecida por el tutorial de la Cornell University titulado Digital preservation management: (Kenney et al., 2003)

...un conjunto de tareas organizadas y diseñadas para lograr la transferencia periódica de materiales digitales desde una configuración de hardware y software a otra, o bien, desde una generación de tecnología informática a una generación posterior. (Kenney et al., 2003)

 

La migración es la estrategia más empleada hoy día, en parte porque es un pro-ceso informático muy experimentado. Sin embargo, conlleva el riesgo de que se pierdan elementos especiales —como, por ejemplo, los códigos que controlan el formato o la funcionalidad del entorno original— que no siempre se pueden preservar durante la conversión. La migración está especialmente indicada para grandes lotes de recursos de un solo formato. La posibilidad de programar de antemano las migraciones para lle-varlas a cabo en el momento oportuno contribuirá a mantener los costes más bajos. También se prevén ahorros si se llega a reducir la frecuencia con que sea necesa-rio migrar los formatos. Esto se conseguirá mediante la adopción de formatos normalizados para la creación de recursos en vez del uso de formatos propieta-rios por muy actualizados que sean. Si la migración se lleva a cabo en el momento oportuno, es relativamente sencilla. Para ello se recomienda un seguimiento constante de los avances en la tecnología, mediante un "observatorio tecnológico" (technology watch) que per-mitirá prever los cambios venideros y así tomar las decisiones adecuadas sobre la selección del nuevo entorno y programar a tiempo la migración.

¿Qué pasa si no se realiza la migración de los datos en el momento oportuno? En organizaciones que han realizado migraciones de software, la experiencia

 

demuestra que a menudo los documentos que no se utilizan cuando se realiza la migración, permanecen almacenados en su formato original, donde corren el riesgo de convertirse en "huérfanos" irrecuperables cuando su entorno quede obsoleto. Es importante reconocer que suele haber un período de variable duración en que la transferencia puede llevarse a cabo fácilmente. La migración no puede ser programada tan sistemáticamente como el refresco de los soportes cuyo calendario responde a las recomendaciones de los fabricantes y la expectativa de vida prevista. En cambio, la evolución de los formatos responde a factores externos, impulsados por la industria informática según las presiones y oportunidades del mercado, y por las agencias internacionales que trabajan en la normalización de formatos para evitar que la diversidad de formatos inhiba el avance de la ciencia y, también, del mercado. De hecho se trata de una de las numerosas contradicciones que marcan la diferencia de tratamiento entre un documento digital y otro en soporte tradicional. En el caso de estos últimos, la falta de uso se considera un elemento a favor de la conservación.

 

Sería el caso de un diario manuscrito que ha permanecido intacto dentro de un armario durante el último siglo, protegido en un microambien-te cerrado. Probablemente su estado será mejor que el de otro documento que estuviese deteriorado por los daños producidos por cien años de uso físico y efectos medioambientales nocivos. Este tipo de preservación "pasiva" o abandono benigno es positivo para la mayoría de los documentos tradicionales pero perjudicial para los digitales que pueden quedar inaccesibles en pocos años.

 

Migraciones de datos bibliográficos En el mundo de las bibliotecas, la migración puede ocurrir cuando una biblioteca cambia el sistema de gestión bibliográfica. Si los datos bibliográficos son estándar -por ejemplo, si siguen el formato MARC- pueden ser migrados sin problema. Pero la transferencia de otros datos no normalizados -los de usuarios, préstamos o proveedores- suele ser más problemática y a veces no se puede lle-var a cabo, dejando como soluciones una conversión costosa o la reintroducción manual de los datos.

 

La programación de la migración El Atmospheric Radiation Monitoring Center del Laboratorio Nacional de Oakrldge (Tennessee, Estados Unidos) calculaba que había necesidad de migrar

a nuevas tecnologías cada cuatro o cinco años, y que cada migración duraba entre seis y doce meses. (Hodge, 2000)

Diferentes variedades de la migración

 

Migración sobre la demanda: Se trata de separar el código binario de su entor-no y soporte original en el momento en que se deposite el recurso. Junto con esta cadena de bits, se guardan los metadatos técnicos que especifican cómo debe migrarse a otros entornos. De ese modo el centro evita tener que realizar migraciones periódicas de toda la colección para poder concentrar los esfuerzos y recursos en los documentos con una demanda constatada. Aunque mediante este método se ahorran los esfuerzos de las migraciones periódicas, al mismo tiempo se requiere mayor dedicación en la preparación y la actualización de los metada-tos técnicos que tienen que ser modificados paralelamente a la evolución de la tecnología. (Cedars guide to digital preservation ..., 2002).

 

Migración a un formato estándar: Se refiere a la migración del documento ori-ginal a un formato neutral o estandarizado, con una mayor duración prevista. Por ejemplo, muchos centros pasan los documentos textuales de diferentes formatos a XML, PDF u otros formatos abiertos. Por esta razón y por contar, como consecuencia, con un mayor número de usuarios, se prevé que estos formatos tendrán una vida más larga que un formato propietario. Con una medida parecida, algunos depósitos sólo admiten determinados formatos. De esta forma los depósitos pueden centrar sus esfuerzos y recursos en la gestión del fondo digital en vez de desperdigados en procesar unos formatos minoritarios. Algunas instituciones incentivan o incluso obligan a los autores a utilizar formatos estándares para la creación de documentos.

 

En cambio, otras asumen la responsabilidad de convertir el fichero a un formato estandarizado en el momento de ingresar el documento. Migración sucesiva o conversión en serie: Mediante esta técnica (conocida en inglés como serial conversión y también backward compatibility) se actualizan los documentos con cada cambio incremental del software, sea necesario o no para la operación interna. Es obvio ya que cuando se introducen nuevas versiones de software es justamente cuando existe mayor motivo por parte de los fabricantes para facilitar la conversión. De esta forma, no corren el riesgo de perder la opor-tunidad, cuando el formato esté a punto de desaparecer y existan menos facilidades para realizar la migración.

 

La migración tiene varios inconvenientes, entre los más importantes destacan: • No se puede evitar la alteración del documento original. Esta alteración puede afectar la estructura, el contenido, la apariencia y la funcionalidad en mayor o menor grado. Por la inevitabilidad de algunas alteraciones, los procesos seguidos durante la migración han de ser documentados mediante los metadatos técnicos, igual que cualquier efecto que hayan producido en el documento. De esta forma los futuros usuarios sabrán qué diferencias hay entre el documento original y la versión recuperada. • No es muy adecuado para los objetos digitales que contienen una variedad de formatos, ya que cada uno de estos necesitará recibir un tratamiento diferente, haciendo muy difícil la automatización del proceso. Actualmente la catalogación tradicional no capta con exactitud la presencia de los diferen-tes elementos incorporados en el documento, dificultando aún más la migra-ción de cada formato en el momento oportuno.

 

Elección de formatos Sabiendo las necesidades se puede elegir entre estrategias (migración, emulación, etc.) o entre los formatos hacia los que se convertirá el documento original: por ejemplo, un documento textual que podría migrarse a otro forma-to de texto o como imagen (p. ej., JPEG). Este último captura el contenido y el formato con exactitud, pero faltará la capacidad de realizar búsquedas sobre el texto, prestación que podría ser esencial para determinados colectivos como, por ejemplo, lingüistas, que estudian las concurrencias de palabras. La decisión sobre si hay que mantener este documento en formato de texto, con la probable pérdida de formato, o convertirlo en otro de imagen tendría que tomarse pensando en el probable uso futuro.

 

Resumen de ventajas e inconvenientes de la migración

 

Ventajas: • Es una operación muy experimentada. • No se requieren conocimientos técnicos muy especializados. • Se puede automatizar una parte de los procesos. • La tendencia hacia la estandarización de software y formatos facilitará la migración.

 

 

• Convierte el documento a un formato compatible con sistemas actuales.

Inconvenientes: • Es difícil programar la migración para objetos digitales complejos. • Altera el documento con el riesgo de la pérdida de elementos importantes. • Tiene que repetirse periódicamente a lo largo de la vida del recurso.

 

2.2 La emulación del entorno

 

Los partidarios de la emulación creen que esta estrategia ofrece la mejor solución para preservar recursos digitales más complejos ya que es la única que garantiza la recuperación del documento original, sin alteraciones como las inevitables que ocurren en la migración. El objetivo es que los sistemas informáticos del futuro tengan la capacidad de recuperar los datos originales, como si se tratase del software original. Así, el programa emulador permitirá que el usuario del futu-ro vea y experimente el recurso tal y cómo era cuando se creó.

 

Como se ha afirmado en la sección anterior, en vez de pretender convertir el documento original para que funcione en sistemas nuevos, la emulación convierte el entorno para que pueda leer el documento en su estado original. En su informe Avoiding technological quicksand (Cómo evitar las arenas movedizas tecnológicas), Jeff Rothenberg, el primer proponente de esta estrategia, argumentaba que la emulación era la única manera capaz -al menos en teoría- de garantizar la conservación de los datos junto con sus elementos esenciales, en lo que se refiere tanto a su apariencia como a su funcionalidad -o sea, su look and feel-"de manera coherente, automática y homologable para diferentes tipos de documentos". (Rothenberg, 1999) Debido a las ventajas de esta estrategia, el proyecto europeo NEDLIB eligió la emulación para desarrollar el prototipo de una biblioteca europea virtual de depósito de material digital.

 

El desarrollo del emulador se le encargó al propio Rothenberg. Los resultados de este proyecto contribuyeron al diseño e implantación del sistema actual empleado por la biblioteca nacional holandesa. A diferencia de la migración, la emulación no está tan experimentada y requiere unos conocimientos informáticos más avanzados, para entender la funcionalidad del sistema original y programar los sistemas actuales para que la reproduzcan. Según las conclusiones de NEDLIB, aún faltaban experiencias reales para  comprobar el funcionamiento de la emulación en la práctica.3 En 2000 Rothenberg resumía lo que quedaba por hacer para desarrollar un sistema operacional: (Rothenberg, 2000, p. 69)

 

• Desarrollar técnicas de especificaciones que puedan describir todos los atributos per-tinentes de las plataformas informáticas, con suficiente detalle para que puedan ser emuladas en sistemas del firturo. • Desarrollar técnicas para el alojamiento, con un mínimo de esfuerzo, de estos emuladores en cualquier plataforma del futuro. • Seguir retocando los metízdaos necesarios para describir los documentos digitales y para enlazarlos con el conjunto de software y el hardware emulado que les permitirá acceder en el Muro. • Asegurar que las descripciones podrán mantenerse en formato legible a largo plazo. • Seguir identificando y retocando los criterios de autenticidad y las pruebas que validan los recursos digitales de varios tipos, y así ofrecer un mecanismo para eva-luar el éxito de la preservación basada en la emulación.

 

Resumen de ventajas e Inconvenientes de la emulación

 

Ventajas: • Reproduce el documento original, incluyendo el look-and-feel. • No requiere un seguimiento continuado del formato del recurso. • Ofrece una solución para objetos digitales complejos, ya que no hay que controlar cada tipo de formato y funcionalidad que contengan. lncorzvenientes: • Hay pocas experiencias reales. • Se tendrá que actualizar los emuladores con cada cambio significativo de sistemas. • La programación de los emuladores es compleja y requiere conocimientos especializados, lo que representa un coste más elevado. • Depende de la predisposición de los informáticos en el futuro.

 

3. Un reciente estudio del estado de la preservación digital en las bibliotecas nacionales afirmó que de los programas de emulación existentes, muchos sirven para motivos "nostálgicos" como, por ejemplo, para recrear las plataformas informáticas originales de los juegos informáticos. (Verheul, 2006, p.52)

Comentarios