Os desafios dos arquivistas no séc. XXI se ligam a uma questão estratégica: a preservação para futuras gerações da diversidade cultural humana, face à multiplicação de documentos. O grande volume de informação digital produzida nos dias atuais poderá ser completamente perdido, a menos que técnicas e políticas sejam desenvolvidas para conservá-los.
Para realização deste trabalho foi feita uma pesquisa descritiva na forma de levantamento bibliográfico, buscando principalmente textos recentes e autores renomados na área, bem como locais de pesquisa, como bases de dados on-line de periódicos (Portal da Capes), artigos, teses, textos páginas web.
Ações de preservação de documentos digitais: migração
Em sua obra Introdução à preservação digital, Miguel Ferreira cita que migração “é a transferência de materiais digitais de uma plataforma computacional, hardware e software, em vias de descontinuidade para outra mais moderna, preservando assim a integridade dos objetos digitais. É a transferência periódica do recurso digital de uma mídia que está se tornado obsoleta ou fisicamente deteriorada, ou ainda menos estável para um suporte mais novo, de um formato ultrapassado para um formato mais atual ou padronizado. As estratégias baseadas na migração centram-se na preservação de seu conteúdo intelectual”.
Miguel Ángel Márdero Arellano, no livro Critérios para a preservação digital da informação científica, acrescenta que, “o propósito da migração é preservar a integridade dos objetos digitais e assegurar a habilidade dos clientes para recuperá-los, expô-los e usá-los de outra maneira diante da constante mudança da tecnologia. A importância da migração é transferir para novos formatos, enquanto for possível, preservando a integridade da informação”.
Uma das vantagens da migração é que ela permite o acesso rápido ao recurso, já que o documento estará sempre em um formato compatível com os padrões tecnológicos de hardware e software da época, apesar da perda de algum atributo visual.
Emulação/encapsulamento
A emulação consiste no desenvolvimento de um sistema que funcione da mesma forma que outro software já obsoleto, objetivando permitir a leitura de documentos que perderam suporte por software e hardware. Na mesma obra, Arellano descreve que “as técnicas de emulação sugerem a preservação do dado no seu formato original, por meio de programas emuladores que poderiam imitar o comportamento de uma plataforma de hardware obsoleta e emular o sistema operacional relevante. O processo consiste na preparação de um sistema que funcione da mesma forma que outro do tipo diferente, para conseguir processar programas”.
Conservação de hardware e software
Trata-se de uma estratégia dispendiosa e complexa a nível tecnológico e encontra-se em declínio apesar de ser utilizada ainda por algumas empresas. A estratégia de conservação de software e hardware sob a perspectiva de preservação digital é cara e pouco prática. Ela sugere que os dados digitais sejam preservados em mídia estável e copiados para nova mídia, caso seja necessário, e associados às cópias preservadas de uma aplicação de software original.
É necessário que software e hardware se mantenham em condições que permitam consultar a informação neles armazenada.
Reprografia
“A digitalização é um processo de conversão dos documentos para o formato digital, que consiste em unidades de dados binários, denominadas de bits – que são 0 (zero) e 1 (um), agrupadas em conjuntos de 8 bits (binary digit) formando um byte, e com os quais os computadores criam, recebem, processam, transmitem e armazenam dados”, esclarece o Conselho Nacional de Arquivos, em sua obra: publicações digitais.
A reprodução em microfilme garante que, se este for gerado com qualidade e for devidamente preservado, possibilitará acesso às informações contidas por cerca de meio milênio. Como bem destaca Marcelo Leone Santana: “Sabe-se, contudo, que a reprodução a partir de um microfilme é de qualidade inferior à reprodução a partir do original e o problema do documento multimídia permanece”.
Refrescamento
O refrescamento consiste em transferir a informação digital de um suporte físico de armazenamento para outro mais atual, antes que o primeiro se deteriore, acentua Ferreira. A desvantagem mais apontada reside no fato de o refrescamento apenas resolver os problemas de degradação e de obsolescência dos suportes.
Atualização de versões
A atualização de versões é, possivelmente, a estratégia de preservação mais vulgarmente utilizada pela generalidade dos utilizadores. Essencialmente, consiste em atualizar os materiais digitais produzidos por um determinado software recorrendo a uma versão mais atual do mesmo.
Ferreira cita que “a atualização de versões é a atualização de materiais digitais produzidos por um determinado software através de regravação em uma versão mais atual do mesmo”.
Conversão para formatos concorrentes
O processo e atualização de versões é geralmente controlado pela organização que desenvolveu a respectiva aplicação de software. A qualidade da migração depende, assim, da capacidade dos importadores fornecidos pelo fabricante e do grau de retro compatibilidade oferecido pelo novo formato.
Conforme Ferreira, “idealmente, o fabricante deveria assegurar que todos os atributos presentes numa dada versão de um formato se encontram disponíveis na nova versão que o vem substituir. No entanto, independentemente do sucesso econômico de um fabricante ou produto de software, os formatos estão constantemente sujeitos a descontinuidade. Uma forma de garantir que os objetos digitais sobrevivam a este tipo de rupturas tecnológicas consiste em convertê-los para formatos de uma linha de produtos concorrente”.
Existem, no entanto, formatos que não são dependentes de qualquer aplicação de software. Tal acontece com grande parte dos formatos de imagem (JPEG, TIFF, PNG). Isto possibilita que os objetos sejam convertidos entre formatos análogos, independentemente da aplicação utilizada na sua criação.
Normalização
A normalização tem como objetivo a simplificação do processo de preservação através da redução do número de formatos distintos que se encontram no repositório de objetos digitais, conforme o entendimento de Luiz Fernando Sayão.
Para Ferreira “existe um leque variado de opções no que diz respeito a formatos para representação de imagens bidimensionais (BMP, GIF, JPEG, PNG, TARGA). Se durante o processo de ingestão, todas as imagens digitais forem convertidas para um único formato, futuras intervenções ao nível da sua preservação poderão ser realizadas de forma mais simples e, consequentemente, mais econômica”.
Sayão, por sua vez, cita as vantagens e a política de aplicação da normalização: “migração mais fácil, mais barata e menos freqüente; automação e a transversalidade; interoperabilidade. Política de aplicação: lista de formatos tratados pelo repositório para cada tipo de informação; conversão automática para formato único; repositório limita os formatos aceitos (produtores convertem)”.
A Pedra de Rosetta Digital
Nesta estratégia, em vez de se preservar as regras que permitem descodificar o objeto digital, são reunidas amostras de objetos que sejam representativas do formato que se pretende recuperar. Estas amostras deverão existir num formato que possa ser diretamente interpretado pelo ser humano. Trata-se do conjunto de referência, por exemplo, a versão grega do decreto inscrito na Pedra de Rosetta. Com esta informação seria possível inferir as regras necessárias para traduzir/converter o objeto original para um qualquer formato contemporâneo.
“Esta estratégia deverá ser considerada apenas em situações em que todos os esforços de preservação falharam. Trata-se, sobretudo de uma ferramenta de arqueologia digital e não propriamente de uma estratégia de base para preservação de objetos digitais”, defende Ferreira.
Arqueologia digital
Conforme Ferreira, “Arqueologia digital é resgatar recursos digitais os quais tornaram-se inacessíveis pelo resultado da obsolescência tecnológica e/ou degradação da mídia, não é tanto uma estratégia em si mesma, mas uma substituta para quando materiais digitais ficaram fora de um programa de preservação sistemática”.
A arqueologia digital é uma solução parcial de preservação. Não há garantia de que seja possível recuperar a totalidade dos dados, nem a sua legibilidade.
Considerações parciais/finais
O esforço para que se consiga uma solução a longo-prazo para preservação de documentos digitais é justificado pela importância que a informação cada vez mais exerce na sociedade. Concluiu-se que muitas são as ações neste sentido, mas que ainda não existem consensos no que diz respeito às técnicas e metodologias utilizadas. Acredita-se que estratégias como a emulação e o encapsulamento são ainda muito caras e difíceis para se manter, já que exigem um maior aporte tecnológico, além de especialistas comprometidos com o processo da representação estrutural e detalhes da interpretação do documento pelos softwares e hardwares.
Entre as atuais estratégias utilizadas, apresentadas nesta pesquisa, a que parece mais viável e confiável para ser implantada seria a migração juntamente com a emulação, por serem técnicas mais utilizadas por organizações com grandes acervos, além de o foco ser o conteúdo e não apenas o suporte.