Dia Mundial da Preservação Digital 2025

 

Rosália Dias Lourenço
Arquivo de Ciência e Tecnologia da Fundação para a Ciência e a Tecnologia

 

A 6 de novembro comemora-se o Dia Mundial da Preservação Digital (World Digital Preservation Day). Uma iniciativa criada em 2017 pelo Digital Preservation Coalition (DPC), um consórcio internacional que decidiu que esta data coincidisse sempre com a primeira quinta-feira de novembro.

Em 2025, o Arquivo de Ciência e Tecnologia assinala, mais uma vez, a importância da Preservação Digital para a memória futura com este texto que pretende sensibilizar os nossos utilizadores para a importância e atualidade deste assunto.

Foi a partir dos anos oitenta do século XX que o avanço tecnológico pôs na ordem do dia o ambiente digital, com a utilização de tecnologia que permite o registo, a criação, o processamento, o acesso, a utilização e o armazenamento de grandes quantidades de informação.

Foi a partir dos anos oitenta do século XX que o avanço tecnológico pôs na ordem do dia o ambiente digital, com a utilização de tecnologia que permite o registo, a criação, o processamento, o acesso, a utilização e o armazenamento de grandes quantidades de informação.

E logo surgiram novas necessidades de preservação da informação nado-digital, sistematizadas em iniciativas, programas e projetos de várias entidades, como a UNESCO e a UE, que assentam na migração eficaz da informação para garantia do seu acesso, de acordo com normas internacionais que asseguram a autenticidade dos repositórios digitais. Preservar depende da existência de sistemas onde a informação seja criada, utilizada e preservada, sob a responsabilidade dos produtores da informação e dos programas informáticos que têm de ser concebidos no pressuposto da necessidade de preservação a médio/longo prazo. Desafio complexo que carece da garantia de acesso continuado e que as características de criação da informação se mantêm inalteradas com o passar do tempo, o que só é possível antecipando a obsolescência tecnológica com a transferência sucessiva da informação para novos suportes e sistemas operativos.

A preservação tem de integrar a Gestão da Informação com a definição de regras de criação, transmissão, preservação, meta-informação normalizada e segurança em ambiente digital. Tem de ser considerada na criação de sistemas eletrónicos com a definição das etapas de preservação e acesso da informação, que garanta a compatibilidade entre sistemas e a migração quando necessária, e a meta-informação imprescindível nas situações de emulação, migração, encapsulação, aplicação de Virtual Machine Software e XML, avaliação e seleção da informação.

A existência de novas funcionalidades é um estímulo para a produção de informação, fenómeno social e cultural resultante da alteração do paradigma bidimensional para tridimensional, em que o registo escrito de informação criada num suporte passa a ser registo da criação da informação num suporte em dispositivos e plataformas tecnológicos. O acesso à informação passa a precisar de hardware e software, vulneráveis porque sujeitos à obsolescência tecnológica, mas a memória precisa de uma ação sistemática que garanta requisitos suficientes de acessibilidade, integridade, autenticidade, fiabilidade e inteligibilidade.

A preservação torna-se então a forma de garantir o uso e a inteligibilidade da informação digital e a memória de indivíduos e organizações. Passa a ser uma preocupação para os profissionais das Ciências da Informação, pois só com a preservação será possível a continuidade da memória coletiva. Aos Gestores da Informação cabe, por isso, definir soluções que impeçam a perda total da informação.

Os desafios da preservação da informação digital são a obsolescência tecnológica, as mudanças constantes dos ambientes tecnológicos, a multiplicação e disseminação da informação digital (a mesma informação em suportes e locais diferentes), a fidedignidade e inteligibilidade da informação. A obsolescência tecnológica implica perda de inteligibilidade e de acesso à informação, obriga à existência de meta-informação que caracterize o contexto de produção e alterações subsequentes e também a transferência de suportes.

O propósito maior da preservação é garantir o armazenamento e manter o acesso, garantido pela Gestão da Informação de forma transversal, através de migrações que garantam a meta-informação dos elementos formais dos documentos desde a sua criação até à sua salvaguarda, com o registo de todas as alterações efetuadas.

Preservar não é o mesmo que guardar. Os documentos digitais têm de ser autênticos, duráveis e acessíveis para sobreviverem à passagem do tempo e à obsolescência tecnológica. Preservação digital adequada é essencial para evitar perda de informação valiosa.

Preservar não é arquivar na nuvem, preservar é garantir que os documentos arquivados mantêm a autenticidade para serem fidedignos e originais; são duráveis para que se mantenham acessíveis apesar da passagem do tempo e da alteração dos formatos; mantêm acesso eficiente para que sejam recuperados de forma rápida e segura. Se não estiverem garantidas todas estas condições haverá risco de perda de informação essencial que afetará a transparência institucional e perda de parte da sua memória.

A preservação digital é um processo contínuo que implica planeamento, monotorização, atualização e auditoria. Não basta guardar, há que preservar, migrar formatos e documentar cada passo. Assim, protegemos, não só os arquivos, mas também a História e a identidade digital no futuro. É também uma forma de assegurar os direitos dos cidadãos à informação num mundo dependente dos sistemas de hardware e software em que é fácil adulterar a efémera informação eletrónica.

A multiplicação de documentos põe em causa o original, a facilidade de modificação desafia a salvaguarda da integridade, a falta de critérios na criação de documentos digitais questiona a autenticidade, a precaridade e efemeridade dos suportes é obstáculo à preservação de longo prazo.

A evidência de um documento de arquivo remete para a autenticidade (critérios formais e legais), integridade (estado completo e inalterado), fidedignidade (servir de prova digna de crédito), inteligibilidade e usabilidade (capacidade de localizar, recuperar, apresentar e interpretar) da informação.

A preservação digital pressupõe um sistema de Arquivo Digital assente num Plano de Preservação Digital com medidas e estratégias que garantam o acesso à informação digital a longo prazo. A gestão da informação digital tem de garantir o acesso à informação eletrónica e a sua autenticidade, tendo em conta os vários formatos, hardware e software usados na sua produção e utilização, o armazenamento e os utilizadores. Para garantir a confiança do sistema terá de haver conformidade legal, certificação e auditoria.
Numa realidade em que deixamos de conseguir aceder diretamente à informação porque precisamos de intermediação para produzir, armazenar e aceder, o registo da linguagem humana passou a precisar da linguagem máquina ou artificial. Perante esta novidade na forma de escrevermos e comunicarmos, novas tecnologias, novas formas de registo, novos objetos precisam de novas formas de preservação.

A dificuldade resultante do novo paradigma digital aumenta quando a maior parte das soluções se tem baseado no paradigma analógico e na transposição da sua realidade para a realidade digital. Impossível comparar realidades tão distintas. O paradigma tecnicista e custodial, centrado no documento e na instituição que o tem sob custódia, tem de atender à diversidade de repositórios digitais e à dificuldade de transpor para estes as regras de avaliação, seleção, categorização e condições de preservação.

A FCT produziu, em 2016, um Plano de Preservação Digital com medidas e estratégias para gestão do seu Arquivo Digital que garantam o acesso e a autenticidade da informação, armazenada neste repositório ao longo do tempo, ultrapassando os perigos da obsolescência tecnológica com os requisitos da norma OAIS (Sistema Aberto de Informação de Arquivo) que asseguram a confiança nos repositórios digitais.

O Arquivo de Ciência e Tecnologia (ACT) tem promovido nos últimos anos iniciativas de sensibilização para a importância da Preservação Digital, das quais é de realçar o encontro promovido no dia 7 de novembro de 2024 (Dia Mundial da Preservação da Preservação Digital 2024) intitulado Novos caminhos para a preservação e o acesso à informação. Um evento muito participado que envolveu a comunidade dos Gestores de Informação e outros interessados no tema. Ao longo desse dia foram discutidos os principais desafios dos profissionais da informação e documentação na produção, organização, disponibilização e preservação da informação em formato digital.

Ainda sem soluções definitivas para o desafio da Preservação Digital, eis que os Gestores de Informação têm desde já no seu trabalho um outro desafio – os conteúdos produzidos pela Inteligência Artificial (IA). Como será feita a sua preservação? Como será assegurada a sua memória futura?

A preservação da IA deverá assegurar a integridade, longevidade e replicabilidade de modelos treinados, algoritmos e dados, para que esses conteúdos digitais possam ser reutilizados e compreendidos no futuro. Isso envolve a preservação da meta informação dos sistemas de IA, ao longo do tempo. A preservação da IA, no âmbito da preservação digital, fará parte da produção de conteúdos e de novas ferramentas de trabalho que deverão permanecer acessíveis no futuro.

Esta preservação passará por garantir a integridade e a longevidade de modelos de IA. Ao utilizar ferramentas de IA para a preservação, torna-se crucial garantir que esses modelos, que são ativos digitais em si, sejam preservados para uso futuro. Isso pode envolver a aplicação de técnicas de preservação digital aos próprios arquivos dos modelos.
É necessário preservar o contexto e os metadados dos sistemas de IA para que determinado modelo seja útil no futuro (a forma como foi desenvolvido, treinado, configurado e utilizado é conhecida por esta informação), bem como mitigar os riscos da obsolescência de software e hardware com a emulação ou a migração dos modelos para novas plataformas.

Tudo isto é importante para que os recursos de IA, que são essenciais para a preservação digital, não se percam com o tempo e permitam que as futuras gerações saibam como continuar a utilizar esses modelos.

A utilização da inteligência artificial na UE é regulada pela Lei da IA, a primeira regulamentação abrangente sobre a IA. A prioridade do Parlamento Europeu consistiu em garantir que os sistemas de IA utilizados na UE sejam seguros, transparentes, rastreáveis, não discriminatórios e respeitadores do ambiente. Os sistemas de IA devem ser supervisionados por pessoas, em vez de serem automatizados, para evitar resultados prejudiciais. O Parlamento Europeu quis também estabelecer uma definição uniforme e neutra em termos tecnológicos para a IA, de modo a ser aplicada em futuros sistemas de IA.

Em junho de 2024, a UE adotou as primeiras regras mundiais sobre a inteligência artificial e o Regulamento relativo à Inteligência Artificial será aplicável, na íntegra, em 2026.

Outro desafio para os Gestores de Informação é a criação de conteúdos pela inteligência artificial. Assim, os sistemas de IA que podem criar imagens, áudios, vídeos, textos, entre outros itens anteriormente criados apenas por seres humanos, põem em causa os Direitos de Autor.

Juridicamente o tema é complexo e sem consenso. Há países que rejeitam a proteção dos Direitos de Autor, caso dos EUA, mas há outros, como Reino Unido e Nova Zelândia, que defendem o contrário e consideram autor a pessoa que desencadeia a produção de uma obra, ainda que esta seja criada pela IA.

Por outro lado, as criações de conteúdos pela IA podem violar direitos de terceiros sempre que utilizam bases de dados ou bancos de dados de imagens, música, vídeo e afins para criar conteúdos sem atribuir créditos ao autor original. Nos EUA e na Europa há artistas que já interpuseram ações judiciais por causa da violação dos Direitos de Autor.

A UE tem-se concentrado principalmente na regulamentação dos materiais que as empresas de IA utilizam para treinar modelos de IA generativa, mas não existe ainda regulamentação, ou orientações claras, sobre a forma como é tratada a propriedade dos resultados.

Novembro de 2025

PDF para download.

Bibliografia

Corujo, L. (2022). Introdução aos repositórios digitais. Edições Colibri.

Pacheco, A. (2017). Informação digital: O vértice comum entre a Diplomática e a Ciência da Informação. Edições Húmus.

Pinto, M. (2009). PRESERVMAP um roteiro da preservação na era digital. Edições Afrontamento.

Webgrafia

Arsénio, C. (2023, 16 dezembro). A nova lei da UE sobre Inteligência Artificial em cinco pontos essenciais. Jornal de Negócios.

Lopes, V. (S. d.). Preservação Digital. Universidade do Minho.

Pequenino, K. (2024, 13 março). Lei da IA adoptada na UE. O que mudou em cinco anos de discussões? Jornal PÚBLICO.

Sayão, L. (2012, janeiro). Metadados de preservação: Informações para a gestão da preservação de objetos digitais. Museu de Astronomia.