A digitalização de documentos cartográficos da Biblioteca Nacional de Portugal (BNP) teve início no contexto da criação de sites temáticos, muitas vezes comemorativos ou relacionados com exposições documentais, ou integrados em projetos de colaboração institucional.

Com o aparecimento das denominadas “bibliotecas digitais”, iniciou-se na BNP um processo de digitalização mais consistente deste tipo de materiais, tendo rapidamente surgido a necessidade de definir critérios, procedimentos e normas técnicas para a digitalização e disponibilização destes documentos em linha.

Este artigo relata a evolução dos processos de digitalização de documentos cartográficos, partindo de contextos de projetos circunscritos no tempo e limitados a determinada temática, para depois progredir para a constituição de verdadeiros programas de digitalização, caracterizados pela definição de políticas e procedimentos consistentes, capazes de assegurar a sustentabilidade técnica e organizacional de um serviço regular de criação, disponibilização e gestão de conteúdos e serviços digitais.

2. Digitalização de documentos cartográficos da BNP: génese e contexto das primeiras experiências

2.1 Participação em projetos pontuais

Na Biblioteca Nacional de Portugal as primeiras experiências de digitalização emergiram no final da década de noventa do século XX e resultaram de oportunidades de financiamento no âmbito de projetos nacionais, comunitários ou internacionais. No que se refere a documentos cartográficos, considera-se neste capítulo a participação em dois projetos distintos: um projeto de digitalização e disponibilização dessas imagens em sítio Web temático (projeto “Cartografia do Brasil…”) e um projeto de enriquecimento de conteúdos já digitalizados (projeto “Digmap”).

a) Projeto “Cartografia do Brasil nas Coleções da Biblioteca Nacional 1700-1822”

Uma das primeiras experiências da BNP consistiu na digitalização de mapas do Brasil, que decorreu entre 1998 e 2000, no âmbito das comemorações dos 500 anos da Descoberta do Brasil, e que foi realizada em parceria entre a Biblioteca Nacional de Portugal e a Comissão para as Comemorações dos Descobrimentos Portugueses. As imagens destes mapas foram disponibilizadas no sítio Web “A cartografia do Brasil nas coleções da Biblioteca Nacional (1700-1822)”, que pode ser acedido através do seguinte endereço: http://purl.pt/103.

Este sítio temático, versão bilingue (em português e inglês), inovador para o tempo em que foi produzido, inclui vários índices de pesquisa, bem como uma descrição geral do projeto e da exposição, com a apresentação dos cinco núcleos que a compuseram, cumprindo, assim, os objetivos de divulgação dos conteúdos digitalizados e da exposição. No entanto, este sítio foi concebido como um produto muito análogo a um mero catálogo de exposição impresso, sem qualquer possibilidade de atualização dinâmica e sem integração com a base de dados bibliográficos da BNP. Este e outros sítios temáticos correspondem a uma tipologia de objetos, concebidos no âmbito de projetos circunscritos no tempo, desenvolvidos em parceria e subsidiados por entidades externas, na primeira fase de digitalização de documentos na BNP. Apesar de se tratar de um site de conteúdos estáticos (http://purl.pt/103), a verdade é que este é um dos objetos digitais mais acedidos na Biblioteca Nacional Digital (BND), registando uma média mensal de 4.000 visitas e estando quase permanentemente na lista mensal dos 15 objetos mais visitados da BND.

b) Projeto “DIGMAP – Discovering our past world with digitized Maps”

Ainda no âmbito das experiências de aprendizagem facultadas pela participação em projetos relacionados com a digitalização e acesso de documentos cartográficos, cabe, também, aqui referir a participação da Área de Cartografia da BNP no projeto DIGMAP. A participação neste projeto europeu, também permitiu a captação de verbas para a digitalização de alguns documentos cartográficos selecionados para o efeito. Este projeto decorreu no âmbito do Programa eContentplus (Out. 2006 – Out. 2008) e teve como objetivo principal, o desenvolvimento de um novo software que reutilizasse recursos já disponíveis na internet para obtenção de resultados de melhoria de acesso a documentos cartográficos. Ou seja, implementar acessos privilegiados a descrições de documentos cartográficos com imagens digitalizadas associadas, representados em bases de dados de distintos catálogos em linha de diferentes instituições europeias, através da reutilização de outros recursos disponíveis na internet, designadamente mapas Google e tesauros geográficos, para gerar formas avançadas de pesquisa e recuperação, no universo específico destes documentos. Um dos aspetos mais apelativos e inovadores consistiu na indexação da imagem, que teve por base a georreferenciação das imagens dos mapas, por um processo automático de fazer coincidir as imagens digitalizadas dos mapas, por sobreposição, com as áreas geográficas dos mapas Google, garantindo, assim, a extração automática de coordenadas geográficas, cujos valores eram transpostos para os registos bibliográficos. Independentemente de algumas limitações, relacionadas com as margens de erro que este procedimento veio a revelar, sobretudo para cartografia antiga e para determinadas tipologias de projeção, foi uma experiência enriquecedora em termos de aprendizagem, por todas as fases exploratórias em que se baseou. O portal e o software em código aberto, principal produto deste projeto, ainda hoje se encontra disponível na Internet e pode ser acedido através do seguinte endereço: http://portal.digmap.eu/?locale=pt].

Se a primeira experiência, iniciada em 1998, teve como resultado a criação de um sítio Web estático, muito similar a um catálogo impresso e que disponibilizava dados e conteúdos inseridos manualmente; o projeto DIGMAP partiu da informação disponibilizada na base de dados bibliográfica da BNP, para a extração de informação com o objetivo de gerar outras formas de exploração, a partir da reutilização de conteúdos pré-existentes e disponíveis na Internet, com recurso a tecnologias de informação inovadoras, capazes de propiciar experiências mais avançadas de exploração desses recursos.

2.2 Disponibilização sistemática de documentos cartográficos na BND

Em paralelo com outros projetos similares de bibliotecas digitais, emergentes ao tempo, a Biblioteca Nacional Digital (BND) foi lançada em 2002, no âmbito da melhoria da qualidade dos serviços prestados pela BNP, visando oferecer um serviço para acesso online a todos os seus conteúdos digitais. Este projeto beneficiou de financiamento comunitário e caracterizou-se por uma forte aposta na inovação e experimentação tecnológica, numa época marcada pela ausência de software comercialmente disponível para os diferentes processos desta área: captura e geração de imagens, produção de metadados, publicação em linha, gestão de armazenamento digital, etc.

Entre 2004 e 2005, no âmbito de um projeto de digitalização, também com o apoio de fundos comunitários, foram digitalizados cerca de 1100 documentos cartográficos, correspondentes a aproximadamente 1000 mapas e 100 atlas. Os critérios de seleção, para os documentos cartográficos, tiveram por base as representações do espaço geográfico nacional, da Península Ibérica e de espaços extraeuropeus no período cronológico em que estiveram sob administração portuguesa.

No decurso do processo de digitalização estes critérios sofreram algumas alterações, em função de condicionantes de ordem prática, relacionadas quer com o maus estado de preservação dos documentos, quer com os grandes formatos de certas obras.

A partir de 2006 e no contexto da reforma da administração pública portuguesa, ultrapassou-se a fase experimental e de projeto, tendo-se procedido à implementação de medidas de criação de um serviço dedicado à criação e gestão de conteúdos digitais, no contexto das prioridades estratégicas que viriam a ser formalizadas no Plano Estratégico da Biblioteca Nacional de Portugal para 2007-2010. Esta estratégia da BNP para os conteúdos e serviços digitais foi orientada pela necessidade de criar estruturas técnicas e organizacionais sustentáveis e integradas, capazes de alimentar continuamente uma massa crítica de recursos culturais online que pudessem servir, simultaneamente, a preservação do património e as necessidades de investigação, bem como de contribuir para a formação e cooperação de serviços integrados, tanto a nível nacional como a nível internacional.

Neste contexto foi criada, em 2007, uma unidade orgânica responsável pela produção e gestão de conteúdos digitais, com o objetivo principal de desenvolver processos de digitalização sistemática de conteúdos, seguindo linhas de atuação contínuas e consistentes. Assim sendo, a partir dessa reestruturação orgânica verificou-se a plena integração e articulação dos serviços de digitalização com as outras unidades da BNP, em que se inclui o serviço de coleções especiais, onde se integram as coleções cartográficas. Como resultado desta reorganização interna, nos últimos sete anos foi redefinida uma política de seleção de conteúdos digitais, critérios e procedimentos técnicos para a digitalização e organização do arquivo digital. Ao longo deste processo de reestruturação, a BND deixou de ser um projeto especial administrado lateralmente por equipas especiais pouco integradas e articuladas com os restantes serviços da BNP, tendo-se transformado num serviço integrado, plenamente assimilado e integrado na BNP.

3 Coleções de Cartografia na BND: conteúdos e serviços

De 2007 até à atualidade, a BNP deu prioridade à melhoria das suas capacidades de produção de conteúdos digitais, através da revisão de procedimentos de digitalização, aquisição de equipamentos mais adequados, bem como da renovação das infraestruturas de armazenamento digital. A redefinição de políticas e metodologias de trabalho para a BND, contemplam as seguintes vertentes: seleção de documentos para digitalização, captura e processamento de imagem; gestão do arquivo digital e desenvolvimento de novos interfaces e funcionalidades para a visualização e utilização de imagens.

Nos pontos que se seguem começaremos por caracterizar os conteúdos de natureza cartográfica atualmente disponíveis na BND, abordando em seguida as novas políticas e metodologias de trabalho aplicadas à disponibilização em linha de documentos cartográficos.

3.1 Caracterização e critérios de seleção de conteúdos

Atualmente a BND disponibiliza em linha cerca de 26 000 títulos de documentos, a que correspondem aproximadamente dois milhões de imagens (conferir documento com caracterização geral dos conteúdos da BND, disponível em http://purl.pt/resources/ConteudosBND.pdf). Neste universo incluem-se um conjunto de cerca de 1.800 documentos cartográficos, com cerca de 10.000 imagens, o que representa uma percentagem de cerca de 0,5 % da totalidade das imagens disponíveis.

Dos 1.830 títulos disponíveis na BND e que se integram na coleção de Cartografia, cerca de 1.740 correspondem a material cartográfico (mapas, plantas, etc) e aproximadamente 80 títulos a material textual cartográfico (atlas, por exemplo).

O documento cartográfico mais antigo que está disponível na BND é um atlas, Geografia de Ptolomeu, edição de Estrasburgo de 15131 (http://purl.pt/24484). A grande maioria dos documentos cartográficos disponíveis na BND foram publicados entre os séculos XVII e XIX, conforme se pode observar no quadro abaixo.

50_16_01
Gráfico 1

No que se refere aos critérios adotados para a seleção de documentos a digitalizar, os mesmos foram estabelecidos em função dos três grandes objetivos da atividade de digitalização da BNP:

  • a) Promover a divulgação das coleções da BNP;
  • b) Preservar os documentos originais;
  • c) Colaborar em atividades editoriais e exposições da própria BNP, ou em outros eventos culturais ao nível nacional, internacional e comunitário.

Aplicando as orientações gerais para a seleção de documentos a digitalizar (disponíveis em http://purl.pt/resources/PoliticaDigitalizacaoBND.pdf), podemos distinguir quatro grandes linhas de ação:

  • a) Coleções de obras reservadas, que englobam as obras mais valiosas do património bibliográfico português. Devendo cada coleção ser considerada na sua globalidade, ou numa parte substancial, e não apenas os seus documentos mais significativos, por forma a reunir uma massa crítica de informação, permitindo assim o relacionamento dos documentos digitalizados. Ao abrigo deste critério foi selecionada para digitalização a coleção de alcobacenses da Divisão de Reservados e os documentos cartográficos provenientes do Mosteiro de Alcobaça, de que são exemplo, os atlas: Theatro de la tierra universal…, de Abraham Ortelius, impresso en Anvers, por Christoval Plantino, em 1588 (http://purl.pt/26148) e o Atlas marítimo de España, de Vincente Tofiño de San Miguel, composto por 15 mapas, datados de 1786 (http://purl.pt/784), e três mapas de Eustache Herisson, publicados em Paris por Chez Basset, 1795, respectivamente: Mappe monde en deux hemispheres (http://purl.pt/3751), Carte général de l’Afrique… (http://purl.pt/3753) e Carte génerale de l’Asie.(http://purl.pt/3752);
  • b) Obras raras ou únicas em Portugal, ou no mundo: cujo valor intrínseco justifica a sua digitalização, independentemente da coleção a que pertençam transversal a todas as coleções sempre o que o seu valor intrínseco expresso na classificação como Tesouro da BNP o justifique. São exemplo da aplicação deste critério às coleções cartográficas, a disponibilização em linha da carta náutica do Atlântico Norte, manuscrita, em pergaminho, atribuída a Lopo Homem, de cerca de 1550 (http://purl.pt/5053); do atlas manuscrito, em pergaminho, atribuído a Fernão Vaz Dourado, de cerca de 1576 (http://purl.pt/400); do mapa manuscrito da Correição de Santarém, atribuído a João Teixeira Albernaz, de cerca de 1640 (http://purl.pt/4010); da Vista da barra e da costa da cidade de Lisboa, de Bernardo de Caula, datada de 1763 (http://purl.pt/13906) e ainda do Mapa da configuração de todas as praças fortalezas e baterias do Reino do Algarve, de José de Sande Vasconcelos, de cerca de 1788 (http://purl.pt/762), também manuscritos;
  • c) Obras frágeis: que apresentam riscos adicionais de serem danificadas pelo manuseamento de consulta pública, quer pelo estado de conservação quer pela qualidade do suporte e formato, como é o caso de alguns mapas colados em tela e com camada de verniz, por exemplo do Mapa hidrográfico da costa do Reino do Algarve, da autoria de José Sande de Vasconcelos, de cerca de 1793 (http://purl.pt/23688); de alguns mapas de grandes formatos, como é o caso do mapa do Douro português e país adjacente…, de Joseph James Forrester, publicado em Londres em 1848, cujo comprimento ultrapassa os três metros (http://purl.pt/22487); de obras impressas em papel muito frágil, como é o caso dos Estudos corográficos, físicos e hidrográficos da bacia do Tejo…, de Manuel José Júlio Guerra, publicados pela Imprensa Nacional entre 1861 e cerca de 1864, que se compõem de 1 volume de texto, 8 plantas e 7 perfis (http://purl.pt/21846); de obras encadernadas, ou inseridas em capas, que pelo seu peso e dimensões são difíceis de manusear, como são os casos da Planta do Rio Minho desde sua foz até a confluência do rio Trancoso, da responsabilidade da Comissão Internacional de Limites entre Portugal e Espanha, publicada em 1898, composta por 59 folhas, inseridas em capa (http://purl.pt/24780), e, ainda, do atlas Maps and plans, showing the principal movements, battles & sieges, in which the British Army was engaged during the war from 1808 to 1814, de James Wyld, publicado em Londres em 1840, composto por 50, em 39 fólios, cinco dos quais duplos e dobrados e 5 vistas em 1 fólio (http://purl.pt/25343)
  • d) Digitalização colaborativa ou de oportunidade: que contempla a digitalização integral e sistemática de conjuntos de documentos selecionados no âmbito de projetos de edição, ou eventos culturais e comemorativos a nível nacional e internacional, ou no contexto de apoios financeiros a projetos de digitalização. Como principais exemplos de aplicação deste critério, podem por exemplo consultar-se os documentos cartográficos cuja digitalização foi financiada pela Fundação Luso Brasileira, no âmbito do Projeto “Portuguese Culture”, disponíveis em: http://purl.pt/index/cartography/EN/index.html

3.2 Normas técnicas e procedimentos de digitalização/publicação

a) Captura de imagem

No que respeita às normas estabelecidas para a qualidade das imagens, é necessário considerar vários aspetos, tais como, a natureza do documento analógico, as necessidades dos utilizadores, os objetivos da digitalização e os recursos técnicos e financeiros disponíveis (Kenney, 2000).

Os principais requisitos para a captura de imagens digitais, produção de cópias de consulta e processamento de imagem, são os seguintes:

  • Requisitos gerais: o primeiro dos requisitos gerais para a digitalização de documentos da BNP consiste na completude da imagem, ou seja a imagem não deve ser cortada, nem incluída mais do que uma página em cada imagem. Decorre deste princípio geral que em redor da imagem capturada deve ser preservada uma margem mínima, de forma a poder facilmente constatar que nenhuma informação do documento original foi desprezada. A imagem também deve respeitar as dimensões e escala do documento original. No caso de documentos de grande dimensão e com elevado nível de detalhe como é o caso de muitos dos documentos cartográficos, paralelamente à imagem que captura a totalidade do documento, poderão ser criadas imagens sectoriais, que confiram maior resolução aos detalhes. Seguem-se, também, as recomendações do NARA (2004) quanto à colocação de folhas brancas ou cremes por trás do documento original, de forma a maximizar o brilho do documento e a tornar a margem menos “visível”, no entanto, por razões de ordem técnica e de gestão, este princípio apenas é observado, de forma sistemática, na digitalização de obras reservadas, especialmente quando as mesmas se apresentam em muito mau estado de conservação. Por último, estabeleceu-se a utilização de cunhas de cor para documentos em que a cor tenha valor informativo, como são os casos dos documentos cartográficos, uma vez que as mesmas permitem a configuração dos scanners e monitores, para uma reprodução mais rigorosa das cores e tons.
  • Requisitos técnicos: foram definidos requisitos diferenciados para as imagens de arquivo, ou matrizes, e para as imagens de consulta. Com efeito, os requisitos técnicos para as imagens de arquivo devem ser mais exigentes, uma vez que se pretende que as mesmas salvaguardem, a longo prazo, o valor da imagem, maximizando o investimento da digitalização ao evitar que a captura tenha de se realizar mais do uma vez e ao permitirem a criação de imagens derivadas ou de consulta. Se as imagens de arquivo devem obedecer a requisitos de qualidade mais elevados dos que em cada momento se estabelecem para as imagens em geral, já as imagens de consulta são derivadas das primeiras em resposta às necessidades dos utilizadores e de acordo com a tecnologia disponível em cada momento (Kenney, 2000).

Relativamente aos formatos dos ficheiros de imagem a BNP adotou os seguintes formatos:

  • Formato TIFF (Tagged Image File Format), versão 6, para as imagens de arquivo, uma vez que este é considerado o standard de facto para matrizes, por preservar a resolução, a profundidade de cor e os metadados das imagens, para além de ser um formato bem documentado, largamente aplicado e compatível com múltiplas aplicações e plataformas.
  • Formato JPEG (Joint Photographic Experts Group), para as imagens de consulta, que permite níveis de compressão ajustáveis e portanto reduz o tamanho dos ficheiros, tornando mais rápida a sua visualização e transmissão na Web, bem como o formato PDF (Portable Document Format), que permite reunir num único documento vários ficheiros de imagem, o que facilita a consulta e o download de documentos multipágina.

O nível de resolução de uma imagem depende do tamanho e do detalhe do documento original, pelo que a BNP aplica os métodos definidos pela Universidade de Cornell (Kenney, 2000) e que se baseiam na fórmula Quality Index (IQ) para determinação dos níveis de qualidade de uma imagem. Não sendo, contudo, possível aplicar estes métodos item a item, a BNP estabeleceu como padrões mínimos de resolução 300 dpi para imagens de arquivo e 150 dpi para imagens de consulta, sem embargo de as características de cada documento poderem determinar outros níveis de resolução.

Sobre a compressão dos ficheiros de imagem, seguindo as recomendações do NARA (2004) e as melhores práticas de instituições congéneres, a BNP definiu a não compressão de matrizes, para facilitar a preservação digital das mesmas, garantindo a sua integridade.

A profundidade de cor corresponde ao número de bits por pixel (bpp). Quanto maior for o número de bpp, mais cores podem ser representadas. No contexto das actuais linhas de acção estabelecidas para a digitalização na BNP, adotou-se, tanto para as matrizes como para as imagens derivadas, o padrão de 24 bpp (cor) e não 1 bpp (preto e branco), nem 8 bpp (escala de cinzas), uma vez que grande parte dos documentos originais têm manchas ou papel escurecido. O modo de cor adotado é o RGB, por ser o utilizado em monitores de computadores.

Sobre o processamento de imagem, seguindo as orientações do NARA (2004), a BNP procede a um processamento mínimo das imagens de arquivo, efetuando o crop da imagem, deixando pequenas margens como acima se referiu, convertendo a cor para RGB quando necessário, endireitando a imagem e efetuando ajustamentos mínimos de cor. Com efeito, apenas os ficheiros raw não sofrem qualquer tipo de ajustamento de imagem, os TIFF têm sempre um processamento mínimo, durante a digitalização e mesmo antes da gravação da imagem, pelo que é preferível efetuar ações mínimas sobre as matrizes que tornem a representação do original mais rigorosa e que permitam depois processos em batch sobre as imagens digitalizadas, por exemplo para a criação das imagens derivadas.

b) Criação e associação de metadados

A natureza digital dos conteúdos e o ciclo de vida dos objetos digitais requerem novas funcionalidades (v.g. estruturação, preservação, gestão e controlo de acessos), a que deverão corresponder novos tipos de metadados, distintos dos necessários aos sistemas de informação bibliográfica.

Fruto da diversidade de sistemas de informação digital (bibliotecas, arquivos, museus, empresas, etc), existe uma grande variedade de standards e formatos de codificação de metadados. A ausência de um conjunto estável e único de funcionalidades para os sistemas de informação digital e de esquemas de metadados, determinou a necessidade de definir para as colecções digitais da BNP tanto os objectivos do sistema de metadados, como os esquemas a adoptar para expressar esses metadados e os métodos para o seu empacotamento com as imagens digitalizadas que descrevem.

Apresentam-se, seguidamente, os requisitos de metadados para as obras digitalizadas a partir das coleções da BNP, por tipologia ou função dos mesmos, e, bem assim, os esquemas selecionados para a sua expressão e respetivo empacotamento de acordo com o esquema METS.

  • a) Metadados descritivos – Consistindo a função dos metadados descritivos na descoberta e identificação do recurso, estes metadados referem-se sempre ao documento analógico que foi digitalizado, sendo portanto distintos da informação técnica das imagens digitais. Estando os metadados bibliográficos armazenados no catálogo bibliográfico, i.e. fora do objeto digital, é importante haver informação descritiva básica a acompanhar os metadados criados no momento da captura da imagem, que permita identificar os ficheiros de imagem durante e após o processo de produção. Por este motivo, os metadados descritivos associados aos objetos digitais da BND consistem quer em apontadores para o registo bibliográfico, quer num ficheiro (unimarc.xml) que importa a informação do registo bibliográfico para o recurso digital. O esquema MARCXML, adaptado ao formato UNIMARC, é utilizado para codificar estes metadados descritivos armazenados no objeto digital. A adopção pela BNP do esquema MARCXML para a definição de elementos MARC num esquema XML, justifica-se por este esquema permitir a conversão sem perdas de e para o formato MARC (ISO 2709), para além de suportar todos os formatos MARC, incluindo o UNIMARC. Os apontadores para o registo UNIMARC no catálogo bibliográfico e para o ficheiro unimarc.xml estão especificados na secção dmdSec dos ficheiros METS de empacotamento do objecto digital.
  • b) Metadados administrativos – Os metadados administrativos possibilitam funções de gestão interna dos recursos digitais, sendo determinados pelas necessidades locais da organização. Também denominados por meta-metadados, constituem informação que descreve os próprios metadados, os esquemas adoptados, o criador e a data de criação dos metadados, etc. A BNP aplica o esquema METS para especificar os seguintes metadados administrativos: identificador único do recurso ou cota, localização do esquema (atributos de ); criador, data de criação e modificação do ficheiro METS (atributos de ). Para além do METS, é também utilizado o esquema ContentE para especificar metadados administrativos referentes ao programa de criação de metadados (ContentE) e identificar o ficheiro metsItems.xml, que encapsula todos os metadados e imagens do objecto digital.
  • c) Metadados técnicos – Os metadados técnicos descrevem os atributos das imagens digitais, o processo e o ambiente técnico da captura, com a função de apresentar, render e permitir a utilização do recurso digital. Propiciando a informação de que as aplicações necessitam para utilizar os ficheiros e controlar as transformações e migrações das imagens para formatos diferentes, estes metadados devem ser sempre expressos de forma estruturada. Os requisitos de metadados técnicos especificados pela BNP são os seguintes:
    • Para os ficheiros de imagem de arquivo em formatoTIFF, devem ser preenchidas as etiquetas que a especificação TIFF 6.05 determina como obrigatórias: nº de pixeis na horizontal e vertical, esquema e profundidade de cor, compressão, cota do documento, equipamentos e software de captura, resolução, data e hora da captura, nome da entidade que digitaliza e copyright da imagem.
    • Para fazer face aos inconvenientes das etiquetas TIFF que consistem essencialmente na dificuldade de utilização e armazenamento dos dados delas extraídos e no facto de a maior parte dos programas não localizarem nem apresentarem etiquetas privadas, a BNP adoptou o esquema MIX6 para a expressão dos metadados técnicos das imagens de arquivo de acordo com a norma Z39.87, num ficheiro .xml separado do recurso descrito. A opção pelo formato MIX para os metadados técnicos justifica-se por se tratar de um esquema aplicável quer a ficheiros TIFF, quer ao formato JPEG2000; por ser um esquema de extensão do METS; por especificar elementos constantes de uma norma nacional NISO, por esses elementos estarem harmonizados com o esquema PREMIS; e por especificarem dados técnicos fora dos ficheiros de imagem, o que permitirá num futuro próximo acelerar o processo de produção de metadados técnicos de imagens de arquivo, já que não será necessário obter essa informação a partir dos cabeçalhos das matrizes. Os elementos do esquema MIX são na sua maioria coincidentes com as etiquetas TIFF, com excepção dos metadados relativos ao tamanho da imagem, formato e checksum que não podem ser expressos nos cabeçalhos dos ficheiros TIFF. O software que produz os metadados técnicos no formato MIX foi desenvolvido por entidade externa para a BNP e encontra-se de momento em fase de teste, pelo que estes metadados não serão referidos a propósito do encapsulamento METS que adiante se descreve.
    • Para o conjunto dos ficheiros de imagem correspondentes a cada item do objecto (cópias de consulta e cópia de arquivo), é produzido um ficheiro de metadados técnicos (info.xml) com a seguinte informação relativa a cada conjunto de ficheiros de imagem: formato, tamanho, resolução, nº de ficheiros e profundidade de cor. Estes metadados são especificados no esquema local da BNP Tech-info7. Os metadados técnicos são ainda especificados ao nível de cada ficheiro de imagem, utilizando os seguintes elementos da secção fileSec do METS: formato, tamanho e checksum.
  • d) Metadados de direitos – Os metadados de direitos permitem identificar o titular dos direitos e o estatuto legal do recurso digital, para o efeito de implementação de restrições de acesso e utilização. Os metadados de direitos de acesso às cópias digitais da BND são especificados para cada item, de acordo com os elementos do esquema local Rights para descrever o tipo e permissões de acesso e utilização de cada item, bem como os detentores desses direitos
  • e) Metadados estruturais – Os metadados estruturais desempenham a dupla função de registar a informação necessária para a reconstrução de um recurso a partir das suas partes constitutivas e de descrever a estrutura de um recurso de forma a facilitar o acesso ao documento e a partes específicas do mesmo. Para o empacotamento dos diferentes tipos de metadados que integram o objecto digital, recorre-se ao esquema METS, criando para cada objecto um ficheiro metsItems.xml e, para cada item, ficheiros mets.xml. No que respeita à segunda função dos metadados estruturais, possibilitar o acesso ao documento e a partes específicas do mesmo, utiliza-se a secção fileSec do esquema METS para descrever quer os vários itens do objecto digital (item de arquivo e itens de consulta), quer o conjunto de imagens que compõem cada item. Utiliza-se, ainda, o elemento StructMap do esquema METS para descrever a estrutura física de cada item, i.e. a sequência das imagens ou paginação, e a estrutura lógica ou as partes constitutivas do conteúdo de um documento. Para o empacotamento dos diferentes tipos de metadados que integram o objecto digital, recorre-se ao esquema METS, criando para cada objecto um ficheiro metsItems.xml e, para cada item, ficheiros mets.xml. No que respeita à segunda função dos metadados estruturais, possibilitar o acesso ao documento e a partes específicas do mesmo, utiliza-se a secção fileSec do esquema METS para descrever quer os vários itens do objecto digital (item de arquivo e itens de consulta), quer o conjunto de imagens que compõem cada item. Utiliza-se, ainda, o elemento StructMap do esquema METS para descrever a estrutura física de cada item, i.e. a sequência das imagens ou paginação, e a estrutura lógica ou as partes constitutivas do conteúdo de um documento.

c) Armazenamento digital

Face à ocorrência de falhas graves no sistema de armazenamento digital da BND e à necessidade de assegurar o aumento do espaço disponível para o arquivo de imagens digitalizadas, no final do ano de 2008 foi adquirido um novo sistema de armazenamento digital, com capacidade para 36 TB de imagens de arquivo, compreendendo a renovação de uma parte substancial do hardware de suporte e a substituição das soluções de software, que era baseado em soluções desenvolvidas localmente (que exigiam manutenção e não davam garantias de desempenho, disponibilidade, estabilidade e integração na infraestrutura existente).

Este novo sistema é constituído por três níveis de armazenamento distintos (ingestão dos objetos digitais, disponibilização de cópias de consulta e armazenamento de ficheiros de arquivo), para além de uma solução de proteção de dados ou backup.

A implementação do novo sistema de arquivo digital e a redefinição das políticas de armazenamento da BND foram concluídas no primeiro semestre de 2009, tendo-se iniciado de imediato a publicação de novos conteúdos no sistema e a migração dos dados arquivados no sistema antigo.

3.3 Interfaces de visualização e funcionalidades

Em 2011/2012, ficou disponível um novo método para a visualização de imagens com elevado nível de detalhe e de grandes dimensões, como é o caso de grande número dos documentos cartográficos. Este novo interface aplica a tecnologia DeepZoom da Microsoft, que permite aproximações superiores a 300% e o direcionamento do zoom para detalhes de imagem utilizando apenas um clique de rato (por exemplo: http://purl.pt/1249/3/). Com estas novas funcionalidades, deixou de ser necessária a segmentação das imagens em matriz, que muitas vezes cortava informação importante, como o nome de localidades. Na imagem abaixo, exemplificamos o método antigo (Figura 1) e o novo formato de visualização (Figura 2) aplicados a um pormenor da mesma imagem. Foram reconvertidas todas as imagens de documentos com apenas uma imagem, de modo a todas apresentarem o novo interface de acesso.

50_16_02
Figura 1 – Formato de visualização em matriz (http://purl.pt/1249)

50_16_03
Figura 2 – Formato de visualização DeepZoom (http://purl.pt/1249)

Este novo interface de visualização tem ainda a vantagem de disponibilizar num só ecrã múltiplas funcionalidade como o download do JPEG, impressão, partilha, integração com catálogo bibliográfico, etc.

Por outro lado foi criado um novo interface de acesso para obras textuais, que, para além de simular o ato de folhear um livro (v. Figura 3), permite a pesquisa em texto integral nos documentos em que a qualidade do OCR atinge o nível mínimo (por exemplo: http://purl.pt/403/4/ca-614-p/ca-614-p_item4/index.html#/0). A pesquisa no texto de documentos textuais como atlas e outras obras de carácter cartográfico, por exemplo, pode revelar-se muito útil, tendo a particularidade de manter o aspeto do documento original na apresentação dos resultados de pesquisa, uma vez que o texto resultante do OCR é mantido “por trás” da imagem (v. Figura 4).

50_16_04
Figura 3 – Exemplo de visualização de documentos com múltiplas páginas

50_16_05
Figura 4 – Exemplo de pesquisa em texto integral http://purl.pt/403/4/

4 Aplicação de regimes de Direito de Autor

Nas coleções da BND incluem-se documentos de acesso livre e também documentos protegidos por direitos de autor, que apenas estão acessíveis na rede interna da BNP.

Os documentos digitalizados estão disponíveis livre e gratuitamente na Internet, sempre que se trate de obras no domínio público ou relativamente às quais a BNP possui os direitos de publicação. Sempre que os conteúdos estejam protegidos pelo Direito de Autor, as cópias digitais estão apenas acessíveis na rede interna da BNP.

Os critérios para disponibilização de cópias digitais de conteúdos da BNP, de forma livre na Internet ou apenas na rede local, foram fixados com base na análise e aplicação da legislação portuguesa, para os Direitos de Autor e Direitos Conexos, designadamente o estipulado no Código de Direito Administrativo (Art.ºs 31º, 32º, 33º, 39º, 173º e 174º), no Código de Direito Civil (Art.ºs 75º, 76º, 77º, 78º e 79º) e no Decreto-Lei nº 16/93 (Art.ºs 17º, nºs 2 a 4, e 43º), estando uma síntese das mesmas disponível em:: http://purl.pt/resources/PoliticaDisponibilizacaoBND.pdf.

Para facilitar a aplicação do Direito de Autor durante a clarificação de direitos de cada obra, criámos a seguinte tipificação de situações:

4.1 Obras de autor(es) identificado(s) já falecido(s) e com data de morte

  • a) Obras de pessoa singular só podem ser disponibilizadas 70 anos após a morte. Como exemplo de aplicação deste regime, temos o “Mapa de África”, de J.R. da Silva (1953-1991), disponível apenas na rede interna (http://purl.pt/16990).
  • b) Obras de pessoa coletiva, sem pessoas singulares identificadas na obra, só podem ser disponibilizadas 70 anos após a 1ª publicação. A título de exemplo referimos o mapa de “Localização industrial”, da Secretaria de Estado de Planeamento, editado em 1979 e que, portanto, apenas pode estar disponível internamente na BNP (http://purl.pt/22485).
  • c) Obras de pessoa coletiva, com pessoas singulares identificadas na obra, só podem ser disponibilizadas 70 anos após a morte da pessoa singular que faleceu em último lugar. Como exemplo temos a obra “Carta administrativa de Portugal”, da Comissão Nacional de Ambiente, com coordenação de José Correia da Cunha, nascido em 1927 (http://purl.pt/23068)
  • d) Edições de inéditos no domínio público ou edições críticas/científicas de obras no domínio Público só podem ser disponibilizadas 25 anos após a data de publicação. Para ilustrar esta situação, poderemos considerar a edição fac-similada no ano 2000 do “Atlas universal” de Diogo Homem (http://purl.pt/16669), que considerámos como edição crítica de obra do domínio público e que, por esse motivo, não pode ser livremente disponibilizada na Internet.

4.2 Obras com autor(es) identificado(s), pessoa singular ou coletiva, já falecido(s) sem data de morte identificada, mas com data de produção e/ou publicação

Uma vez que só podem ser disponibilizadas 70 anos após a data da morte (anterior a 1944) sendo essa data desconhecida, deduz-se a essa data 80 anos, tempo máximo provável de vida do autor (1944-80= 1864), com nesta base racional disponibilizam-se as obras com data de edição anterior a 1864, para datas de edição posteriores a sua disponibilização apenas se pode efetuar-se na rede local

4.3 Obras órfãs

São consideradas órfãs todas as obras cujos titulares de direitos não é possível identificar ou localizar, após pesquisa diligente e registada.

A Directiva 2012/28/EU regulamenta esta matéria, estabelecendo que estas obras poderão ser livremente disponibilizadas na Internet pelas bibliotecas, desde que a localização/identificação dos titulares de direitos tenha sido alvo de uma pesquisa diligente e se tenha procedido ao respetivo registo. Esta Directiva carece ainda de transposição nacional e da implementação de medidas que permitam a sua aplicação prática, mas parece-nos desde já que este regime não pode aplicar-se a material cartográfico, a não ser que o mesmo esteja inserido em documentos textuais (v. artigo 1º nºs 2 e 4 da Directiva).

Assim sendo, para o material cartográfico não inserido em documentos textuais e cujos titulares de direitos sejam desconhecidos, continuaremos a disponibilizar na Internet todas as obras publicadas ou produzidas em data anterior a 1864 e, para obras publicadas ou produzidas posteriormente a essa data, procederemos à sua disponibilização apenas na rede local.

5 Acesso e reutilização de dados e conteúdos

Os documentos cartográficos digitalizados estão disponíveis em secção autónoma da BND (http://purl.pt/index/cart/PT/index.html), sendo possível navegar por índices de autor, título e data de publicação destas obras.

Os dados disponibilizados na BND são extraídos automaticamente do catálogo bibliográfico, sendo mensalmente atualizados.

A partir do catálogo da BNP é possível pesquisar apenas no conjunto dos documentos cartográficos que estejam disponíveis na BND (http://catalogo.bnportugal.pt/ipac20/ipac.jsp?session=121K94409V062.21174&profile=bn&menu=tab20&submenu=subtab94&ts=1215950179718.

Observando o disposto na denominada Directiva PSI (Public Sector Information), Directiva 2003/98/EU, de 17 de Novembro, todas as descrições e os conteúdos digitalizados de obras do domínio público estão livremente disponíveis para reutilização de qualquer interessado, aplicando-se o regime das licenças CC0 1.0 Public Domain Dedication.

Os acessos aos objetos da BND têm registado um crescimento contínuo e muito acentuado nos últimos cinco anos (2009-2013), verificando-se uma média de quase 9 milhões de visitas anuais, a que correspondem 700 mil visitas mensais ou 25.000 visitas diárias.

Apesar de pontualmente se continuar a construir sítios web temáticos, a tendência tem sido a de disponibilizar livremente os recursos de modo a que os mesmos possam ser reutilizados e recombinados de forma espontânea pelo público em geral.

Isto sem embargo de a própria BNP reutilizar os recursos da BND, agregando-os em projetos temáticos que os ponham em destaque e lhes possam, muitas vezes, dar outros contextos. Exemplos de reutilização de conteúdos cartográficos pela própria BNP surgiram no âmbito do projeto Portuguese Culture (http://purl.pt/index/cartography/EN/index.html), que reúne conteúdos em língua inglesa sobre Portugal e “A Grande Guerra” (http://purl.pt/index/IGuerraMundial_cart/PT/index.html) que até 2018 vai disponibilizando mapas relacionados com a I Guerra Mundial.

6 Integração em serviços coletivos de acesso

A progressiva adoção de standards e normas técnicas e a partilha de protocolos comuns de comunicação permitiram assegurar a interoperabilidade de dados com outros sistemas, o que conduziu a iniciativas diversificadas de integração de acesso aos conteúdos digitais, quer a nível nacional, quer internacional. A nível nacional a BNP disponibiliza metadados para acesso integrado aos seus recursos digitais através da sincronização do seu catálogo bibliográfico com o catálogo bibliográfico nacional PORBASE e com o Registo Nacional de Objetos Digitais (RNOD). O RNOD é um sistema de informação para partilha e coordenação de desenvolvimento de coleções digitais que tem como objetivo evitar a duplicação de esforços de digitalização e obviar aos inconvenientes de dispersão das fontes e formas de disponibilização de obras digitalizadas. Pretende-se ainda, com esta iniciativa, coordenar a disponibilização na Europeana de conteúdos digitais de bibliotecas portuguesas funcionando como serviço agregador.

Ao nível internacional pela pesquisa e navegação nos recursos descritivos dos objetos digitais da BND no TEL (The European Library) ) que faculta acesso aos catálogos das bibliotecas nacionais e de várias bibliotecas universitárias europeias, no portal Europeana (http://www.europeana.eu/portal/) (Biblioteca Digital Europeia) e na Biblioteca Digital do Património Ibero-americano (http://www.iberoamericadigital.net/BDPI/).

A utilização colaborativa de metadados nestes serviços integrados de acesso permite criar mais oportunidades para a descoberta dos recursos digitais da BNP, uma vez que os seus metadados descritivos estão presentes num maior número de sistemas, enriquecer os serviços básicos de pesquisa e navegação através da utilização de ferramentas que podem melhorar ou tirar maior partido da qualidade e consistência dos metadados, criando serviços melhorados de recuperação e refinamento de informação por assunto, pessoa, data ou localização geográfica (Groat, 2009) e criar valor acrescentado, com a oferta de novos serviços para a utilização dos recursos.

Bibliografia

GROAT, Greta de – Future directions in metadata remediation for metadata aggregators. S.l: Digital Library Federation, 2009. Disponível em: http://www.diglib.org/aquifer/dlf110.pdf

KENNEY, Anne R. ; RIEGER, Oya y. – Moving theory into practice: digital imaging for libraries and archives. Mountain View: Research Library Group, 2000. 189 p. ISBN 0-97000225-0-6.

UNITED STATES. National Archives and Records Administration – Technical guidelines for digitizing archival materials for electronic access: creation and production master files – raster images. S.l.: NARA, 2004. Disponível em: http://www.archives.gov/preservation/technical/guidelines.html 

Nota

1. Claudii Ptolemaei viri Alexandrini Mathematicae disciplinae Philosophi doctissimi Geographiae opus novissima traductione e grecorum archetypis castigatissime pressum… Argentinen : Joannis Schotti, 1513.