qualidade de dados geoespaciais - ufrgs

38
Universidade Federal do Rio Grande do Sul Instituto de Informática Curso de Pós-Graduação em Ciência da Computação Qualidade de Dados Geoespaciais por Eliseu Weber, Roni Anzolch, Jugurta Lisboa Filho Andréia Castro Costa e Cirano Iochpe RP-293 Janeiro/1999 Relatório de Pesquisa ÓRGÃOS FINANCIADORES: RHAE / CNPq UFRGS - II - CPGCC Caixa Postal 15064 - CEP 91509-900 Porto Alegre - RS - BRASIL Telefone: (051) 316-6155 Fax: (051) 319-1776 Email: [email protected]

Upload: others

Post on 17-Oct-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Qualidade de Dados Geoespaciais - UFRGS

Universidade Federal do Rio Grande do Sul

Instituto de Informática

Curso de Pós-Graduação em Ciência da Computação

Qualidade de Dados Geoespaciaispor

Eliseu Weber, Roni Anzolch, Jugurta Lisboa Filho

Andréia Castro Costa e Cirano Iochpe

RP-293

Janeiro/1999

Relatório de Pesquisa

ÓRGÃOS FINANCIADORES: RHAE / CNPq

UFRGS - II - CPGCC

Caixa Postal 15064 - CEP 91509-900

Porto Alegre - RS - BRASIL

Telefone: (051) 316-6155

Fax: (051) 319-1776

Email: [email protected]

Page 2: Qualidade de Dados Geoespaciais - UFRGS

2

Resumo

O presente relatório descreve os resultados obtidos na pesquisa de padrõesinternacionais de metadados (implementados ou propostos) e no estudo das categoriasde metadados abrangidas pelos diversos padrões. Contém uma revisão de conceitosbásicos relacionados a geodados, tipos de aplicações de metadados e aspectosrelacionados à sua produção, além de um comparativo entre os padrões existentes.Enfoque especial é dado nos metadados de qualidade. Traz ainda a experiência do grupona documentação de dados de uma aplicação real de Sistema de Informação Geográficautilizando um dos padrões estudados, com relato das dificuldades encontradas.

Palavras-chaves: Qualidade, dados geoespaciais, metadados, padrões de metadados.

Abstract

This report describes results obtained on a review of the implemented or proposedinternational metadata standards and on the study of metadata categories included bythese standards. Contains a review of basic concepts related to geodata, metadataapplications, aspects related to metadata production and a comparison between theexisting standards. Special focus is given on quality metadata. Brings still theexperience of the working group on a GIS application data documentation using one ofthe studed standards and relates the dificulties encountered on the work.

Keywords: Quality, geospatial data, metadata, metadata standards.

Page 3: Qualidade de Dados Geoespaciais - UFRGS

3

Agradecimentos

Ao programa de fomento à pesquisa RHAE/CNPq, pela concessão de recursos na formade bolsas;

Ao convênio GTZ-FEPAM, em cuja aplicação de SIG se baseou a documentação dosdados, possibilitando uma experiência com dados espaciais reais;

Page 4: Qualidade de Dados Geoespaciais - UFRGS

4

Conteúdo

LISTA DE FIGURAS ................................................................................................................................ 5

1 INTRODUÇÃO ....................................................................................................................................... 6

2 METADADOS......................................................................................................................................... 9

2.1 TIPOS DE APLICAÇÕES DE METADADOS ................................................................................................... 92.1.1 Transferência................................................................................................................................ 102.1.2 Acesso e disponibilização de dados.............................................................................................. 102.1.3 Interoperabilidade ........................................................................................................................ 10

2.2 METADADOS DE QUALIDADE................................................................................................................. 112.2.1 Linhagem ...................................................................................................................................... 112.2.2 Acurácia ....................................................................................................................................... 112.2.3 Consistência lógica....................................................................................................................... 122.2.4 Completeza ................................................................................................................................... 132.2.5 Cobertura de nuvens..................................................................................................................... 132.2.6 Precisão ........................................................................................................................................ 132.2.7 Erro............................................................................................................................................... 13

2.3 PROBLEMAS NA PRODUÇÃO E IMPLEMENTAÇÃO DE METADADOS.......................................................... 13

3 PADRÕES DE METADADOS GEOESPACIAIS.............................................................................. 15

3.1 SPATIAL DATA TRANSFER STANDARD - SDTS ..................................................................................... 153.2 CONTENT STANDARDS FOR DIGITAL GEOSPATIAL METADATA - CSDGM ........................................... 163.3 SPATIAL ARCHIVE AND INTERCHANGE FORMAT - SAIF ....................................................................... 173.4 CEN TC287.......................................................................................................................................... 193.5 ANZLIC ............................................................................................................................................... 193.6 GCMD/NASA...................................................................................................................................... 203.7 DUBLIN CORE ....................................................................................................................................... 203.8 PRINCIPAIS CATEGORIAS DE METADADOS ............................................................................................. 203.9 CRITÉRIOS PARA ESCOLHA DO PADRÃO DE METADADOS ....................................................................... 22

4 ESTUDO DE CASO.............................................................................................................................. 23

4.1 RESULTADOS E CONSIDERAÇÕES SOBRE A APLICAÇÃO DA BACIA DO RIO CAÍ ....................................... 27

5 CATÁLOGO DE METADADOS ........................................................................................................ 29

5.1 CATÁLOGO DE METADADOS DO FGDC ................................................................................................. 29

6 CONSIDERAÇÕES FINAIS................................................................................................................ 31

BIBLIOGRAFIA...................................................................................................................................... 32

ANEXO 1 - EXEMPLO DE RELATÓRIO DE DOCUMENTAÇÃO DE DADOS ........................... 34

Page 5: Qualidade de Dados Geoespaciais - UFRGS

5

Lista de Figuras

FIGURA 1 - Localização da bacia do rio Caí no RS e na área do Pró-Guaíba ............. 24

FIGURA 2 – Imagem satélite rio Caí ............................................................................ 26

FIGURA 3 – Temáticos rio Caí..................................................................................... 27

Page 6: Qualidade de Dados Geoespaciais - UFRGS

6

1 Introdução

A humanidade já faz uso de informação espacial há vários séculos, tendo reconhecidoseu valor em uma série de atividades importantes, como a navegação, a demarcação deterritórios, a elaboração de estratégias militares e comerciais, entre outras. Inicialmentea informação espacial era manuseada na forma de mapas manuscritos ou impressos. Apartir da década de 60, em paralelo com o desenvolvimento dos computadoreseletrônicos, iniciou-se na América do Norte a pesquisa e o desenvolvimento de sistemasde informação especialistas para tratar e analisar esse tipo de informação, denominadossistemas de informação geográfica - SIG [TEI 95, ANT 91]. Na década de 80 odesenvolvimento e a difusão desses sistemas experimentou um impulso significativo,verificando-se aplicações nas mais diversas áreas de conhecimento, tanto no setorpúblico quanto no setor privado. A produção de software para aplicações geográficaslogo atingiu um caráter fortemente comercial, a ponto de haver nos Estados Unidos nofinal dos anos 80 nada menos do que 62 sistemas diferentes já registrados [PAR 89].

Originou-se a partir de então uma intensa demanda por dados espaciais digitais. Noinício, cada órgão, instituição ou empresa produzia sua própria base de dados parapreencher necessidades específicas da aplicação pretendida. Uma grande quantidade dedados espaciais de diversas regiões começou a ser armazenada em meio digital. Aconfecção da base de dados tornou-se a etapa mais crítica, longa e onerosa dasaplicações de SIG. No início da década de 90, estimativas mostravam que a base dedados totalizava um custo cerca de 10 vezes superior ao do software SIG e 100 vezessuperior ao do hardware [BUR 92]. O elevado custo de estruturação de uma base dedados e a facilidade de reproduzir dados em meio digital tornou necessário evitar aredundância na confecção e no armazenamento. Com essa finalidade, em vários países aprodução e distribuição de dados espaciais digitais foi normatizada e regulamentada,tornando-se uma atividade comercial executada em alguns países pelo setor público eem outros pela iniciativa privada.

Além da redução de custos, a produção normatizada trouxe como vantagem adicional ofato de que todas as aplicações realizadas sobre uma determinada região utilizassem amesma base de dados geográfica e pudessem, dessa forma, em qualquer momento serconfrontadas ou integradas. Resolveu-se em parte os problemas decorrentes do uso debases distintas por diferentes usuários, mas uma nova lacuna surgiu no que se refere aoconhecimento, por parte dos usuários, das características dos dados digitais disponíveis.Para que os dados pudessem ser utilizados com segurança pela diversificadacomunidade de usuários tornou-se necessário prover algumas informações básicas sobrea qualidade desses dados.

As informações que descrevem dados ou conjuntos de dados são denominadas demetadados. A informação prestada pelos metadados representa uma substancialeconomia de recursos na pesquisa e busca de dados geoespaciais existentes, bem comono monitoramento, controle e aquisição dos mesmos. Sua importância reside, entreoutras coisas, no fato de possibilitarem avaliar o grau com que um conjunto de dadossatisfaz as necessidades de uma determinada aplicação geográfica e inferir o produtoque pode ser esperado como resultado de uma análise com eles efetuada.

Na tentativa de organizar os metadados para facilitar seu uso na localização e acesso adados geográficos surgiram várias propostas de padrões de metadados. Os padrões

Page 7: Qualidade de Dados Geoespaciais - UFRGS

7

estabelecem categorias e elementos de metadados necessários para descreveradequadamente os dados. As iniciativas mais significativas no estabelecimento depadrões ocorreram no início da presente década nos Estados Unidos, com o trabalhocoordenado pelo Federal Geographic Data Comittee (FGDC). Logo depois surgiramestudos sobre outros padrões no Canadá, na Europa e na Austrália. Atualmente, com afacilidade de distribuição de dados on-line através da Internet, o tema metadadosgeoespaciais voltou a ganhar relevância sob aspectos como interoperabilidade,compartilhamento, disponibilidade, busca e transferência de dados [TIM 96].

Até agora já foram propostos diversos padrões, os quais encontram-se em diferentesestágios de desenvolvimento, alguns ainda em nível conceitual e outros jáimplementados. Esses padrões de metadados são alvo de intensa pesquisa na tentativade identificar um conjunto satisfatório de metadados que possa suprir as necessidades dedocumentação de dados geoespaciais.

Para o Brasil, a pesquisa com metadados geoespaciais torna-se área importante devidoao contato com a tecnologia de SIG ser muito recente. A primeira oportunidade dopúblico em geral trabalhar com esses sistemas ocorreu no final dos anos 80, durante operíodo da reserva de mercado de informática, através do software SGI, produzido peloInstituto Nacional de Pesquisas Espaciais (INPE). O desenvolvimento das primeirasaplicações foi lento e em pequeno número e o meio acadêmico tardou a incorporar anova tecnologia nos currículos de cursos relacionados a aplicações geográficas.Somente nos últimos anos é que se verificou um sensível acréscimo na difusão deaplicações geográficas no País, resultado do surgimento de microcomputadores demaior capacidade de processamento e de softwares mais eficazes e de menor custo, bemcomo da participação do setor privado, entre outros fatores.

Passada uma década do contato inicial com a tecnologia de SIG no País, existeatualmente uma forte demanda por bases de dados geoespacias digitais, sendo quemuitas instituições ainda estão iniciando a sua produção. Por estar em um estágioinicial, a geração de bases de dados espaciais digitais é um setor que carece doestabelecimento de normas e regras para facilitar o posterior intercâmbio e evitar aredundância na produção. Praticamente em todos os encontros recentes de especialistase usuários na área de geoprocessamento, bastante atenção tem sido dada a uma série deaspectos referentes à produção e distribuição de dados.

A vantagem de se criar em âmbito nacional um mecanismo para auxiliar as instituiçõesno compartilhamento de dados geoespaciais tem sido bastante discutida [RIB 96,GUI 97, WEB 98]. Contudo, é aconselhável não esquecer que tão importante quantoproduzir e distribuir dados geoespaciais confiáveis é prover informações sobre essesdados que permitam seu emprego correto por parte dos usuários.

O presente relatório, no âmbito do projeto SIGMODA, reúne os resultados de umestudo sobre os padrões de metadados existentes com o objetivo de fornecer subsídiospara a adoção de um padrão em nível nacional. O Capítulo 2 apresenta conceitosbásicos relacionados a metadados geoespaciais, principais tipos de aplicação eproblemas relacionados à produção e implementação de metadados. O Capítulo 3descreve os padrões de metadados mais importantes e relaciona as principais categoriasde metadados. No Capítulo 4 é apresentado um estudo de caso relatando a experiênciade documentação de conjuntos de dados espaciais pertencentes à aplicação da baciahidrográfica do Rio Caí, com base em um dos padrões de metadados analisados. OCapítulo 5 descreve a estrutura de catálogos de metadados existentes, apresentando emdetalhes o catálogo de metadados do FGDC. As considerações finais do estudo são

Page 8: Qualidade de Dados Geoespaciais - UFRGS

8

descritas no Capítulo 6.

Page 9: Qualidade de Dados Geoespaciais - UFRGS

9

2 Metadados

Os dados que descrevem dados ou conjuntos de dados são chamados de metadados.Metadados descrevem o conteúdo, a qualidade, os procedimentos de geração e outrascaracterísticas dos dados. Metadados referentes a dados geoespaciais são denominadosmetadados geoespaciais [SHE 97]. Dados geoespaciais, neste contexto, incluem os maisvariados tipos de coleções de dados georreferenciados como imagens de satélite,fotografias aéreas, amostragem geológica, observações biológicas, dados de redes deinfra-estrutura, dados censitários, entre outros.

Os metadados podem ser usados para uma descrição de alto nível, disponibilizandoinformações sobre referenciamento espacial, qualidade, linhagem e periodicidade dosdados [GOO 97]. Os maiores objetivos ou benefícios do uso dos metadados incluem:

• preservar os investimentos internos de uma organização em dados geoespaciais;

• prover informação sobre uma organização para catálogos de dados;

• prover informação necessária para processar e interpretar dados a serem recebidosatravés de transferência de uma fonte externa.

Em linhas gerais, uma coleção de metadados, em vários níveis de agregação ougranularidade, forma um catálogo. Este catálogo, pode, por exemplo, pertencer acoleções de conjuntos de dados, a conjuntos de dados simples ou somente a certo tipode dados. Atuando como índice, um catálogo serve como referência de autoridade emuma ou mais coleções de dados e pode incluir um dicionário de dados e modelos dedados. Usuários potenciais da informação podem pesquisar no catálogo a relevância dosdados, sua extensão, custos e os meios válidos para acessar os dados.

Certas aplicações de metadados surgiram como resultado de usos muito específicos, queimplicavam na geração e monitoramento de grandes conjuntos de dados e permitiamuma adequação mais exata do domínio e suas aplicações. Com o desenvolvimento daInternet, questões relativas à disponibilidade, adequação, acesso e transferência dosdados tornaram-se relevantes devido à possibilidade de ampliar o acesso às informaçõese dados para um número maior de usuários.

Além da potencial expansão do número de usuários, há o aspecto de diversificação, poisum número crescente de aplicações diferenciadas podem ser feitas a partir do uso dainformação já disponível, bem como de aplicações que necessitam só uma parte destesdados ou mesmo de dados obteníveis da composição ou compartilhamento de partes debancos de dados diferentes. Aumentar o número de usuários implica, obviamente, nainclusão de indivíduos com pouco conhecimento sobre os dados, o que reforça aimportância de existirem metadados adequados tanto para a caracterização quanto paraa descrição e compreensão dos dados.

2.1 Tipos de aplicações de metadados

Os tipos de aplicações de metadados podem ser reunidos em três grandes grupos, quaissejam a transferência de dados, o acesso e a disponibilização e a interoperabilidade desistemas.

Page 10: Qualidade de Dados Geoespaciais - UFRGS

10

2.1.1 Transferência

A transferência dos dados implica numa série de ações conjuntas envolvendo acesso,disponibilidade e adequação dos dados, que dependem de software de conversão.Metadados para transferência compreendem a informação necessária para processar eusar um conjunto de dados. É importante, neste caso, determinar o volume deinformação a ser transferida, levando em consideração quais os dados realmentenecessários, a compatibilidade dos sistemas e a compartimentação dos arquivos e meios(digital ou analógico).

Nos casos de processos de transferência de dados entre diferentes sistemas a estruturados dados e metadados em pouco ou nada deve ser afetada, permitindo a busca epesquisa entre sistemas e indicando a adequação ou possibilidade de transferência dedados. Os metadados devem traduzir as características dos dados que podem sertransferidos e a maneira como isto pode ser feito. Nesse sentido, aspectos depadronização devem ser averiguados, bem como a cobertura e confiabilidade que osaspectos de qualidade propostos pretendem garantir.

2.1.2 Acesso e disponibilização de dados

Para a transferência de dados é necessário um conhecimento prévio do conteúdo dosarquivos. O acesso engloba os itens necessários para se obter um conjunto determinadode dados que pode ser estabelecido ou solicitado pelo usuário final e sob quaiscondições. A disponibilização se refere a um levantamento direto das características,conteúdos e compartimentação dos dados existentes para uma localização geográficasem acessar aos dados propriamente ditos. Os metadados que desempenham essa funçãopermitem conhecer a estrutura da informação e orientam o usuário na navegação doconjunto de dados, permitindo que o mesmo decida sobre a adequação dos dados para atransferência.

2.1.3 Interoperabilidade

A interoperabilidade refere-se ao uso efetivo em um determinado sistema da informaçãoresidente em outro sistema. As preocupações em torno de dados espaciais dizemrespeito ao acesso fácil aos dados por seus eventuais consumidores e como estes podemsaber se os dados são realmente utilizáveis, se os dados de uma origem são compatíveiscom os dados de outra, se os modelos de dados são também compatíveis com asnecessidades dos clientes e, por fim, quais tecnologias estão disponíveis e necessárias.

As conversões de sistema, em especial, devem considerar a preservação das relaçõestopológicas e de referenciamento geográfico. O problema é extensível aos catálogos demetadados que, considerados aqui como uma coleção de metadados aplicados a váriosníveis de agregação e granularidade, são indispensáveis para a avaliação da relevânciados dados, sua extensão, custo e caminho de busca.

A interoperabilidade e o gerenciamento de dados são vistos e concebidos sob duasóticas principais diferentes. Uma delas constitui um protótipo de distribuiçãodescentralizada a partir de servidores já existentes, o conceito de Clearinghouse, tônicona América do Norte e Europa. A outra tem uma abordagem mais centralizadora, ondese disporia de um diretório único e geral de dados que os usuários poderiam acessar,como é a proposta da Austrália e Nova Zelândia.

Page 11: Qualidade de Dados Geoespaciais - UFRGS

11

2.2 Metadados de qualidade

Metadados de qualidade são dados que descrevem a qualidade de dados utilizados emaplicações geográficas. A qualidade é uma característica essencial ou de distinçãonecessária para dados cartográficos de forma a torná-los aptos para uso. A existência demedidas de qualidade de dados é fundamental para avaliar a confiabilidade deresultados obtidos a partir de aplicações efetuadas com esses dados.

A qualidade da informação espacial e de seus produtos é multidimensional e complexa,variando espacial e temporalmente. Além disso, a necessidade de informação dependeda aplicação pretendida. Em outras palavras, qualidade não é a performance máximamas o respeito da performance especificada para responder às necessidades. Ainformação sobre a qualidade muda com o tempo e com a pretensão dos usuários[FAI 97]. Uma informação imprecisa para um usuário pode ser boa para outro, pois elaé simplesmente suficiente para as suas necessidades. Por exemplo, uma estrada cujocruzamento com outra está deslocado 30 metros de sua posição real pode serperfeitamente aceitável para estudos de infra-estrutura regional, mas inaceitável para umprojeto de pavimentação, que necessita de medidas muito acuradas para realizarcálculos de áreas e volumes.

Os metadados de qualidade de maior evidência incluem a linhagem, a acurácia, aconsistência lógica e a completeza. Além destes, há ainda outros elementoscontemplados em alguns padrões, como a cobertura de nuvens, a precisão e o erro. Asdefinições dessas categorias são detalhadas a seguir.

2.2.1 Linhagem

A linhagem contém o detalhamento dos passos seguidos na criação dos dados, tudo quese refere à descrição do material de origem, métodos de derivação utilizados,transformações executadas e comentários. É um “histórico” do processamento do dado(interpolação, filtragem, retificações, classificação). No caso de dados espaciais, alinhagem deve incluir ainda os pontos de controle utilizados para permitir a futurareconstrução com os mesmos parâmetros. Deve trazer também os algoritmos detransformação utilizados.

A linhagem traz informação sobre os eventos, parâmetros e dados de origem queconstruíram o conjunto de dados documentado, bem como informações sobre as partesresponsáveis pela construção. Inclui referências sobre quais dados originais foramutilizados para gerar o conjunto, a escala e o meio (ex.: papel, magnético, dados decampo) de cada um, o período de tempo que cada dado original descreve e a base demedição desse período, descrição dos processos utilizados (cada evento, processo oupasso com os parâmetros e tolerâncias relacionados), data da realização de cada passo eperíodo de processamento, citação sobre a fonte de dados intermediários (significante naopinião do produtor, gerada no passo de processamento ou usada em processamentosposteriores) e, finalmente, informação sobre a parte responsável pela informação para opasso de processamento. A linhagem é uma informação do tipo composto, com valoresquantitativos e texto descritivo.

2.2.2 Acurácia

A acurácia constitui uma medida de quão correto é o dado, quão próximo o dado,resultado de uma observação, cálculo ou estimativa, se encontra do valor verdadeiro outido como verdadeiro. Seu conceito assemelha-se à definição de exatidão, sendo

Page 12: Qualidade de Dados Geoespaciais - UFRGS

12

freqüentemente assim traduzida para o português. A acurácia é um dos metadados dequalidade de caráter mais quantitativo, com métodos razoavelmente padronizados deobtenção dos valores. É uma informação do tipo composta, formada por um valorquantitativo e um texto descritivo sobre esse valor.

Acurácia posicional ou geométrica: medida de quanto o dado difere espacialmente (emtermos de posição absoluta, posição relativa e forma) daquele tido como referência. Oteste de acurácia é feito através de funções trigonométricas ou estatísticas conhecidas(ex.: desvio médio quadrado - RMS), e os valores podem ser absolutos ou relativos.Exprime o grau de atendimento às normas de registro espacial ou normas geodésicas.

Métodos de medição da acurácia posicional:

• estimativa dedutiva: qualquer sentença dedutiva baseada no conhecimento de errosem cada passo da produção;

• evidência interna: procedimentos para testes de repetição de medidas e redundânciastais como fechamento de cruzamentos e resíduos de ajustamento;

• comparativo de origem: para o caso de inspeção gráfica. Descrição das tolerânciasgráficas e métodos de registro;

• origem independente de alta acurácia: comparação com um ponto de alta acuráciaindependente, resultados numéricos em unidades de terreno, bem como o número ea localização dos ponto de teste.

Acurácia temporal: é uma medida de atualidade do dado, geralmente representada peladata de produção do dado.

Acurácia de atributos: retrata a fidelidade dos dados descritivos, com uma avaliaçãogeral da identificação de entidades e atribuição de valores de atributo no conjunto dedados. As estimativas são feitas basicamente através de funções estatísticas que medema concordância/discordância dos atributos existentes em relação àqueles tidos comoverdadeiros. Os métodos mais empregados consistem a avaliação de matrizes de erro etabulação cruzada. O relatório contempla a apresentação de um valor médio paraquantificar a acurácia e a identificação do teste que gerou esse valor.

Métodos de medição da acurácia de atributos:

• estimativa deduzida: qualquer estimativa é permitida, até mesmo “palpites” combase na experiência. A base de dedução deve ser explicada. Qualificativos como“bom” ou “pobre” devem ser referidos de forma quantitativa;

• testes em exemplos independentes: matriz de erros como base em categorias deamostra e material testado, descrição do procedimento de amostragem e localizaçãodas amostras devem ser descritos;

• testes de sobreposição de polígonos: a relação entre dois mapas deve ser explicada e,tanto quanto seja possível, os mapas devem ser independentes e um deve ter maioracurácia. Geralmente o resultado é apresentado numa matriz de erros.

2.2.3 Consistência lógica

Este item informa sobre a manutenção de relações lógicas e topológicas consistentes. Ostestes de consistência lógica incluem testes de valores válidos, testes gerais para dadosgráficos (ex.: se os nós estão todos unidos, se os polígonos estão todos fechados) etestes topológicos específicos (ex.: se limites de polígonos vizinhos não estão se

Page 13: Qualidade de Dados Geoespaciais - UFRGS

13

cruzando, se o sentido de fluxo não é contrário em elementos de uma rede). É umainformação textual, embora seja possível atribuir uma nota referente à porcentagemrevisada. O relatório deve contemplar a data da aplicação dos testes. Correções emodificações por motivo de consistência lógica, devem ser mencionadas juntamentecom os métodos utilizados para checagem.

2.2.4 Completeza

A completeza engloba informações sobre omissões, critérios de seleção, generalizações,definições utilizadas e outras regras de mapeamento. Propriedades espaciais etaxonômicas (atributos) de um conjunto de feições podem ser testadas É umainformação textual.

2.2.5 Cobertura de nuvens

Relata a área de um conjunto de dados (imagens aéreas ou de satélite, neste caso)obstruída por nuvens, expressa como uma porcentagem da área total coberta peloconjunto de dados. É um valor quantitativo entre 0 e 100, constituindo informação típicade dados oriundos de imagens de sensoriamento remoto.

2.2.6 Precisão

A precisão refere-se ao número de casas decimais utilizado em um valor descritivo oude posição (coordenadas) de um dado ou conjunto de dados.

2.2.7 Erro

O erro constitui uma medida de quão incorreto é o dado, é o desvio do valorconsiderado como verdade. Da mesma forma que a acurácia, o erro pode ser medido emvalores absolutos ou relativos. No caso de erro de posição ou geométrico, as formas deobtenção dos valores são praticamente idênticas às utilizadas para medir a acurácia. Asemelhança aparente dos conceitos pode fazer com que o erro seja confundido com oconceito de acurácia. Os tipos básicos de erro são o erro inerente, os erros deprocessamento (modo de operação das máquinas) e os erros comuns aos processos deanálise e implementação de procedimentos.

2.3 Problemas na produção e implementação de metadados

Apesar de todas as vantagens já relacionadas, a produção e o uso de metadados enfrentacertas dificuldades de natureza técnico-operacional causadas por problemas dequantidade, qualidade, descrição e durabilidade (ou obsolescência). Alguns tipos dedados, especialmente as imagens rasterizadas por satélite, produzem uma enormequantidade de arquivos de grande tamanho e de curta vida útil (período de utilização).Essas imagens constituem uma das informações mais organizadas e seus metadadosexistem para utilizações muito específicas. No campo das imagens vetoriais oudigitalizadas, pelo contrário, a informação tem uma cobertura espaço-temporal precária,sua utilidade é múltipla e provém de várias fontes com diferentes graus de qualidade ediferentes formas de referenciamento espacial. É também a que menos dispõe demetadados, não apenas por sua menor qualidade de produção e baixa organização, mastambém por sua difícil interpretação para disponibilização e acesso pela diversidade deusuários e aplicações. Isso implica em problemas de descrição e especificação dos

Page 14: Qualidade de Dados Geoespaciais - UFRGS

14

dados e conteúdos em função de uma provável aptidão dos arquivos a um fimpresumível.

Os problemas relacionados à produção de metadados podem ser agrupados nosseguintes tópicos:

• disponibilidade: apenas parte da informação digital atualmente existente estádocumentada com metadados, sendo extremamente difícil recuperar o que nãoexiste;

• durabilidade: o tempo de validade para disponibilizarão de dados e metadados não énecessariamente o mesmo, sendo necessário estabelecer uma periodicidade para aatualização dos metadados;

• quantidade de dados: a quantidade e a qualidade de dados produzida em diferentescampos de atividades é desproporcional; produzindo-se muita informação emalgumas áreas de conhecimento e quase nada em outras;

• volume de dados: se refere à quantidade de dados e também ao tamanho dosarquivos, sendo que freqüentemente os metadados podem ser de maior volume doque os próprios dados documentados;

• interoperabilidade: a compatibilidade de dados entre sistemas exige grande númerode informações;

• padronização: é necessário adotar e seguir normas para constituição de metadados;

• aspectos de qualidade: que tipo de metadados são realmente necessários eindispensáveis para se acessar a confiabilidade da informação geoespacial;

• universo da informação: não apenas os dados digitais possuem metadados. Os dadosanalógicos também podem e devem ser documentados com metadados.

A implementação de metadados em larga escala apresenta algumas limitaçõesrelacionadas a hardware e a software. No que se refere ao hardware, apesar da evoluçãodos últimos anos, o desafio ainda se concentra na forma de armazenamento dainformação e na velocidade de transferência da informação digital. Quanto ao software,as necessidades incluem o desenvolvimento e refinamento dos browsers , especialmenteno sentido do tipo de busca pretendido, o desenvolvimento de programas de conversãode dados e o desenvolvimento de programas de codificação e produção dos própriosmetadados.

Page 15: Qualidade de Dados Geoespaciais - UFRGS

15

3 Padrões de Metadados Geoespaciais

Há atualmente padrões internacionais que visam garantir a transferência de dadosgeoespaciais digitais, bem como permitir o cruzamento de suas informações, controle dequalidade, metodologias de transferência, terminologia e requisitos mínimos paradisponibilização. Estes padrões estabelecem basicamente uma terminologia comum aosfenômenos espaciais, classes de geodados e seus modelos de informação, além de regraspara produção de metadados. Alguns padrões já são operacionais, dispondo inclusive desoftware para cadastramento de metadados e esquemas para disponibilizar os metadadosem sites da Internet. Os principais padrões de dados e metadados geoespaciaisoperacionais e propostos são detalhados a seguir.

3.1 Spatial Data Transfer Standard - SDTS

O padrão Spatial Data Transfer Standard (SDTS) [MOE 88] foi desenvolvido peloFederal Geographic Data Comitee (FGDC) dos Estados Unidos e publicado no USFederal Information Processing Standard em 1992. Foi desenvolvido para permitir àsagências federais dos Estados Unidos o compartilhamento de dados espaciais entreaplicações que usavam hardware, software e sistemas operacionais diferentes. É oprotocolo mais antigo de transferência de informação espacial digital entre software deinformações espaciais. Leva em consideração aspectos topológicos e a correspondênciade arquivos gráficos.

Um subconjunto limitado do SDTS, projetado para uso com um tipo específico de dadoforma um perfil SDTS. Seleções específicas são feitas para codificar possibilidades nãocontempladas, deixadas como opcionais ou deixadas com seleções numerosas dentro dopadrão SDTS.

O primeiro perfil desenvolvido foi o Topological Vector Profile (TVP), para uso comdados geográficos vetoriais com topologia gráfica planar. O segundo perfildesenvolvido foi o Raster Profile, que pode acomodar dados de imagens, modelosdigitais de elevação, planos raster de sistemas de informação geográfica e outros tiposde dados em grade. Esse perfil se aplica a dados georreferenciados (dadosgeograficamente registrados à superfície da terra).

A Parte 2 do SDTS representa uma tentativa formal de desenvolver uma listapadronizada de termos. Atualmente, esta lista consiste de termos topográficos ehidrográficos, baseados em uma metodologia hierárquica que pode acomodar a maioriadas especificações de conteúdo de dados. É esperado que a Parte 2 seja expandida atéformar um registro de feições espaciais que inclua termos de cada subcomitê decategoria de dados do FGDC.

Para facilitar o acesso e o uso do SDTS, o United States Geological Survey (USGS)desenvolveu ferramentas de software que dão suporte à implementação do SDTS. Aferramenta mais importante é uma biblioteca de funções C++ que pode ser chamada porprogramas do usuário para ler e escrever arquivos em conformidade com o padrãousado pelo SDTS para sua implementação física.

Por ser um dos primeiros padrões, o SDTS é bastante utilizado, sendo requerido emtodas as contratações do governo americano para obtenção de dados geoespaciais.Também forma parte do conjunto de especificações DIGEST (Digital Geographic

Page 16: Qualidade de Dados Geoespaciais - UFRGS

16

Information Exchange Standards), utilizado em aplicações militares por vários paísesmembros da OTAN, que no nível conceitual parece-se muito com o SDTS. Esseconjunto de especificações reúne uma família de padrões internacionalmente aceitos quefornecem um método uniforme para intercâmbio de informação geográfica digital. Seusformatos de dados possibilitam o intercâmbio de dados cartográficos de texto, matriz,raster e vetorial.

3.2 Content Standards for Digital Geospatial Metadata - CSDGM

O Content Standards for Digital Geospatial Metadata (CSDGM) [FED 97] foidesenvolvido pelo Federal Geographic Data Comitee (FGDC) dos Estados Unidos. Opadrão foi aprovado em 1994 e entrou em vigor em 1995.

O padrão CSDGM especifica o conteúdo da informação de metadados para um conjuntode dados geoespaciais digitais. O objetivo do padrão é prover um conjunto comum determinologia e definições para a documentação ligada a esses metadados. Estabelece onome dos elementos de dados e grupos de elementos de dados a serem usados para ointercâmbio de dados, as definições desses elementos e grupos de dados, e informaçãosobre os valores que serão dados para os elementos de dados. Informação sobre termosque são obrigatórios, obrigatórios sob certas condições, e opcionais (fornecidos naopinião do produtor de dados) é provida no padrão.

A informação incluída no padrão foi selecionada com base em quatro funções que osmetadados em geral devem desempenhar:

• disponibilidade: dados necessários para determinar os conjuntos de dados queexistem para uma localização geográfica;

• adequabilidade para uso: dados necessários para determinar se um conjunto dedados preenche uma necessidade específica;

• acesso: dados necessários para adquirir um conjunto de dados identificado;

• transferência: dados necessários para processar e usar um conjunto de dados.

O padrão CSDGM é complementar ao padrão SDTS e vice-versa. O padrão SDTS foidesenvolvido para permitir a transferência de conjuntos de dados espaciais entrediferentes sistemas, enquanto o padrão CSDGM foi desenvolvido para definir oselementos de metadados usados para documentar dados geoespaciais digitais para váriospropósitos. Isso inclui metadados para preservar o valor e o significado de um dado,para ajudar a catalogar o dado e para ajudar na transferência de dados. Uma vez que oSDTS é um padrão para transferência de dados, o conteúdo de seus metadadosprimários é usado para determinar a aptidão do conjunto de dados para o propósito dousuário.

Há um relacionamento estreito entre o padrão CSDGM e os elementos de metadadoscontidos no modulo Data Quality do SDTS, e em outros locais dentro do conjunto detransferência SDTS. Como o padrão CSDGM contem metadados usados para procurarpor conjuntos de dados espaciais digitais, esses elementos não precisam estar contidosno conjunto de transferência SDTS.

O padrão CSDGM define os seguintes grupos de metadados:

• identificação: informação básica sobre o conjunto de dados. Inclui o título, a áreageográfica coberta, atualidade e rotinas para adquirir ou usar os dados;

Page 17: Qualidade de Dados Geoespaciais - UFRGS

17

• qualidade dos dados: uma avaliação da qualidade do conjunto de dados. Inclui aacurácia posicional e de atributos, completeza, consistência, as fontes da informaçãoe métodos usados para produzir os dados (recomendações sobre a informação a serreportada e tarefas a executar estão no padrão SDTS);

• organização dos dados espaciais: o mecanismo usado para representar a informaçãoespacial no conjunto de dados. Inclui os métodos usados para representar posiçõesespaciais diretamente (como raster e vetor) e indiretamente (como endereços deruas e códigos de cidades) e o número de objetos espaciais no conjunto de dados;

• referência espacial: descrição da rede de referência e meios de codificarcoordenadas no conjunto de dados. Inclui o nome e parâmetros para projeções demapa ou sistemas de grade de coordenadas, datuns verticais e horizontais e aresolução do sistema de coordenadas;

• entidade e atributo: informação sobre o conteúdo do conjunto de dados, incluindo ostipos de entidades, seus atributos e os domínios dos valores que serão atribuídos aosatributos. Inclui os nomes e definições das feições, atributos e valores de atributos;

• distribuição: informação sobre a obtenção dos dados. Inclui contato com odistribuidor, formatos disponíveis, informação sobre como obter conjuntos de dadoson-line ou em meio físico;

• referência dos metadados: informação sobre a atualidade da informação dosmetadados e a parte responsável pelos mesmos.

Em termos de uso, as normas do FGDC têm servido de referência para odesenvolvimento de praticamente todos os demais padrões hoje propostos. Existembases de metadados de várias regiões do mundo, mas principalmente nos EUA. Em abrilde 1994, o presidente dos Estados Unidos assinou a Ordem Executiva 12096,Coordinating Geographic Data Acquisition and Access: The National Spatial DataInfrastructure. Essa ordem instruiu todas as agências federais americanas a usar opadrão do FGDC para documentar novos dados geoespaciais a partir de 1995, além dedisponibilizar esses metadados ao público através da National Geospatial DataClearinghouse.

Existem vários sistemas disponíveis para cadastramento de metadados nesse padrão,sendo NBII MetaMaker v. 2.10 e Corpsmet 95, os mais difundidos.

3.3 Spatial Archive and Interchange Format - SAIF

O Spatial Archive and Interchange Format (SAIF) [BRI 95] foi desenvolvido pelaDivisão de Levantamento e Mapeamento de Recursos do Ministério do Ambiente,Território e Parques da Columbia Britânica (Canadá). O padrão SAIF foi concebidopara facilitar a interoperabilidade, particularmente no contexto da troca de dados. Elerepresenta também um meio eficiente para arquivamento de dados num formato neutro.Uma característica extremamente importante é que o SAIF é capaz de tratar dadosgeográficos como simplesmente outro tipo de dados, isto é, suas raízes estão nasciências da informação.

Os objetivos que nortearam o desenvolvimento do SAIF foram:

• O padrão deve ser apropriado para modelar e mover dados em geral, isto é, ele deveser capaz de lidar tanto com a informação espaço-temporal quanto com ainformação tradicional;

Page 18: Qualidade de Dados Geoespaciais - UFRGS

18

• Ele deve manusear virtualmente qualquer tipo de dado geográfico, incluindoaqueles: (i) com ou sem descrições extensivas de atributo, (ii) com geometriadefinida por estruturas raster ou vetoriais em duas ou três dimensões (p. ex., dadostopográficos, cadastrais e temáticos típicos, mas também dados geológicos desubsuperfície, climáticos, hidrográficos, etc.);

• O padrão precisa abordar tempo, de forma que eventos temporais e relacionamentospossam ser manuseados (p. ex., manchas de óleo móveis, navegação de veículos,atividades gerais de monitoramento);

• Ele precisa contemplar requerimentos de gerenciamento de dados (suporte paraatualizações, integração com dados de multimídia, aplicabilidade tanto a grandesquanto a pequenos volumes de dados, possibilidade de estabelecer interface comconsultas a bancos de dados e compatibilidade com desenvolvimentos de catálogo);

• O padrão precisa ser apto a operações efetivas em ambientes de rede, assim comodeve ser apropriado para transferência convencional de arquivos em meio magnéticoou ótico;

• Ele precisa ser fácil de usar e de baixo custo, além de ser fácil de manter e expandirpara atender as necessidades dos usuários e mudanças tecnológicas (sem demandarmaiores investimentos por parte dos produtores ou usuários de dados);

• O padrão deve ser harmonizado com novos desenvolvimentos SQL e iniciativasOpen GIS, assim como a outros padrões geográficos como DIGEST e SDTS.

O SAIF não enfatiza a separação entre entidades gráficas e atributos, incorpora a noçãode compartilhamento de objeto (dados espaciais e espaço-temporais), permitindo ummaior leque de informações e possibilidade de atendimento específico. Introduzestruturas de mais alto nível que contém um número arbitrário de atributos. Algunsatributos podem definir espaço, tempo e topologia, além de outros atributos tradicionais.A modelagem de dados torna-se mais vigorosa, é maior a compatibilidade de formatos,os dados são auto-descritivos e os formatos são neutralizados. Torna-se possível umamaior densidade de informação.

O SAIF enfatiza a estrutura de dados dos objetos através do paradigma da orientação aobjetos. Os dados são considerados como instâncias de tipos (classes) que seguem umahierarquia extensível pelo usuário. O modelo de dados é definido como um conjunto deconceitos e regras de composição associados, usadas para descrever tipos erelacionamentos entre instâncias destes tipos. Classes de metadados são colocadasabaixo dos metadados ou em uma de suas subclasses. Outros metadados podem serdefinidos pela inclusão de atributos determinados em classes definidas pelo usuário.Estes atributos podem ter como domínio classes de metadados do SAIF ou classesdefinidas pelo usuário.

Numa estrutura de alto nível há uma distinção entre a maneira como a informação édescrita e a forma como é codificada. Existem três níveis de descrição. No nível maisabstrato toda a informação é definida como construções matemáticas, incluindo objetosabstratos, listas, enumerações e primitivas. Usando isso como blocos de construção, oSAIF introduz várias construções espaciais e temporais. Torna-se possível, então, dizerque o mundo real pode ser representado como um tipo de objeto espacial, existindo noespaço e no tempo e com vários tipos de relações com outros objetos geográficos.

Atualmente, o SAIF vem sendo usado no Canadá e em várias regiões dos EstadosUnidos. Apesar disso, é extremamente raro encontrar disponibilizadas bases de

Page 19: Qualidade de Dados Geoespaciais - UFRGS

19

metadados cadastrados de acordo com esse padrão. Entre os usuários cita-se o ProjetoSequoia 2000.

Existem alguns sistemas disponíveis para cadastramento de metadados no padrão SAIF,entre eles o SaifSuite1.1; o FMEBC (Feature Manipulation Engine (BC)), o Saif3.1 e oSaif3.2. Na verdade, não são programas para cadastramento, o usuário tem de escreverseu próprio programa usando as bibliotecas em C++.

3.4 CEN TC287

O CEN TC287 é o padrão de metadados Europeu preparado pelo Comitê Técnico 287(TC287) do Comitê Europeu de Padronização (CEN) [CEN 96]. Atualmente o TC287do CEN está no processo de solicitação de comentários sobre o esboço do padrão, decaráter ainda propositivo. No entanto o padrão CEN já está sendo usado como parte doprojeto Multipurpose Europeean Ground Related Information Network (MEGRIN) etambém está previsto que servirá de base para o desenvolvimento da norma ISO 15096.

O padrão CEN define um conjunto mínimo de metadados que devem ser providos pelosprodutores/fornecedores de dados. A maior razão da criação do padrão é encorajar o usogeneralizado de dados geoespaciais.

O conjunto de normas CEN (ISO) constituirá a futura Norma Européia para informaçãogeográfica. Este grupo de normas interrelacionadas provê técnicas de desenvolvimentode esquemas para primitivas geométricas, qualidade de informação, diretórios deinformação e dicionários. A parte de busca e atualização de arquivos utiliza umalinguagem de busca, que incorpora operadores espaciais e sistemas de identificação parabusca e atualização de dados geográficos, inclusive metadados.

As categorias de metadados previstos no padrão CEN-TC287 são muito equivalentes àscategorias do padrão CSDGM. No padrão CEN-TC287, os esquemas conceituais sãodefinidos usando a linguagem EXPRESS. A linguagem EXPRESS foi desenvolvidapara ser usada na modelagem e representação de dados geoespaciais. O objetivo dodesenvolvimento da linguagem foi o de prover um mecanismo neutro capaz dedescrever os dados de forma independente de implementação.

3.5 ANZLIC

O padrão ANZLIC, proposto pelo Australia New Zealand Land Information Council[ANZ 97], tomou como base o padrão americano CSDGM, mas utiliza um subconjuntoreduzido (núcleo) dos elementos de metadados, proposto pelo padrão CSDGM. Oobjetivo foi manter no padrão, somente aqueles elementos essenciais e indispensáveis,para facilitar ao máximo o uso por parte dos usuários e produtores de dadosgeoespaciais. Uma das características diferenciais deste padrão é a possibilidade deincluir a documentação de dados não digitais. Isto foi necessário devido à existência degrande quantidade de dados em meio analógico.

O núcleo de elementos do ANZLIC foi definido através de um longo processo deconsultas a usuários e produtores de dados geoespaciais. O resultado consiste em umconjunto de aproximadamente quarenta elementos, contra os duzentos e vinte elementosdo padrão CSDGM. As principais categorias de metadados são: identificação doconjunto de dados; descrição; data de atualização; estado do conjunto de dados (ex.:ativo, desatualizado); formato de acesso; qualidade dos dados; informações para contatoe data de confecção do metadado.

Page 20: Qualidade de Dados Geoespaciais - UFRGS

20

A Austrália começou com a coleta, gerenciamento e apresentação de metadadosespaciais no início da década de 80, mas parou pela dificuldade e o alto custo de coleta eatualização. Em 1989 o National Resource Information Centre (NRIC) iniciou odesenvolvimento de um sistema de diretório de dados espaciais. Foi desenvolvido osoftware FINDAR, que tinha como metas coletar, manter e prover acesso ao diretório demetadados. Com ele as agências federais e regionais podiam gerenciar seus própriosmetadados, uma porção apropriada dos quais era passada para um diretório nacional,provendo um ponto de acesso único.

Apesar do esforço, apenas uma pequena parte das agências adotou o software. Foramentão estabelecidos alguns princípios para obter melhores resultados, como aadministração dos dados, em que a responsabilidade em gerenciar e manter os dados foiatribuída a agências individuais, e o intercâmbio de informação entre agênciasestimulada o tanto quanto possível. O desenvolvimento de um diretório nacional para aAustrália e Nova Zelândia faz parte das metas atuais do grupo de trabalho ANZLIC[SHE 97].

3.6 GCMD/NASA

O Global Change Master Directory (GCMD) foi desenvolvido pela NASA. É umafonte compreensível de informação sobre dados de satélite e de ciências da Terra “insitu”, com recobrimento da atmosfera, hidrosfera, oceanos, terra firme e biosfera.Dispõe de uma interface de procura que permite ao usuário acessar essa base de dados.O formato Directory Interchange Format (DIF) permite ao GCMD integrar informaçãode aproximadamente 700 diferentes provedores de dados de várias disciplinas ecompartilhar entradas com outros nós na International Directory Network (IDN).

Os metadados do GMDC identificam o item a ser procurado, descrevem os dados nodomínio temporal e espacial e fornecem informação adicional útil para o pesquisador,tais como o estado, formato e restrições de acesso. A maioria desses metadados pode serusada para acesso aos dados, mas somente seis são indispensáveis. O GCMD combinacampos de procura controlados com outros descritivos, mais extensos e de formatolivre. Por isso a interoperabilidade entre os centro de dados participantes do diretório émuito difícil de funcionar quando utilizados todos os campos. O conjunto mínimo demetadados é necessário para integrar descrições de dados desses sistemas, mas umconjunto mais completo está disponível, case seja necessário.

3.7 Dublin Core

O padrão Dublin Core é uma especificação de metadados para catálogo de documentoseletrônicos. Atualmente, a intenção desse padrão é definir um conjunto pequeno euniversalmente aceito de elementos de metadados que permita a autores e provedores deinformação espacial a descrever seu trabalho. Além disso, deve facilitar ainteroperabilidade entre ferramentas de descobrimento de recursos. Como a geraçãoautomática de metadados resulta em informação insuficiente e a geração manual é muitocara, o Dublin Core procura conceber um sistema que esteja entre esses dois extremos,especificando que os elementos de metadados sejam opcionais e extensíveis.

3.8 Principais categorias de metadados

Examinando os padrões é possível identificar algumas categorias que são mais

Page 21: Qualidade de Dados Geoespaciais - UFRGS

21

relevantes. Numa abordagem classificatória, Drewry [DRE 97] propõe uma definição derequisitos por categorias para os metadados segundo temas comuns na arquitetura deinformação dos padrões, chegando a um conjunto de metadados que poderia servir auma descrição de dados suficiente para qualquer aplicação. Essas categorias são:

• identificação: identificador de entrada, identificador de título, identificador derecurso, título do conjunto de dados;

• origem: investigador, contato técnico, centro de origem, centro de dados, criador ouautor, editor, contribuidores, distribuição, organização;

• cobertura espacial: localização, limites de coordenada (norte, sul, leste, oeste);

• cobertura temporal: data de publicação, início e final;

• domínio específico: disciplina, parâmetros, palavras-chave (tema e locais), resoluçãodos dados, projeto, tipo de recurso, linguagem, relação;

• restrições de uso: acesso, restrições, direitos, datas de limite de acesso e de uso;

• documentação: conjunto de dados, citação, link de catálogo (URL), referência,sumário, assunto, descrição, resumo, proposta, informação suplementar;

• formato: distribuição, formato, tipo de browser, tipo de dados espaciais, forma deapresentação;

• status: progressão do conjunto de dados (estado atual);

• metadados de qualidade: medida da qualidade dos dados em aspectos de posição,atributos e estruturação;

• exemplos: multimídia;

• atributos de custódia: meio de armazenamento (digital ou analógico), datas demanutenção e revisão, agregação (bandeira), edição, referência periódica.

Das categorias acima, é possível notar que os dados de identificação e origem sãopróprios à organização do produtor dos dados e ao sistema utilizado. Os dados decobertura espacial e cobertura temporal são os mais comuns e necessários, pois sedestinam à procura e busca dos dados no espaço, tais como sistema de coordenadas,referências hidrográficas, controle (horizontal e vertical), transformação (decoordenadas) método de posicionamento (satélite, rádio, aproximação e métodostradicionais entre outros, além de aspectos de localização geral como descrição textual,designação de mapas e boundingbox (retângulo de variação em duas, três ou quatrodimensões) e no tempo, como as de tipo comum (Greenwich [UTC], GPS ou referêncialocal), offset (+/- Greenwich) e intervalo (estimativa de erro não estatística). Ausentes àlista, no entanto, estão os dados relativos à periodicidade com que os mesmos dados sãoatualizados, informação que pode variar com a freqüência de segundos a anos.

Os dados de domínio configuram especificações de natureza técnica, uma vez quetratam de unidades de medida, granularidade da informação (imagens raster), a formade aquisição (equipamentos) e o sistema de operação e produção dos dados. Os demaisdados são de natureza administrativa ou textual, pois tratam das formas de acesso aosdados, gerenciamento, qualidade, controle e disponibilização, incluindo comentáriosadicionais, para o que se veiculam anotações sobre aspectos de natureza genérica e dedifícil classificação e feitas na forma de texto ou símbolos que podem ser espacialmentereferidos.

Page 22: Qualidade de Dados Geoespaciais - UFRGS

22

3.9 Critérios para escolha do padrão de metadados

Com o propósito de efetuar o cadastramento dos metadados referentes à aplicação dabacia do rio Caí (ver Capítulo 4), foram estudados e comparados os padrões SDTS,FGDC, SAIF e CEN. Os critérios utilizados foram os seguintes:

• Propósito do padrão: finalidade para a qual o padrão foi concebido;

• Grupos de metadados contemplados por cada padrão: a sugestão é ver quais gruposcada padrão contempla e abrir (detalhar) alguns para verificar em que nível dedetalhamento os ítens estão identificados. Num primeiro momento a sugestão é abriros metadados de qualidade e de referência espacial;

• Se são contemplados tanto os dados quanto os metadados;

• Possibilidade de incluir informações sobre os próprios metadados;

• Ferramentas de software disponíveis.

• Facilidade de uso/método e dados produzidos (base existente)

• Formatos e padrões de disponibilização dos metadados cadastrados

Buscou-se e avaliou-se softwares disponibilizados na Internet pelas organizaçõesresponsáveis por cada padrão. Os critérios de escolha do software para cadastramentoincluíram a facilidade de manuseio, a clareza dos menus, o sistema operacionalnecessário para a sua execução e a disponibilidade de exemplos de metadados. Ossoftwares comparados foram:

• STDS: SDTS; SDTS-EP (Spatial Data Transfer Standard Encoding Program)

• FGDC: Corpesmet 95 e NBII Metamaker 2.10;

• SAIF: SaifSuite1.1; FMEBC (Feature Manipulation Engine (BC)),Saif3.1 e Saif3.2;

• CEN: ST-Developer_1.5

O padrão escolhido para o primeiro teste de cadastramento dos metadados foi oCSDGM, do Federal Geographic Data Commitee. A escolha justifica-se pela facilidadede uso e pela existência de um grande número de metadados para estudar comoexemplo, além da existência de softwares prontos para uso. O software escolhido para ocadastramento dos metadados foi o NBII Metamaker versão 2.10, disponível noendereço de FTP Anonymous fgdc.er.usgs.gov, do National Biological Service dosEstados Unidos, fabricante do software.

Page 23: Qualidade de Dados Geoespaciais - UFRGS

23

4 Estudo de Caso

Para propiciar um maior aprofundamento no conhecimento do assunto metadados easpectos relacionados à sua constituição, bem como para adquirir experiência prática,foi efetuado um estudo piloto documentando-se os dados de uma aplicação geográfica jáconcluída.

A área de estudo da aplicação utilizada é a bacia do rio Caí, uma das cinco sub-baciasdo programa Pró-Guaíba. Uma bacia hidrográfica pode ser definida como a área total dedrenagem que alimenta uma determinada rede hidrográfica, ou ainda como um espaçogeográfico de sustentação dos fluxos d´água de um sistema fluvial hierarquizado[MIN 87]. É cada vez mais utilizada como unidade de planejamento e gestão territorial.No gerenciamento ambiental, sobretudo, tem-se adotado a bacia hidrográfica comounidade do espaço geográfico para o desenvolvimento de projetos e ações relativos aosrecursos naturais.

A bacia do Guaíba abrange uma área total de 85.900 km2 e uma população deaproximadamente 6 milhões de pessoas distribuída em 227 municípios do Rio Grandedo Sul. A bacia do rio Caí totaliza uma área de 5.057,25 km² e uma população estimadaem 383.929 habitantes distribuída em 41 municípios, entre as latitudes 29° 06’ e 30° sule as longitudes 50° 24’ e 51° 40’ oeste (figura 1). Limita-se a sul e a leste com a baciado rio dos Sinos e a norte e oeste com a bacia dos rios Taquari-Antas. O curso principaltem 257,6 km de extensão, medidos desde suas nascentes mais altas, a 1000 m dealtitude, até sua foz, no delta do rio Jacuí, podendo ser dividido em 3 segmentos decaracterísticas distintas [AGR 71]. O curso superior apresenta declividades de 0,15 a3,5%, o curso médio tem de 0,07 a 0,37% e o curso inferior de 0,01 a 0,07%.

Em termos da geologia, a bacia do rio Caí encontra-se inserida quase totalmente sobrerochas que compõem a seqüência vulcano-sedimentar da Bacia do Paraná. Depósitosaluvionares e lacustres, de idades quaternárias, localizam-se junto ao rio principal, emseus cursos médio e inferior [AGR 71, SEP 86]. Ocorrem basicamente 5 tipos de solos,quais sejam, Terra Bruna Estruturada intermediária para Podzólico Bruno-Acinzentadohúmica álica, Terra Roxa Estruturada álica distrófica e eutrófica, Brunizemavermelhado, Cambissolo Bruno húmico álico e Solos Aluviais eutróficos e distróficos[SEP 86]. Quanto ao clima, predomina o tipo Cfa pela classificação de Köppen,subtropical úmido com precipitações durante todo o ano, sofrendo a influência demassas de ar tropicais e polar-atlânticas [IPA 89]. A precipitação varia de 1.300 a 1.400mm/ano no curso inferior, de 1.400 a 1.600 mm/ano no curso médio e de 1.600 a 2.000mm/ano no curso superior.

A aplicação de SIG da bacia do Caí consiste na estruturação de um sistema deinformação ambiental, composto por dados cartográficos e temáticos e tabelas comdados descritivos. Seu propósito foi o levantamento dos usos da água e do solo na baciado rio Caí, colhendo subsídios para uma proposta de segmentação do curso principal emtrechos bem como para identificar os conflitos de uso da água e do solo existentes nabacia, contemplando a primeira etapa do processo de enquadramento dos recursoshídricos definida na Resolução CONAMA 20/86

Page 24: Qualidade de Dados Geoespaciais - UFRGS

24

FIGURA 1 - Localização da bacia do rio Caí no Estado do Rio Grande do Sul e na áreado programa Pró-Guaíba.

O enquadramento dos recursos hídricos é um importante instrumento de gestão, poisestabelece restrições e potencialidades, definindo objetivos de qualidade da água aserem alcançados e/ou mantidos, com base nos usos preponderantes de cada trecho docurso d’água principal da bacia analisada. A partir da Resolução CONAMA 20/86, oenquadramento das águas recebeu novas diretrizes, incluindo novas classes e padrõesambientais e atribuindo ainda a responsabilidade pelo processo ao órgão ambiental

Page 25: Qualidade de Dados Geoespaciais - UFRGS

25

estadual [CON 93]. Posteriormente, a Lei 10.350, de 30 de dezembro de 1994, instituiuo Sistema Estadual de Recursos Hídricos, incluindo novos atores no processo deenquadramento e exigindo sua readequação à nova realidade. Os comitês de baciashidrográficas passaram a ter um papel fundamental, pois tornaram-se tambémresponsáveis pela elaboração da proposta de enquadramento, partindo de subsídiostécnicos fornecidos pelas agências de bacias hidrográficas e do levantamento dosanseios da sociedade [RGS 94]. Desse modo, cabe à FEPAM (Fundação Estadual deProteção Ambiental), como órgão estadual de meio ambiente do Rio Grande do Sul,aprovar as propostas encaminhadas pelos comitês, bem como atuar no sentido de supriras necessidades resultantes do fato do Sistema Estadual de Recursos Hídricos ainda nãoestar completamente implantado.

A metodologia proposta pela FEPAM para o enquadramento dos recursos hídricosconstitui-se de várias etapas, quais sejam o levantamento dos usos da água e do solo, adefinição e a classificação da qualidade atual da água; a identificação dos interesses dasociedade; a aprovação da proposta e publicação de seu instrumento legal e a efetivaçãodo enquadramento, através da elaboração de um plano de ação para a recuperação ouconservação do recurso hídrico. Atualmente a FEPAM, em convênio com o GTZ(Agência de Cooperação Técnica Alemanha - Brasil), numa iniciativa inédita, estáestruturando o sistema de informação ambiental da bacia do rio Caí para auxiliar no seuenquadramento e gerenciamento.

Assim como a maioria das aplicações existentes no Brasil, a estruturação do sistema foiefetuada por especialistas de diversas áreas de aplicação diretamente em um software deSIG, no caso o IDRISI for Windows, sem passar por uma fase prévia de modelagemconceitual dos dados nem pela especificação das informações a serem coletadas sobreos dados utilizados. Isso ocorreu devido à necessidade de atender uma demandaimediata, sem levar em conta o fato de que esses dados poderão ser total ouparcialmente utilizados mais tarde para outro propósito, proporcionando economia derecursos financeiros e de tempo. A documentação dos dados é fundamental parapermitir esse reaproveitamento.

Como o intuito do trabalho foi analisar o padrão e sua viabilidade de uso, apenas algunsdados do conjunto completo de dados da aplicação da bacia do rio Caí foramdocumentados. A seleção foi feita visando-se contemplar dados representativos dostipos de dados normalmente existentes em aplicações ambientais de SIG. Os dadosdocumentados foram:

• Imagem de satélite classificada com os diferentes usos do solo na área da bacia(raster);

• Mapa da hidrografia (linhas);

• Mapa de divisas municipais em escala 1:250.000 fornecido pelo IBGE (polígonos);

• Mapa de pontos de deposição de resíduos sólidos (pontos);

• Dados de atributo dos pontos de deposição de resíduos sólidos (tabela de banco dedados Access).

Os metadados foram levantados na informação analógica, fornecida pelas organizaçõesresponsáveis pela produção dos dados, e nos procedimentos utilizados na estruturaçãodos dados no SIG, fornecida pela equipe que estruturou os dados. Para auxiliar acompreensão dos itens a preencher no trabalho de cadastramento dos metadados foramtambém buscadas na Internet exemplos de metadados disponíveis.

Page 26: Qualidade de Dados Geoespaciais - UFRGS

26

As figuras 2 e 3 ilustram os dados espaciais da aplicação de SIG do rio Caí que foramdocumentados.

FIGURA 2 – Imagem de satélite classificada com os diferentes usos do solo na área dabacia do rio Caí.

Page 27: Qualidade de Dados Geoespaciais - UFRGS

27

FIGURA 3 – Mapa com a hidrografia, divisas municipais e pontos de deposição deresíduos sólidos na área da bacia do rio Caí.

4.1 Resultados e considerações sobre a aplicação da bacia do rio Caí

As dificuldades encontradas no teste de cadastramento de metadados referem-sebasicamente a dois problemas distintos: (1) recuperação das informações sobre os dados(metadados); (2) utilização do padrão.

Como de fato acontece na maioria dos casos, quando a documentação dos dados é feitasubsequentemente à sua produção, é necessário um considerável esforço para recuperaras informações necessárias, e nem sempre haverá a possibilidade de recuperar todas.Mesmo que a documentação seja conduzida pelo técnico ou grupo que produziu osdados, é impossível reunir a partir do que existe em meio analógico e na memória daspessoas, todos os detalhes das características, parâmetros e procedimentos adotados. Osdados documentados têm origens muito diversas e não há informação completa econfiável, motivo pelo qual o cadastramento de vários itens teve de ser ignorado.

A geração dos metadados concomitantemente à produção/digitalização dos dados evitauma série de problemas decorrentes da documentação a posteriori, com redução decustos e maior fidelidade da informação. Quando feito mais tarde, como de fatoacontece na maioria dos casos, é necessário um considerável esforço para recuperar as

Page 28: Qualidade de Dados Geoespaciais - UFRGS

28

informações necessárias, e nem sempre todas ainda serão possíveis de serem obtidas.Mesmo que isso seja feito pela pessoa ou grupo que gerou os dados, é impossível reunira partir do que existe em meio analógico e na memória das pessoas, todos os detalhes decaracterísticas, parâmetros e procedimentos adotados. Num país com históriacartográfica muito recente, como o Brasil, esse aspecto é ainda mais crítico, pois aimportância de muitos detalhes referentes aos dados não recebe a devida atençãodurante a sua produção. A preocupação concentra-se em produzir os dados para que osusuários os utilizem com valor absoluto, sem lhes fornecer subsídios para julgamentos.

A reunião e cadastramento dos metadados por quem estruturou o conjunto de dados,como feito no presente estudo de caso, permite avaliar bem as dificuldades dadocumentação de dados após a sua produção.

Uma dificuldade encontrada no cadastramento foi saber exatamente o que é e comopreencher cada um da extensa lista de itens do padrão CSDGM. É difícil dominarsuficientemente a terminologia do padrão.

Outra grande dificuldade foi a recuperação das informações necessárias, visto que osdados têm origens muito diversas. Não há informação completa disponível e algunsitens foram ignorados ou esquecidos (memória humana tem duração).

Quanto ao padrão CSDGM, num primeiro momento foi difícil dominar bem suaterminologia, saber exatamente o que cada item da extensa lista de itens representa ecomo preenchê-lo. Em parte, essa dificuldade é fruto da nossa pequena experiência commetadados, mas ela é rapidamente vencida à medida que o contato com o padrãoaumenta.

O Anexo 1 traz um exemplo de relatório com os metadados cadastrados para um dosconjuntos de dados documentados. É possível verificar que sua análise, compreensão eavaliação não é muito simples nem muito clara. Talvez por ser muito abrangente, opadrão utilizado se torna muito extenso e complexo, especialmente para quem não temuma maior familiaridade com o tema. Para que se recomendasse sua adoção num Paíscom pouca experiência como o Brasil, um padrão deveria ser ao menos fácil de usar.Um padrão adequado de metadados deveria ser ao mesmo tempo abrangente osuficiente para permitir uma adequada descrição de um conjunto de dados e simples eclaro o suficiente para permitir sua fácil operação por parte de produtores de dados eusuários.

Apesar de algumas limitações, o CSDMG serviu de base para o desenvolvimento dosdemais padrões, sendo amplamente aceito nos Estados Unidos e empregado em váriosoutros países. O grande número de usuários, a existência de uma grande quantidade demetadados e a disponibilidade de softwares prontos para uso, de fácil aprendizado, sãopontos positivos que contam a favor no momento de indicá-lo como padrão a adotar noBrasil.

As dificuldades encontradas neste estudo de caso com relação à recuperação deinformações sobre dados já produzidos e ao uso do padrão de metadados servem dealerta. Elas tendem a ser maiores num processo sistemático de documentação, ondequem fará o trabalho de cadastramento provavelmente teve pouco contato com os dadosgeoespaciais que está documentando e não é especialista na área de dados ou demetadados geoespaciais [TIM 96]. Dessa forma, torna-se importante aprofundar adiscussão e a pesquisa em metadados para o caso do Brasil.

Page 29: Qualidade de Dados Geoespaciais - UFRGS

29

5 Catálogo de Metadados

A efetiva reutilização de dados geoespaciais digitais depende de diversos fatores, entreeles pode-se citar a interoperabilidade dos dados e a vontade de compartilhamento dosdados entre as instituições (de forma comercial ou não). Para que o maior númeropossível de usuários possam reutilizar os dados geoespaciais existentes, catálogos demetadados estão sendo disponibilizados, na maioria das vezes, através da Internet.

Uma vez elaborado um conjunto de metadados, é necessário torná-lo acessível atravésde ferramentas de busca, o que vem suprir o primeiro objetivo dos metadados que é alocalização dos dados. Os conjuntos de dados geoespaciais são localizados através dosmetadados, no entanto, estes conjuntos não estão, necessariamente, disponíveis paraserem obtidos automaticamente (ex.: download via ftp). Pode-se, por exemplo, localizarum conjunto de dados para uma determinada região geográfica de interesse. Através dosmetadados de qualidade, avalia-se a adequabilidade desse conjunto para o usoplanejado. Por último, pode ser necessário, caso o dado não esteja disponível, fazer ocontato direto com o fornecedor do dado a fim de obte-lo.

A seguir é descrito o catálogo de metadados do Federal Geographic Data Commitee(FGDC), que disponibiliza os metadados gerados segundo o padrão CSDGM.

5.1 Catálogo de metadados do FGDC

O FGDC foi encarregado pelo governo americano de desenvolver procedimentos eauxiliar na implementação de um mecanismo distribuído de divulgação de dadosgeoespaciais digitais. Usando os elementos de metadados definidos no padrão CSDGM,participantes governamentais e não governamentais, no mundo todo, podem tornar suascoleções de informação espacial localizáveis e acessíveis na Internet, usando o sistemade clearinghouse, desenvolvido pelo próprio FGDC. Clearinghouse é um sistemadescentralizado de servidores localizados na Internet, os quais contêm metadados sobreos dados geoespaciais digitais disponíveis [NEB 96].

O FGDC coordena o desenvolvimento de uma infra-estrutura para dados espaciais(National Spatial Data Infrastructure - NSDI). A NSDI abrange políticas, padrões eprocedimentos para organizações produzirem e compartilharem dados geoespaciaiscooperativamente. Quinze agências federais, que compõem o FGDC, estãodesenvolvendo a NSDI em cooperação com organizações de governos locais eestaduais, a comunidade acadêmica e o setor privado.

Um nó do sistema de clearinghouse pode ser estabelecido sempre que se dispuser deuma coleção de dados e metadados que os descrevem. Instituições com poucosconjuntos de metadados, com conexão limitada à Internet, ou que não desejam criarseus próprios servidores de metadados são orientadas a estabelecer parcerias com outrasinstituições na sua região (ou disciplina). O objetivo principal é tornar os metadadosacessíveis através do sistema de busca da clearinghouse, independente de onde osmetadados estão armazenados. Alguns países (ex.: África do Sul, Costa Rica) optarampor adotar o sistema de clearinghouse do FGDC para promover a interoperabilidade oupara aproveitar a tecnologia existente.

Page 30: Qualidade de Dados Geoespaciais - UFRGS

30

O FGDC fornece suporte técnico e os programas necessários para a implementação deum nó de clearinghouse. Para ser inserido no sistema de clearinghouse um participantedeve dispor dos seguintes itens [NEB 96]:

• metadados (campos descritivos) que descrevem um conjunto de dados geoespaciais.Esses metadados devem ser armazenados localmente em arquivos texto ou embanco de dados. Os elementos de dados devem corresponder aos campos e à lógicado padrão CSDGM. Os metadados precisam ser fornecidos em formato texto ou emSGML, uma linguagem específica para o padrão CSDGM;

• hardware para armazenar os metadados indexados em várias formas, conectado àInternet. As plataformas suportadas incluem Intel (Linux), Sun, DEC, HP, IBM eData General com suporte para Windows NT e Mac (MachUNIX);

• o software Z39.50 que suporta o acesso aos metadados usando o GeospatialMetadata Profile (GEO). O FGDC oferece uma referência de implementação deprograma que suporta a indexação e serve os metadados do FGDC;

• programa analisador de metadados (opcional), que suporta validação e reformataçãode metadados do FGDC nos formatos SGML, HTML, TEXTO e DIF. Érecomendado para a geração rápida e padronizada de HTML para clientes Web epara a criação de intercâmbio e indexação de dados em SGML;

• servidor www (opcional). A descoberta e acesso primário a metadados geoespaciaisna clearinghouse é através do protocolo Z39.50, provendo capacidade de busca emnível de campo. Os sites podem prover uma interface para complementar o serviçode busca oferecido pelo Z39.50.

Para possibilitar a interoperabilidade de busca entre os diferentes servidores demetadados o sistema de clearinghouse adotou o protocolo ANSI Z39.50-1995 (ISO10163-1995). O protocolo Z39.50 foi desenvolvido, originalmente, para recuperarmaterial bibliográfico em registros de bibliotecas a partir de conjuntos de atributospredefinidos (ex.: nome do autor, título e assunto). Através de uma conexão cliente-servidor, o sistema passe uma consulta formatada, retorna os resultados da consultausando um conjunto de atributos e apresenta os documentos identificados ao cliente, emum dos diversos formatos disponíveis.

Agências de manutenção do protocolo Z39.50 são responsáveis pelo registro deconjuntos de atributos específicos, operadores e regras de implementação, para ageração de um novo profile de aplicação. Com base em um subconjunto dos elementosde metadados do padrão CSDGM, foi definido o profile para aplicações geográficas,denominado “GEO”. Este profile, juntamente com os programas do protocolo Z39.50,possibilitam um mecanismo de busca a metadados geoespaciais, através na Internet,muito mais eficiente do que as máquinas de busca tradicionais. Consultas a conjuntos demetadados podem ser feitas, por exemplo, baseadas nos limites espaciais da regiãorelativa ao conjunto de dados.

Page 31: Qualidade de Dados Geoespaciais - UFRGS

31

6 Considerações Finais

Metadados têm vários usos distintos. Alguns atributos de metadados são necessáriospara descobrir o histórico e a localização de um objeto de dados dentro de um sistemade acesso e disponibilização, enquanto outros são úteis para um usuário externodeterminar quais objetos de dados extrair. Há um grande volume de informação quepode ser catalogada sobre um conjunto de dados, mas a porção que se refere aosmetadados somente tem valor para o usuário mais informado, aquele que já obteve osdados. Assim, como determinar quais atributos de metadados coletar e manter numsistema de procura e solicitação de dados? Quanto é suficiente? Quanto é excessivo?Uma vez determinados quais os itens necessários, como fazer para obtê-los? Nalocalização de um objeto de dados particular, o metadado certo é freqüentemente maisvalioso que a maior parte dos metadados.

Como não se pode determinar ou controlar a quantidade de metadados, que em nívelespecialista pode ultrapassar uma centena, um número mínimo de metadados poderiagarantir uma estrutura de metadados mais homogênea, mais confiável e mais robusta. Amaioria dos padrões abrange uma quantidade excessiva de metadados de caráteradministrativo, quando aspectos de qualidade seriam muito mais importantes edecisivos no uso e implementação de metadados. Assim, o mínimo a ser contempladoem metadados para qualquer conjunto de dados geoespaciais são os itens de qualidade,que permitiriam o uso adequado destes dados.

Aspectos de qualidade como linhagem, acurácia, consistência lógica e completezatornam-se fundamentais para se determinar a confiabilidade dos dados espaciais, quenunca é absoluta. Tais descrições têm repercussões positivas, pois uma melhor noçãodas limitações técnicas implica numa melhor noção da adequabilidade dos dadosutilizados, numa tomada de decisões mais apurada e melhor informada, numatransferência de informação mais robusta e, por fim, numa melhor delimitação dasresponsabilidades dos produtores de dados.

A redução na quantidade de metadados é, sem dúvida, a razão do grande número depadrões propostos até hoje e do interesse de especialistas pelo tema. O caminho nodesenvolvimento do tema metadados geoespaciais aponta para uma definição de umconjunto mínimo de dados que satisfaça a maior parte das necessidades de aplicação, oque parece estar contido numa intersecção dos padrões existentes.

Um padrão para metadados, concordando com o afirmado por [TIM 96], precisa serclaro, compreensível, consistente, completo, flexível e, principalmente, fácil de usar. Édifícil fazer uma comparação mais aprofundada entre padrões pois apenas um foirealmente utilizado para documentar dados neste projeto. Além disso, a poucaexistência de bases de metadados e de softwares de cadastramento também dificulta acomparação e avaliação.

Page 32: Qualidade de Dados Geoespaciais - UFRGS

32

Bibliografia

[AGR 71] AGRAR UND HIDROTECHNIK/SOP-RS. Planejamento hidrológico eestudo de desenvolvimento regional da bacia do rio Caí. 5v. PortoAlegre, 1971.

[ANT 91] ANTENUCCI, J.C. et al. Geographic Information Systems: a guide tothe technology. New York: Van Nostrand Reinhold, 1991.

[ANZ 97] ANZLIC THE AUSTRALIA NEW ZEALAND LAND INFORMATIONCOUNCIL. Core Metadata Elements for Land and GeographicDirectories in Australia and New Zealand. 1997.<http://www.anzlic.org.au/metaelem.htm>

[BRI 95] BRITISH COLUMBIA SPECIFICATIONS AND GUIDELINES FORGEOMATICS. Spatial Archive and Interchange Format: SAIF formaldefinition. Release 3.2. British Columbia, Canada: Ministry ofEnvironment, Lands and Parks, Reference series. 1995. v.1. Disponívelem <http://www.lii.crl.gov.bc.ca/saif/saifHome.html>

[BUR 92] BURROUGH, P. A. Principles of geographical information systemsfor land resources assessment. Oxford: Oxford University Press, 1992.194p.

[CEN 96] CEN EUROPEAN COMMITTEE FOR STANDARDIZATION.Geographic Information – Data Description Language – ConceptualSchema Language. Brussels: CEN, 1996. (Report CR 287005).

[CON 93] CONAMA. Resoluções CONAMA entre 1984 e 1992. Brasília:Ministério do Desenvolvimento Urbano e do Meio Ambiente, 1993.

[DRE 97] DREWRY, M. et al. Metadata: Quality vs. Quantity. In: 2nd IEEEMetadata Conference, 1997, Silver Spring. Disponível emhttp://computer.org/conferen/proceed/meta97/papers/hconover/mdrewry.html.

[FAI 97] FAIZ, S. Modelisation, Exploitation et Visualisation de l’InformationQualité dans les Bases de Données Geographiques. Orsay: Universitéde Paris-Sud, 1996. PhD thesis.

[FED 97] FEDERAL GEOGRAPHIC DATA COMITEE. Content Standard forDigital Geospatial Metadata. Washinton, D.C.: FGDC - FederalGeographic Data Comitee, 1997. Disponível em: http://www.fgdc.gov.

[GOO 97] GOODCHILD, M. (ed.). GIS Interoperability, 1997. Disponível em:http://www.env.gov.bc.ca/gdbc/fmebc/comment.htm.

[GUI 97] GUIDARA, P. J.; QUINTANILHA, J. A. Padrões de metadados parabase de dados geográficos. In: IV SIMPÓSIO BRASILEIRO DEGEOPROCESSAMENTO, São Paulo, 1997. Anais... São Paulo: UPUSP,1997.

[IPA 89] IPAGRO. Atlas agroclimático do estado do Rio Grande do Sul. 3 v.Porto Alegre: IPAGRO - Seção de Ecologia Agrícola, 1989.

Page 33: Qualidade de Dados Geoespaciais - UFRGS

33

[MIN 87] MINISTÉRIO DA AGRICULTURA. Programa Nacional deMicrobacias Hidrográficas: Manual Operativo. Brasília: Ministério daAgricultura, 1987. 60p.

[MOE 88] MOELLEWING, H. The proposed standard for digital cartographic data:report of the digital cartographic data standards task force. TheAmerican Cartographer, v.15, n.1, 1988.

[PAR 89] PARKER, H. D. GIS software 1989: a survey and commentary.Photogrammetric Engineering & Remote Sensing. vol. 55, 1989. p.1589-1591.

[RGS 94] RGS. Política Estadual de Recursos Hídricos. LEI N° 10.350(30/12/94).

[RIB 96] RIBEIRO, G. P.; SOUZA, J. M.; FREITAS, A. L. B. Digital geospatialmetadata: a brazilian case federal databases. In: IEEE METADATACONFERENCE, 1., 1996, Maryland. Proceedings... Maryland: IEEE,1996.

[SEP 86] SEPLAN/IBGE. Levantamento de Recursos Naturais. V 33. Rio deJaneiro: Radambrasil, 1986. 791p.

[SHE 97] SHELLEY, E.P. el alli. Spatial Metadata in Austrália - a learningexperience. In: 2nd IEEE Metadata Conference, 1997, Silver Spring.http://computer.org/conferen/proceed/meta97/papers/pshelley/pshelley.html

[TEI 95] TEIXEIRA, A.A. et al. A história dos SIG. Revista Fator GIS, no 10,1995. p. 21-26.

[TIM 96] TIMPF, S. et al. Experiences with Metadata. In: SDH’96, Delft, 1996.http://www.geoinfo.ac.at /publications/timpf. htm

[WEB 98] WEBER, E. J.; LISBOA F., J.; IOCHPE, C.; HASENACK, H. Geospatialmetadata in Brazil: an experience in data documentation of anenvironmental GIS application. In: INT. CONFERENCE &EXHIBITION ON GEOGRAPHIC INFORMATION - GIS Planet, 1998,Lisbon, Portugal. Proceedings... Lisbon: USIG,1998.

Page 34: Qualidade de Dados Geoespaciais - UFRGS

34

ANEXO 1 -Exemplo de Relatório de Documentação de Dados

Report Date: 13-Jan-1998Metadate Data Set Name: Cahybhcl_Imagem1 Identification Information1.1 Citation Information: 8.1 Originator: Eliseu Weber 8.1 Originator: Andréia Costa 8.2 Publication Date: 19970820 8.3 Publication Time: 9:00 8.4 Title: Levantamento dos usos da água e do solo na bacia do rio Caí 8.6 Data Presentation Form: Relatório 8.8.1 Publication Place: Porto Alegre - RS, Brasil 8.8.2 Publisher: FEPAM ( Fundação Estadual de Proteção Ambiental)1.2 Description 1.2.1 Abstract: In the present study a GIS was used as auxiliar tool for the diagnosis andmanagement of the Caí watershed, located in the state of Rio Grande do Sul. The aimwas to perform an environmental diagnosis due to the survey of the main soil and wateruses throughout the watershed, the first step for the classification of the riverbasinregarding its water resources. The integration of data was done with IDRISI GIS, andnew information was derived. the results allowed a characterization of the watershedwith a proposal of river segmentation according to the uses of the water and theconflicts associated to them. This will be an important input for the classification of thewater resources. The results showed the possibility of using GIS technics in waterresource studies to obtain good practical responses at a low cost.1.3 Time Period Of Content 9.3 Range of Dates/Times 9.3.1 Beginning Date: 19961111 9.3.2 Beginning Time: 10:00 9.3.3 Ending Date: 19970511 9.3.4 Ending Time: 19:00 1.3.1 Currentness Reference: Publication Date1.4 Status 1.4.1 Progress: Completo 1.4.2 Maintenance and Update Frequency: Não planejado1.5 Geographic Extent 1.5.1 Description of Geographic Extent:

Page 35: Qualidade de Dados Geoespaciais - UFRGS

35

A extensão geográfica dos dados abarca a bacia hidrográfica do Rio Caí 1.5.2 Bounding Rectangle Coordinates 1.5.2.1 West Bounding Coordinate: -51.6984978 1.5.2.2 East Bounding Coordinate: -50.3572731 1.5.2.3 North Bounding Coordinate: -29.0524693 1.5.2.4 South Bounding Coordinate: -30.00036811.6 Keywords 1.6.1.1 Theme Keyword Thesaurus: None 1.6.1.2 Theme Keyword: Uso/Cobertura do Solo 1.6.2.1 Place Keyword Thesaurus: None 1.6.2.2 Place Keyword: Rio Grande do Sul, rio Caí1.10 Point of Contact 10.1 Contact Person Primary 10.1.1 Contact Person: Dra. Pineda, Maria Dolores 10.1.2 Contact Organization: Fundação Estadual de Proteção Ambiental (FEPAM) 10.3 Contact Position: Coordenadora Brasileira do Convênio FEPAM / GTZ 10.4 Contact Address 10.4.1 Address Type: Mailing and Physical Address 10.4.2 Address: Carlos Chagas,55/sala 803 10.4.3 City: Porto Alegre 10.4.4 State or Province: Rio Grande do Sul 10.4.6 Country: Brasil 10.5 Contact Voice Telephone: (051)225-6532 10.7 Contact Facsimile Telephone: (051)225-6532 10.8 Contact Electronic Mail Address: [email protected] Hours of Service: 08:00 a.m - 18:00 p.m. - segunda-sexta1.12 Data Set Credit: Fundação Estadual de ProteçãoAmbiental (FEPAM)1.14 Native Data Set Environment: IDRISI for Windows2 Data Quality Information2.1 Attribute Accuracy 2.1.1 Attribute Accuracy Report: Não testado. É sabido que a classe solo exposto inclui também as áreas urbanas.2.2 Logical Consistency Report: Não aplicável2.3 Completeness Report: Não aplicável2.4 Positional Accuracy 2.4.1 Horizontal Positional Accuracy 2.4.1.1 Horizontal Positional Accuracy Report: Não aplicável. 2.4.2.1 Vertical Positional Accuracy Report:

Page 36: Qualidade de Dados Geoespaciais - UFRGS

36

Não aplicável2.5 Lineage 2.5.1 Methodology 2.5.1.1 Methodology Type: Campo/Laboratorio 2.5.1.2.2 Methodology Keyword: Classificação de imagens 2.5.1.3 Methodology Description: Classificação pelo método da máxima verossimilhança gaussiana. Áreas detreinamento definidas com base em trabalho de campo, num total de 1095 áreas detreinamento. A imagem foi classificada em duas partes, referentes a duas órbitasdiferentes. As duas partes foram depois reunidas por concatenação para formar aimagem de uso do solo. 2.5.1.4 Methodology Citation: 8.1 Originator: Eliseu Weber 8.1 Originator: Andréia Costa 8.2 Publication Date: 19970820 8.3 Publication Time: 9:00 8.4 Title: Levantamento dos usos da água e do solo na bacia do rio Caí 8.6 Data Presentation Form: Map 8.8.1 Publication Place: Porto Alegre - RS, Brasil 8.8.2 Publisher: FEPAM ( Fundação Estadual de Proteção Ambiental)2.5.2 Source Information 2.5.2.1 Source Citation: 8.1 Originator: Eliseu Weber 8.1 Originator: Andréia Costa 8.2 Publication Date: 19970820 8.3 Publication Time: 9:00 8.4 Title: Levantamento dos usos da água e do solo na bacia do rio Caí 8.6 Data Presentation Form: Map 8.8.1 Publication Place: São José dos Campos- SP, Brasil 8.8.2 Publisher: INPE (Instituto Nacional de Pesquisas Espaciais) 2.5.2.3 Type Of Source Media: CD-ROM 2.5.2.4 Source Time Period Of Content: 9.1 Single Date/Time 9.1.1 Calendar Date: 19951021 9.1.2 Time Of Day: 10:00 2.5.2.4.1 Source Currentness Reference: Publication Date2.6 Cloud Cover: 03 Spatial Data Organization Information

Page 37: Qualidade de Dados Geoespaciais - UFRGS

37

3.2 Direct Spatial Reference Method: Point3.4 Raster Object Information 3.4.1 Raster Object Type: Pixel 3.4.2 Row Count: 3500 3.4.3 Column Count: 4333 3.4.4 Vertical Count: 256

4 Spatial Reference Information4.1 Horizontal Coordinate System Definition4.1.2 Planar 4.1.2.1.1 Map Projection Name: Transverse Mercator 4.1.2.1.2.2 Longitude Of Central Meridian: -51 4.1.2.1.2.3 Latitude Of Projection Origin: 0 4.1.2.1.2.4 False Easting: 500000 4.1.2.1.2.5 False Northing: 1000000 4.1.2.4.1 Planar Coordinate Encoding Method: Coordinate Pair 4.1.2.4.2.1 Abscissa Resolution: 1 4.1.2.4.2.2 Ordinate Resolution: 1 4.1.2.4.4 Planar Distance Units: Meters 4.1.4.1 Horizontal Datum Name: Corrego Alegre 4.1.4.2 Ellipsoid Name: Internacional 4.1.4.3 Semi-Major Axis: 6378388

5 Entity and Attribute Information

6 Distribution Information

7 Metadata Reference Information7.1 Metadata Date: 199712057.2 Metadata Review Date: Não revisado7.3 Metadata Future Review Date: 199712087.4 Metadata Contact: 10.1 Contact Person Primary 10.1.1 Contact Person: Weber, E. J. ; Costa, A. C. 10.1.2 Contact Organization: Universidade Federal Do Rio Grandedo Sul - Instituto de Informática (UFGRS) 10.3 Contact Position: Bolsista 10.4 Contact Address 10.4.1 Address Type: Mailing Address 10.4.2 Address: [email protected] 10.4.2 Address: [email protected] 10.4.3 City: Porto Alegre

Page 38: Qualidade de Dados Geoespaciais - UFRGS

38

10.4.4 State or Province: Rio Grande do Sul 10.4.5 Postal Code: 10.4.6 Country: Brasil7.5 Metadata Standard Name: FGDC Content Standards ForDigital Geospatial Metadata7.6 Metadata Standard Version: NBII Draft of December 1995,Based FGDC of June 8, 19947.7 Metadata Time Convention: Local Time7.8 Metadata Access Constraints: Nenhuma7.9 Metadata Use Constraints: Nenhum7.10 Metadata Security Information 7.10.1 Metadata Security Classification System: None 7.10.2 Metadata Security Classification: Unclassified 7.10.3 Metadata Security Handling Description: None