[Biotasp-l] Data Cleaning - nova ferramenta SinBiota

colombo biotasp-l@biota.org.br
Wed, 21 Jul 2004 16:31:19 -0300


Caros Pesquisadores

A equipe do CRIA - Centro de Referencia em Informação Ambiental - 
analizando os dados inseridos no sistema SinBiota, detectou algumas 
possíveis falhas e erros na inserção de dados.
Estes são posíveis erros de digitação ou padronização. Geralmente erros 
pequenos e simples, onde uma letra é adicionada, trocada ou omitida. 
Estes são erros difícies de serem encontrados em um grande conjunto de 
dados devido a pequena diferença da ortografia.

Para facilitar a localização desses dados,  foi desenvolvida a 
ferramenta chamada "Data Cleaning".
A ferramenta apenas identificará os possíveis erros.

Os registros suspeitos indicados pela ferramenta não é de acesso 
público, o acesso é exclusivo aos usuários do Sinbiota.
A ferramenta não interfere na informação, nenhum dado é modificado e 
cabe ao autor que confira e escolha entre corrigir ou não a informação.

Esta ferramenta esta em fase de teste, logo críticas e sugestões serão 
bem vindas , tanto na visualização dos dados, como nas regras utilizadas 
para a confecção dos filtros.

Para acessar os dados de seu projeto basta acessar a página 
http://sinbiota.biota.org.br/info/info_amb
e clicar em "Data Cleaning (requer login/senha)"
Informar seu login e sua senha
Selecione seu projeto e identifique os possíveis erros.

Atenciosamente

-- 
Alexandre Falanga Colombo

CRIA - Centro de Referência em Informação Ambiental
Biólogo
Tel: +55 19 3288-0466
Fax: +55 19 3249-0960

http://www.cria.org.br