Dado, informação e conhecimento: Metadados e Ontologias

Para iniciarmos a discussão de metadados e ontologias, vamos começar apresentando alguns dos principais conceitos copilados de algumas das principais referencias no assunto.

Metadados

Segundo Turban et. al (2008) em seu livro “Business Intelligence: Um enfoque gerencial para a inteligência do negócio”, os metadados são dados sobre dados. Os metadados descrevem a estrutura e alguns significados a respeito dos dados, e, assim, contribuem para que seu uso seja eficiente ou ineficiente. De modo geral poucas organizações entendem os metadados e como podem fazer para implementar e projetar uma estratégia de metadados. Quando falamos em metadados nesse contexto, dizemos que são metadados técnicos ou de negócios. Existem alguns metadados chamados de metadados por padrão que podem ser diferenciados em metadados sintáticos(dados que escrevem a sintaxe dos dados), metadados estruturais (dados que descrevem a estrutura dos dados) e metadados semânticos (dados que descrevem o significado dos dados em determinado domínio) Os metadados de negócios incluem informações que aumentam nossa compreensão sobre os dados tradicionais (estruturados). O principal objetivo dos metadados é oferecer contexto aos dados relatados, isto é, informações enriquecedoras que levam a criação de conhecimento. Os metadados de negócios, ainda que difíceis de providenciar corretamente, liberam mais potencial dos dados estruturados. O contexto não precisa ser o mesmo para todos os usuários. Como exemplo, os SGBDs(Sistemas de Gerenciamento de Banco de Dados) usam um catálogo no  qual armazenam os metadados técnicos necessários ao seu processo de otimização de consultas. As tabelas dos SGBDs podem conter informações sobre tabelas relacionais, campos, índices, usuários, triggers, stored procedures etc. Para cada campo, existem metadados como nome, tipo, tamanho, indexação, cardinalidade etc. Estes dados são fundamentais o SGBD na escolha dos melhores caminhos de acessos existentes dentro de um comando SQL,

Os metadados formam uma base para arquitetura de metanegócios (Bell, 2001)

Tanembaum (2002), autor conhecido da área de computação, descreveu como identificar requisitos de metadados. Outros autores como Vadva e Vetterli (2001) proporcionam uma visão geral da gestão de metadados para data warehousing. Zhao (2005) descreveu cinco níveis de maturidade da gestão de metadados: 1) ad hoc, 2) descoberta, 3) gerenciada, 4) otimizada e 5) automatizada. Esses níveis ajudam a compreender onde uma organização se encontra em termos de como usa e se faz bom uso de seus metadados. Palestino(2011), em seu livro “Bi2: Business Intelligence – Modelagem & Qualidade” reforça a importância da devida formação dos metadados no contexto de governança de dados e qualidade de dados. Segundo o autor, os dados para produzirem devidamente informações e conhecimentos, ter definição completa e uníssona (Que tem o mesmo som ou qualidade que outro. Garantia unânime) sendo que a definição dos dados é a essência dos metadados. O autor compara metadados com aquelas plaquinhas que indicam o tipo de comida a ser servido em um restaurante. Se você possui esse metadado acrescido da sua percepção do contexto, você será capaz de inferir até mesmo os ingredientes utilizados no preparo daquele prato a partir do descritor fornecido. De muitas formas, os metadados auxiliam a converter dados e informações em conhecimento. Segundo Palestino(2011), de modo geral, os metadados terão grande importância no conceito de web semântica, a medida que, nesse contexto, os conteúdos serão cada vez mais acessados e processados por algoritmos inteligentes. No plano de negócios, a fronteira dos metadados com a gerencia do conhecimento se dá por modelos ontológicos que definem domínios maiores, nos quais aquele dado se contextualiza. Com a extensão do conceito de BI (BI2, como chamamos) aos conceitos de governança de dados e de processos, os metadados poderão representar certas propriedades dos dados associados a processos do ambiente de desenvolvimento de software.

1266614236_75307415_1-Fotos-de-Curso-de-ONTOLOGIA-DEL-LENGUAJE

Ontologias

Ontologia é uma área de estudo que vem reunindo profissionais de diversas áreas do conhecimento. Na Ciência da Informação a ontologia é um artefato terminológico que permite que possamos organizar um domínio de conhecimento contendo relações e definições sobre termos. A ontologia permite modelar um domínio  de conhecimento, criar uma teoria de raciocínio sobre o domínio de conhecimento recuperar uma informação com determinada precisão e auxiliar na descoberta do conhecimento dentro de um determinado domínio. Também pode ser chamada de tesauros, taxonomia. O termo “ontologia” ainda é pouco conhecido e nesse sentido a discussão sobre o assunto se torna pertinente.

Uma ontologia é uma especificação explícita de uma conceituação. O termo é tomado por empréstimo da filosofia, onde uma ontologia é um relato sistemático da Existência. Para sistemas baseados em conhecimento, o que ‘existe’ é exatamente aquilo que pode ser representado. Quando o conhecimento de um domínio é representado em um formalismo declarativo, o conjunto de objetos que podem ser representados é chamado o universo do discurso. Este conjunto de objetos, e as relações formalizadas entre eles, são refletidas no vocabulário representativo com o qual um programa baseado em conhecimento representa conhecimento. Portanto, nós podemos descrever a ontologia de um programa através da definição de um conjunto de termos representativos. Em tal ontologia, definições associam os nomes de entidades no universo do discurso (e.g. classes, relações, funções ou outros objetos) com texto legível para humanos, descrevendo o que os nomes significam e axiomas formais que restringem a interpretação e o uso bem formado destes termos. (GRUBER, 1993)

Ao pesquisar sobre ontologia, as principais referencias remetem a um estudo voltado a filosofia e aos aspectos cognitivos. Em uma linguagem menos técninca e mais humana-existencialista(vou arriscar usar essas palavras), o conhecimento é associado a palavra “ontos” (ser) e “logos” (estudo,discurso) de modo a promover um estudo das categorias fundamentais do “ser enquanto ser”. No campo destinado a Ciência e  Tecnologia da Informação, as ontologias são classificações usadas para agrupar e categorizar as informações em classes. Assim como os metadados, são aplicadas em Web Semântica e em Inteligência Artificial para assimilar e codificar conhecimento.

Alguns métodos para construção de ontologias foram propostos por alguns autores.

  •  Identificação do propósito;
  • Construção da ontologia: captura da ontologia, codificação da ontologia, integração das ontologias existentes.
  • Avaliação;
  • Documentação;

Também é importante estar atento ao que se deseja construir, identificar quem são os que irão utilizar a ontologia e como farão isso, escolher bem a linguagem mais apropriada para representar a ontologia e escolher o método mais apropriado para capturar a ontologia.

Neste artigo, discutimos academicamente o significado de metadados e ontologias no contexto da Tecnologia da Informação e Ciência da Informação. O vídeo abaixo contribui para discussão do tema e introduz novas perspectivas na área de Engenharia do Conhecimento e  Sistemas Inteligentes. A primeira metade do vídeo é a mais interessante, seguido pelos casos de uso no contexto empresarial.

 

 

Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

w

Conectando a %s