A Web Semântica ou Inteligente, vem se apresentando como solução para ordenar o caos
informacional existente na web.
Segundo Berners-Lee et alii (2001), a web semântica será uma extensão da web atual porém apresentará estrutura que possibilitará a compreensão e o gerenciamento dos
conteúdos armazenados na web independente da forma em que estes se apresentem, seja
texto, som, imagem e gráficos à partir da valoração semântica desses conteúdos, e através
de agentes que serão programas coletores de conteúdo advindos de fontes diversas capazes
de processar as informações e permutar resultados com outros programas
A web
semântica, a exemplo da web atual, será
tão descentralizada quanto possível e
deverá manter a responsabilidade exigida por esta descentralização, procurando alcançar o
ideal de consistência de interconexões, porém permitindo seu crescimento exponencial.
O fantasma de perda de informação
ou mensagens do
tipo “Error 404: Not Found”
deverão inexistir, ou estar, sob controle, ainda segundo os autores.
Para a implementação
ou reorganização da web semântica
há um contigente de
pesquisadores
trabalhando no W3C- World Wide Web Consortium,
hospedado
no
Massachusetts Institute of Tecnhology, Laboratory for Computer Science, nos Estados
Unidos, no Institut National de Rechurche in Informatique et em Automatique, na França,
e no Japão, a Keio University Shanam Fujisawa. O W3C é um fórum aberto de indústrias
e organizações com a missão de alavancar a web ao seu potencial máximo (www.w3.org;
www.w3.org./People ).
3
Basicamente, a web
semântica
se compõe de três elementos: (a) Representação do
conhecimento (Knowledge representation);
(b) Ontologias (Ontologies) e (c) Agentes
(Agents).
(a) Representação do conhecimento
A web semântica trará estrutura ao conteúdo significativo (valoração semântica) de
páginas web criando um ambiente onde programas-agentes ou agentes inteligentes
buscando de uma página à outra poderá, imediatamente, executar tarefas sofisticadas para
os usuários.
(b) Ontologias
Designa
a faceta semântica da representação dos seres, dos entes, aquilo
que se
convenciona chamar de assuntos , conteúdos temáticos dos registros sobre a realidade.
A ontologia seria então, como uma especificação de uma conceituação. A Ontologia, na
web semântica estabelece uma ligação terminológica entre membros de uma comunidade
podendo ser estes membros, agentes humanos ou máquinas. No jargão dos pesquisadores
em inteligência artificial,
uma ontologia é um
documento ou arquivo que define
formalmente a relação entre termos.
Cabe neste contexto de formalidade relacional apresentar os metadados .
Etmologicamente, metadado significa “dado sobre dado”; dado que descreve a essência,
atributos e contexto de emergência de um recurso e caracteriza suas relações, visando o
seu acesso e uso potencial (FERREIRA, 1986).
Segundo Ikematu (2001), definir metadados tem sido uma tarefa
difícil pois as várias
interpretações sobre o assunto estão relacionadas ao estágio da organização dentro da
hierarquia evolucionária de gestão do conhecimento.
São apresentados alguns conceitos sobre metadados. Dados que descrevem atributos de
um recurso, suportando um número de funções, como: localização,
descoberta,
documentação, avaliação e seleção. Ou ainda, “Metadado é dado associado com objetos
que auxilia seus usuários potenciais a ter vantagem completa do conhecimento da sua
existência ou características”.
4
O autor salienta ainda que se há necessidade
de integração e de uniformidade de
linguagem
e significado dos dados através da organização, os metadados devem ser o
núcleo dos esforços de forma centralizada. Para que isto ocorra, a instituição deve ter
pleno conhecimento
das vantagens da organização e da documentação dos dados.
A
informação baseada em metadados enriquece documentos
com informações semânticas
acrescentando explicitamente metadados aos recursos informacionais.
Existem várias linguagens de metadado que podem ser utilizadas para marcar ou anotar
estes recursos informacionais, como o XML e RDF (STAAB et alli, 2000, p.148).
As linguagens de marcação (markup languages) evoluiram desde o SGML (Standard
Generalized Markup Language), para o HTML (Hypertext Markup Language) em 1980 e
XML (Extensible Markup Language) em 1996.
Ao contrário da HTML que através das marcas pré-definidas gerenciam os textos marcados
e controlam sua representação estabelecendo ligações entre os documentos, a linguagem
XML marca semânticamente um documento. XML consiste em
padrão utilizado para
marcação
de documentos que contém informações estruturadas, ou seja, documentos que
contém uma estrutura clara e precisa da informação armazenada e obtida com XML. Esta
estruturação define e separa claramente conteúdo, significado e apresentação.
Assim os
documentos em XML podem ser indexados com maior precisão que as páginas planas
escritas em HTML.
O padrão XML permite troca de informações entre diversas plataformas e possibilita a
descrição de dados em arquivos texto. A linguagem XML torna-se poderosa ferramenta
para a publicação de informações na web (OLIVEIRA, 2002).
O padrão XML pode ser utilizado de modo geral, no armazenamento de bases de dados
e documentos estruturados e as aplicações de XML criam novos padrões e linguagens
(www.xml.com.br).
A sintaxe de
um documento XML é armazenada
em tabelas
DTD – Document Type
Definition que determinam as regras, hierarquias e marcações criadas para caracterizar as
informações do documento (BAX, 2001).
5
Enquanto a função principal do metadado é descrever um documento através de atributos
conferidos
a um objeto, retratando as suas características como dimensão, formato,
autoria, localização e outros com o objetivo de intercambiar dados, o RDF – Resource
Description Framework é um grafo para descrever e intercambiar metadado.
Segundo Tim Bray (www.xml.com/ltp/a/2001/01/24/rdf.htm) as regras para construção de
RDF são: Fonte (Resource), qualquer coisa q possa ter uma identificação na rede – URI
ue
(Uniform Resource Identifier); ou um elemento individual de
um documento XML;
-
Propriedade, é uma fonte que possui um nome e pode ser usado como uma propriedade e –
Afirmação (statement) que consiste na combinação de uma fonte, uma propriedade e um
valor, partes estas conhecidas como “assunto”, “predicado” e “objeto” de uma Afirmação
(statement). Para um objeto 0 existe um atributo A cujo valor é V, sendo que objetos e
valores são intercâmbiados em RDF, onde um objeto pode ser um valor. Em grafos RDF
pode-se identificar de que tipo é o objeto e estabelecer relações à sua definição (Decker et
alii, 2000).
Várias implementações podem ser desenvolvidas utilizando RDF nível simples ou Schema
RDF e aplicações XML.
O modelo a ser adotado para a web semântica parte do modelo RDF geral. Este modelo
básico contém apenas conceito sobre asserção (assertion) e de “quotation” – criando
asserções sobre asserções, portanto necessita, segundo
Berners-Lee (2001), em artigo
“Semantic Web Road Map” implementações e aplicações como conversão de linguagem,
leis da lógica, com o objetivo de imprimir lógica aos documentos; predicado lógico
(not, and, or) e leis de quantificação (para todo x y (x)). Neste estágio, o autor ainda cita
a introdução da linguagem
de provas e de busca e índices de termos evoluindo para
vocabulário .
A arquitetura da web semântica é processo em construção por grupos de trabalho da
W3C (www.xml.com/pub/r/1246; www.w3.org) com o objetivo de mapear as complexas
relações
semânticas, lógicas, de sintaxe e de apresentação dos documentos no novo
espaço.
6
(c) Agentes
A função dos programas agentes ou agentes inteligentes é coletar conteúdos na web a
partir
de fontes diversas, processar a informação e permutar os resultados com outros
programas permitindo através de linguagem que expressa inferências lógicas resultantes do
uso de regras e informação como aquelas especificadas pelas ontologias. O principio está,
não no entendimento, pela máquina, daquilo que está escrito e sim no reconhecimento de
provas escritas na linguagem estabelecida pela ontologia, onde os programas-agente, pela
inferência
lógica retornam respostas ao que
foi
requerido, ou agente e consumidor
podem alcançar
entendimento compartilhado permutando as ontologias, que oferecem o
vocabulário necessário para a discussão.

A Web Semântica ou Inteligente, vem se apresentando como solução para ordenar o caos informacional existente na web.

Segundo Berners-Lee et alii (2001), a web semântica será uma extensão da web atual porém apresentará estrutura que possibilitará a compreensão e o gerenciamento dos conteúdos armazenados na web independente da forma em que estes se apresentem, seja texto, som, imagem e gráficos à partir da valoração semântica desses conteúdos, e através de agentes que serão programas coletores de conteúdo advindos de fontes diversas capazes de processar as informações e permutar resultados com outros programas.

A web semântica, a exemplo da web atual, será tão descentralizada quanto possível e deverá manter a responsabilidade exigida por esta descentralização, procurando alcançar o ideal de consistência de interconexões, porém permitindo seu crescimento exponencial.

O fantasma de perda de informação ou mensagens do tipo “Error 404: Not Found” deverão inexistir, ou estar, sob controle, ainda segundo os autores.

Para a implementação ou reorganização da web semântica há um contigente de pesquisadores trabalhando no W3C- World Wide Web Consortium, hospedado no Massachusetts Institute of Tecnhology, Laboratory for Computer Science, nos Estados Unidos, no Institut National de Rechurche in Informatique et em Automatique, na França, e no Japão, a Keio University Shanam Fujisawa. O W3C é um fórum aberto de indústrias e organizações com a missão de alavancar a web ao seu potencial máximo (www.w3.org;www.w3.org./People ).

Basicamente, a web semântica se compõe de três elementos: (a) Representação do conhecimento (Knowledge representation); (b) Ontologias (Ontologies) e (c) Agentes (Agents).

(a) Representação do conhecimento

A web semântica trará estrutura ao conteúdo significativo (valoração semântica) de páginas web criando um ambiente onde programas-agentes ou agentes inteligentes buscando de uma página à outra poderá, imediatamente, executar tarefas sofisticadas para os usuários.

(b) Ontologias

Designa a faceta semântica da representação dos seres, dos entes, aquilo que se convenciona chamar de assuntos , conteúdos temáticos dos registros sobre a realidade.

A ontologia seria então, como uma especificação de uma conceituação. A Ontologia, na web semântica estabelece uma ligação terminológica entre membros de uma comunidade podendo ser estes membros, agentes humanos ou máquinas. No jargão dos pesquisadores em inteligência artificial, uma ontologia é um documento ou arquivo que define formalmente a relação entre termos.

Cabe neste contexto de formalidade relacional apresentar os metadados . Etmologicamente, metadado significa “dado sobre dado”; dado que descreve a essência, atributos e contexto de emergência de um recurso e caracteriza suas relações, visando o seu acesso e uso potencial (FERREIRA, 1986).

Segundo Ikematu (2001), definir metadados tem sido uma tarefa difícil pois as várias interpretações sobre o assunto estão relacionadas ao estágio da organização dentro da hierarquia evolucionária de gestão do conhecimento.

São apresentados alguns conceitos sobre metadados. Dados que descrevem atributos de um recurso, suportando um número de funções, como: localização, descoberta, documentação, avaliação e seleção. Ou ainda, “Metadado é dado associado com objetos que auxilia seus usuários potenciais a ter vantagem completa do conhecimento da sua existência ou características”.

O autor salienta ainda que se há necessidade de integração e de uniformidade de linguagem e significado dos dados através da organização, os metadados devem ser o núcleo dos esforços de forma centralizada. Para que isto ocorra, a instituição deve ter pleno conhecimento das vantagens da organização e da documentação dos dados. A informação baseada em metadados enriquece documentos com informações semânticas acrescentando explicitamente metadados aos recursos informacionais.

Existem várias linguagens de metadado que podem ser utilizadas para marcar ou anotar estes recursos informacionais, como o XML e RDF (STAAB et alli, 2000, p.148).

As linguagens de marcação (markup languages) evoluiram desde o SGML (Standard Generalized Markup Language), para o HTML (Hypertext Markup Language) em 1980 e XML (Extensible Markup Language) em 1996.

Ao contrário da HTML que através das marcas pré-definidas gerenciam os textos marcados e controlam sua representação estabelecendo ligações entre os documentos, a linguagem XML marca semânticamente um documento. XML consiste em padrão utilizado para marcação de documentos que contém informações estruturadas, ou seja, documentos que contém uma estrutura clara e precisa da informação armazenada e obtida com XML. Esta estruturação define e separa claramente conteúdo, significado e apresentação. Assim os documentos em XML podem ser indexados com maior precisão que as páginas planas escritas em HTML.

O padrão XML permite troca de informações entre diversas plataformas e possibilita a descrição de dados em arquivos texto. A linguagem XML torna-se poderosa ferramenta para a publicação de informações na web (OLIVEIRA, 2002).

O padrão XML pode ser utilizado de modo geral, no armazenamento de bases de dados e documentos estruturados e as aplicações de XML criam novos padrões e linguagens (www.xml.com.br).

A sintaxe de um documento XML é armazenada em tabelas DTD – Document Type Definition que determinam as regras, hierarquias e marcações criadas para caracterizar as informações do documento (BAX, 2001).

Enquanto a função principal do metadado é descrever um documento através de atributos conferidos a um objeto, retratando as suas características como dimensão, formato, autoria, localização e outros com o objetivo de intercambiar dados, o RDF – Resource Description Framework é um grafo para descrever e intercambiar metadado.

Segundo Tim Bray (www.xml.com/ltp/a/2001/01/24/rdf.htm) as regras para construção de RDF são: Fonte (Resource), qualquer coisa q possa ter uma identificação na rede – URI ue (Uniform Resource Identifier); ou um elemento individual de um documento XML;

Propriedade, é uma fonte que possui um nome e pode ser usado como uma propriedade e Afirmação (statement) que consiste na combinação de uma fonte, uma propriedade e um valor, partes estas conhecidas como “assunto”, “predicado” e “objeto” de uma Afirmação (statement). Para um objeto 0 existe um atributo A cujo valor é V, sendo que objetos e valores são intercâmbiados em RDF, onde um objeto pode ser um valor. Em grafos RDF pode-se identificar de que tipo é o objeto e estabelecer relações à sua definição (Decker et alii, 2000).

Várias implementações podem ser desenvolvidas utilizando RDF nível simples ou Schema

RDF e aplicações XML.

O modelo a ser adotado para a web semântica parte do modelo RDF geral. Este modelo básico contém apenas conceito sobre asserção (assertion) e de “quotation” – criando asserções sobre asserções, portanto necessita, segundo Berners-Lee (2001), em artigo “Semantic Web Road Map” implementações e aplicações como conversão de linguagem, leis da lógica, com o objetivo de imprimir lógica aos documentos; predicado lógico (not, and, or) e leis de quantificação (para todo x y (x)). Neste estágio, o autor ainda cita a introdução da linguagem de provas e de busca e índices de termos evoluindo para vocabulário .

A arquitetura da web semântica é processo em construção por grupos de trabalho da W3C (www.xml.com/pub/r/1246; www.w3.org) com o objetivo de mapear as complexas relações semânticas, lógicas, de sintaxe e de apresentação dos documentos no novo espaço.

(c) Agentes

A função dos programas agentes ou agentes inteligentes é coletar conteúdos na web a partir de fontes diversas, processar a informação e permutar os resultados com outros programas permitindo através de linguagem que expressa inferências lógicas resultantes do uso de regras e informação como aquelas especificadas pelas ontologias. O principio está, não no entendimento, pela máquina, daquilo que está escrito e sim no reconhecimento de provas escritas na linguagem estabelecida pela ontologia, onde os programas-agente, pela inferência lógica retornam respostas ao que foi requerido, ou agente e consumidor podem alcançar entendimento compartilhado permutando as ontologias, que oferecem o vocabulário necessário para a discussão.