web do futuro

20
WEB SEMÂNTICA A Internet do Futuro Por Armando Levy

Upload: e-press

Post on 08-Jul-2015

1.859 views

Category:

Education


2 download

DESCRIPTION

A busca do sentido nos textos publicados na Internet está levando ao avançfo gradativo do XML como linguagem padrão

TRANSCRIPT

Page 1: Web do Futuro

WEB SEMÂNTICA

A Internet do Futuro

Por Armando Levy

Page 2: Web do Futuro

Qual o sentido da WEB?• Pesquise no Google:

• “Minas”

• Você recebe respostas tão variadas quanto a bandeira de Minas Gerais, o queijo minas e minas de ouro e diamantes

• Mas você quer saber sobre MINAS EXPLOSIVAS

Page 3: Web do Futuro

Por que?• Sistema não distingue o Estado,

o tipo de queijo e a mineração da arma

• Técnica mais usada é combinar palavras, de modo a aprimorar o resultado da pesquisa• Busca Avançada

• Mas resultado é sempre desolador

• São dezenas (às vezes centenas) de páginas que não interessam, tornando difícil separar o joio do trigo

• Por que isso ocorre?

Page 4: Web do Futuro

HTML é limitado• Crescimento exponencial da

WEB tornou difícil indexar as informações

• A linguagem HTML, que popularizou a WEB e é utilizada pela maioria dos sites, não possui recursos que permitam atribuir significado à informação

• As tags HTML são muito limitadas nesse sentido. Elas apenas descrevem como a página deve ser exibida e não oferecem nenhuma descrição dos dados

Minas, Estado

Minas, Ouro

Minas, Queijo

Minas, Explosivas

Page 5: Web do Futuro

Como mudar?• Para melhorar a indexação são

necessárias categorias mais apuradas que permitam triar com eficiência no oceano de dados disponíveis

• Categorias já existem• Para o usuário que visita as páginas da

Estado de Minas, do Queijo Minas, das Minas de Ouro a diferença é evidente

• O problema é que essas diferenças só são entendidas por nós: humanos

• Aspiração da Inteligência Artificial é fazer com que a máquina reproduza os mecanismos da inteligência humana

• Mas ainda estamos muito longe disso

Minas, Estado

Minas, Ouro

Minas, Queijo

Minas, Explosivas

Page 6: Web do Futuro

WEB Semântica• A WEB Semântica é uma

tentativa inversa de solução

• Ao invés de pensar na informação para os humanos, a idéia é pensar na máquina

• "Machine-understandable Information", esta é a definição da WEB Semântica, segundo o "pai da WEB", Tim Berners-Lee, um dos comandantes desse projeto

Page 7: Web do Futuro

W3C• A criação da WEB Semântica

é capitaneada pelo consórcio W3C

• O W3C é um sucessor do projeto Metadados, cujos princípios são os mesmos: incluir "informação sobre a informação" na WEB

• O projeto Metadados tentava fazer isso via linguagem HTML, o que se revelou impossível porque o HTML não permite criar categorias semânticas.

Page 8: Web do Futuro

Linguagem XML• Componente central da WEB

Semântica é a linguagem XML (Extended Markup Language), que permite descrever semanticamente os dados a partir de categorias que o próprio usuário pode definir

• Elemento XML pode ter dados declarados como preço de venda, título de livro, quantidade de chuva ou qualquer outro

• Uma vez que o dado é encontrado, ele pode ser distribuído pela rede e apresentado em um browser de várias formas possíveis

Page 9: Web do Futuro

Por que XML?• É uma linguagem extremamente flexível• Mas criação de muitas categorias diferentes também

não é interessante• É preciso definir categoria em conjunto• Um exemplo é o da Unicamp e CNPq, que

estabeleceram um protocolo comum (criado por uma equipe da Universidade Federal de Santa Catarina) para poder trocar dados relativos aos currículos de seus pesquisadores

Page 10: Web do Futuro

Como criar XML?• Para criar aplicações XML são

necessários quatro passos:• DTD (Document Type Definition)• Definir conjunto de tags e a

gramática da linguagem de marcação

• Não sobrepor tags e não omitir tags de finalização

• Usar os padrões DOM (Document Object Model) e SAX (Simple API for XML) para interpretá-las

• Transformar o arquivo para folhas de estilo (CSS) porque nem todo navegador lê XML

Page 11: Web do Futuro

Categorias• Processo ainda é complexo• Há a necessidade de acordo

sobre que categorias a utilizar, como os dados devem ser relacionados, como os usuários irão interagir com eles

• Sem isso não há como montar "banco de dados"

• Este é, aliás, um dos maiores desafios do futuro da WEB

• No comércio eletrônico as empresas devem chegar a um acordo, pois têm muito interesse nessa tecnologia

Page 12: Web do Futuro

Outros componentes• Outros componentes da WEB

Semântica são:• Universal Resource Identifier

• Como a URL especifica uma identidade • Resource Description Framework

• Uma linguagem e uma gramática para definir informação na WEB

• Ontologias• Conjuntos de asserções que definem as

relações entre conceitos e estabelecem regras lógicas de raciocínio

• Agentes• Softwares que funcionam sem

necessidade de controle direto ou supervisão

AgentesProgramas robôs

que executam tarefas específicas

na WEB

Page 13: Web do Futuro

Premissa• A WEB Semântica reside na

esperança de que as pessoas comecem a publicar seus dados em RDF (Resource Description Framework)

• RDF é simplesmente um modelo de dados que permite às pessoas criarem dados legíveis pela máquina

• A WEB Semântica será construída baseada nestes dados

• Quando se publica algo em RDF não se está criando necessariamente uma parte da WEB Semântica, apenas se está colocando os dados à disposição dos processadores semânticos da WEB

Page 14: Web do Futuro

Metas• As metas da WEB Semântica são

mais ambiciosas do que simplesmente permitir indexar melhor a informação da WEB

• Interessam as aplicações que se tornam possíveis com a utilização de categorias semânticas para descrever os dados

• Você pode criar um agente (programa robô), especificando que tipo de emprego gostaria de ter, qual a remuneração de seu interesse, local de trabalho ideal, benefícios de seu interesse, entre outras informações, fazendo com que ele circule pela Internet

Page 15: Web do Futuro

Sites e blogs• Sites não comerciais

também se beneficiam da utilização do XML e do desenvolvimento da WEB Semântica

• Seus conteúdos indexados podem ser mais facilmente localizados pelos sites de busca como Google

• Este fenômeno explica o boom dos Blogs Corporativos

Page 16: Web do Futuro

A WEB atual

FONTE: Eric Miller – W3C

Page 17: Web do Futuro

A WEB Semântica

FONTE: Eric Miller – W3C

Page 18: Web do Futuro

Onde a roda pega?• É necessária uma nova política de

propriedade intelectual• Os avanços da tecnologia de

informação e redes digitais possibilitam que cada um de nós se torne em um editor

• Roubo de propriedade intelectual é difícil de vigiar em uma rede distribuída

• Os proprietários de diretos autorais (textos, músicas, filmes) perseguem e combatem ferozmente as tecnologias que possibilitam acesso dinâmico a conteúdos protegidos por leis autorais

• O avanço da WEB Semântica vai exigir repensar os direitos autorais

Page 19: Web do Futuro

Como ser feliz?• O segredo da WEB Semântica

está no conteúdo• Definição de categorias é

fundamental• Publicar documentos sem

categorias ou tags será o mesmo que jogar uma pedra no rio

• Surge uma nova profissão?• O categorizador de web?

O produtor de conteúdo na web escreve, filma,

grava, edita e define categorias

Tem sentido falar ainda em “jornalista”?

Page 20: Web do Futuro

Obrigado!

• Armando Levy• Formação em Comunicação Social pela FAAP• Pós-Graduação em Gestão de Comunicação pela USP• Especialização em Gestão de Informática pela FGV• MBA em E-Business pela FGV• Mestre em Teoria e Pesquisa em Comunicação pela ECA-USP• Gerente de Comunicação e Internet da Credicard, Vésper e

Banco1.Net• Diretor da e-Press Comunicações• Consultor do Núcleo de Formação Profissional da Câmara Brasil

Alemanha• [email protected]• (11) 4082 4600