Exploração da semântica intrínseca dos dados

Pierre Lévy, em seu A Esfera Semântica, propõem um trabalho que combina ciências humanas com informática e ciências cognitivas, começando o trabalho teórico e conceitual da construção colaborativa de um “Hipercórtex global coordenada por uma metalinguagem computacional”.

A Web tem um problema sério a ser resolvido: a quantidade absurda de documentos não estruturados que não permitem que computadores entendam o que eles significam.

Guardem essa palavra: significado.

O significado dos seus dados

Um campo do conhecimento que é pouco explorado, apesar da sua importância, é o que cuida da utilização da semântica incluída nos documentos em si. O potencial intrínseco no textos, criado pelo uso da linguagem natural, conectado com o potencial de tecnologias como a Inteligência Artificial, Tesauros, ontologias e marcação de dados, promete revolucionar o jeito que fazemos indexação, organização e recuperação da informação.

Os sistemas de recuperação de informação tradicionais têm sido suplantadas pela crescente exploração das técnicas de recuperação semântica (PINHEIRO DE MELO GOMES; MARTINS DE ARAÚJO ALTOUNIAN, 2016).

(…) possibilitam a compreensão dos conceitos em seu contexto e finalidade. Algumas tecnologias têm contribuído para essa realidade, como a marcação semântica dos dados, utilizada na web semântica, o processamento de linguagem natural e as redes neurais. O tesauro também apresenta-se como um componente semântico que impacta no desempenho dos SRI. Tesauros são ferramentas da linguagem artificial em um domínio específico, formados por um sistema de conceitos relacionados entre si.1

A recuperação semântica da informação no contexto do controle externo.

Sistemas de recuperação da informação

SRI ou sistemas de recuperação de informação geralmente usam palavras isoladas como descritores e unidades de recuperação.

Embora funcionem bem para fins de recuperação de informação, o principal motivo de falha é que eles não consideram o contexto de informação implícito em toda a consulta. Isso acontece porque eles não são preparados para lidar com a forma como essas palavras ou conceitos estão relacionados.

Os relacionamentos entre termos são, na prática, os elementos usados para determinar os assuntos pesquisados, em seus detalhes mais específicos.

Pesquisas acerca da informação e dados

As pesquisas feitas nesta nessa área vão do uso de estruturas profundas da linguagem natural, como os sintagmas verbais e nominais, usados na indexação e recuperação da informação, como no trabalho de Kuramoto, Moreiro e Souza (KURAMOTO, 1996 e 1999; MOREIRO et al, 2003; SOUZA, 2005); chegando ao uso de ferramentas que criam representações dos relacionamentos semânticos e conceituais, como os tesauros e ontologias, usados durante muito tempo para ampliar a gama de informações recuperadas e aferição de contextos.

A Biblioteconomia e as Ciências da Informação usam metodologias e técnicas como as descritas acima e tem um papel fundamental na definição teórica e metodologia para esse campo.

E o SEO com isso?

Quantas vezes você, amigo analista SEO, trabalhou em um projeto que toda a informação está corretamente marcada, estruturada, relacionada?

Quantas vezes o projeto que foi chamado para otimizar tinha uma ontologia, taxonomia ou um tesauros definido?

Se você respondeu algo além de zero, é um sortudo.

Na maioria esmagadora das vezes trabalhamos em projetos onde o conteúdo está definidos em páginas, planilhas, arquivos (como pdf) e banco de dados, sem estruturação, relacionamento e descrição. Sem semântica nenhuma, portanto.

Lembra que lhe pedi para guardar essa palavra: Semântica? Então, é para isso. É para saber que a Web precisa de um trabalho de indexação, organização e recuperação da informação usando as técnicas de recuperação semântica.

Trabalhos como o de Pierre Levy, dos sistemas de criação de ontologias com ferramentas automatizadas precisam estar no nosso radar. São elas que vão nos permitir transformar o volume de dados desestruturados em informação semanticamente relevante.


1- PINHEIRO DE MELO GOMES, B; MARTINS DE ARAÚJO ALTOUNIAN, M. A recuperação semântica da informação no contexto do controle externo. Revista do TCU, Setembro/Dezembro – 2016. Disponível em: https://revista.tcu.gov.br/ojs/index.php/RTCU/article/view/1376/1522. Acesso em: 3 abr. 2021.

SEO Semântico: A pesquisa Semântica

Gerencie o SEO com a pesquisa semântica em mente. Desde que o Google lançou o RankBrain em 26 de Outubro de 2015, a forma como otimizamos o conteúdo dos...

Checklist de SEO para wordpress em 2021

Numa manhã um amigo me pergunta no WhatsApp: “Tu tem algum checklist de SEO para wordpress pra me indicar?”. Eu resolvi escrever o meu.

A Web Semântica e o SEO – Ao Vivo

Venha conversar comigo sobre SEO e Web Semântica!

Google Core Updates

O Google acabou de confirmar que lançou um update amplo hoje: Uma nova atualização ampla do núcleo começará a ser lançada na quarta-feira – esta chamada de Atualização do núcleo de junho de 2021, anunciou o contato de pesquisa do Google Danny Sullivan, acrescentando que também devemos esperar uma atualização principal de julho de 2021 no mês que vem. Aqui a minha formação (em andamento) de Bibliotecário fala mais forte: para um conteúdo ser publicado é preciso cumprir certos critérios como experiência, autoridade no assunto, confiabilidade de fontes e informações, originalidade.

Como trabalhar com o SEO?

Antes de responder como trabalhar com o SEO, quero que separe um tempo para assistir esse filme. Você não precisa fazer nenhuma faculdade para começar a trabalhar com SEO mas precisa desenvolver algumas habilidades importantes, como redação para Web, conhecimento técnico de desenvolvimento de sites (mas não precisa necessariamente ser um desenvolvedor), conhecer a fundo o funcionamento dos buscadores e algoritmos, análise de dados entre outras habilidades.

A Solução para as Fake News

Esse post foi originalmente escrito no meu linkedin e está sendo repostado aqui no blog. Se fizermos um esforço conjunto de todos que criam para a Web (redatores, programadores, pesquisadores e etc) podemos finalmente construir o sonho do Tim quando escreveu o Linked Data: A Web Semântica não é apenas sobre colocar dados na web.

O que é SEO em marketing digital?

Essa é uma das perguntas que me fazem um dia desses: O que é SEO em marketing digital? Isso acontece através do envio de uma série de mensagens (que podem ser feitas por e-mail, mensagens por celular ou aplicativos e redes sociais), no intuito de informar seu lead.

As 5 Leis do SEO

As 5 leis da Biblioteconomia, criadas por Ranganathan, definem as regras por qual todo ambiente informacional deve se relacionar com seus visitantes e suas necessidades de informação. Elas foram adaptadas ao SEO.

O que é e como funciona o SEO?

Este post inaugura uma série de posts que venho comecei a planejar tem pouco tempo e resolvi colocar logo em prática. Você está em um site de um consultor SEO, que defende e adora trabalhar com otimização, mas a resposta para essa pergunta é só uma: Experiência do Usuário.

Otimização de Sites: as 3 novas diretrizes técnicas

É hora de falar sobre algo que assusta muitos profissionais de SEO e donos de sites: os aspectos técnicos para a otimização de sites. A interatividade do usuário com o seu site O atraso na primeira entrada ou First Input Delay (FID) é uma métrica técnica muito importante, sendo usada para medir a capacidade de resposta da carga na página, pois quantifica a experiência que os usuários tem ao tentar interagir com páginas que não respondem.