DUPLICAÇÃO DE CONTEÚDO

Conteúdo duplicado e referenciamento

A duplicação de conteúdo é um problema real para os mecanismos de pesquisa. Embora o Google tenha anunciado em julho de 2008 que possui 1.000 bilhões de URLs no seu índice, imagine esse número em 2020 ?

Portanto, o Google não indexa todas as URLs localizadas, simplesmente porque muito conteúdo não é interessante (página em branco) ou simplesmente duplicado !

Quando estiver trabalhando num volume tão grande de dados e tiver que oferecer resultados relevantes para o mundo inteiro em menos de meio segundo, entenderá que a poupança de energia  é mais do que necessária.

Como é que os mecanismos de pesquisa lidam com o conteúdo duplicado ?

O conteúdo duplicado desperdiça tempo, recursos, relevância e, portanto, em última análise, dinheiro para os mecanismos de pesquisa. Além disso, o tamanho da web continua a crescer e  cada vez mais rapidamente. Para sobreviver e não ficar sobrecarregado, os mecanismos de pesquisa  devem fazer escolhas e deixar de lado o conteúdo considerado duplicado.

Esse conteúdo duplicado pode sofrer vários tratamentos diferentes :

  • Ser desindexado
  • Ser rastreado com menos frequência
  • Ser desclassificado

Obviamente que esse tratamento difere de um mecanismo de pesquisa para outro e depende de vários fatores.

Dadas as consequências, pode-se imaginar que os mecanismos de pesquisa devem ter localizado o original da cópia antes de penalizar ? Na realidade, esse não é realmente o caso, uma vez que os seus algoritmos ainda hoje parecem incapazes de lidar perfeitamente com esse problema. Aqui estão alguns critérios que eles levam em consideração (ou devem levar em consideração) :

  • Semelhança de conteúdo com outra URL
  • Popularidade da página
  • Autoridade do Site
  • Presença de um link para a fonte
  • Data da publicação
  • Data da primeira indexação

Penalização geral por duplicar o conteúdo

Além das penalizações pelas quais uma URL pode sofrer, se um site receber uma taxa muito alta de conteúdo duplicado, todo o domínio pode ser penalizado.

Os diferentes tipos de duplicação de conteúdo

Dois casos de duplicação de conteúdo podem ser diferenciados :

  • Duplicação automática de conteúdo : Quando um site duplica as suas páginas no seu próprio domínio
  • Duplicação de conteúdo externo : quando o seu conteúdo está presente num outro site

Como evitar a duplicação de conteúdo no seu site

Antes de entrar em guerra contra o conteúdo duplicado por um webmaster sem escrúpulos, é aconselhável garantir que o seu site não ofereça conteúdo idêntico em URLs diferentes. Aqui estão os casos mais comuns :

  • Conteúdo acessível com e sem www
  • Links internos diferentes para o mesmo conteúdo
  • Páginas muito pobres em conteúdo : Por exemplo, uma única linha de conteúdo original
  • Links de entrada que contêm parâmetros (de rastreamento, por exemplo)
  • Criação de sessões pelos robots

A regra de ouro a respeitar é que um documento deve ser exibido numa e apenas numa URL. No entanto, isso nem sempre é possível. Nesse caso, devem ser criados mecanismos para que os robots possam indexar apenas uma URL.

Aqui estão várias opções :

  • Uso do arquivo robots.txt
  • Instalação de um meta robô noindex
  • Implantação de redirecionamento 301
  • Remoção de URL pelo Google Search Console
  • Meta tag canônica

Vá à procura de conteúdo duplicado ou roubado

O uso do seu conteúdo noutros sites pode afetar negativamente a sua visibilidade nos mecanismos de pesquisa. Os webmasters que fazem isso às vezes estão de boa fé e não imaginam os problemas que podem criar. Para outros, o roubo de conteúdo é um negócio real. Hoje, é possível usar a palavra agregador para esconder os seus erros ...

O número de inserções do Adsense costuma ser uma forma de diferenciar o homem honesto do saqueador vil.

O uso generalizado do formato RSS é para alguns como uma autorização para roubar conteúdo.

O Google é uma ótima ferramenta para detetar plágio ou qualquer outro uso do seu conteúdo sem permissão. Digite entre aspas uma frase tirada do coração do seu artigo e visualize os resultados.

O site copyscape.com também é uma ótima maneira de garantir a originalidade de um texto.

O discurso do Google sobre duplicação de conteúdo

Em primeiro lugar, é preciso saber que o Google não está a falar  realmente de penalidade pela duplicação de conteúdo, mas sim por filtros. Pessoalmente, admito que não vejo realmente nenhuma diferença... Ele também anuncia que possui algoritmos eficientes, capazes de localizar o conteúdo original, principalmente se a cópia conter um link para a fonte. O seu índice prova que tudo isso ainda está longe de ser perfeito.

Além disso, a noção de índice complementar desapareceu das páginas de resultados.

O Google também recomenda para não se preocupar muito com o conteúdo duplicado. Está nas suas mãos...

 

Próximo : Tecnica de referenciamento

Anterior : Imagem

Oseox Monitoring