DUPLICAÇÃO DE CONTEÚDO
Conteúdo duplicado e referenciamento
A duplicação de conteúdo é um problema real para os mecanismos de pesquisa. Embora o Google tenha anunciado em julho de 2008 que possui 1.000 bilhões de URLs no seu índice, imagine esse número em 2020 ?
Portanto, o Google não indexa todas as URLs localizadas, simplesmente porque muito conteúdo não é interessante (página em branco) ou simplesmente duplicado !
Quando estiver trabalhando num volume tão grande de dados e tiver que oferecer resultados relevantes para o mundo inteiro em menos de meio segundo, entenderá que a poupança de energia é mais do que necessária.
Como é que os mecanismos de pesquisa lidam com o conteúdo duplicado ?
O conteúdo duplicado desperdiça tempo, recursos, relevância e, portanto, em última análise, dinheiro para os mecanismos de pesquisa. Além disso, o tamanho da web continua a crescer e cada vez mais rapidamente. Para sobreviver e não ficar sobrecarregado, os mecanismos de pesquisa devem fazer escolhas e deixar de lado o conteúdo considerado duplicado.
Esse conteúdo duplicado pode sofrer vários tratamentos diferentes :
- Ser desindexado
- Ser rastreado com menos frequência
- Ser desclassificado
Obviamente que esse tratamento difere de um mecanismo de pesquisa para outro e depende de vários fatores.
Dadas as consequências, pode-se imaginar que os mecanismos de pesquisa devem ter localizado o original da cópia antes de penalizar ? Na realidade, esse não é realmente o caso, uma vez que os seus algoritmos ainda hoje parecem incapazes de lidar perfeitamente com esse problema. Aqui estão alguns critérios que eles levam em consideração (ou devem levar em consideração) :
- Semelhança de conteúdo com outra URL
- Popularidade da página
- Autoridade do Site
- Presença de um link para a fonte
- Data da publicação
- Data da primeira indexação
Penalização geral por duplicar o conteúdo
Além das penalizações pelas quais uma URL pode sofrer, se um site receber uma taxa muito alta de conteúdo duplicado, todo o domínio pode ser penalizado.
Os diferentes tipos de duplicação de conteúdo
Dois casos de duplicação de conteúdo podem ser diferenciados :
- Duplicação automática de conteúdo : Quando um site duplica as suas páginas no seu próprio domínio
- Duplicação de conteúdo externo : quando o seu conteúdo está presente num outro site
Como evitar a duplicação de conteúdo no seu site
Antes de entrar em guerra contra o conteúdo duplicado por um webmaster sem escrúpulos, é aconselhável garantir que o seu site não ofereça conteúdo idêntico em URLs diferentes. Aqui estão os casos mais comuns :
- Conteúdo acessível com e sem www
- Links internos diferentes para o mesmo conteúdo
- Páginas muito pobres em conteúdo : Por exemplo, uma única linha de conteúdo original
- Links de entrada que contêm parâmetros (de rastreamento, por exemplo)
- Criação de sessões pelos robots
A regra de ouro a respeitar é que um documento deve ser exibido numa e apenas numa URL. No entanto, isso nem sempre é possível. Nesse caso, devem ser criados mecanismos para que os robots possam indexar apenas uma URL.
Aqui estão várias opções :
- Uso do arquivo robots.txt
- Instalação de um meta robô noindex
- Implantação de redirecionamento 301
- Remoção de URL pelo Google Search Console
- Meta tag canônica
Vá à procura de conteúdo duplicado ou roubado
O uso do seu conteúdo noutros sites pode afetar negativamente a sua visibilidade nos mecanismos de pesquisa. Os webmasters que fazem isso às vezes estão de boa fé e não imaginam os problemas que podem criar. Para outros, o roubo de conteúdo é um negócio real. Hoje, é possível usar a palavra agregador para esconder os seus erros ...
O número de inserções do Adsense costuma ser uma forma de diferenciar o homem honesto do saqueador vil.
O uso generalizado do formato RSS é para alguns como uma autorização para roubar conteúdo.
O Google é uma ótima ferramenta para detetar plágio ou qualquer outro uso do seu conteúdo sem permissão. Digite entre aspas uma frase tirada do coração do seu artigo e visualize os resultados.
O site copyscape.com também é uma ótima maneira de garantir a originalidade de um texto.
O discurso do Google sobre duplicação de conteúdo
Em primeiro lugar, é preciso saber que o Google não está a falar realmente de penalidade pela duplicação de conteúdo, mas sim por filtros. Pessoalmente, admito que não vejo realmente nenhuma diferença... Ele também anuncia que possui algoritmos eficientes, capazes de localizar o conteúdo original, principalmente se a cópia conter um link para a fonte. O seu índice prova que tudo isso ainda está longe de ser perfeito.
Além disso, a noção de índice complementar desapareceu das páginas de resultados.
O Google também recomenda para não se preocupar muito com o conteúdo duplicado. Está nas suas mãos...
Próximo : Tecnica de referenciamento
Anterior : Imagem