Quais são os erros mais comuns que causam duplicação de conteúdo?

A duplicação de conteúdo é um problema que afeta a maioria dos sites (estamos falando de 60%).  É possível falar de duplicação, quando o conteúdo é indexável em várias URLs.

Por exemplo, a página inicial de um site é frequentemente acessível das duas maneiras :

domaine.com

domaine.com/index.php (ou /home...)

Todas as páginas de um site também são duplicadas regularmente por meio da ausência (ou adição) do subdomínio www.

www.domaine.com/page.html

http://domaine.com/page.html

A segurança dos sites (os «https») exigida pelo Google por um longo tempo pode também, entretanto, fortalecer a duplicata.

Ex: Eu tenho um site em https declarado em https://www. Se eu não configurar redirecionamentos para essa url principal, este também estará acessível em https (sem www) e/ou http (com ou sem www.). Portanto, em vez de oferecer aos mecanismos 1 site próprio e exclusivo, pode-se (entretanto) oferecer até 4 vezes o mesmo! Um belo (e frequente) tiro no pé.

O terceiro problema mais comum é a indexação do site por meio de todas as extensões (TLD) compradas:

www.domaine.fr

www.domaine.com

Mais uma vez, tem que redirecionar (em 301, chamado redireccionamento permanente) todos os nomes de domínios anexados para o seu NDD principal, para evitar duplicatas.

Ex: Eu escolhi um NDD .fr para ser visível principalmente em francês e, para proteger a minha marca, comprei o NDD em .com, .net (e/ou, por exemplo, minha marca-cidade ou pays.fr).

É essencial que eu redirecione todos os NDDs para o meu NDD principal em 301. Portanto, se seguiu corretamente, para o NDD canônico assim geralmente em https com ou sem www.

Outros problemas comuns estão relacionados à indexação pelo Google da versão de pré-produção/aceitação. (teste e validação antes de entrar on-line) ou ainda URLs contendo parâmetros de rastreamento.  Portanto, desconfie, é preciso privilegiar uma versão de pré-produção acessível apenas por login/senha e, portanto, invisível do Google. Um bom fornecedor de serviços pensará sobre isso, um mau não. 

Por último, os links internos que não são consistentes em todo o site constituem um outro erro grave e relativamente pernicioso. Portanto, não crie um link para criar um link passando pela cozinha tailandesa para bolas de boliche. É preciso direcionar o seu conteúdo. É preciso também evitar links quebrados (404) ou outros problemas desaprovados pelos mecanismos.

Assim, para acessar, por exemplo, à ficha do produto de um site de comércio eletrônico, podem ser oferecidos várias URLs (cuidado com alguns CMS): 

www.domaine.com/categorie/produit.html

www.domaine.com/produit.html

As agências Web raramente são conscientizadas ou mesmo sensíveis a esses problemas delicados e demorados. O referenciador raramente atrai os desenvolvedores («Ah você conhece-me, o desempenho» «Tenho mais com que me ocupar do que com o Google»).

Portanto, é conveniente estar muito atento, mesmo que, de acordo com o Google, a duplicação de conteúdo não seja um grande problema ... ou pelo menos não seja um problema de penalidade, ao contrário da legenda.

Oseox Monitoring