Quais são os erros mais comuns que causam duplicação de conteúdo?
A duplicação de conteúdo é um problema que afeta a maioria dos sites (estamos falando de 60%). É possível falar de duplicação, quando o conteúdo é indexável em várias URLs.
Por exemplo, a página inicial de um site é frequentemente acessível das duas maneiras :
domaine.com
domaine.com/index.php (ou /home...)
Todas as páginas de um site também são duplicadas regularmente por meio da ausência (ou adição) do subdomínio www.
www.domaine.com/page.html
http://domaine.com/page.html
A segurança dos sites (os «https») exigida pelo Google por um longo tempo pode também, entretanto, fortalecer a duplicata.
Ex: Eu tenho um site em https declarado em https://www. Se eu não configurar redirecionamentos para essa url principal, este também estará acessível em https (sem www) e/ou http (com ou sem www.). Portanto, em vez de oferecer aos mecanismos 1 site próprio e exclusivo, pode-se (entretanto) oferecer até 4 vezes o mesmo! Um belo (e frequente) tiro no pé.
O terceiro problema mais comum é a indexação do site por meio de todas as extensões (TLD) compradas:
www.domaine.fr
www.domaine.com
Mais uma vez, tem que redirecionar (em 301, chamado redireccionamento permanente) todos os nomes de domínios anexados para o seu NDD principal, para evitar duplicatas.
Ex: Eu escolhi um NDD .fr para ser visível principalmente em francês e, para proteger a minha marca, comprei o NDD em .com, .net (e/ou, por exemplo, minha marca-cidade ou pays.fr).
É essencial que eu redirecione todos os NDDs para o meu NDD principal em 301. Portanto, se seguiu corretamente, para o NDD canônico assim geralmente em https com ou sem www.
Outros problemas comuns estão relacionados à indexação pelo Google da versão de pré-produção/aceitação. (teste e validação antes de entrar on-line) ou ainda URLs contendo parâmetros de rastreamento. Portanto, desconfie, é preciso privilegiar uma versão de pré-produção acessível apenas por login/senha e, portanto, invisível do Google. Um bom fornecedor de serviços pensará sobre isso, um mau não.
Por último, os links internos que não são consistentes em todo o site constituem um outro erro grave e relativamente pernicioso. Portanto, não crie um link para criar um link passando pela cozinha tailandesa para bolas de boliche. É preciso direcionar o seu conteúdo. É preciso também evitar links quebrados (404) ou outros problemas desaprovados pelos mecanismos.
Assim, para acessar, por exemplo, à ficha do produto de um site de comércio eletrônico, podem ser oferecidos várias URLs (cuidado com alguns CMS):
www.domaine.com/categorie/produit.html
www.domaine.com/produit.html
As agências Web raramente são conscientizadas ou mesmo sensíveis a esses problemas delicados e demorados. O referenciador raramente atrai os desenvolvedores («Ah você conhece-me, o desempenho» «Tenho mais com que me ocupar do que com o Google»).
Portanto, é conveniente estar muito atento, mesmo que, de acordo com o Google, a duplicação de conteúdo não seja um grande problema ... ou pelo menos não seja um problema de penalidade, ao contrário da legenda.