Le duplicate content ou contenu similaire
Se dit lorsque deux pages d'un site web rigoureusement identiques sont indexées dans un moteur de recherche. Volontaire ou non, cette opération peut résulter en une suppression pure et simple de l'index d'une des deux, voire des deux pages indexées.
L'origine la plus répandue de cette anomalie est sans doute l'indexation multiple d'un même nom de domaine dont les sous domaines seraient mal configurés.
Par exemple :
http://monsite.com/
http://www.monsite.com/
On peut parler ici de Duplicate Content. Car les mêmes pages seront présentes sous http://monsite.com/ et aussi sous http://www.monsite.com/. Le "www" étant considéré comme un sous-domaine donc un site différent.
Pour corriger, il suffit d'ajouter ce fichier .htaccess à la racine du site :
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.monsite\.com [NC]
RewriteRule (.*) http://www.monsite.com/$1 [QSA,R=301,L]
A retenir aussi que si vous avez plusieurs sites internet qui parlent du même sujet, écrivez des textes différents pour chaque site. Ne reprenez pas à l'identique un texte du site A pour le mettre sur le site B.
Contenu dupliqué et plagiat
L'autre source de contenu dupliqué est sans contexte le plagiat. Cela est un véritable fléau. En effet, des webmasters peu scrupuleux copient sans autorisation aucune des textes se trouvant sur d'autres sites internet.
Il existe un outil bien pratique pour déterminer quels sont les sites qui ont copié notre contenu :
Il suffit d'entrer l'url d'une page de votre site et l'outil vous affiche toutes les sites qui ont repris votre contenu. Les résultats sont parfois édifiants et surtout décourageants !
Contenu dupliqué et URL canonique
Une balise de ce type (<link rel=”canonical” href=”#”>) a été mise à disposition dernièrement pour lutter contre le contenu dupliqué. Prise en compte par Google entre autres, cette dernière permet de spécifier les URLs canoniques des pages d'un site internet. Le principe est simple. Il suffit d’indiquer pour chaque page d'un site quelle est l’URL canonique, c’est-à-dire l’URL officielle de la page.
A lire : http://www.skyminds.net/2009/02/18/eviter-le-contenu-duplique-en-specifiant-lurl-canonique/
===============================================================
NOTA : A savoir que Google a démystifié les pénalités dues au contenu dupliqué en Février 2009 Infox ou intox ? Plus d'infos ici.
:: Menu ::
- Accueil
- Référencement site
- Nom de domaine
- Hébergement site
- Définition mots clefs
- Optimisation metas
- Optimisation site
- Optimisation url
- Optimisation alt
- Optimisation image
- Optimisation contenu
- Liens entrants
- Campagne Netlinking
- Contenu dupliqué
- Page Rank Google
- Outils référencement
- Faire site AdSense
- Ouvrir un Blog
