Hi all,
Comme nous le savons tous, le contenu dupliqué ou le duplicate content nuit beaucoup au référencement d’un site et a une mauvaise influence sur la popularité d’une page.
Personnellement, j’ai eu le problème avec un site que j’ai codé à la main parlant de la ville de Tataouine qui est un site dynamique avec une gestion des utilisateurs. Quelques jours après l’indexation du site par google, je constate dans google webmaster tools que tous les pages dynamiques ont été indexé deux fois: une fois avec le lien normal et une autre dont le lien comporte le paramètre PHPSESSID et tous ces pages ont été considéré comme contenu dupliqué.
En fait l’impact du duplicate content sur le référencement s’explique en deux axes:
1- La présence de contenu dupliqué dilue la popularité de vos pages et donc au lieu d’avoir une page populaire, vous aurez deux pages beaucoup moins populaires.
2- Le détection d’un contenu dupliqué (duplicate content) par les bot comme googlebot fait ralentir l’indexation des pages et en même temps diminue vos chances que le site soit crawlé fréquemment.
Je ferme la parenthèse et je reviens au sujet du billet, pour éviter le duplicate content à cause du paramètre PHPSESSID, plusieurs solutions se posent: Soit en ajoutant des paramètres dans un fichier .htaccess (le fichier htaccess permet aussi de bloquer le hotlinking et sauvagder sa bande passante et aussi à mieux protéger son site web) qui permettent de stocker les sessions dans des cookies, soit d’ajouter quelques lignes dans le code php juste avant session_start() mais aucune de ces solutions ne m’a été utiles soit à cause de l’incompatibilité avec l’hébergeur soit pour d’autres raison.
La bonne solution dont je n’avais pas fait attention était déjà présente dans Google Webmaster Tools: il suffit de demander à google de ne pas tenir compte de ce paramètre!!
Il faut tout simplement aller dans google webmaster tools, choisir le site en question ensuite aller dans Configuration du site >> Paramètres >> Adapter la configuration des paramètres
Déjà quand vous cliquez sur « Ajouter un paramètre » Google va vous proposer des paramètres présents dans votre site sinon vous choisissez le paramètre a ignorer (PHPSESSID dans notre cas), vous choisissez « Ignorer » ensuite vous enregistrez.
Catégorie: Referencement, seo
Tags: contenu dupliqué, duplicate content, phpsessid, Referencement, seo.
8 commentaires
[…] This post was mentioned on Twitter by Bruno Bichet and oussama MKAD M I N I, oussama MKAD M I N I. oussama MKAD M I N I said: http://blog.galerie-cesar.com/eviter-le-duplicate-content-cause-par-phpsessid/ […]
Merci pour le post, aprés avoir tout tenté, cela me semble la solution la moins problématique 😉
On peut considérer le duplicate content comme de la tricherie, ce n’est plus une action naturel mais du copié collé tous simplement.
Tu veux tricher à Google? ben il te punis 😉
Egalement sur nos tendres annuaires il ne faut pas tricher………..
Bonjour,
Le problème de la solution proposée par google webmaster tools est loin d’être la meilleur.
1) Google ne prend pas forcément en compte cette demande ! Etonnant, mais faite l’essai…
2) Ca ne règle pas le problème avec les autres moteurs de recherche.
La solution du htaccess est à mon avis de loin la meilleur.
Salut
C’est quoi les deux autres méthodes excactement car j’ai le même probleme avec un script que j’utilise souvent pour mes webs
merci
Google Webmaster tools n’est pas la bonne solution. Passer par le .htaccess me semble être la meilleure solution. Google fait ce qu’il veut de ces paramètres. Le mieux serait de lui interdire l’accès à ces URLs
ben c est tres simple faut juste eviter le duplicate content c est tout
Intéressant. Je ne savais pas que PHPSESSID pouvait entrainer un risque de duplicate content. J’avais déjà eu un ennui dans des identifiants PHPSESSID qui apparaissaient dans l’url d’un de mes blogs. J’avais été obligé de toucher au .htaccess pour parvenir à faire disparaître le PHPSESSID de mes urls.