Le changement de serveur est un des aléas de l’administration d’un site web. D’ailleurs, durant le processus, il est d’usage de vérifier le contenu dupliqué. Cela consiste à utiliser des outils de vérification de contenu ou outils de vérification de plagiat afin de localiser les pages de contenu dupliqué. C’est alors que faire l’audit de contenu intervient. Il permet d’éviter des problèmes de référencement ainsi que des soucis qui relèvent du juridique. Sa réalisation se traduit généralement par le contrôle chronique du contenu du site, l’installation de balises, la consultation des rapports d’erreur de Google Search Console…
Les sources du contenu dupliqué
Habituellement, la duplication de contenu provient du processus de migration d’un site web. Il consiste à changer d’hébergeur. Ainsi, toutes les données sont transférées vers un autre serveur en ligne. Les raisons qui amènent les administrateurs d’un site internet à migrer ses données peuvent être nombreuses. À l’instar de cela il y a l’envie de changer le nom de domaine. Par ajout, la mise à jour de la version du Contenu du système de gestion en est également une cause courante.
Ce changement est pourtant un projet à risques. Si les étapes nécessaires à sa concrétisation ne sont pas respectées, la bonne place à la sortie des résultats après une recherche via les moteurs comme Google sera complètement perdue. Bien évidemment, dès que l’on modifie des pages qui sont déjà indexées, son référencement se voit inévitablement altéré. Là où le bât blesse c’est de savoir comment limiter ces dégâts.
Enfin, l’une des raisons de la duplique d’un contenu c’est l’être humain. Assurément, le contenu web est rédigé en majeure partie par des personnes opérant dans plusieurs domaines. Usuellement, leur rédaction doit tendre à assurer le référencement naturel des pages auxquelles ils proposent leurs services. En effet, dans ce secteur d’activité, le SEO ou référencement naturel est très important, car c’est ce qui aide les sites à mieux se positionner. Cependant, à défaut d’inspiration, il arrive que ces opérateurs fassent des copies collées du travail des autres.
Les différentes sortes de contenu dupliqué
Généralement, il faudrait remarquer qu’il existe deux types de contenus dupliqués.
La première c’est le contenu dupliqué en externe. Il survient dès lors qu’un texte identique est localisé de façon partielle ou intégrale sur divers sites. Pour les repérer, l’emploi des outils de vérification de contenu serait l’idéal. On entend par là, un vérificateur de plagiat ou un duplicate checker. Même une simple recherche sur Google peut suffire.
Par la suite, le contenu dupliqué en interne est quand des phrases identiques sont repérées maintes fois dans un même site web. Couramment, cette duplique interne est due à l’existence de plusieurs urls pour une même page. Cela dit, il peut également être issu de la polyvalence catégorique d’un même produit. L’un des meilleurs outils de vérification de ce type d’erreur est Xenu.
Enfin, c’est en sachant faire la distinction entre ces deux types de plagiat en ligne que l’on peut faire une détection de contenu dupliqué pertinente. Néanmoins, que cela soit l’un ou l’autre, le résultat reste le même.
Les précautions à prendre pour éviter le contenu dupliqué
Lors de la migration d’un site, le contenu dupliqué figure parmi les erreurs à ne pas commettre. Pour le déjouer, il faudrait s’assurer que chaque page soit redirigée vers les bonnes adresses urls. De ce fait, la redirection doit toucher les adresses IP.
L’ajout des balises canoniques en est le meilleur moyen. Ce sont des outils assurant l’indexation des pages web donc plus précisément la redirection.
Par addition, il arrive parfois que certains dossiers par défaut disposent du même contenu. Il faudra alors accorder de l’attention à ces contenus en question.
En outre, garantir l’accès à un seul des deux types de protocole de transmission pour accéder au site web n’est pas à négliger. Affirmativement, les sites internet quel qu’ils soient sont accessibles via http ou https. Pour les internautes, l’un témoigne souvent un caractère beaucoup plus sécurisé que l’autre durant la navigation.
Par ailleurs, une veille régulière sur les pages pourrait empêcher la duplique de contenu. Certainement, il arrive que ce soit du Content management système que proviennent l’erreur. À cela s’ajoute entre autres la mise en avant d’un caractère rigoureux envers les prestataires de service de rédaction pour le copier coller des textes.
Ce qu’il faut faire pour vérifier le contenu dupliqué
Il existe plusieurs astuces et outils pour vérifier le duplicate content.
D’abord, il y a le logiciel de crawl. Il s’agit d’un outil d’indexation qui a pour but de scanner l’ensemble des pages du site. De ce fait, à part le contenu, même les urls sont prises en compte. C’est ainsi que les erreurs telles que les contenus dupliqués sont détectés.
La vérification peut aussi se faire via des filtres. À titre d’exemple, la dernière version de Google Panda est très opérante. C’est un outil de vérification de contenu élaboré par Google. Il s’applique sur l’ensemble des pages web sur la toile. Dernièrement, son efficacité s’est d’ailleurs démontrée par le déclin du référencement des profiteurs de texte plagié.
D’autre part, que le moteur de recherche soit Yahoo, Bing, Google ou d’autres, MOZ bar permet également de trouver le contenu dupliqué. En pratique, c’est un plugin d’identification des principales parties d’un texte dont à l’instar le méta description et du title. Pareillement, kill Duplicate démarque son utilité en repérant efficacement le plagiat.
D’un autre côté, l’utilisation de Google Search Console est aussi recommandée. Proposé par Google, ce service non payant permet le repérage des problèmes rencontrés sur vos pages. Pratiquement, pour détecter un contenu dupliqué, le webmaster est invité à consulter le volet couverture de cet outil.
La vérification de contenu peut se faire en utilisant simplement la barre de recherche. Autrement dit, dans un moteur de recherche, il est conseillé aux administrateurs d’une page web d’insérer une partie de son texte dans la barre dédiée. Après la vérification de contenu dupliqué, mettre en place sans tarder la correction des erreurs commises est primordial.
D’autres outils gratuits comme Smallseotools, Plagium, Copyscape et autres sont également disponibles en ligne pour vérifier des contenus dupliqués. Pour bénéficier de tous les avantages proposés par ce type d’outil, vous pouvez opter pour la version payante.
Les autres étapes de l’audit de contenu
- La balise canonical
- Le pagerank interne
- La proximité sémantique
- L’analyse du contenu en fonction du ranking
Patrick Valibus est le fondateur de l'agence E-commerce 410 Gone. Il est également président de la FePSeM (ex SEO CAMP) depuis 2021. Il a créé Swan tools pour sécuriser les migrations SEO dans le monde entier.