-

Pour tout spécialiste du marketing expérimenté, le marketing de contenu est l’un des moyens les plus efficaces d’accroître votre audience en ligne. Le partage constant de contenu de qualité est un élément essentiel d’une campagne d’optimisation pour les moteurs de recherche (SEO) efficace et une force motrice pour guider les clients potentiels plus loin dans votre entonnoir.

Avec la quantité de travail nécessaire pour produire régulièrement un contenu unique et bien écrit, il est facile de comprendre pourquoi il existe un contenu en double (même si la plupart d’entre eux ne sont pas intentionnels). Mais le fait d’avoir une copie en double entraîne-t-il un classement inférieur sur les pages de résultats des moteurs de recherche (SERP) ? Oui et non – et pas d’une manière à laquelle vous vous attendez.

C’est une idée fausse courante dans l’industrie du référencement que la copie en double a un impact négatif sur votre classement en raison d’une pénalité de contenu en double perçue par Google. Dans un récent lieu de rencontre pendant les heures de bureau de Google SEO, l’avocat de la recherche Google, John Mueller, a déclaré que Google n’attribue pas de score de classement négatif au contenu en double de Google SEO. Il choisit cependant les pages à afficher.

« … ce n’est pas tant qu’il y a un score négatif qui y est associé », a déclaré Mueller. « C’est plus que si nous trouvons exactement les mêmes informations sur plusieurs pages sur le Web, et que quelqu’un recherche spécifiquement cette information, alors nous essaierons de trouver la meilleure page correspondante. »

Alors, ça répond à ça. Mais ce n’est pas parce que ce n’est pas un facteur de classement négatif que cela n’aura pas d’impact sur votre référencement – et négativement, en plus. Lisez la suite pour une explication de la façon dont Google classe les sites Web pour comprendre pourquoi le contenu dupliqué n’affecte pas le classement. Nous discuterons également en détail de l’impact SEO du contenu dupliqué et déterminerons pourquoi il est toujours mauvais pour votre site Web, même sans pénalité.

Comment les sites Web sont-ils classés par Google ?

Lorsque vous recherchez une information sur Google, Google renvoie un ensemble de résultats, chacun classé en fonction de sa pertinence par rapport à votre requête. Le classement de chaque page est déterminé par le processus en trois étapes suivant :

Crawling – Google utilise des programmes complexes appelés crawlers (communément appelés robots ou araignées) pour trier des centaines de milliards de pages Web sur plus de 1,83 milliard de sites Web afin d’identifier les informations trouvées sur chaque page.
Indexation – Google organise les informations trouvées sur chaque page Web et les stocke dans une base de données appelée l’index.
Classement – Google extrait les informations de l’index et affiche les résultats les plus pertinents.

Lors de l’affichage des classements d’un site Web, Google examine une pléthore de facteurs de classement Google pour évaluer la pertinence de chaque résultat par rapport à la requête. Ces facteurs de classement Google peuvent être condensés comme suit :

Signification de votre requête – ce facteur de classement Google détermine l’intention derrière la requête pour trouver les meilleurs résultats en utilisant des recherches similaires.
Pertinence sur les pages Web – Google utilise des mots-clés, des balises méta et l’interaction pour signaler la pertinence.
Qualité du contenu – ce facteur de classement Google évalue l’expertise, l’autorité et la fiabilité (E-A-T) d’une page Web sur un sujet donné.
Facilité d’utilisation des pages Web – la convivialité donne la priorité à l’expérience utilisateur (UX), en identifiant les points faibles de l’utilisateur sur une page et en renvoyant les pages jugées plus utilisables que les autres.
Contexte et paramètres – le contexte donne des résultats personnalisés en fonction de votre emplacement, de l’historique de recherche et des paramètres de recherche.

Chaque facteur de classement Google se voit attribuer un poids spécifique, qui varie en fonction de la nature de votre recherche. Par exemple, le contexte jouera un rôle encore plus important dans les résultats qui appellent des événements actuels que dans les définitions de dictionnaire.

Qu’est-ce que le contenu dupliqué ?

La façon dont Google classe les sites Web est assez simple. Google trouve votre site Web, indexe les informations qu’il contient et les affiche lorsqu’il est jugé pertinent pour la recherche. En même temps, c’est aussi un processus compliqué, en particulier lorsque du contenu en double est trouvé. Mais qu’est-ce que le contenu dupliqué ?

Comme son nom l’indique, le contenu en double se produit lorsque des parties importantes du texte correspondent à d’autres contenus trouvés sur des pages Web distinctes ou sur un site Web différent. Cela couvre tout, y compris les descriptions de produits, les en-têtes et les pieds de page, les copies d’un article de blog et d’autres formes de texte non malveillant (contenu copié sans intention de manipuler les classements de recherche).

Pour que le contenu soit considéré comme dupliqué, il doit être soit une correspondance exacte, soit très similaire. Par exemple, si vous trouvez la même définition de dictionnaire sur différents sites Web lorsque vous dupliquez du contenu sur Google en utilisant le terme de recherche « qu’est-ce que le contenu dupliqué ? », il s’agit d’une forme de contenu dupliqué.

Pénalité de contenu en double et règles de contenu en double de Google SEO

Comme mentionné ci-dessus, la pénalité de contenu en double de Google est un mythe. Google n’impose pas de pénalité de contenu en double sur les pages Web avec copie en double. Mais bien qu’il n’y ait pas de facteurs de classement Google négatifs pour le référencement de contenu dupliqué, cela peut toujours nuire à vos stratégies de référencement.

Voici comment le contenu en double de Google SEO affecte votre site Web :

1. Il empêche l’indexation de vos pages Web.

Saviez-vous que les bots Google suivent un budget de crawl lors du processus d’indexation d’un site Web ? En un mot, le budget de crawl de Google est le degré d’attention que ses robots d’exploration accordent à votre site Web. Le budget d’exploration détermine le temps que les bots passent à explorer votre site Web pour les pages à indexer. Un site Web gonflé rempli de contenu dupliqué augmente le budget d’exploration de Google. Avec un budget de crawl réduit, les pages Web uniques ne seront pas indexées correctement.

2. Il empêche le classement de vos pages Web.

En plus d’utiliser le budget d’exploration de Google, le contenu dupliqué empêche également les pages précédemment indexées d’apparaître sur les SERP. Google n’aime pas afficher un contenu identique, même s’il s’agit d’un contenu en double SEO hautement optimisé. Ainsi, lorsque les robots d’exploration trouvent du contenu en double SEO sur vos pages Web, ils essaient immédiatement de trouver la page qui offre la meilleure correspondance. Au lieu de cinq pages indexées et affichées dans les classements, une seule apparaîtra finalement sur les SERP, diluant la visibilité de votre site Web.

3. Il dilue l’équité du lien.

Lorsqu’une page Web reçoit des backlinks, plus d’autorité lui est transmise grâce à l’équité des liens. Au fur et à mesure que de plus en plus de pages pointent vers cette page, sa propre autorité s’améliore, car Google la considère comme un contenu faisant autorité. Mais lorsque vous avez plusieurs versions de la même page, d’autres sites peuvent créer des liens vers différentes copies de cette page, ce qui dilue la quantité de jus de lien que vous obtenez. Cela pourrait être problématique si vous recherchez des pages spécifiques à classer.

Une façon plus succincte de regarder le contenu dupliqué de Google est son contenu qui se fait concurrence. En d’autres termes, plus il y a de cas de duplication, plus une page a de concurrents.

Comment gérer les problèmes de référencement de contenu en double

Résoudre les problèmes de contenu en double de Google n’est pas facile. Vous ne pouvez pas simplement supprimer les doublons, surtout s’ils sont externes à votre domaine. La meilleure façon de gérer ces problèmes est de mettre en place des contrôles qui pointent vers le contenu d’origine, en disant à Google « c’est celui que vous devez indexer ». Vous pouvez configurer des contrôles tels qu’une redirection 301 et une balise canonique, entre autres. Mais qu’est-ce qu’une redirection 301 ? Qu’est-ce qu’une balise canonique ?

En savoir plus ci-dessous.

Localiser les problèmes avec un vérificateur de contenu en double

Vous ne pouvez pas résoudre les problèmes de contenu en double sans savoir d’abord où ils se trouvent. Le moyen le plus efficace de le faire est d’utiliser des outils comme un vérificateur de contenu en double pour détecter où ils se trouvent. Qu’il s’agisse de blocs de texte ou de doublons d’une page entière, un vérificateur de contenu en double automatisé peut vous aider à détecter ces problèmes. Parcourez une liste des meilleurs outils en ligne que vous pouvez utiliser et choisissez-en un.

Configurer une redirection 301

Tout d’abord, répondons à la question « Qu’est-ce qu’une redirection 301 ? ». La redirection 301 est un contrôle utilisé pour pointer en permanence vers une page tout en passant l’équité complète du lien. La mise en place d’une redirection 301 est souvent le moyen le plus rapide et le plus simple de résoudre les problèmes de contenu dupliqué. Vous pouvez l’utiliser pour transmettre tous les liens pointant vers une page dupliquée vers la page d’origine, éliminant ainsi la concurrence entre les deux pages.

Par exemple, si vous aviez à l’origine un article de blog qui répondait « qu’est-ce qu’une redirection 301 ? » et l’a fusionné avec un sur « qu’est-ce qu’une balise canonique? », Tous les utilisateurs seront automatiquement dirigés vers le billet de blog combiné. Vous pouvez configurer une redirection 301 en accédant au fichier .htaccess de votre serveur.

Utiliser la balise canonique

Si vous ne souhaitez pas configurer de redirection, vous pouvez également utiliser la balise canonique. Qu’est-ce qu’une balise canonique, me demanderez-vous ? L’attribut rel=canonical indique qu’une page spécifique est l’original et que tout le reste n’est qu’un doublon.

Toutes les pages doivent-elles utiliser l’attribut rel=canonical ? Si vous voulez que la page soit correctement classée, alors oui. En déclarant une page canonique, vous dites à Google que « c’est celle que je veux afficher sur les SERP ».

Pour utiliser l’attribut rel=canonical, accédez au backend de chaque page en double, ajoutez le lien vers la page canonique sous l’en-tête HTML et ajoutez l’attribut « rel=canonical » à la balise de lien. Le format doit être le suivant : <head> <link href= »URL de la page d’origine » rel= »canonical » /> </head>

Ajouter la balise Noindex Meta Robots

Une autre façon de contrôler les problèmes de contenu dupliqué consiste à utiliser des méta-robots, en particulier en utilisant l’attribut « noindex, follow ». L’utilisation de la balise indique explicitement à Google d’exclure certains liens de son index tout en permettant l’exploration de la page.

Vous pouvez trouver la balise meta robots sous l’en-tête HTML de chaque page. Utilisez le format suivant : <head> <meta name=”robots” content=”noindex, follow”> </head>

Modifier les paramètres de domaine préféré sur Google Search Console

Dans les cas où vous avez plusieurs domaines (www et pas de www), vous pouvez définir le domaine préféré sur Google Search Console, ce qui vous permet de spécifier comment Google explore divers paramètres d’URL. Vous pouvez localiser cette option sous Paramètres du site sur Google Search Console.

Notez que cela ne couvre que la façon dont Google gère les instances de contenu dupliqué. Bing et d’autres moteurs de recherche exploreront toujours votre website normalement.

Conclusion

Tirer constamment parti d’un contenu excellent et unique est un défi de taille. La pénalité de contenu en double de Google n’existant pas réellement, devez-vous toujours vous soucier de ces problèmes ? Bien sûr. D’autres problèmes peuvent survenir qui pourraient encore compter comme une autre forme de pénalité de contenu dupliqué. Vous pouvez gérer ces problèmes efficacement en suivant les conseils que nous avons partagés ci-dessus.

Votre stratégie de marketing de contenu est plus cruciale que jamais en 2021. Avec plus de 93 % de tout le trafic Web passant par les moteurs de recherche, la mise en œuvre d’un plan de marketing de contenu robuste est le meilleur moyen de mettre la croissance de votre entreprise sur pilote automatique lorsqu’elle est exécutée correctement.

Amplifiez votre portée et automatisez les ventes en tirant parti du contenu de haute qualité de Thrive. Nous sommes une agence de marketing de contenu professionnelle dédiée à garder votre contenu frais et unique. Nous vous aidons à rester compétitif en créant du contenu qui offre de la valeur à votre public et correspond à vos objectifs. Par-dessus tout, nous nous occupons de tous les problèmes de contenu dupliqué afin que vous gardiez une longueur d’avance. Appelez-nous au +32 2 342 0740 ou remplissez notre formulaire et commencez à travailler avec nous dès aujourd’hui !