Dans un Webmaster Hangout, John Mueller de Google a demandé si un contenu plagié risquait d’affecter le classement d’un site. La réponse de Mueller a donné un aperçu de la manière dont Google gère les sites qui volent du contenu et de son effet sur votre site.
Sites de raclage et effet sur le classement
Il y a beaucoup de mauvais acteurs qui volent du contenu et l'utilisent sur leurs propres sites. Cela se fait avec un logiciel automatisé. Le processus s'appelle le raclage de contenu et les sites qui publient du contenu volé sont appelés racleurs de contenu.
Le contenu volé est associé à la perte de classement dans Google. Il n’est pas rare de rechercher un extrait de votre propre contenu et de voir un autre classement de site avec celui-ci.
L’inquiétude concernant l’effet sur les classements est légitime.
Voici la question:
«Quelques sites Web ont commencé à supprimer mon contenu et à le publier. Nous avons essayé de contacter leurs hôtes pour un takedown DMCA sans succès. Avoir mon contenu gratté et republié blesse-t-il mon site? Devrais-je désavouer ces URL?
Qu'est ce que le DMCA?
La question faisait référence à un retrait DMCA. DMCA est une loi américaine appelée The Digital Millennium Copyright Act (DMCA).
La loi protège les hôtes, les registraires de noms de domaine et les autres entreprises contre toute violation du droit d'auteur, pour autant que les créateurs de contenu aient la possibilité de demander que le contenu volé soit supprimé. Il contient également des dispositions relatives à la régularité de la procédure permettant de contester le retrait, ce qui peut alors entraîner un litige coûteux pour le créateur de contenu.
Il est quelque peu surprenant que l’éditeur ait essayé d’utiliser le DMCA et ait échoué. Cela peut se produire lorsque l'hôte Web et / ou le registraire de nom de domaine se trouvent dans un pays autre que les États-Unis. Chaque pays a son propre remède.
Le contenu copié affecte-t-il les classements?
John Mueller de Google a donné un aperçu de la manière dont le contenu volé affecte le classement:
«Ainsi, de notre point de vue, la copie de votre contenu par d’autres sites n’aurait pas une incidence négative sur votre site Web. C’est une situation très courante: les sites copient le contenu.
… Si vous ne voyez pas ces copies apparaître dans la recherche des requêtes qui vous intéressent, il se peut que la priorité ne soit pas la plus haute priorité. ”
Ce que John Mueller a du sens dans le contexte où les sites de récupération ne se classent généralement pas pour les requêtes de recherche réelles. Est-il possible pour les racleurs de se classer dans les requêtes à longue queue ou non compétitives? Presque tout est possible avec ce genre de questions.
Pourquoi les gratteurs classent-ils les extraits de contenu?
Il n’est pas inhabituel qu’un site de diffusion raccroche pour un extrait de contenu volé sur un autre site, mais il ya une bonne raison à cela.
Les extraits de contenu sont généralement considérés comme du charabia. Si un autre site se classe pour un extrait, ce n’est pas parce que son vol a rendu votre site moins pertinent. C’est parce que l’algorithme de recherche classe les pages différemment pour des phrases absurdes.
L'algorithme de Google tente de donner un sens à toutes les requêtes de recherche. C’est pratiquement impossible à faire s’il n’ya pas de «sens» dans la requête de recherche.
Et lorsque l'extrait de code a du sens, Google peut très bien classer les autres sites pour cette requête avant vos sites, mais c'est l'algo qui lance, classant les pages pour "les sujets. "
Google ne classe pas les pages en fonction des mots clés. Ainsi, même si la recherche est votre extrait, cela ne garantit pas que votre site sera classé numéro un.
L’important est que les voleurs de contenu ne se classent généralement pas pour les requêtes de recherche importantes. Donc, ne vous laissez pas troubler si vous voyez des sites de racleurs vous surpasser pour des bribes. Cela ne signifie pas que votre site a perdu sa force de classement à cause du contenu volé.
Comment se protéger contre les grattoirs?
WordPress Anti-bot Plugins
Il existe de nombreux plugins WordPress qui fournissent une défense contre les scrapers malveillants.
WordFence
WordFence est un plugin populaire qui peut être personnalisé pour bloquer les scrapers quelle que soit l'heure à laquelle vous souhaitez les bloquer. Il vous envoie un e-mail pour vous informer du moment où vous êtes attaqué, ce qui peut vous aider à augmenter la rapidité avec laquelle WordFence les éteint.
WordFence semble fonctionner en surveillant le comportement des visiteurs, en particulier le nombre de pages ou le type de pages qu'il tente de télécharger. C’est le comportement qui déclenche un mur qui bloque les robots.
J'utilise WordFence pour arrêter les scrapers et les hacker bots et je suis heureux de la façon dont cela fonctionne.
Blackhole Anti-bot WordPress Plugin
Un autre plugin WordPress populaire est celui appelé Trou noir. (Il est également livré avec une fonctionnalité riche et raisonnablement version Pro payante)
Blackhole fonctionne sur le principe du pot de miel. Les bons robots éviteront d'explorer un lien interdit. Les mauvais robots vont se précipiter. Blackhole crée un piège pour les mauvais robots en incluant un lien vers le pot de miel. Une fois que le mauvais bot suit le lien interdit, le piège est déclenché et le bot est exclu de l'analyse.
Tous les moteurs de recherche sont sur liste blanche. Cela signifie qu'aucun moteur de recherche légitime ne sera jamais bloqué, même si Google suit le lien.
Blackhole PHP
Il existe un bloqueur de bots PHP appelé Blackhole. Blackhole peut être installé sur n’importe quel serveur utilisant PHP. Il sera donc compatible avec un site de forum utilisant des logiciels tels que Xenforo ou phpBB. En savoir plus sur le La version PHP de Blackhole ici.
reCAPTCHA Enterprise Beta
Google a récemment annoncé un essai gratuit de la version bêta d'un service appelé reCAPTCHA Enterprise. Il s’agit d’un service cloud conçu pour bloquer les scrapers automatisés, les pirates informatiques et autres robots malveillants.
Le fait que Google lui-même offre une solution aux robots malveillants témoigne peut-être de l’importance de bloquer les logiciels de bot automatisés, y compris les scrapers.
Devriez-vous vous protéger contre les grattoirs?
Je pense que c’est une bonne idée de protéger votre site contre les robots automatisés. Les robots ont tendance à ramper la nuit au moment où Google et d'autres robots légitimes rampent. Cela peut devenir problématique lorsque trop de robots malveillants sondent votre site, ralentissant votre serveur. Cela peut amener votre serveur à commencer à transmettre des codes de réponse aux erreurs à Google. Ce dernier ne pourra alors pas analyser et indexer votre site.
Ainsi, bien que John Mueller ait raison de dire que le contenu volé n’affecte pas votre classement, vous devez tout de même essayer de vous protéger contre les scrapers afin que Google puisse analyser et indexer correctement votre site.
À emporter
L’important est que Google ait confirmé que le contenu supprimé n’affectait pas votre classement.
Comments are closed.