Imaginez travailler dur pour écrire une excellente histoire ou un excellent article, pour ensuite découvrir que quelqu'un d'autre s'en attribue le mérite. C'est ce qui arrive lorsque des personnes volent le contenu de votre site web.
Le vol de contenu, ou « scraping », est un problème majeur pour les propriétaires de sites web. Ces personnes sont des voleurs qui copient votre travail, l'utilisent sur leurs propres sites, et prétendent parfois même que c'est le leur. Cela peut être vraiment frustrant et injuste.
Dans cet article, nous allons aborder ce qu'est le scraping de contenu de blog, comment vous pouvez réduire et prévenir le scraping de contenu, et même comment tirer parti des scrapers de contenu à votre avantage.

Qu'est-ce que le scraping de contenu de blog dans WordPress ?
Le scraping de contenu de blog consiste à prendre du contenu de nombreuses sources et à le republier sur un autre site. Généralement, cela se fait automatiquement via le flux RSS de votre blog.
Malheureusement, il est très facile et très courant que le contenu de votre blog WordPress soit volé de cette manière. Si cela vous est arrivé, vous comprenez à quel point cela peut être stressant et frustrant.
Parfois, votre contenu sera simplement copié et collé directement sur un autre site web, y compris votre mise en forme, vos images, vos vidéos, et plus encore.
D'autres fois, votre contenu sera republié avec attribution et un lien vers votre site web, mais sans votre permission. Bien que cela puisse aider votre SEO, vous pourriez vouloir que votre contenu original soit hébergé uniquement sur votre site.
Pourquoi les scrapeurs de contenu volent-ils du contenu ?
Certains de nos utilisateurs nous ont demandé pourquoi les scrapeurs volent du contenu. Habituellement, la principale motivation du vol de contenu est de profiter de votre travail acharné :
- Commission d'affiliation : Les spécialistes du marketing d'affiliation malhonnêtes peuvent utiliser votre contenu pour attirer du trafic vers leur site par le biais des moteurs de recherche afin de promouvoir leurs produits de niche.
- Génération de prospects : Les avocats et les agents immobiliers peuvent payer quelqu'un pour ajouter du contenu et gagner en autorité dans leur communauté sans se rendre compte qu'il est extrait d'autres sources.
- Revenus publicitaires : Les propriétaires de blogs peuvent extraire du contenu pour créer un centre de connaissances dans une certaine niche « pour le bien de la communauté » et ensuite inonder le site de publicités.
Est-il possible d'empêcher complètement le scraping de contenu ?
Dans cet article, nous vous montrerons quelques étapes que vous pouvez suivre pour réduire et prévenir le scraping de contenu. Mais malheureusement, il n'y a aucun moyen d'arrêter complètement un voleur déterminé.
C'est pourquoi nous avons terminé cet article par une section sur la façon dont vous pouvez tirer parti des scrapeurs de contenu. Bien que vous ne puissiez pas toujours arrêter un voleur, vous pourriez être en mesure de générer du trafic et des revenus grâce au contenu qu'ils vous ont volé.
Que faire lorsque vous découvrez que quelqu'un a extrait votre contenu ?
Comme il n'est pas possible d'arrêter complètement les scrapeurs, vous pourriez un jour découvrir que quelqu'un utilise le contenu qu'il a volé sur votre blog. Vous pourriez vous demander quoi faire lorsque cela se produit.
Voici quelques approches que les gens adoptent lorsqu'ils traitent avec des scrapeurs de contenu :
- Ne rien faire : Vous pouvez passer beaucoup de temps à combattre les scrapeurs, donc certains blogueurs populaires décident de ne rien faire. Google considère déjà les sites bien connus comme des autorités, mais ce n'est pas vrai pour les petits sites. Donc, cette approche n'est pas toujours la meilleure, à notre avis.
- Retrait : Vous pouvez contacter le scraper et lui demander de retirer le contenu. S'il refuse, vous soumettez alors une demande de retrait. Vous pouvez apprendre comment faire dans notre guide sur comment trouver et supprimer facilement le contenu volé dans WordPress.
- Tirer parti : Bien que nous travaillions activement à faire retirer le contenu copié de WPBeginner, nous utilisons également quelques techniques pour générer du trafic et gagner de l'argent grâce aux scrapers. Vous pouvez apprendre comment faire dans la section « Tirer parti des scrapers de contenu » ci-dessous.
Cela étant dit, examinons comment empêcher le scraping de blog dans WordPress. Comme il s'agit d'un guide complet, nous avons inclus une table des matières pour faciliter la navigation :
- Protégez par copyright ou marque le nom et le logo de votre blog
- Rendez votre flux RSS plus difficile à scraper
- Désactiver les trackbacks et les pingbacks
- Bloquer l'accès du scraper à votre site WordPress
- Empêcher le vol d'images dans WordPress
- Découragez la copie manuelle de votre contenu
- Profitez des grattoirs de contenu
1. Déposez une marque ou un droit d'auteur sur le nom et le logo de votre blog
Les lois sur les marques et les droits d'auteur protègent votre propriété intellectuelle, votre marque et votre entreprise contre de nombreux litiges. Cela inclut le plagiat et l'utilisation illégale de votre matériel protégé par droit d'auteur ou du nom et logo de votre marque.
Vous devriez afficher clairement un avis de droit d'auteur sur votre site. Bien que le contenu de votre site Web soit automatiquement couvert par les lois sur les droits d'auteur, l'affichage d'un avis indiquera que votre contenu est protégé par droit d'auteur et que les tiers ne peuvent pas utiliser vos propriétés protégées à des fins commerciales.

Par exemple, vous pouvez ajouter un avis de droit d'auteur avec une date dynamique dans le pied de page de votre WordPress. Cela maintiendra votre avis de droit d'auteur à jour.
Cela peut décourager certains utilisateurs de le voler. Cela vous aidera également dans le cas où vous auriez besoin d'envoyer une lettre de mise en demeure ou de déposer une plainte DCMA pour faire retirer votre contenu volé.
Vous pouvez également demander l'enregistrement du droit d'auteur en ligne. Ce processus peut être compliqué, mais heureusement, il existe des services juridiques peu coûteux qui peuvent aider les petites entreprises et les particuliers.
Apprenez comment dans notre guide sur comment déposer une marque et un droit d'auteur sur le nom et le logo de votre blog.
2. Rendez votre flux RSS plus difficile à gratter
Étant donné que le grattage de contenu de blog est généralement effectué automatiquement via le flux RSS de votre blog, examinons quelques modifications utiles que vous pouvez apporter à votre flux.
N'incluez pas le contenu complet de l'article dans votre flux RSS WordPress
Vous pouvez inclure uniquement un résumé de chaque article dans votre flux RSS au lieu du contenu complet. Cela inclut un extrait ainsi que les métadonnées de l'article, telles que la date, l'auteur et la catégorie.
Il y a certainement un débat dans la communauté des blogueurs sur la question de savoir s'il faut avoir des flux RSS complets ou des flux de résumé. Nous n'allons pas entrer dans ce débat maintenant, sauf pour dire que l'un des avantages d'avoir seulement un résumé est qu'il aide à prévenir le vol de contenu.
Vous pouvez modifier les paramètres en allant dans Paramètres » Lecture dans votre panneau d'administration WordPress. Vous devez sélectionner l'option 'Extrait' puis cliquer sur le bouton 'Enregistrer les modifications'.

Désormais, le flux RSS n'affichera qu'un extrait de votre article. Si quelqu'un vole votre contenu via votre flux RSS, il n'obtiendra que le résumé, pas l'article complet.
Si vous souhaitez affiner le résumé, vous pouvez consulter notre guide sur comment personnaliser les extraits WordPress.
Optimisez votre flux RSS pour empêcher le vol de contenu
Il existe d'autres moyens d'optimiser votre flux RSS WordPress pour protéger votre contenu, obtenir plus de backlinks, augmenter votre trafic web, et plus encore. L'une des meilleures façons est de retarder l'apparition des articles dans le flux RSS.
L'avantage est que lorsque vous retardez l'apparition des articles dans votre flux RSS, vous donnez aux moteurs de recherche le temps d'explorer et d'indexer votre contenu avant qu'il n'apparaisse ailleurs, par exemple sur les sites web des voleurs de contenu. Les moteurs de recherche considéreront alors votre site comme faisant autorité.
La manière la plus sûre et la plus simple de le faire est d'utiliser WPCode car il dispose d'une recette qui ajoute automatiquement le code personnalisé correct à WordPress.

Pour des instructions détaillées, consultez notre guide sur comment retarder l'apparition des articles dans le flux RSS de WordPress.
3. Désactiver les trackbacks, les pingbacks et l'API REST
Aux premiers temps du blogging, les trackbacks et les pingbacks ont été introduits comme un moyen pour les blogs de s'informer mutuellement des liens. Lorsque quelqu'un crée un lien vers un article de votre blog, son site web vous envoie automatiquement un ping.
Ce pingback apparaîtra alors dans la modération des commentaires de votre blog avec un lien vers leur site web. Si vous l'approuvez, ils obtiendront un backlink et une mention de votre site.
Cela donne au spammeur une incitation à parcourir votre site et à envoyer des trackbacks. Heureusement, vous pouvez désactiver les trackbacks et les pingbacks pour donner aux scrapers une raison de moins de voler votre contenu.

Pour plus d'informations, consultez notre guide sur la désactivation des trackbacks sur tous les futurs articles. Vous pourriez également aimer apprendre comment désactiver les trackbacks et les pings sur les articles WordPress existants.
Désactiver l'API REST de WordPress
Outre les trackbacks et les pingbacks, nous vous recommandons également de désactiver l'API REST de WordPress, car elle peut faciliter le parcours de votre contenu par les spammeurs.
Nous avons un guide détaillé sur la façon dont vous pouvez désactiver l'API REST de WordPress.
Tout ce que vous avez à faire est d'installer et d'activer le plugin gratuit WPCode et d'utiliser leur snippet prédéfini pour désactiver l'API REST.
4. Bloquez l'accès du scraper à votre site WordPress
Une façon d'empêcher les scrapers de voler votre contenu est de leur retirer l'accès à votre site Web. Vous pouvez le faire manuellement en bloquant leur adresse IP, mais la plupart des utilisateurs trouveront plus facile d'utiliser un plugin de sécurité tel qu'un pare-feu d'application Web.
Bloquez le scraper à l'aide d'un plugin de sécurité (recommandé)
Bloquer les scrapers manuellement est délicat et demande beaucoup de travail. D'autant plus que de nombreuses tentatives de piratage et attaques sont effectuées à l'aide d'un large éventail d'adresses IP aléatoires du monde entier. Il est presque impossible de suivre toutes ces adresses IP aléatoires.
C'est pourquoi vous avez besoin d'un pare-feu d'application Web (WAF) tel que Wordfence ou Sucuri. Ceux-ci agissent comme un bouclier entre votre site Web et tout le trafic entrant en surveillant le trafic de votre site Web et en bloquant les menaces de sécurité courantes avant qu'elles n'atteignent votre site WordPress.
Pour le site Web WPBeginner, nous utilisons Sucuri. C'est un service de sécurité de site Web qui protège votre site Web contre de telles attaques en utilisant un pare-feu d'application Web.
Essentiellement, tout le trafic de votre site web passe par les serveurs du service de sécurité, où il est examiné pour détecter toute activité suspecte. Ils bloquent automatiquement les adresses IP suspectes pour qu'elles n'atteignent pas votre site web. Voyez comment Sucuri nous a aidés à bloquer 450 000 attaques WordPress en 3 mois.
Bloquer ou rediriger manuellement l'adresse IP du scraper
Les utilisateurs avancés peuvent également souhaiter bloquer manuellement l'adresse IP d'un scraper. Cela demande plus de travail, mais vous pouvez cibler spécifiquement l'adresse du scraper une fois que vous l'avez identifiée. Le développeur web Jeff Star suggère cette approche lorsqu'il écrit sur la façon dont il gère les scrapers de contenu.
Remarque : L'ajout de code aux fichiers du site web peut être dangereux. Même une petite erreur peut causer des problèmes majeurs sur votre site. C'est pourquoi nous recommandons cette méthode uniquement aux utilisateurs avancés.
Vous pouvez trouver l'adresse IP du scraper en visitant les « Journaux d'accès bruts » dans le tableau de bord cPanel de votre compte d'hébergement web. Vous devez rechercher les adresses IP avec un nombre de requêtes inhabituellement élevé et en garder une trace, par exemple en les copiant dans un fichier texte séparé.

Astuce : Vous devez vous assurer de ne pas vous bloquer vous-même, les utilisateurs légitimes ou les moteurs de recherche de l'accès à votre site web. Copiez une adresse IP suspecte et utilisez des outils de recherche d'adresse IP en ligne pour en savoir plus à son sujet.
Une fois que vous êtes sûr que l'adresse IP appartient à un scraper, vous pouvez la bloquer en utilisant l'outil cPanel « Bloqueur d'IP » ou en ajoutant un code comme celui-ci dans votre fichier racine .htaccess :
Deny from 123.456.789
Assurez-vous de remplacer l'adresse IP dans le code par celle que vous souhaitez bloquer. Vous pouvez bloquer plusieurs adresses IP en les saisissant sur la même ligne, séparées par des espaces.
Pour des instructions détaillées, consultez notre guide sur comment bloquer les adresses IP dans WordPress.
Au lieu de simplement bloquer les scrapers, Jeff suggère de leur envoyer des flux RSS factices à la place. Vous pourriez créer des flux remplis de Lorem Ipsum et d'images ennuyeuses ou même les renvoyer vers leur propre site web, provoquant une boucle infinie et faisant planter leur serveur.
Pour les rediriger vers un flux factice, vous devrez ajouter un code comme celui-ci à votre fichier .htaccess :
RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://dummyfeed.com/feed [R,L]
5. Empêcher le vol d'images dans WordPress
Ce ne sont pas seulement votre contenu écrit que vous devez protéger. Vous devriez également empêcher le vol d'images dans WordPress.
Comme pour le texte, il n'y a aucun moyen d'empêcher complètement les gens de voler vos images, mais il existe de nombreuses façons de décourager le vol d'images sur un site WordPress.
Par exemple, vous pouvez désactiver le hotlinking de vos images WordPress. Cela signifie que si quelqu'un récupère votre contenu HTML, ses images ne se chargeront pas sur son site.
Cela réduira également la charge de votre serveur et l'utilisation de la bande passante, améliorant ainsi la vitesse et les performances de votre WordPress.
Alternativement, vous pouvez ajouter un filigrane à vos images qui vous donne le crédit. Cela indiquera clairement que le récupérateur a volé votre contenu.
Vous pouvez apprendre ces deux techniques, ainsi que d'autres moyens de protéger vos images, dans notre guide sur les moyens d'empêcher le vol d'images dans WordPress.
6. Décourager la copie manuelle de votre contenu
Bien que la plupart des récupérateurs utilisent des outils automatiques, certains voleurs de contenu peuvent essayer de copier manuellement tout ou partie de votre contenu.
Une façon de rendre cela plus difficile est de les empêcher de copier et coller votre texte. Vous pouvez y parvenir en rendant plus difficile la sélection du texte sur votre site Web.
Pour savoir comment arrêter la copie manuelle de votre contenu, consultez notre guide étape par étape sur comment empêcher la sélection et le copier-coller de texte dans WordPress.
Cependant, cela ne protégera pas complètement votre contenu. N'oubliez pas que les utilisateurs avertis en technologie peuvent toujours afficher le code source ou utiliser l'outil Inspecter pour copier tout ce qu'ils veulent. De plus, cette méthode ne fonctionnera pas avec tous les navigateurs Web.
De plus, gardez à l'esprit que tout le monde qui copie votre texte ne sera pas un voleur de contenu. Par exemple, certaines personnes voudront peut-être copier le titre pour partager votre article sur les réseaux sociaux.
C'est pourquoi nous vous recommandons de n'utiliser cette méthode que si vous estimez qu'elle est vraiment nécessaire pour votre site.
7. Profitez des grattoirs de contenu
À mesure que votre blog s'agrandit, il devient presque impossible d'arrêter ou de suivre tous les scrapeurs de contenu. Nous envoyons toujours des plaintes DMCA. Cependant, nous savons qu'il existe des tonnes d'autres sites qui volent notre contenu et que nous ne pouvons tout simplement pas suivre.
Au lieu de cela, notre approche consiste à essayer de tirer parti des scrapeurs de contenu. Ce n'est pas si mal quand vous voyez que vous gagnez de l'argent grâce à votre contenu volé ou que vous recevez beaucoup de trafic d'un site Web de scrapeur.
Prenez l'habitude de créer des liens internes pour obtenir du trafic et des backlinks des scrapeurs
Dans notre guide ultime du SEO, nous vous recommandons de prendre l'habitude de créer des liens internes. En plaçant des liens vers votre autre contenu dans vos articles de blog, vous pouvez augmenter les pages vues et réduire le taux de rebond sur votre propre site.
Mais il y a un deuxième avantage en ce qui concerne le scraping. Les liens internes vous obtiendront de précieux backlinks de la part des personnes qui volent votre contenu. Les moteurs de recherche comme Google utilisent les backlinks comme signal de classement, donc les backlinks supplémentaires sont bons pour votre SEO.
Enfin, ces liens internes vous permettent de voler l'audience du scrapeur. Les blogueurs talentueux placent des liens sur des mots-clés intéressants, ce qui rend tentant pour les utilisateurs de cliquer. Les visiteurs du site Web du scrapeur cliqueront également sur les liens, ce qui les ramènera directement sur votre propre site Web.
Liez automatiquement les mots-clés avec des liens d'affiliation pour gagner de l'argent grâce aux scrapeurs
Si vous gagnez de l'argent sur votre site Web grâce au marketing d'affiliation, nous vous recommandons d'activer la liaison automatique dans vos flux RSS. Cela vous aidera à maximiser vos revenus auprès des lecteurs qui ne lisent votre site Web que via les lecteurs RSS.
Mieux encore, cela vous aidera à gagner de l'argent sur les sites qui volent votre contenu.
Utilisez simplement un plugin WordPress comme ThirstyAffiliates qui remplacera automatiquement les mots-clés assignés par des liens d'affiliation. Nous vous montrons comment faire dans notre guide sur comment lier automatiquement les mots-clés avec des liens d'affiliation dans WordPress.
Promouvoir votre site Web dans le pied de page de votre flux RSS
Vous pouvez utiliser le plugin All in One SEO pour ajouter des éléments personnalisés à votre pied de page RSS.
Par exemple, vous pouvez ajouter une bannière qui promeut vos propres produits, services ou contenu.

Le meilleur, c'est que ces bannières apparaîtront également sur le site Web du pirate.
Dans notre cas, nous ajoutons toujours une petite clause de non-responsabilité en bas des articles de nos flux RSS. Ce faisant, nous obtenons un backlink vers l'article original depuis le site du pirate.
Cela permet à Google et aux autres moteurs de recherche de savoir que nous sommes l'autorité. Cela permet également à leurs utilisateurs de savoir que le site vole notre contenu.
Pour plus d'astuces, consultez notre guide sur comment contrôler le pied de page de vos flux RSS dans WordPress.
Nous espérons que ce tutoriel vous a aidé à apprendre comment empêcher le scraping de contenu de blog dans WordPress. Vous pourriez également consulter notre guide ultime de la sécurité WordPress ou notre sélection d'experts des meilleurs plugins de protection de contenu pour WordPress.
Si cet article vous a plu, abonnez-vous à notre chaîne YouTube pour des tutoriels vidéo WordPress. Vous pouvez également nous retrouver sur Twitter et Facebook.

Dennis Muthomi
OK Wow, c'est un guide incroyablement complet sur la façon d'empêcher le scraping de contenu de blog ! Merci, WPBeginner, d'avoir mis en lumière ce problème frustrant.
J'ai particulièrement apprécié la section sur la façon de rendre le flux RSS plus difficile à scraper – je n'y avais pas pensé auparavant.
Le conseil sur le retardement de l'apparition des articles dans le flux RSS est brillant et quelque chose que je vais absolument mettre en œuvre sur mon propre blog TOUT DE SUITE !
Moinuddin Waheed
J'ai beaucoup d'amis qui me parlaient d'utiliser les flux RSS et de créer du contenu sur leur site web de cette manière. Je ne savais pas exactement comment cela fonctionnait ni quels avantages ils en retiraient.
Scraper le contenu des autres et le présenter comme s'ils l'avaient créé eux-mêmes est une infraction, mais dans un monde non éthique, qui s'en soucie. Merci d'avoir créé ce guide qui nous permet d'empêcher le scraping de notre contenu et au moins de le retourner à notre avantage.
Jiří Vaněk
Merci pour l'article. J'ai un blog avec plus de 1200 articles, et je dois commencer à m'en occuper aussi. Merci pour ces précieux conseils.
Support WPBeginner
De rien !
Admin
Toheeb Temitope
Merci pour le post.
Mais puis-je même supprimer ou désactiver totalement le flux RSS, ou y a-t-il un avantage particulier ?
Ensuite, si je veux désactiver totalement le flux RSS, comment vais-je faire ?
Merci.
Support WPBeginner
Si vous souhaitez désactiver le flux RSS de votre site, notre guide ci-dessous vous sera utile :
https://www.wpbeginner.com/wp-tutorials/how-to-disable-rss-feeds-in-wordpress/
Les flux RSS peuvent être utiles à certains utilisateurs de votre site qui utilisent des lecteurs de flux RSS pour savoir quand un site a du nouveau contenu.
Admin
Moinuddin Waheed
C'est une bonne idée de savoir que nous pouvons même désactiver le flux RSS, empêchant ainsi le vol potentiel et le scraping du contenu.
Bien que la désactivation du flux RSS ait aussi quelques inconvénients.
Y a-t-il un désavantage en termes de SEO à désactiver le flux RSS ?
Ou cela n'a-t-il rien à voir avec le SEO et le classement ?
Support WPBeginner
Votre flux RSS ne devrait pas affecter le SEO de votre site.
Giovanni
Merci. Exactement les informations dont j'ai besoin. Mais les scrapers utilisent-ils encore le flux RSS en 2019 ?
Support WPBeginner
Ils le peuvent certainement et essaieront de le faire
Admin
Nergis
On entend beaucoup parler de l'acquisition de contenu de site par la curation de contenu. Le piratage de contenu est-il la même chose que la curation de contenu ? Sinon, quelle est la différence entre les deux ?
Support WPBeginner
Le scraping de contenu consiste à prendre du contenu d'autres sites pour le placer sur votre site sans autorisation, la curation de contenu consiste normalement à lier à d'autres contenus au sein du contenu que vous avez créé
Admin
Kingsley Felix
Je rencontre ces problèmes, j'en avais plus de 20 pour l'une de nos marques, puis nous avons déménagé ailleurs et ils sont de retour.
Support WPBeginner
les scrapers de contenu sont malheureusement une lutte constante
Admin
slevin smith
J'ai trouvé un très mauvais pirate de contenu sur mon blog, non seulement ils volent mon contenu, utilisent le même nom pour leur blog de spam séparé par un – et toute la description, les tags, essayant essentiellement d'être moi, utilise des liens dans le flux RSS avec mon blog, ma chaîne YouTube, Facebook, Twitter, Pinterest & Google Plus, qui apparaissent sur leur blog de spam, j'ai aussi constaté que les images PNG apparaissent sur la page d'accueil mais pas les JPEG, mais cela n'est peut-être que sur Blogger.
astrid maria boshuisen
J'adore absolument l'idée d'interconnexion. Je vais devoir regarder la suggestion RSS, car j'ai oublié comment cela fonctionne exactement, m'étant concentrée sur l'écriture d'e-books Kindle pendant un certain temps (parlez de piratage de contenu – zéro protection là-dessus !.. d'où mon retour à l'écriture de sites Web), mais je pense que j'ai vraiment un point de départ pour protéger mon contenu ! Merci !
Danni Phillips
WOW ! Tant de choses à prendre en compte lorsque l'on démarre un blog. Mon blog n'a que 2 semaines. J'ai principalement utilisé WP Beginner pour configurer mon blog. Tant de bonnes informations présentées d'une manière qu'un débutant peut suivre.
Je ne sais pas si cela fonctionne pour le piratage de contenu, mais j'ai installé un plugin appelé Copyright Proof. Il désactive le clic droit afin que les gens ne puissent pas copier et coller votre contenu.
J'ai décidé d'utiliser ce plugin car c'était un plugin recommandé pour les sites d'auteurs.
Eri
votre article peut être copié facilement, croyez-moi.
Reo
Désactiver la sélection est une bonne méthode, mais elle ne prend en charge que les navigateurs Web populaires comme Chrome, Safari et Opera, mais pas IE et Edge.
Dave Coldwell
Un autre excellent article, je travaille comme journaliste indépendant, donc je vends beaucoup d'articles et c'est aux personnes qui les achètent de décider de leurs politiques.
Mais j'ai aussi quelques blogs et sites web affiliés, donc je pense que je devrais peut-être regarder ce qui se passe avec mon contenu.
Absynth
Ne pas accorder de crédit là où il est dû compte-t-il comme du « piratage de contenu » ?
Parce que Jeff Starr a écrit ce même article sur Perishable Press il y a plus de 5 ans :
Vérifiez la structure et la terminologie de votre article et comparez-les à l'original.
Je dis ça, je dis rien.
Support WPBeginner
Nous avons bien crédité Jeff Starr. Veuillez lire l'article avant de signaler des erreurs.
Admin
Absynth
Yes my apologies.. I missed that the first time through. My bad
Sieu
Je viens de développer un thème pour Blogger et ce thème a besoin d'un flux complet pour fonctionner. Je m'inquiète du scraping de contenu. Je pense que si de nombreux scrapers utilisent mon contenu sur leur site Blogger, qui a le même contenu que mon site, et que les backlinks pointent vers mon site, mon blog sera considéré comme du spam par Google et sera supprimé.
Lori
Merci pour cet article incroyable avec des conseils utiles ! J'ai en fait juste reçu une pénalité pour « contenu mince » de Google. J'ai demandé l'aide d'un expert SEO, il m'a dit d'arrêter de scraper du contenu. Il m'a envoyé un lien vers un article que j'avais écrit hier et pensait que je l'avais volé sur un autre site web. Le truc pourri, c'est qu'ils me volaient, pas seulement cet article, mais probablement quelques milliers d'articles ! Ils sont toujours dans la recherche Google, et moi non. C'est moi qui suis pénalisé ! Il s'avère qu'il y a au moins trois sites web qui scrapent mon contenu, je ne sais même pas quoi faire.
Raviraj
Article génial.
Je suis plus ou moins d'accord avec la plupart des points que vous avez abordés. En fait, quelques points sont vraiment géniaux.
Mais si votre seule activité repose sur le contenu de votre site web, ne devrions-nous pas être plus prudents face aux scrapers ?
Je ne pense pas que le vol de contenu soit jamais bon pour le propriétaire du contenu.
Je suppose que nous devrions tous penser à opter pour des mesures préventives plutôt que réactives. Vous pouvez envisager d'utiliser ShieldSquare, une solution de protection de contenu pour arrêter le scraping de contenu de manière permanente.
Andre
Je sais que c'est un vieil article, mais la seule source qui est NOTOIRE pour permettre le scraping de contenu est WordPress avec sa fonctionnalité « Press This ». Ils encouragent en fait cela.
Sara
Je pense avoir enfin trouvé la réponse à mon problème. Je pensais que quelqu'un volait mes histoires et en faisait de « nouvelles ». Je pensais que soit quelqu'un me voulait du mal, soit que je perdais la tête. Je perdais presque la tête à penser comme ça. Paranoïaque. Craignant que quelqu'un n'écoute mes appels téléphoniques privés. Alors qu'en réalité, toutes les informations proviennent directement de mon blog ! Cet article m'a peut-être sauvé la vie. Littéralement. Je ne plaisante même pas car j'avais tellement peur de devenir fou et j'essayais très sélectivement d'en parler à des amis, pour obtenir des commentaires ou du soutien, et on me regardait comme si j'étais dingue et que j'avais besoin d'aller à l'asile pour un moment. Cet article rend ce qui m'arrive tout à fait logique. Merci ! Je suis tellement soulagée.
John
Merci pour quelques conseils, mais une bonne partie de cet article n'est pas très utile. La plupart des scrapers ne sont pas des scrapers aveugles, le contenu est généralement aspiré, examiné par un œil humain, puis publié. Ce qui signifie que même en prenant une minute pour regarder un article, le spammeur est capable de publier des centaines d'articles copiés par jour. Le problème des backlinks est très facile à contourner pour les scrapers de contenu car les importateurs de flux ont des options de prétraitement et ils les règlent généralement pour supprimer les liens du corps. De plus, je ne vois pas comment transformer le rss en résumé pourrait aider, les importateurs de flux n'utilisent le rss que pour saisir le lien du nouveau contenu et à partir de là, ils suivent le squelette de votre html, que vous avez bien configuré avec des balises d'image, de titre, de lien, etc. appropriées pour la commodité de Google et extraient très facilement le contenu.
Bloquer l'adresse IP est évidemment une très bonne solution. Les DMCA sont généralement une perte de temps ; il faut du temps pour les formuler et des hôtes stupides prennent du temps pour répondre (car les spammeurs choisissent ces hôtes spécifiquement parce qu'ils sont laxistes sur les activités de type spam). De tous, Google est le plus frustrant ; peu importe le nombre de signalements que vous leur faites, ils n'agissent jamais sur aucun contenu volé sur lequel ils affichent des publicités et classent toujours le site de merde-spam bien dans les résultats de recherche, même s'il est facile pour leurs systèmes de détecter les copies
Evie
John, je ne pourrais pas être plus d'accord avec vous. Google s'est énervé contre moi en déclarant que j'étais la personne qui volait mon propre contenu. Cette personne a volé mon contenu et l'a mis sur Blogger. L'audace. Il faut une solution à cela. À ce stade, je bloque tout simplement !
L'équipe de WPBeginner
Alors peut-être que la meilleure façon pour vous est de changer la licence et d'envoyer agressivement des avis de retrait aux scrapeurs de contenu. Pendant ce temps, continuez à vous concentrer sur la création de contenu de qualité.
Philipp D
Bonjour,
Je suis tombé sur votre article en cherchant des réponses à certaines de mes préoccupations.
J'ai, avec quelques amis, lancé il y a quelques mois un site web sur le bricolage en Italie, qui fonctionne de manière inattendue, avec des classements élevés, beaucoup de trafic, etc. Cependant, le PR est encore de 0. Notre contenu a une licence Creative Commons 4.0, car nous croyons sincèrement que c'est un bon moyen de partager du contenu. CEPENDANT :
Il y a quelque temps, nous avons remarqué qu'un site PR4 avec beaucoup de trafic copiait nos meilleurs articles, renvoyant vers notre page d'accueil (ce qui n'est pas ce que l'on est censé faire avec une licence CC, mais c'est toujours acceptable). Les problèmes sont les suivants :
1. il y a beaucoup de petits sites qui raclent leur (notre) contenu et renvoient vers eux au lieu de notre site
2. le site PR4 et certains des petits sites se classent mieux que notre site
3. il y a de fortes suggestions qu'une pénalité Google sur NOTRE contenu a eu lieu, car il a un PR inférieur à la plupart des autres pages (qui sont en ligne depuis longtemps).
Nous sommes en contact avec le site PR4 et cela nous convient s'ils utilisent notre contenu, tant qu'ils créent un lien vers l'article original (c'est tout l'intérêt de la licence CC), MAIS nous essayons de trouver une solution pour éviter les pénalités Google : le rel canonical ferait-il l'affaire ? Quel est votre avis ? Devrions-nous changer notre licence et être plus agressifs envers la copie de contenu ? Merci !
Support WPBeginner
Philipp, Si vous ne l'avez pas déjà fait, vous devriez créer un compte Google Search Console pour votre site et soumettre votre sitemap. Cela vous aide à déterminer s'il y a un problème avec votre site, comment votre site se porte dans les recherches, et vous pouvez utiliser de nombreux autres outils. Cela aide également Google à mieux comprendre où certains contenus sont apparus pour la première fois.
Nous ne pensons pas que changer la licence empêchera les robots d'extraction de contenu de copier votre contenu.
Admin
Philipp
Salut ! Oui, nous avons configuré un compte Google Search Console, lié le site à notre page Google+, et la plupart des auteurs à leurs profils Google+ en utilisant les balises publisher et author. L'auteur semble fonctionner correctement dans les extraits de recherche, mais jusqu'à présent, cela ne semble pas faire une grande différence en cas de contenu copié. Les pages avec un PR plus élevé qui copient notre contenu sont toujours en tête...
Garratt
L'une des meilleures façons de ne pas être affecté par cela est de faire du ping efficacement. Le ping, et la soumission manuelle de pages à Google et Bing, font venir les robots sur votre site RAPIDEMENT. Ils indexent les pages AU PLUS VITE, puis lorsqu'ils trouvent du contenu dupliqué sur d'autres sites, ils vous considèrent comme l'autorité.
J'ai cependant le soupçon que cela pourrait avoir à voir avec le PageRank... Mais Matt Cutts (équipe webspam @ Google) a préconisé l'utilisation de pinger sur ce sujet précis. Je ne suis juste pas sûr de pouvoir lui faire confiance.
Pour ajouter plus de services, allez dans Paramètres -> Paramètres d'écriture -> Services de mise à jour -> Ouvrez le lien « Services de mise à jour » dans un nouvel onglet et copiez tous les services de mise à jour. De retour dans WordPress, collez-les dans la liste de ping et cliquez sur enregistrer.
Ouvrez un compte dans les outils Bing Webmaster pour la soumission manuelle d'URL afin d'accélérer l'indexation.
Chris Backe
J'ai récemment découvert un type qui peut prendre un flux RSS de mon blog – gardez à l'esprit que mon blog est un flux de résumé avec la ligne « Cet article a été trouvé pour la première fois sur » de Yoast. J'ai envoyé un message de remerciement au type, lui disant essentiellement qu'il me donnait des backlinks, ET disant à Google qu'il copiait mon site web (car ils peuvent regarder les horodatages pour voir lequel a été publié en premier).
Vérifié deux jours plus tard, et tout mon contenu avait mystérieusement disparu…
Personnel éditorial
Hah ouais. La plupart de ces escrocs ne sont pas très brillants lol. Heureux que vous ayez résolu le problème.
-Syed
Admin
Ian
Quelqu'un a-t-il vu ou utilisé ce plugin anti-scraping WP http://wordpress.org/plugins/wordpress-data-guards/ il semble solide mais très peu de gens l'ont téléchargé ? Je ne suis pas technique – j'apprécierais donc des avis sur sa valeur ou son impact sur le SEO
Personnel éditorial
Vous pouvez absolument utiliser ce plugin. Il bloque les clics droits, les raccourcis clavier pour copier, la liste noire d'IP, etc. Tout cela empêche le scraping manuel, cependant la plupart des scrapers de contenu utilisent des outils automatiques. Donc, aucun de ceux-ci ne serait très utile.
Admin
Ian
Merci pour votre réponse – la version pro indique qu'elle vous protège des attaques de bots, j'imagine que cela signifie les bots scrapers ? le prix me dissuade de l'installer sur tous mes sites, mais je pourrais l'utiliser sur un juste pour voir comment il fonctionne
Mark Conger
C'est l'un des meilleurs articles « pour débutants », sinon le meilleur, que j'ai jamais rencontré sur le web.
Après l'avoir lu, j'ai l'impression d'avoir eu une réunion avec un consultant en sécurité.
J'applique ces techniques tout de suite !
Merci. Je suis maintenant un follower de ce site.
Personnel éditorial
Thanks for the very kind words Mark
Admin
Neil Ferree
Cela ne m'est arrivé que quelques fois. Un blogueur extérieur aux États-Unis a pris mon article mot pour mot et l'a publié sur son site comme si c'était le sien. Comme il ne s'agissait que d'un seul article avec ma vidéo YT intégrée, je ne me suis pas trop soucié des détails, car le CTR de ma chaîne a vu une belle augmentation de visites de toute façon.
Edward B. Rockower, Ph.D.
Je veux juste dire merci, merci et merci !
Je viens de découvrir votre site aujourd'hui, j'ai lu seulement 3 articles jusqu'à présent (celui-ci inclus)... mais je suis extrêmement impressionné.
Je ne blogue que depuis 5 semaines, mais je trouve ça addictif, surtout en voyant le trafic croissant et l'engagement des utilisateurs grâce à mes efforts. Voir 100 visiteurs sur mon blog en une journée, et pouvoir voir qui les réfère, me motive à apprendre tout ce que je peux pour augmenter le marketing sur les réseaux sociaux et les interactions avec les nouveaux visiteurs.
Cordialement,
@earthlingEd
Debbie Gilbert
J'adore votre site et j'ai été sidéré d'apprendre le scraping de contenu ! Y a-t-il un moyen de créer une sorte de filigrane qui ne soit pas distrayant pour vos lecteurs, mais qui soit évident sur le site du scraper ?
Personnel éditorial
Vous pouvez faire de la protection contre le hotlinking entre autres choses pour désactiver les images sur les domaines qui ne sont pas sur liste blanche.
Admin
Usman
Est-il légal de publier l'article complet d'un autre site web et d'indiquer le nom du site source en bas de l'article ?
Personnel éditorial
Non.
Admin
Usman
Et si nous mettons un lien direct vers l'article en bas ?
Dan
Ce n'est toujours pas bien, à moins que le propriétaire ne l'approuve
Abdul Karim
Y a-t-il un moyen / plugin
quelqu'un copie ma photo de blog de mode et la publie sur son forum
mais quand je clique sur l'image sur ce forum. elle s'ouvre dans une nouvelle fenêtre
je veux un plugin ou un script qui, s'il copie mes images, lorsque quelqu'un clique sur ces images, cette personne est redirigée vers mon article de blog lié à ces images ?
un plugin déjà ? lien avec les images de l'article ?
Personnel éditorial
Aucun que nous connaissions.
Admin
Abdul Karim
Je l'ai fait, il suffit de changer
quand quelqu'un télécharge une image, le lien URL s'affiche sur le côté droit
le réglage par défaut est le fichier multimédia
vous devez le changer dans l'url de la pièce jointe
puis c'est fait !
quand quelqu'un copie les images de votre blog, cela crée un backlink vers votre page publiée
Anton
Si quelqu'un prend un article écrit en anglais et le traduit, en utilisant sa tête et pas Google Translate, dans une autre langue, disons parce que la majorité des gens dans le pays de cette autre langue ne comprennent pas l'anglais. Les mettriez-vous quand même en cause comme des scrapeurs ? Ou quelle est votre opinion à ce sujet ?
Pour moi personnellement, je ne trouve pas cela extrêmement problématique, bien sûr, je crois que l'« auteur » devrait renvoyer vers l'article original tout en précisant que son article est traduit.
Personnel éditorial
Sauf si vous avez l'autorisation écrite de l'auteur, alors c'est techniquement du scraping.
Admin
Greg
C'est un article formidable. Après l'avoir lu, j'espère que vous ne me considérez pas comme un scrapeur de contenu. J'ai utilisé des extraits de votre article (curation), j'ai toujours le lien « Lire l'article complet » et j'ai votre lien de page, et beaucoup de mes articles sont tweetés et j'inclus votre compte Twitter. Si vous ne le souhaitez pas, faites-le moi savoir et je le supprimerai volontiers. J'apprécie énormément votre travail et je souhaite le partager avec mes visiteurs. Mon intention n'est pas de voler vos visiteurs mais de pouvoir offrir une bonne valeur aux miens et de les envoyer vers vous pour en savoir plus.
Personnel éditorial
Greg, tant que vous n'affichez qu'un extrait et que vous envoyez l'utilisateur sur notre site pour lire l'article complet, ce n'est pas du scraping. Comme vous l'avez dit, c'est de la curation. Des tonnes de sites populaires font cela (c'est-à-dire reddit, digg, etc.).
Admin
ryan
Mon site contient beaucoup d'articles de sécurité originaux et quelques-uns ont été copiés. Le site qui m'a copié était dans Yahoo! News avec mon article et les gens commentaient dessus. J'ai géré le problème en commentant et en disant que j'étais l'auteur original et j'ai répondu à quelques commentaires. J'avais des liens internes, c'est comme ça que j'ai découvert si rapidement. Une astuce sur laquelle je vais écrire est de faire apparaître une bannière ou une image aux personnes qui viennent d'un site de scraping, leur disant ce qui s'est passé. La suggestion de requête sans fin semble illégale en vertu de la loi sur la fraude et les abus informatiques. Je ne suis pas avocat. J'écris seulement sur la sécurité, donc je dois connaître les lois sur la sécurité informatique.
Je n'aime pas que votre formulaire n'ait pas accepté l'e-mail de mon entreprise comme un e-mail valide.
Personnel éditorial
Désolé Ryan que notre formulaire n'ait pas approuvé votre e-mail professionnel. Je ne suis pas sûr de ce qui s'est passé, mais il est censé approuver tous les e-mails valides.
Admin
andre
comment utiliser ce code, pouvez-vous fournir plus de détails ou de tutoriels, merci
RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://dummyfeed.com/feed [R,L]
Personnel éditorial
Vous devrez modifier le fichier .htaccess.
Admin
Ali Rashid
belle et informative rédaction, j'aime votre approche de tirer parti des scrapers, cependant bloquer une IP peut ne pas toujours fonctionner ; un scraper sérieux utiliserait souvent une liste de proxys anonymes ou gratuits, dans ce cas, la mise sur liste noire d'une IP pourrait ne pas être une solution efficace car le scraper la changerait souvent. Une solution consiste à écrire un petit script qui détectera tout trafic anormal d'une IP donnée, disons plus de 20 requêtes/seconde et le défiera avec un captcha si aucune réponse, mettez l'IP sur une liste noire temporaire pendant environ 30 minutes. vous pouvez le renforcer avec un autre javascript qui détecte les mouvements de souris, tactiles ou de clavier après quelques requêtes, si aucun clavier, souris ou toucher n'est détecté, vous pouvez à nouveau mettre le scraper sur la liste noire temporaire, cela a fonctionné à merveille pour nous.
Arihant
Vos solutions sont suffisantes pour les scrapeurs de contenu.
Mais qu'en est-il si les gens copient et collent manuellement du contenu sur leurs pages Facebook.
Nous avons implémenté tynt mais ils suppriment le lien vers l'article original, avez-vous des idées sur la façon dont vous pouvez gérer ce genre de situation.
Personnel éditorial
Si les gens veulent vraiment voler votre contenu, vous ne pouvez rien y faire. C'est une triste vérité, mais c'est la vérité.
Admin
Garratt
En fait, il existe un plugin créé par IMWealth Builders, probablement le seul de leurs plugins que j'aime, le reste est assez médiocre et implique le scraping de sites Ecommerce (CB, Azon, CJ etc) pour des commissions d'affiliation.
Il s'appelle "Covert Copy Traffic" et permet en fait de définir n'importe quel texte avant ou après un nombre défini de mots. Donc, disons que je le règle pour poster "Ce contenu a été tiré de xxxxxxx.com" après 18 mots. Ensuite, chaque fois que quelqu'un copiait/collait plus de 18 mots du site Web, il ajouterait ce texte en bas, 17 mots ou moins, il ne ferait rien.
Ce n'étaient que des exemples de paramètres. Plugin assez utile, fonctionne à merveille. J'ai essayé à peu près toutes les méthodes que j'ai pu imaginer pour contourner l'insertion de texte, mais cela semble impossible. Le plugin est trop solide.
Personnel éditorial
On dirait que vous décrivez ce tutoriel ici :
https://www.wpbeginner.com/wp-tutorials/how-to-add-a-read-more-link-to-copied-text-in-wordpress/
Garratt
Oui, c'est exact. Vous pouvez simplement utiliser ce script pour dire "Le contenu provient de votre site Web.com" plutôt que "Lire la suite".
Jennae Barker
Est-il vrai que leurs programmes Amazon etc sont des scrapers – si c'est le cas – j'ai fait une énorme erreur sur un achat chez eux – heureusement, je ne l'ai pas encore utilisé.
Garratt
Oui Jennae, c'est légal dans le sens où Amazon vous permet de copier du contenu de leurs pages. Cela aide leurs ventes, les affiliés sont la raison pour laquelle Amazon est Amazon.
Cependant, Google et les autres moteurs de recherche (qui comptent) le considèrent simplement comme un "site d'affiliation mince" en l'absence de contenu original. Par conséquent, ils ne se classent pas à moins qu'il y ait un certain pourcentage de contenu original sur le site également.
Un scraper, n'est rien de plus qu'une araignée/un robot d'exploration, généralement il fonctionne en mode socket, cependant certains fonctionnent dans un navigateur.
Ce n'est pas parce que quelque chose est étiqueté comme un scraper que c'est forcément mauvais. J'utilise régulièrement des scrapers et des spiders pour vérifier mon site à la recherche de liens non naturels, j'en vérifie d'autres pour l'analyse de la concurrence, la recherche de mots-clés et une variété d'autres tâches qui ne nuisent à personne, mais qui me sont bénéfiques.
Cependant, je n'aime pas et je ne cautionne personne qui scrape dans le but de violer le droit d'auteur. C'est de cela dont il est vraiment question dans cette discussion.
Google utilise le spider « Google Bot » pour indexer le web, ainsi que des centaines d'autres moteurs de recherche. Il y a des milliers, des centaines de milliers de spiders qui parcourent le web à diverses fins. Google scrape également les sites web pour les « mettre en cache ». Tout comme le font de nombreux services importants dont nous avons besoin, tels que les archives historiques du web.
Troy
Je m'apprête à rechercher activement les sites qui copient mon contenu et à le faire supprimer. Je sais que cela a un impact sur le classement de mon site, je dois donc faire quelque chose. Avez-vous une idée de la quantité de contenu qui doit être copiée avant de pouvoir envoyer des avis DMCA ? Un paragraphe dans un article suffit-il légalement pour pouvoir le qualifier de plagiat ?
Personnel éditorial
Nous ne sommes pas des experts juridiques ici, nous nous abstenons donc de donner des conseils juridiques sur ce site.
Admin
Dallas
Vous omettez de mentionner que tout autoblogger qui se respecte retirera les liens et insérera ses propres liens d'affiliation plutôt que d'utiliser votre contenu tel quel, de sorte que votre approche pour obtenir des liens d'eux échouera généralement.
Personnel éditorial
Existe-t-il un autoblogger qui se respecte ? S'ils avaient un minimum de respect pour eux-mêmes, ils écriraient du contenu original.
Admin
David Halver
D'accord ! Il existe un « endroit chaud » très spécial près du centre de la Terre pour les spammeurs, les scrapeurs et les blogueurs automatiques…
TrèsCréatif
Je pense que la meilleure idée est d'inclure des liens d'affiliation.
Après la dernière mise à jour de Penguin, mon site web a été pénalisé. J'ai commencé à l'analyser et j'ai découvert que de nombreux autres sites copiaient mon contenu. Je ne sais pas pourquoi, mais ces sites se classent mieux que moi dans les moteurs de recherche, en utilisant mon contenu.
Personnel éditorial
Pas seulement des liens d'affiliation. Incluez autant de liens internes que possible. Parce que si ces sites renvoient vers vos autres pages, alors Google SAURA que vous êtes le site d'autorité.
Admin
Bayer
Bonjour l'équipe wpbeginner.com. J'apprécie vraiment cet article, mais j'ai une question concernant les liens internes dans vos pages/articles.
Je suppose que vous voulez dire des liens « absolus » ?? Sinon, cela pourrait ne pas fonctionner en votre faveur, une fois que le contenu a été récupéré… Eh bien, jusqu'à présent, j'ai toujours utilisé des liens relatifs, comme vous le faites, je suppose. Quelle est la meilleure méthode ? Merci !
Personnel éditorial
Nous utilisons toujours des liens absolus car cela permet que les choses fonctionnent sans problème.
Gautam Doddamani
tout d'abord votre tutoriel est tout simplement fantastique..chapeau bas ! juste un doute comment savoir si un site est un site de scraping ? j'ai utilisé votre méthode et j'ai découvert que Google Webmaster Tools signale 262 liens vers mon site et il y a beaucoup de sites qui ne le savent pas… donc je suis dans la confusion….comment vérifier si un site est un site de scraping ou un site d'autorité ?? existe-t-il un outil pour cela ? merci d'avance !
Personnel éditorial
Faites-moi confiance, aucun site d'autorité ne volera jamais votre article mot pour mot.
Admin
Gautam Doddamani
oui c'est vrai… mais que faire si je ne veux pas trouver mon article sur ces sites de scraping… je sais que mon article est là car il est signalé par GWT et je veux juste bloquer cette adresse IP en insérant ces règles rewritecond dans le fichier htaccess… je ne veux pas perdre mon temps à chercher ces mauvais sites pour mon article ou à leur demander de retirer mon article.
Nathan
Merci pour cet article – et pour votre site en général ! Je l'aime tellement que je me demandais comment je garderais une trace de cette ressource. Et maintenant, je vois les options d'abonnement ci-dessous. Quelle façon d'obtenir un commentaire !
Yeasin
Empêcher le scraping de contenu est presque impossible. Je ne pense pas que le scrapers de contenu me nuise d'une manière ou d'une autre. Ils me donnent juste un vote parce que j'ai du contenu de haute qualité. Google est assez intelligent pour détecter les éditeurs originaux. Personne ne devrait s'inquiéter.
mrwindowsx
vraiment informatif, si vous utilisez cloudflare, il y a de nouvelles applications appelées ScrapeShield, et vous pouvez facilement protéger et suivre/surveiller le contenu de votre site gratuitement.
wpbeginner
@mrwindowsx Oh, je ne savais pas. Merci de l'avoir signalé.
Gautam Doddamani
wow c'est super mec… utilises-tu cloudflare ? je voulais juste ton avis car je n'ai jamais utilisé ce service cdn… je sais qu'il est gratuit et tout mais je pense que le temps de chargement de mon site est déjà super que je n'en avais pas besoin… maintenant que scrapeshield est là, je pense que je vais absolument vérifier… quelles autres applications aurons-nous si nous commençons à utiliser cloudflare ?? merci
Matt
Bonjour,
IMO @cloudflare est vraiment génial. J'ai deux sites dessus (le mien et le blog de ma femme) et c'est vraiment incroyablement rapide, sans parler de toute la sécurité, de l'analyse du trafic, du support d'applications (installations automatiques d'applications) qu'ils fournissent.
Je sais que toutes les configurations d'hébergement sont différentes, mais j'ai nos deux sites sur le Media Temple (gs)Grid Service. Je peux honnêtement dire que nos sites fonctionnent plus rapidement maintenant qu'ils ne le faisaient lorsque j'utilisais W3 Total Cache et Amazon S3 comme mon CDN. En fait, j'utilise toujours W3TC sur mon site pour minimiser et mettre en cache mon contenu, mais j'utilise CloudFlare pour les services CDN, DNS et de sécurité.
Je recommande vivement… En fait, j'apprécierais vraiment si quelqu'un de WPBeginner nous donnait son opinion approfondie et expérimentée sur les services CloudFlare. Pour moi, ils ont été géniaux !
shivabeach
Vous pouvez également obtenir un plugin dont le nom m'échappe pour le moment qui fait la recherche Google pour vous. Il ajoute également un code à votre flux RSS que l'application recherche.
MuhammadWaqas
Excellent article, je sais qu'il y a beaucoup d'autoblogs qui récupèrent mon contenu. Bien qu'après la mise à jour Penguin, mon site reçoive 3 fois plus de trafic de Google qu'avant. Mais après avoir lu de nombreux désastres ou générateurs de contenu original, je m'inquiète des futures pénalités de Google.
Mon expérience est que généralement Google respecte les sites à PR élevé avec de bons backlinks d'autorité. mais le site n'a qu'un an et le PR est inférieur à 5.
J'essaie de contacter les scrappers mais la plupart n'ont pas de formulaires de contact. donc je pense que j'essaierai cette méthode htaccess pour bloquer les adresses IP des scrappers. Mais d'un autre côté, certains d'entre eux peuvent utiliser feedburner.
Garratt
Personnellement, je ne m'embête pas avec le RSS car la plupart des utilisateurs ne l'utilisent pas. Fournissez plutôt un flux de newsletter. Cela fait la même chose + vous obtenez des e-mails pour faire du marketing (si fait correctement). La majorité des gens sont plus susceptibles de s'abonner à un blog plutôt que de mettre un flux RSS en favori, d'après mon expérience. Il est donc préférable de désactiver le RSS. Vous pouvez le faire en utilisant WordPress SEO by Yoast, et divers autres plugins.
Ensuite, si vous mettez également en œuvre les stratégies mentionnées ci-dessus, vous devriez être bon. Supprimez tous les en-têtes inutiles RSD WLM etc.
Il y en aura quelques-uns capables de scraper efficacement, mais ces astuces en diminueront un grand nombre.