WPBeginner»Blog»Beginners Guide»Beginner’s Guide to Preventing Blog Content Scraping in WordPress

Guide du débutant pour empêcher le scraping de contenu de blog dans WordPress

Q: Qu'est-ce que le scraping de contenu de blog dans WordPress ?

Blog content scraping is when content is taken from numerous sources and republished on another site. Usually, this is done automatically via your blog’s RSS feed. Unfortunately, it is very easy and very common to have your WordPress blog content stolen in this way. If it has happened to you, then you understand how stressful and frustrating it can be. Sometimes, your content will be simply copied and pasted directly to another website, including your formatting, images, videos, and more. Other times, your content will be reposted with attribution and a link back to your website, but without your permission. Although this can help your SEO, you may want to keep your original content hosted on your site only.

Q: Pourquoi les scrapeurs de contenu volent-ils du contenu ?

Some of our users have asked us why scrapers are stealing content. Usually, the main motivation for content theft is to profit from your hard work: Affiliate commission: Dishonest affiliate marketers may use your content to bring traffic to their site through search engines in order to promote their niche products. Lead Generation: Lawyers and realtors may pay someone to add content and gain authority in their community and not realize it is being scraped from other sources. Advertising Revenue: Blog owners may scrape content to create a hub of knowledge in a certain niche ‘for the good of the community’ and then plaster the site with ads.

Q: Est-il possible d'empêcher complètement le scraping de contenu ?

In this article, we will show you some steps you can take to reduce and prevent content scraping. But unfortunately, there is no way to completely stop a determined thief. That’s why we finished this article with a section on how you can take advantage of content scrapers. While you can’t always stop a thief, you may be able to gain some traffic and revenue through the content they have stolen from you.

Q: Que faire lorsque vous découvrez que quelqu'un a extrait votre contenu ?

Since it’s not possible to completely stop scrapers, you may one day discover that someone is using content they stole from your blog. You may wonder what to do when that happens. Here are a few approaches that people take when dealing with content scrapers: Do Nothing: You can spend a lot of time fighting scrapers, so some popular bloggers decide to do nothing. Google already sees well-known sites as authorities, but that’s not true of smaller sites. So this approach is not always the best, in our opinion. Take Down: You can contact the scraper and ask them to take the content down. If they refuse, then you submit a takedown notice. You can learn how in our guide on how to easily find and remove stolen content in WordPress. Take Advantage: While we actively work at having content scraped from WPBeginner taken down, we also use a few techniques to get traffic and make money from scrapers. You can learn how in the ‘Take Advantage of Content Scrapers’ section below.

Par le personnel de la rédaction | 16 août 2024 | Divulgation aux lecteurs

Shares 402 Share ChatGPT Perplexity LinkedIn WhatsApp Email

Imaginez travailler dur pour écrire une excellente histoire ou un excellent article, pour ensuite découvrir que quelqu'un d'autre s'en attribue le mérite. C'est ce qui arrive lorsque des personnes volent le contenu de votre site web.

Le vol de contenu, ou « scraping », est un problème majeur pour les propriétaires de sites web. Ces personnes sont des voleurs qui copient votre travail, l'utilisent sur leurs propres sites, et prétendent parfois même que c'est le leur. Cela peut être vraiment frustrant et injuste.

Dans cet article, nous allons aborder ce qu'est le scraping de contenu de blog, comment vous pouvez réduire et prévenir le scraping de contenu, et même comment tirer parti des scrapers de contenu à votre avantage.

Guide du débutant pour prévenir le scraping de contenu de blog dans WordPress

Qu'est-ce que le scraping de contenu de blog dans WordPress ?

Le scraping de contenu de blog se produit lorsque du contenu est extrait de nombreuses sources et republié sur un autre site. Généralement, cela se fait automatiquement via le flux RSS de votre blog.

Malheureusement, il est très facile et très courant que le contenu de votre blog WordPress soit volé de cette manière. Si cela vous est arrivé, vous comprenez à quel point cela peut être stressant et frustrant.

Parfois, votre contenu sera simplement copié et collé directement sur un autre site web, y compris votre mise en forme, vos images, vos vidéos, et plus encore.

D'autres fois, votre contenu sera republié avec attribution et un lien vers votre site Web, mais sans votre permission. Bien que cela puisse aider votre SEO, vous voudrez peut-être que votre contenu original soit hébergé uniquement sur votre site.

Pourquoi les scrapeurs de contenu volent-ils du contenu ?

Certains de nos utilisateurs nous ont demandé pourquoi les scrapeurs volent du contenu. Habituellement, la principale motivation du vol de contenu est de profiter de votre travail acharné :

Commission d'affiliation : Les spécialistes du marketing d'affiliation malhonnêtes peuvent utiliser votre contenu pour attirer du trafic vers leur site par le biais des moteurs de recherche afin de promouvoir leurs produits de niche.
Génération de prospects : Les avocats et les agents immobiliers peuvent payer quelqu'un pour ajouter du contenu et gagner en autorité dans leur communauté sans se rendre compte qu'il est extrait d'autres sources.
Revenus publicitaires : Les propriétaires de blogs peuvent extraire du contenu pour créer un centre de connaissances dans une certaine niche « pour le bien de la communauté » et ensuite inonder le site de publicités.

Est-il possible d'empêcher complètement le scraping de contenu ?

Dans cet article, nous vous montrerons quelques étapes que vous pouvez suivre pour réduire et prévenir le scraping de contenu. Mais malheureusement, il n'y a aucun moyen d'arrêter complètement un voleur déterminé.

C'est pourquoi nous avons terminé cet article par une section sur la façon dont vous pouvez tirer parti des scrapeurs de contenu. Bien que vous ne puissiez pas toujours arrêter un voleur, vous pourriez être en mesure de générer du trafic et des revenus grâce au contenu qu'ils vous ont volé.

Que faire lorsque vous découvrez que quelqu'un a extrait votre contenu ?

Comme il n'est pas possible d'arrêter complètement les scrapeurs, vous pourriez un jour découvrir que quelqu'un utilise le contenu qu'il a volé sur votre blog. Vous pourriez vous demander quoi faire lorsque cela se produit.

Voici quelques approches que les gens adoptent lorsqu'ils traitent avec des scrapeurs de contenu :

Ne rien faire : Vous pouvez passer beaucoup de temps à combattre les scrapeurs, donc certains blogueurs populaires décident de ne rien faire. Google considère déjà les sites bien connus comme des autorités, mais ce n'est pas vrai pour les petits sites. Donc, cette approche n'est pas toujours la meilleure, à notre avis.
Retrait : Vous pouvez contacter le scraper et lui demander de retirer le contenu. S'il refuse, vous soumettez une demande de retrait. Vous pouvez apprendre comment faire dans notre guide sur comment trouver et supprimer facilement du contenu volé dans WordPress.
Tirer parti : Bien que nous travaillions activement à faire retirer le contenu copié de WPBeginner, nous utilisons également quelques techniques pour générer du trafic et gagner de l'argent grâce aux scrapers. Vous pouvez apprendre comment faire dans la section « Tirer parti des scrapers de contenu » ci-dessous.

Cela étant dit, examinons comment empêcher le scraping de blog dans WordPress. Comme il s'agit d'un guide complet, nous avons inclus une table des matières pour faciliter la navigation :

Protégez par copyright ou marque le nom et le logo de votre blog
Rendez votre flux RSS plus difficile à scraper
Désactiver les trackbacks et les pingbacks
Bloquer l'accès du scraper à votre site WordPress
Empêcher le vol d'images dans WordPress
Découragez la copie manuelle de votre contenu
Profitez des grattoirs de contenu

1. Déposez une marque ou un droit d'auteur sur le nom et le logo de votre blog

Les lois sur les marques et les droits d'auteur protègent votre propriété intellectuelle, votre marque et votre entreprise contre de nombreux litiges. Cela inclut le plagiat et l'utilisation illégale de votre matériel protégé par droit d'auteur ou du nom et logo de votre marque.

Vous devriez afficher clairement un avis de droit d'auteur sur votre site. Bien que le contenu de votre site Web soit automatiquement couvert par les lois sur les droits d'auteur, l'affichage d'un avis indiquera que votre contenu est protégé par droit d'auteur et que les tiers ne peuvent pas utiliser vos propriétés protégées à des fins commerciales.

Afficher un avis de droit d'auteur sur votre site web

Par exemple, vous pouvez ajouter un avis de droit d'auteur avec une date dynamique au pied de page de votre WordPress. Cela maintiendra votre avis de droit d'auteur à jour.

Cela peut décourager certains utilisateurs de le voler. Cela vous aidera également dans le cas où vous auriez besoin d'envoyer une lettre de mise en demeure ou de déposer une plainte DCMA pour faire retirer votre contenu volé.

Vous pouvez également demander l'enregistrement du droit d'auteur en ligne. Ce processus peut être compliqué, mais heureusement, il existe des services juridiques peu coûteux qui peuvent aider les petites entreprises et les particuliers.

Apprenez comment faire dans notre guide sur comment déposer une marque et protéger par droit d'auteur le nom et le logo de votre blog.

2. Rendez votre flux RSS plus difficile à gratter

Étant donné que le scraping de contenu de blog se fait généralement automatiquement via le flux RSS de votre blog, examinons quelques modifications utiles que vous pouvez apporter à votre flux.

N'incluez pas le contenu complet de l'article dans votre flux RSS WordPress

Vous pouvez inclure uniquement un résumé de chaque article dans votre flux RSS au lieu du contenu complet. Cela inclut un extrait ainsi que des métadonnées de l'article telles que la date, l'auteur et la catégorie.

Il y a certainement un débat dans la communauté des blogueurs sur la question de savoir s'il faut avoir des flux RSS complets ou des flux de résumé. Nous n'allons pas entrer dans ce débat maintenant, sauf pour dire que l'un des avantages d'avoir seulement un résumé est qu'il aide à prévenir le vol de contenu.

Vous pouvez modifier les paramètres en allant dans Paramètres » Lecture dans votre panneau d'administration WordPress. Vous devez sélectionner l'option 'Extrait' puis cliquer sur le bouton 'Enregistrer les modifications'.

Les flux RSS peuvent contenir le texte intégral ou un extrait de chaque article

Désormais, le flux RSS n'affichera qu'un extrait de votre article. Si quelqu'un vole votre contenu via votre flux RSS, il n'obtiendra que le résumé, pas l'article complet.

Si vous souhaitez ajuster le résumé, vous pouvez consulter notre guide sur comment personnaliser les extraits WordPress.

Optimisez votre flux RSS pour empêcher le vol de contenu

Il existe d'autres moyens d'optimiser votre flux RSS WordPress pour protéger votre contenu, obtenir plus de backlinks, augmenter votre trafic Web, et plus encore. L'une des meilleures façons est de retarder l'apparition des articles dans le flux RSS.

L'avantage est que lorsque vous retardez l'apparition des articles dans votre flux RSS, vous donnez aux moteurs de recherche le temps d'explorer et d'indexer votre contenu avant qu'il n'apparaisse ailleurs, par exemple sur les sites web des voleurs de contenu. Les moteurs de recherche considéreront alors votre site comme faisant autorité.

La façon la plus sûre et la plus simple de le faire est d'utiliser WPCode car il dispose d'une recette qui ajoute automatiquement le code personnalisé correct à WordPress.

Pour des instructions détaillées, consultez notre guide sur comment retarder l'apparition des articles dans votre flux RSS WordPress.

3. Désactiver les trackbacks, les pingbacks et l'API REST

Aux débuts du blogging, les trackbacks et pingbacks ont été introduits comme un moyen pour les blogs de s'informer mutuellement des liens. Lorsque quelqu'un crée un lien vers un article de votre blog, son site Web vous envoie automatiquement un ping.

Ce pingback apparaîtra alors dans la file d'attente de modération des commentaires de votre blog avec un lien vers leur site Web. Si vous l'approuvez, ils obtiennent un backlink et une mention de votre site.

Cela donne au spammeur une incitation à parcourir votre site et à envoyer des trackbacks. Heureusement, vous pouvez désactiver les trackbacks et les pingbacks pour donner aux scrapers une raison de moins de voler votre contenu.

Désactiver les trackbacks et pingbacks dans WordPress

Pour plus d'informations, consultez notre guide sur la désactivation des trackbacks sur tous les futurs articles. Vous pourriez également aimer apprendre comment désactiver les trackbacks et les pings sur les articles WordPress existants.

Désactiver l'API REST de WordPress

Outre les trackbacks et les pingbacks, nous vous recommandons également de désactiver l'API REST de WordPress, car elle peut faciliter le parcours de votre contenu par les spammeurs.

Nous avons un guide détaillé sur comment vous pouvez désactiver l'API REST de WordPress.

Tout ce que vous avez à faire est d'installer et d'activer le plugin gratuit WPCode et d'utiliser leur extrait prédéfini pour désactiver l'API REST.

4. Bloquez l'accès du scraper à votre site WordPress

Une façon d'empêcher les scrapers de voler votre contenu est de leur retirer l'accès à votre site Web. Vous pouvez le faire manuellement en bloquant leur adresse IP, mais la plupart des utilisateurs trouveront plus facile d'utiliser un plugin de sécurité tel qu'un pare-feu d'application Web.

Bloquez le scraper à l'aide d'un plugin de sécurité (recommandé)

Bloquer les scrapers manuellement est délicat et demande beaucoup de travail. D'autant plus que de nombreuses tentatives de piratage et attaques sont effectuées à l'aide d'un large éventail d'adresses IP aléatoires du monde entier. Il est presque impossible de suivre toutes ces adresses IP aléatoires.

C'est pourquoi vous avez besoin d'un pare-feu d'application Web (WAF) tel que Wordfence ou Securi. Ceux-ci agissent comme un bouclier entre votre site Web et tout le trafic entrant en surveillant le trafic de votre site Web et en bloquant les menaces de sécurité courantes avant qu'elles n'atteignent votre site WordPress.

Pour le site Web WPBeginner, nous utilisons Sucuri. C'est un service de sécurité de site Web qui protège votre site Web contre de telles attaques à l'aide d'un pare-feu d'application Web.

Fondamentalement, tout le trafic de votre site Web passe par les serveurs du service de sécurité, où il est examiné pour déceler toute activité suspecte. Ils bloquent automatiquement les adresses IP suspectes pour qu'elles n'atteignent pas votre site Web. Voyez comment Sucuri nous a aidés à bloquer 450 000 attaques WordPress en 3 mois.

Bloquer ou rediriger manuellement l'adresse IP du scraper

Les utilisateurs avancés peuvent également souhaiter bloquer manuellement l'adresse IP d'un scraper. Cela demande plus de travail, mais vous pouvez cibler spécifiquement l'adresse du scraper une fois que vous l'avez identifiée. Le développeur web Jeff Star suggère cette approche lorsqu'il écrit sur la façon dont il gère les scrapers de contenu.

Remarque : L'ajout de code aux fichiers du site web peut être dangereux. Même une petite erreur peut causer des problèmes majeurs sur votre site. C'est pourquoi nous recommandons cette méthode uniquement aux utilisateurs avancés.

Vous pouvez trouver l'adresse IP du scraper en visitant les « journaux d'accès bruts » dans le tableau de bord cPanel de votre compte d'hébergement Web. Vous devez rechercher les adresses IP avec un nombre de requêtes inhabituellement élevé et en garder une trace, par exemple en les copiant dans un fichier texte séparé.

Astuce : Vous devez vous assurer de ne pas vous bloquer vous-même, les utilisateurs légitimes ou les moteurs de recherche de l'accès à votre site Web. Copiez une adresse IP suspecte et utilisez des outils de recherche d'IP en ligne pour en savoir plus à son sujet.

Une fois que vous êtes convaincu que l'adresse IP appartient à un scraper, vous pouvez la bloquer à l'aide de l'outil « Bloqueur d'IP » de cPanel ou en ajoutant un code comme celui-ci dans le fichier racine de votre .htaccess :

Deny from 123.456.789

Assurez-vous de remplacer l'adresse IP dans le code par celle que vous souhaitez bloquer. Vous pouvez bloquer plusieurs adresses IP en les saisissant sur la même ligne, séparées par des espaces.

Pour des instructions détaillées, consultez notre guide sur comment bloquer les adresses IP dans WordPress.

Au lieu de simplement bloquer les scrapers, Jeff suggère de leur envoyer des flux RSS factices à la place. Vous pourriez créer des flux remplis de Lorem Ipsum et d'images ennuyeuses ou même les renvoyer vers leur propre site web, provoquant une boucle infinie et faisant planter leur serveur.

Pour les rediriger vers un flux factice, vous devrez ajouter un code comme celui-ci à votre fichier .htaccess :

RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://dummyfeed.com/feed [R,L]

5. Empêcher le vol d'images dans WordPress

Ce ne sont pas seulement votre contenu écrit que vous devez protéger. Vous devriez également empêcher le vol d'images dans WordPress.

Comme pour le texte, il n'y a aucun moyen d'empêcher complètement les gens de voler vos images, mais il existe de nombreuses façons de décourager le vol d'images sur un site WordPress.

Par exemple, vous pouvez désactiver le hotlinking de vos images WordPress. Cela signifie que si quelqu'un scrape votre contenu HTML, ses images ne se chargeront pas sur son site.

Cela réduira également la charge de votre serveur et l'utilisation de la bande passante, améliorant la vitesse et les performances de votre WordPress.

Alternativement, vous pouvez ajouter un filigrane à vos images qui vous donne le crédit. Cela indiquera clairement que le récupérateur a volé votre contenu.

Vous pouvez apprendre ces deux techniques, ainsi que d'autres moyens de protéger vos images, dans notre guide sur les moyens d'empêcher le vol d'images dans WordPress.

6. Décourager la copie manuelle de votre contenu

Bien que la plupart des récupérateurs utilisent des outils automatiques, certains voleurs de contenu peuvent essayer de copier manuellement tout ou partie de votre contenu.

Une façon de rendre cela plus difficile est de les empêcher de copier et coller votre texte. Vous pouvez y parvenir en rendant plus difficile la sélection du texte sur votre site Web.

Pour apprendre à arrêter la copie manuelle de votre contenu, consultez notre guide étape par étape sur comment empêcher la sélection et la copie/coller de texte dans WordPress.

Cependant, cela ne protégera pas complètement votre contenu. N'oubliez pas que les utilisateurs avertis en technologie peuvent toujours afficher le code source ou utiliser l'outil d'inspection pour copier tout ce qu'ils veulent. De plus, cette méthode ne fonctionnera pas avec tous les navigateurs Web.

De plus, gardez à l'esprit que tout le monde qui copie votre texte ne sera pas un voleur de contenu. Par exemple, certaines personnes peuvent vouloir copier le titre pour partager votre article sur les réseaux sociaux.

C'est pourquoi nous vous recommandons de n'utiliser cette méthode que si vous estimez qu'elle est vraiment nécessaire pour votre site.

7. Profitez des grattoirs de contenu

À mesure que votre blog s'agrandit, il devient presque impossible d'arrêter ou de suivre tous les scrapeurs de contenu. Nous envoyons toujours des plaintes DMCA. Cependant, nous savons qu'il existe des tonnes d'autres sites qui volent notre contenu et que nous ne pouvons tout simplement pas suivre.

Au lieu de cela, notre approche consiste à essayer de tirer parti des scrapeurs de contenu. Ce n'est pas si mal quand vous voyez que vous gagnez de l'argent grâce à votre contenu volé ou que vous recevez beaucoup de trafic d'un site Web de scrapeur.

Prenez l'habitude de créer des liens internes pour obtenir du trafic et des backlinks des scrapeurs

Dans notre guide ultime sur le SEO, nous vous recommandons de faire de l'interne-linking une habitude. En plaçant des liens vers votre autre contenu dans vos articles de blog, vous pouvez augmenter le nombre de pages vues et réduire le taux de rebond sur votre propre site.

Mais il y a un deuxième avantage en matière de scraping. Les liens internes vous obtiendront de précieux backlinks de la part des personnes qui volent votre contenu. Les moteurs de recherche comme Google utilisent les backlinks comme signal de classement, donc les backlinks supplémentaires sont bons pour votre SEO.

Enfin, ces liens internes vous permettent de voler l'audience du scraper. Les blogueurs talentueux placent des liens sur des mots-clés intéressants, ce qui rend tentant pour les utilisateurs de cliquer. Les visiteurs du site Web du scraper cliqueront également sur les liens, ce qui les ramènera directement sur votre propre site Web.

Liez automatiquement les mots-clés avec des liens d'affiliation pour gagner de l'argent grâce aux scrapeurs

Si vous gagnez de l'argent sur votre site Web grâce au marketing d'affiliation, nous vous recommandons d'activer l'auto-lien dans vos flux RSS. Cela vous aidera à maximiser vos revenus auprès des lecteurs qui ne lisent votre site Web que via les lecteurs RSS.

Mieux encore, cela vous aidera à gagner de l'argent sur les sites qui volent votre contenu.

Utilisez simplement un plugin WordPress comme ThirstyAffiliates qui remplacera automatiquement les mots-clés assignés par des liens d'affiliation. Nous vous montrons comment faire dans notre guide sur comment lier automatiquement les mots-clés avec des liens d'affiliation dans WordPress.

Promouvoir votre site Web dans le pied de page de votre flux RSS

Vous pouvez utiliser le plugin All in One SEO pour ajouter des éléments personnalisés à votre pied de page RSS.

Par exemple, vous pouvez ajouter une bannière qui promeut vos propres produits, services ou contenu.

Pied de page du flux RSS AIOSEO enregistrer

Le meilleur, c'est que ces bannières apparaîtront également sur le site Web du pirate.

Dans notre cas, nous ajoutons toujours une petite clause de non-responsabilité en bas des articles de nos flux RSS. Ce faisant, nous obtenons un backlink vers l'article original depuis le site du pirate.

Cela permet à Google et aux autres moteurs de recherche de savoir que nous sommes l'autorité. Cela permet également à leurs utilisateurs de savoir que le site vole notre contenu.

Pour plus d'astuces, consultez notre guide sur comment contrôler le pied de page de votre flux RSS dans WordPress.

Nous espérons que ce tutoriel vous a aidé à apprendre comment empêcher le scraping de contenu de blog dans WordPress. Vous voudrez peut-être aussi consulter notre guide ultime sur la sécurité WordPress ou notre sélection d'experts des meilleurs plugins de protection de contenu pour WordPress.

Si vous avez aimé cet article, abonnez-vous à notre Chaîne YouTube pour des tutoriels vidéo WordPress. Vous pouvez également nous trouver sur Twitter et Facebook.

Populaire sur WPBeginner En ce moment !

Divulgation : Notre contenu est soutenu par nos lecteurs. Cela signifie que si vous cliquez sur certains de nos liens, nous pouvons gagner une commission. Consultez comment WPBeginner est financé, pourquoi c'est important et comment vous pouvez nous soutenir. Voici notre processus éditorial.

À propos du personnel éditorial

Le personnel éditorial de WPBeginner est une équipe d'experts WordPress dirigée par Syed Balkhi, avec plus de 16 ans d'expérience dans WordPress, l'hébergement web, l'e-commerce, le SEO et le marketing. Lancé en 2009, WPBeginner est aujourd'hui le plus grand site de ressources WordPress gratuites de l'industrie et est souvent appelé le Wikipédia de WordPress.

90 CommentsLeave a Reply

Dennis Muthomi

18 août 2024 à 9:14

OK Wow, c'est un guide incroyablement complet sur la façon d'empêcher le scraping de contenu de blog ! Merci, WPBeginner, d'avoir mis en lumière ce problème frustrant.
J'ai particulièrement apprécié la section sur la façon de rendre le flux RSS plus difficile à scraper – je n'y avais pas pensé auparavant.
Le conseil sur le retardement de l'apparition des articles dans le flux RSS est brillant et quelque chose que je vais absolument mettre en œuvre sur mon propre blog TOUT DE SUITE !

Reply
Moinuddin Waheed

28 nov. 2023 à 23:34

J'ai beaucoup d'amis qui me parlaient d'utiliser les flux RSS et de créer du contenu sur leur site web de cette manière. Je ne savais pas exactement comment cela fonctionnait ni quels avantages ils en retiraient.
Scraper le contenu des autres et le présenter comme s'ils l'avaient créé eux-mêmes est une infraction, mais dans un monde non éthique, qui s'en soucie. Merci d'avoir créé ce guide qui nous permet d'empêcher le scraping de notre contenu et au moins de le retourner à notre avantage.

Reply
Jiří Vaněk

16 nov. 2023 à 2:58

Merci pour l'article. J'ai un blog avec plus de 1200 articles, et je dois commencer à m'en occuper aussi. Merci pour ces précieux conseils.

Reply
- Support WPBeginner
  
  16 nov. 2023 à 10:32
  
  De rien !
  
  Reply
  
  Admin
Toheeb Temitope

6 mai 2022 à 6:04

Merci pour le post.
Mais puis-je même supprimer ou désactiver totalement le flux RSS, ou y a-t-il un avantage particulier ?
Ensuite, si je veux désactiver totalement le flux RSS, comment vais-je faire ?
Merci.

Reply
- Support WPBeginner
  
  6 mai 2022 à 9:45
  
  Si vous souhaitez désactiver le flux RSS de votre site, notre guide ci-dessous vous sera utile :
  
  https://www.wpbeginner.com/wp-tutorials/how-to-disable-rss-feeds-in-wordpress/
  
  Les flux RSS peuvent être utiles à certains utilisateurs de votre site qui utilisent des lecteurs de flux RSS pour savoir quand un site a du nouveau contenu.
  
  Reply
  
  Admin
  - Moinuddin Waheed
    
    28 janv. 2024 à 11:05
    
    C'est une bonne idée de savoir que nous pouvons même désactiver le flux RSS, empêchant ainsi le vol potentiel et le scraping du contenu.
    Bien que la désactivation du flux RSS ait aussi quelques inconvénients.
    Y a-t-il un désavantage en termes de SEO à désactiver le flux RSS ?
    Ou cela n'a-t-il rien à voir avec le SEO et le classement ?
    
    Reply
    - Support WPBeginner
      
      30 janv. 2024 à 14:43
      
      Votre flux RSS ne devrait pas affecter le SEO de votre site.
Giovanni

27 sept. 2019 à 14:38

Merci. Exactement les informations dont j'ai besoin. Mais les scrapers utilisent-ils encore le flux RSS en 2019 ?

Reply
- Support WPBeginner
  
  30 sept. 2019 à 9:49
  
  Ils le peuvent certainement et essaieront de le faire
  
  Reply
  
  Admin
Nergis

20 sept. 2019 à 0:55

On entend beaucoup parler de l'acquisition de contenu de site par la curation de contenu. Le piratage de contenu est-il la même chose que la curation de contenu ? Sinon, quelle est la différence entre les deux ?

Reply
- Support WPBeginner
  
  20 sept. 2019 à 9:58
  
  Le scraping de contenu consiste à prendre du contenu d'autres sites pour le placer sur votre site sans autorisation, la curation de contenu consiste normalement à lier à d'autres contenus au sein du contenu que vous avez créé
  
  Reply
  
  Admin
Kingsley Felix

9 juil. 2019 à 6h09

Je rencontre ces problèmes, j'en avais plus de 20 pour l'une de nos marques, puis nous avons déménagé ailleurs et ils sont de retour.

Reply
- Support WPBeginner
  
  9 juil. 2019 à 12h49
  
  les scrapers de contenu sont malheureusement une lutte constante
  
  Reply
  
  Admin
slevin smith

8 mai 2017 à 5h46

J'ai trouvé un très mauvais pirate de contenu sur mon blog, non seulement ils volent mon contenu, utilisent le même nom pour leur blog de spam séparé par un – et toute la description, les tags, essayant essentiellement d'être moi, utilise des liens dans le flux RSS avec mon blog, ma chaîne YouTube, Facebook, Twitter, Pinterest & Google Plus, qui apparaissent sur leur blog de spam, j'ai aussi constaté que les images PNG apparaissent sur la page d'accueil mais pas les JPEG, mais cela n'est peut-être que sur Blogger.

Reply
astrid maria boshuisen

30 avr. 2017 à 11:34

J'adore absolument l'idée d'interconnexion. Je vais devoir regarder la suggestion RSS, car j'ai oublié comment cela fonctionne exactement, m'étant concentrée sur l'écriture d'e-books Kindle pendant un certain temps (parlez de piratage de contenu – zéro protection là-dessus !.. d'où mon retour à l'écriture de sites Web), mais je pense que j'ai vraiment un point de départ pour protéger mon contenu ! Merci !

Reply
Danni Phillips

19 nov. 2016 à 6:13

WOW ! Tant de choses à prendre en compte lorsque l'on démarre un blog. Mon blog n'a que 2 semaines. J'ai principalement utilisé WP Beginner pour configurer mon blog. Tant de bonnes informations présentées d'une manière qu'un débutant peut suivre.

Je ne sais pas si cela fonctionne pour le piratage de contenu, mais j'ai installé un plugin appelé Copyright Proof. Il désactive le clic droit afin que les gens ne puissent pas copier et coller votre contenu.

J'ai décidé d'utiliser ce plugin car c'était un plugin recommandé pour les sites d'auteurs.

Reply
- Eri
  
  22 nov. 2016 à 3:08
  
  votre article peut être copié facilement, croyez-moi.
  
  Reply
- Reo
  
  16 mars 2018 à 12:32
  
  Désactiver la sélection est une bonne méthode, mais elle ne prend en charge que les navigateurs Web populaires comme Chrome, Safari et Opera, mais pas IE et Edge.
  
  Reply
Dave Coldwell

8 sept. 2016 à 15:04

Un autre excellent article, je travaille comme journaliste indépendant, donc je vends beaucoup d'articles et c'est aux personnes qui les achètent de décider de leurs politiques.
Mais j'ai aussi quelques blogs et sites web affiliés, donc je pense que je devrais peut-être regarder ce qui se passe avec mon contenu.

Reply
Absynth

13 juin 2016 à 18:14

Ne pas accorder de crédit là où il est dû compte-t-il comme du « piratage de contenu » ?

Parce que Jeff Starr a écrit ce même article sur Perishable Press il y a plus de 5 ans :

Vérifiez la structure et la terminologie de votre article et comparez-les à l'original.

Je dis ça, je dis rien.

Reply
- Support WPBeginner
  
  13 juin 2016 à 19:48
  
  Nous avons bien crédité Jeff Starr. Veuillez lire l'article avant de signaler des erreurs.
  
  Reply
  
  Admin
  - Absynth
    
    13 juin 2016 à 20:02
    
    Yes my apologies.. I missed that the first time through. My bad
    
    Reply
Sieu

29 déc. 2015 à 7:52

Je viens de développer un thème pour Blogger et ce thème a besoin d'un flux complet pour fonctionner. Je m'inquiète du scraping de contenu. Je pense que si de nombreux scrapers utilisent mon contenu sur leur site Blogger, qui a le même contenu que mon site, et que les backlinks pointent vers mon site, mon blog sera considéré comme du spam par Google et sera supprimé.

Reply
Lori

1 mai 2015 à 18:43

Merci pour cet article incroyable avec des conseils utiles ! J'ai en fait juste reçu une pénalité pour « contenu mince » de Google. J'ai demandé l'aide d'un expert SEO, il m'a dit d'arrêter de scraper du contenu. Il m'a envoyé un lien vers un article que j'avais écrit hier et pensait que je l'avais volé sur un autre site web. Le truc pourri, c'est qu'ils me volaient, pas seulement cet article, mais probablement quelques milliers d'articles ! Ils sont toujours dans la recherche Google, et moi non. C'est moi qui suis pénalisé ! Il s'avère qu'il y a au moins trois sites web qui scrapent mon contenu, je ne sais même pas quoi faire.

Reply
Raviraj

20 avr. 2015 à 1h01

Article génial.

Je suis plus ou moins d'accord avec la plupart des points que vous avez abordés. En fait, quelques points sont vraiment géniaux.

Mais si votre seule activité repose sur le contenu de votre site web, ne devrions-nous pas être plus prudents face aux scrapers ?

Je ne pense pas que le vol de contenu soit jamais bon pour le propriétaire du contenu.

Je suppose que nous devrions tous penser à opter pour des mesures préventives plutôt que réactives. Vous pouvez envisager d'utiliser ShieldSquare, une solution de protection de contenu pour arrêter le scraping de contenu de manière permanente.

Reply
Andre

19 avr. 2015 à 19h02

Je sais que c'est un vieil article, mais la seule source qui est NOTOIRE pour permettre le scraping de contenu est WordPress avec sa fonctionnalité « Press This ». Ils encouragent en fait cela.

Reply
Sara

31 mars 2015 à 20h22

Je pense avoir enfin trouvé la réponse à mon problème. Je pensais que quelqu'un volait mes histoires et en faisait de « nouvelles ». Je pensais que soit quelqu'un me voulait du mal, soit que je perdais la tête. Je perdais presque la tête à penser comme ça. Paranoïaque. Craignant que quelqu'un n'écoute mes appels téléphoniques privés. Alors qu'en réalité, toutes les informations proviennent directement de mon blog ! Cet article m'a peut-être sauvé la vie. Littéralement. Je ne plaisante même pas car j'avais tellement peur de devenir fou et j'essayais très sélectivement d'en parler à des amis, pour obtenir des commentaires ou du soutien, et on me regardait comme si j'étais dingue et que j'avais besoin d'aller à l'asile pour un moment. Cet article rend ce qui m'arrive tout à fait logique. Merci ! Je suis tellement soulagée.

Reply
John

16 fév. 2015 à 7:38

Merci pour quelques conseils, mais une bonne partie de cet article n'est pas très utile. La plupart des scrapers ne sont pas des scrapers aveugles, le contenu est généralement aspiré, examiné par un œil humain, puis publié. Ce qui signifie que même en prenant une minute pour regarder un article, le spammeur est capable de publier des centaines d'articles copiés par jour. Le problème des backlinks est très facile à contourner pour les scrapers de contenu car les importateurs de flux ont des options de prétraitement et ils les règlent généralement pour supprimer les liens du corps. De plus, je ne vois pas comment transformer le rss en résumé pourrait aider, les importateurs de flux n'utilisent le rss que pour saisir le lien du nouveau contenu et à partir de là, ils suivent le squelette de votre html, que vous avez bien configuré avec des balises d'image, de titre, de lien, etc. appropriées pour la commodité de Google et extraient très facilement le contenu.

Bloquer l'adresse IP est évidemment une très bonne solution. Les DMCA sont généralement une perte de temps ; il faut du temps pour les formuler et des hôtes stupides prennent du temps pour répondre (car les spammeurs choisissent ces hôtes spécifiquement parce qu'ils sont laxistes sur les activités de type spam). De tous, Google est le plus frustrant ; peu importe le nombre de signalements que vous leur faites, ils n'agissent jamais sur aucun contenu volé sur lequel ils affichent des publicités et classent toujours le site de merde-spam bien dans les résultats de recherche, même s'il est facile pour leurs systèmes de détecter les copies

Reply
- Evie
  
  28 mars 2016 à 12:35
  
  John, je ne pourrais pas être plus d'accord avec vous. Google s'est énervé contre moi en déclarant que j'étais la personne qui volait mon propre contenu. Cette personne a volé mon contenu et l'a mis sur Blogger. L'audace. Il faut une solution à cela. À ce stade, je bloque tout simplement !
  
  Reply
L'équipe de WPBeginner

24 avr. 2014 à 10:33

Alors peut-être que la meilleure façon pour vous est de changer la licence et d'envoyer agressivement des avis de retrait aux scrapeurs de contenu. Pendant ce temps, continuez à vous concentrer sur la création de contenu de qualité.

Reply
Philipp D

19 avr. 2014 à 6:08

Bonjour,
Je suis tombé sur votre article en cherchant des réponses à certaines de mes préoccupations.
J'ai, avec quelques amis, lancé il y a quelques mois un site web sur le bricolage en Italie, qui fonctionne de manière inattendue, avec des classements élevés, beaucoup de trafic, etc. Cependant, le PR est encore de 0. Notre contenu a une licence Creative Commons 4.0, car nous croyons sincèrement que c'est un bon moyen de partager du contenu. CEPENDANT :
Il y a quelque temps, nous avons remarqué qu'un site PR4 avec beaucoup de trafic copiait nos meilleurs articles, renvoyant vers notre page d'accueil (ce qui n'est pas ce que l'on est censé faire avec une licence CC, mais c'est toujours acceptable). Les problèmes sont les suivants :
1. il y a beaucoup de petits sites qui raclent leur (notre) contenu et renvoient vers eux au lieu de notre site
2. le site PR4 et certains des petits sites se classent mieux que notre site
3. il y a de fortes suggestions qu'une pénalité Google sur NOTRE contenu a eu lieu, car il a un PR inférieur à la plupart des autres pages (qui sont en ligne depuis longtemps).

Nous sommes en contact avec le site PR4 et cela nous convient s'ils utilisent notre contenu, tant qu'ils créent un lien vers l'article original (c'est tout l'intérêt de la licence CC), MAIS nous essayons de trouver une solution pour éviter les pénalités Google : le rel canonical ferait-il l'affaire ? Quel est votre avis ? Devrions-nous changer notre licence et être plus agressifs envers la copie de contenu ? Merci !

Reply
- Support WPBeginner
  
  20 avr. 2014 à 14:39
  
  Philipp, Si vous ne l'avez pas déjà fait, vous devriez créer un compte Google Search Console pour votre site et soumettre votre sitemap. Cela vous aide à déterminer s'il y a un problème avec votre site, comment votre site se porte dans les recherches, et vous pouvez utiliser de nombreux autres outils. Cela aide également Google à mieux comprendre où certains contenus sont apparus pour la première fois.
  
  Nous ne pensons pas que changer la licence empêchera les robots d'extraction de contenu de copier votre contenu.
  
  Reply
  
  Admin
  - Philipp
    
    23 avr. 2014 à 14:32
    
    Salut ! Oui, nous avons configuré un compte Google Search Console, lié le site à notre page Google+, et la plupart des auteurs à leurs profils Google+ en utilisant les balises publisher et author. L'auteur semble fonctionner correctement dans les extraits de recherche, mais jusqu'à présent, cela ne semble pas faire une grande différence en cas de contenu copié. Les pages avec un PR plus élevé qui copient notre contenu sont toujours en tête...
    
    Reply
Garratt

31 juil. 2013 à 07:46

L'une des meilleures façons de ne pas être affecté par cela est de faire du ping efficacement. Le ping, et la soumission manuelle de pages à Google et Bing, font venir les robots sur votre site RAPIDEMENT. Ils indexent les pages AU PLUS VITE, puis lorsqu'ils trouvent du contenu dupliqué sur d'autres sites, ils vous considèrent comme l'autorité.

J'ai cependant le soupçon que cela pourrait avoir à voir avec le PageRank... Mais Matt Cutts (équipe webspam @ Google) a préconisé l'utilisation de pinger sur ce sujet précis. Je ne suis juste pas sûr de pouvoir lui faire confiance.

Pour ajouter plus de services, allez dans Paramètres -> Paramètres d'écriture -> Services de mise à jour -> Ouvrez le lien « Services de mise à jour » dans un nouvel onglet et copiez tous les services de mise à jour. De retour dans WordPress, collez-les dans la liste de ping et cliquez sur enregistrer.

Ouvrez un compte dans les outils Bing Webmaster pour la soumission manuelle d'URL afin d'accélérer l'indexation.

Reply
Chris Backe

8 juin 2013 à 9h03

J'ai récemment découvert un type qui peut prendre un flux RSS de mon blog – gardez à l'esprit que mon blog est un flux de résumé avec la ligne « Cet article a été trouvé pour la première fois sur » de Yoast. J'ai envoyé un message de remerciement au type, lui disant essentiellement qu'il me donnait des backlinks, ET disant à Google qu'il copiait mon site web (car ils peuvent regarder les horodatages pour voir lequel a été publié en premier).

Vérifié deux jours plus tard, et tout mon contenu avait mystérieusement disparu…

Reply
- Personnel éditorial
  
  16 juin 2013 à 15h38
  
  Hah ouais. La plupart de ces escrocs ne sont pas très brillants lol. Heureux que vous ayez résolu le problème.
  
  -Syed
  
  Reply
  
  Admin
Ian

7 juin 2013 à 16h44

Quelqu'un a-t-il vu ou utilisé ce plugin anti-scraping WP http://wordpress.org/plugins/wordpress-data-guards/ il semble solide mais très peu de gens l'ont téléchargé ? Je ne suis pas un expert technique - j'apprécierais donc des opinions sur sa valeur ou son effet sur le SEO

Reply
- Personnel éditorial
  
  16 juin 2013 à 15h36
  
  Vous pouvez absolument utiliser ce plugin. Il bloque les clics droits, les raccourcis clavier pour copier, la liste noire d'IP, etc. Tout cela empêche le scraping manuel, cependant la plupart des scrapers de contenu utilisent des outils automatiques. Donc, aucun de ceux-ci ne serait très utile.
  
  Reply
  
  Admin
- Ian
  
  17 juin 2013 à 6h22
  
  Merci pour votre réponse – la version pro indique qu'elle vous protège des attaques de bots, j'imagine que cela signifie les bots scrapers ? le prix me dissuade de l'installer sur tous mes sites, mais je pourrais l'utiliser sur un juste pour voir comment il fonctionne
  
  Reply
Mark Conger

27 mai 2013 à 19h07

C'est l'un des meilleurs articles « pour débutants », sinon le meilleur, que j'ai jamais rencontré sur le web.

Après l'avoir lu, j'ai l'impression d'avoir eu une réunion avec un consultant en sécurité.

J'applique ces techniques tout de suite !

Merci. Je suis maintenant un follower de ce site.

Reply
- Personnel éditorial
  
  16 juin 2013 à 14h38
  
  Thanks for the very kind words Mark
  
  Reply
  
  Admin
Neil Ferree

9 mai 2013 à 17h26

Cela ne m'est arrivé que quelques fois. Un blogueur extérieur aux États-Unis a pris mon article mot pour mot et l'a publié sur son site comme si c'était le sien. Comme il ne s'agissait que d'un seul article avec ma vidéo YT intégrée, je ne me suis pas trop soucié des détails, car le CTR de ma chaîne a vu une belle augmentation de visites de toute façon.

Reply
Edward B. Rockower, Ph.D.

3 mars 2013 à 3h06

Je veux juste dire merci, merci et merci !

Je viens de découvrir votre site aujourd'hui, j'ai lu seulement 3 articles jusqu'à présent (celui-ci inclus)... mais je suis extrêmement impressionné.

Je ne blogue que depuis 5 semaines, mais je trouve ça addictif, surtout en voyant le trafic croissant et l'engagement des utilisateurs grâce à mes efforts. Voir 100 visiteurs sur mon blog en une journée, et pouvoir voir qui les réfère, me motive à apprendre tout ce que je peux pour augmenter le marketing sur les réseaux sociaux et les interactions avec les nouveaux visiteurs.

Cordialement,
@earthlingEd

Reply
Debbie Gilbert

25 fév. 2013 à 9h50

J'adore votre site et j'ai été sidéré d'apprendre le scraping de contenu ! Y a-t-il un moyen de créer une sorte de filigrane qui ne soit pas distrayant pour vos lecteurs, mais qui soit évident sur le site du scraper ?

Reply
- Personnel éditorial
  
  25 fév. 2013 à 11h11
  
  Vous pouvez faire de la protection contre le hotlinking entre autres choses pour désactiver les images sur les domaines qui ne sont pas sur liste blanche.
  
  Reply
  
  Admin
Usman

25 fév. 2013 à 8h14

Est-il légal de publier l'article complet d'un autre site web et d'indiquer le nom du site source en bas de l'article ?

Reply
- Personnel éditorial
  
  25 fév. 2013 à 9h06
  
  Non.
  
  Reply
  
  Admin
  - Usman
    
    25 fév. 2013 à 10h04
    
    Et si nous mettons un lien direct vers l'article en bas ?
    
    Reply
    - Dan
      
      4 mars 2013 à 1h43
      
      Ce n'est toujours pas bien, à moins que le propriétaire ne l'approuve
Abdul Karim

21 fév. 2013 à 9h58

Y a-t-il un moyen / plugin

quelqu'un copie ma photo de blog de mode et la publie sur son forum

mais quand je clique sur l'image sur ce forum. elle s'ouvre dans une nouvelle fenêtre

je veux un plugin ou un script qui, s'il copie mes images, lorsque quelqu'un clique sur ces images, cette personne est redirigée vers mon article de blog lié à ces images ?

un plugin déjà ? lien avec les images de l'article ?

Reply
- Personnel éditorial
  
  21 fév. 2013 à 10h42
  
  Aucun que nous connaissions.
  
  Reply
  
  Admin
  - Abdul Karim
    
    25 fév. 2013 à 7:50
    
    Je l'ai fait, il suffit de changer
    
    quand quelqu'un télécharge une image, le lien URL s'affiche sur le côté droit
    
    le réglage par défaut est le fichier multimédia
    vous devez le changer dans l'url de la pièce jointe
    
    puis c'est fait !
    
    quand quelqu'un copie les images de votre blog, cela crée un backlink vers votre page publiée
    
    Reply
Anton

18 fév. 2013 à 19:12

Si quelqu'un prend un article écrit en anglais et le traduit, en utilisant sa tête et pas Google Translate, dans une autre langue, disons parce que la majorité des gens dans le pays de cette autre langue ne comprennent pas l'anglais. Les mettriez-vous quand même en cause comme des scrapeurs ? Ou quelle est votre opinion à ce sujet ?
Pour moi personnellement, je ne trouve pas cela extrêmement problématique, bien sûr, je crois que l'« auteur » devrait renvoyer vers l'article original tout en précisant que son article est traduit.

Reply
- Personnel éditorial
  
  21 fév. 2013 à 9:59
  
  Sauf si vous avez l'autorisation écrite de l'auteur, alors c'est techniquement du scraping.
  
  Reply
  
  Admin
Greg

22 janv. 2013 à 18:09

C'est un article formidable. Après l'avoir lu, j'espère que vous ne me considérez pas comme un scrapeur de contenu. J'ai utilisé des extraits de votre article (curation), j'ai toujours le lien « Lire l'article complet » et j'ai votre lien de page, et beaucoup de mes articles sont tweetés et j'inclus votre compte Twitter. Si vous ne le souhaitez pas, faites-le moi savoir et je le supprimerai volontiers. J'apprécie énormément votre travail et je souhaite le partager avec mes visiteurs. Mon intention n'est pas de voler vos visiteurs mais de pouvoir offrir une bonne valeur aux miens et de les envoyer vers vous pour en savoir plus.

Reply
- Personnel éditorial
  
  24 janv. 2013 à 16:21
  
  Greg, tant que vous n'affichez qu'un extrait et que vous envoyez l'utilisateur sur notre site pour lire l'article complet, ce n'est pas du scraping. Comme vous l'avez dit, c'est de la curation. Des tonnes de sites populaires font cela (c'est-à-dire reddit, digg, etc.).
  
  Reply
  
  Admin
ryan

7 janv. 2013 à 3:55

Mon site contient beaucoup d'articles de sécurité originaux et quelques-uns ont été copiés. Le site qui m'a copié était dans Yahoo! News avec mon article et les gens commentaient dessus. J'ai géré le problème en commentant et en disant que j'étais l'auteur original et j'ai répondu à quelques commentaires. J'avais des liens internes, c'est comme ça que j'ai découvert si rapidement. Une astuce sur laquelle je vais écrire est de faire apparaître une bannière ou une image aux personnes qui viennent d'un site de scraping, leur disant ce qui s'est passé. La suggestion de requête sans fin semble illégale en vertu de la loi sur la fraude et les abus informatiques. Je ne suis pas avocat. J'écris seulement sur la sécurité, donc je dois connaître les lois sur la sécurité informatique.

Je n'aime pas que votre formulaire n'ait pas accepté l'e-mail de mon entreprise comme un e-mail valide.

Reply
- Personnel éditorial
  
  10 janv. 2013 à 11:02
  
  Désolé Ryan que notre formulaire n'ait pas approuvé votre e-mail professionnel. Je ne suis pas sûr de ce qui s'est passé, mais il est censé approuver tous les e-mails valides.
  
  Reply
  
  Admin
andre

26 nov. 2012 à 11:40

comment utiliser ce code, pouvez-vous fournir plus de détails ou de tutoriels, merci

RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://dummyfeed.com/feed [R,L]

Reply
- Personnel éditorial
  
  27 nov. 2012 à 7:49
  
  Vous devrez modifier le fichier .htaccess.
  
  Reply
  
  Admin
Ali Rashid

2 oct. 2012 à 1:22

belle et informative rédaction, j'aime votre approche de tirer parti des scrapers, cependant bloquer une IP peut ne pas toujours fonctionner ; un scraper sérieux utiliserait souvent une liste de proxys anonymes ou gratuits, dans ce cas, la mise sur liste noire d'une IP pourrait ne pas être une solution efficace car le scraper la changerait souvent. Une solution consiste à écrire un petit script qui détectera tout trafic anormal d'une IP donnée, disons plus de 20 requêtes/seconde et le défiera avec un captcha si aucune réponse, mettez l'IP sur une liste noire temporaire pendant environ 30 minutes. vous pouvez le renforcer avec un autre javascript qui détecte les mouvements de souris, tactiles ou de clavier après quelques requêtes, si aucun clavier, souris ou toucher n'est détecté, vous pouvez à nouveau mettre le scraper sur la liste noire temporaire, cela a fonctionné à merveille pour nous.

Reply
Arihant

26 sept. 2012 à 22:34

Vos solutions sont suffisantes pour les scrapeurs de contenu.
Mais qu'en est-il si les gens copient et collent manuellement du contenu sur leurs pages Facebook.
Nous avons implémenté tynt mais ils suppriment le lien vers l'article original, avez-vous des idées sur la façon dont vous pouvez gérer ce genre de situation.

Reply
- Personnel éditorial
  
  27 sept. 2012 à 7:28
  
  Si les gens veulent vraiment voler votre contenu, vous ne pouvez rien y faire. C'est une triste vérité, mais c'est la vérité.
  
  Reply
  
  Admin
  - Garratt
    
    18 mai 2013 à 6h59
    
    En fait, il existe un plugin créé par IMWealth Builders, probablement le seul de leurs plugins que j'aime, le reste est assez médiocre et implique le scraping de sites Ecommerce (CB, Azon, CJ etc) pour des commissions d'affiliation.
    
    Il s'appelle "Covert Copy Traffic" et permet en fait de définir n'importe quel texte avant ou après un nombre défini de mots. Donc, disons que je le règle pour poster "Ce contenu a été tiré de xxxxxxx.com" après 18 mots. Ensuite, chaque fois que quelqu'un copiait/collait plus de 18 mots du site Web, il ajouterait ce texte en bas, 17 mots ou moins, il ne ferait rien.
    
    Ce n'étaient que des exemples de paramètres. Plugin assez utile, fonctionne à merveille. J'ai essayé à peu près toutes les méthodes que j'ai pu imaginer pour contourner l'insertion de texte, mais cela semble impossible. Le plugin est trop solide.
    
    Reply
    - Personnel éditorial
      
      22 mai 2013 à 7h20
      
      On dirait que vous décrivez ce tutoriel ici :
      
      https://www.wpbeginner.com/wp-tutorials/how-to-add-a-read-more-link-to-copied-text-in-wordpress/
    - Garratt
      
      23 mai 2013 à 9h05
      
      Oui, c'est exact. Vous pouvez simplement utiliser ce script pour dire "Le contenu provient de votre site Web.com" plutôt que "Lire la suite".
    - Jennae Barker
      
      30 juil. 2013 à 0h04
      
      Est-il vrai que leurs programmes Amazon etc sont des scrapers – si c'est le cas – j'ai fait une énorme erreur sur un achat chez eux – heureusement, je ne l'ai pas encore utilisé.
    - Garratt
      
      31 juil. 2013 à 7h24
      
      Oui Jennae, c'est légal dans le sens où Amazon vous permet de copier du contenu de leurs pages. Cela aide leurs ventes, les affiliés sont la raison pour laquelle Amazon est Amazon.
      
      Cependant, Google et les autres moteurs de recherche (qui comptent) le considèrent simplement comme un "site d'affiliation mince" en l'absence de contenu original. Par conséquent, ils ne se classent pas à moins qu'il y ait un certain pourcentage de contenu original sur le site également.
      
      Un scraper, n'est rien de plus qu'une araignée/un robot d'exploration, généralement il fonctionne en mode socket, cependant certains fonctionnent dans un navigateur.
      
      Ce n'est pas parce que quelque chose est étiqueté comme un scraper que c'est forcément mauvais. J'utilise régulièrement des scrapers et des spiders pour vérifier mon site à la recherche de liens non naturels, j'en vérifie d'autres pour l'analyse de la concurrence, la recherche de mots-clés et une variété d'autres tâches qui ne nuisent à personne, mais qui me sont bénéfiques.
      
      Cependant, je n'aime pas et je ne cautionne personne qui scrape dans le but de violer le droit d'auteur. C'est de cela dont il est vraiment question dans cette discussion.
      
      Google utilise le spider « Google Bot » pour indexer le web, ainsi que des centaines d'autres moteurs de recherche. Il y a des milliers, des centaines de milliers de spiders qui parcourent le web à diverses fins. Google scrape également les sites web pour les « mettre en cache ». Tout comme le font de nombreux services importants dont nous avons besoin, tels que les archives historiques du web.
Troy

12 sept. 2012 à 16:44

Je m'apprête à rechercher activement les sites qui copient mon contenu et à le faire supprimer. Je sais que cela a un impact sur le classement de mon site, je dois donc faire quelque chose. Avez-vous une idée de la quantité de contenu qui doit être copiée avant de pouvoir envoyer des avis DMCA ? Un paragraphe dans un article suffit-il légalement pour pouvoir le qualifier de plagiat ?

Reply
- Personnel éditorial
  
  13 sept. 2012 à 9:01
  
  Nous ne sommes pas des experts juridiques ici, nous nous abstenons donc de donner des conseils juridiques sur ce site.
  
  Reply
  
  Admin
Dallas

5 août 2012 à 7:40

Vous omettez de mentionner que tout autoblogger qui se respecte retirera les liens et insérera ses propres liens d'affiliation plutôt que d'utiliser votre contenu tel quel, de sorte que votre approche pour obtenir des liens d'eux échouera généralement.

Reply
- Personnel éditorial
  
  6 août 2012 à 7:14
  
  Existe-t-il un autoblogger qui se respecte ? S'ils avaient un minimum de respect pour eux-mêmes, ils écriraient du contenu original.
  
  Reply
  
  Admin
  - David Halver
    
    3 avr. 2013 à 1:27
    
    D'accord ! Il existe un « endroit chaud » très spécial près du centre de la Terre pour les spammeurs, les scrapeurs et les blogueurs automatiques…
    
    Reply
TrèsCréatif

29 juin 2012 à 6h03

Je pense que la meilleure idée est d'inclure des liens d'affiliation.
Après la dernière mise à jour de Penguin, mon site web a été pénalisé. J'ai commencé à l'analyser et j'ai découvert que de nombreux autres sites copiaient mon contenu. Je ne sais pas pourquoi, mais ces sites se classent mieux que moi dans les moteurs de recherche, en utilisant mon contenu.

Reply
- Personnel éditorial
  
  29 juin 2012 à 6h59
  
  Pas seulement des liens d'affiliation. Incluez autant de liens internes que possible. Parce que si ces sites renvoient vers vos autres pages, alors Google SAURA que vous êtes le site d'autorité.
  
  Reply
  
  Admin
  - Bayer
    
    22 fév 2013 à 8h22
    
    Bonjour l'équipe wpbeginner.com. J'apprécie vraiment cet article, mais j'ai une question concernant les liens internes dans vos pages/articles.
    
    Je suppose que vous voulez dire des liens « absolus » ?? Sinon, cela pourrait ne pas fonctionner en votre faveur, une fois que le contenu a été récupéré… Eh bien, jusqu'à présent, j'ai toujours utilisé des liens relatifs, comme vous le faites, je suppose. Quelle est la meilleure méthode ? Merci !
    
    Reply
    - Personnel éditorial
      
      25 fév 2013 à 7h33
      
      Nous utilisons toujours des liens absolus car cela permet que les choses fonctionnent sans problème.
Gautam Doddamani

16 juin 2012 à 9h10

tout d'abord votre tutoriel est tout simplement fantastique..chapeau bas ! juste un doute comment savoir si un site est un site de scraping ? j'ai utilisé votre méthode et j'ai découvert que Google Webmaster Tools signale 262 liens vers mon site et il y a beaucoup de sites qui ne le savent pas… donc je suis dans la confusion….comment vérifier si un site est un site de scraping ou un site d'autorité ?? existe-t-il un outil pour cela ? merci d'avance !

Reply
- Personnel éditorial
  
  16 juin 2012 à 9h47
  
  Faites-moi confiance, aucun site d'autorité ne volera jamais votre article mot pour mot.
  
  Reply
  
  Admin
  - Gautam Doddamani
    
    16 juin 2012 à 9h57
    
    oui c'est vrai… mais que faire si je ne veux pas trouver mon article sur ces sites de scraping… je sais que mon article est là car il est signalé par GWT et je veux juste bloquer cette adresse IP en insérant ces règles rewritecond dans le fichier htaccess… je ne veux pas perdre mon temps à chercher ces mauvais sites pour mon article ou à leur demander de retirer mon article.
    
    Reply
Nathan

7 juin 2012 à 22:40

Merci pour cet article – et pour votre site en général ! Je l'aime tellement que je me demandais comment je garderais une trace de cette ressource. Et maintenant, je vois les options d'abonnement ci-dessous. Quelle façon d'obtenir un commentaire !

Reply
Yeasin

5 juin 2012 à 19:36

Empêcher le scraping de contenu est presque impossible. Je ne pense pas que le scrapers de contenu me nuise d'une manière ou d'une autre. Ils me donnent juste un vote parce que j'ai du contenu de haute qualité. Google est assez intelligent pour détecter les éditeurs originaux. Personne ne devrait s'inquiéter.

Reply
mrwindowsx

21 mai 2012 à 02:34

vraiment informatif, si vous utilisez cloudflare, il y a de nouvelles applications appelées ScrapeShield, et vous pouvez facilement protéger et suivre/surveiller le contenu de votre site gratuitement.

Reply
- wpbeginner
  
  21 mai 2012 à 08:07
  
  @mrwindowsx Oh, je ne savais pas. Merci de l'avoir signalé.
  
  Reply
- Gautam Doddamani
  
  16 juin 2012 à 22:03
  
  wow c'est super mec… utilises-tu cloudflare ? je voulais juste ton avis car je n'ai jamais utilisé ce service cdn… je sais qu'il est gratuit et tout mais je pense que le temps de chargement de mon site est déjà super que je n'en avais pas besoin… maintenant que scrapeshield est là, je pense que je vais absolument vérifier… quelles autres applications aurons-nous si nous commençons à utiliser cloudflare ?? merci
  
  Reply
  - Matt
    
    31 déc. 2012 à 00:55
    
    Bonjour,
    IMO @cloudflare est vraiment génial. J'ai deux sites dessus (le mien et le blog de ma femme) et c'est vraiment incroyablement rapide, sans parler de toute la sécurité, de l'analyse du trafic, du support d'applications (installations automatiques d'applications) qu'ils fournissent.
    
    Je sais que toutes les configurations d'hébergement sont différentes, mais j'ai nos deux sites sur le Media Temple (gs)Grid Service. Je peux honnêtement dire que nos sites fonctionnent plus rapidement maintenant qu'ils ne le faisaient lorsque j'utilisais W3 Total Cache et Amazon S3 comme mon CDN. En fait, j'utilise toujours W3TC sur mon site pour minimiser et mettre en cache mon contenu, mais j'utilise CloudFlare pour les services CDN, DNS et de sécurité.
    
    Je recommande vivement… En fait, j'apprécierais vraiment si quelqu'un de WPBeginner nous donnait son opinion approfondie et expérimentée sur les services CloudFlare. Pour moi, ils ont été géniaux !
    
    Reply
shivabeach

17 mai 2012 à 14:55

Vous pouvez également obtenir un plugin dont le nom m'échappe pour le moment qui fait la recherche Google pour vous. Il ajoute également un code à votre flux RSS que l'application recherche.

Reply
MuhammadWaqas

16 mai 2012 à 11:07

Excellent article, je sais qu'il y a beaucoup d'autoblogs qui récupèrent mon contenu. Bien qu'après la mise à jour Penguin, mon site reçoive 3 fois plus de trafic de Google qu'avant. Mais après avoir lu de nombreux désastres ou générateurs de contenu original, je m'inquiète des futures pénalités de Google.

Mon expérience est que généralement Google respecte les sites à PR élevé avec de bons backlinks d'autorité. mais le site n'a qu'un an et le PR est inférieur à 5.

J'essaie de contacter les scrappers mais la plupart n'ont pas de formulaires de contact. donc je pense que j'essaierai cette méthode htaccess pour bloquer les adresses IP des scrappers. Mais d'un autre côté, certains d'entre eux peuvent utiliser feedburner.

Reply
- Garratt
  
  17 juin 2013 à 06:44
  
  Personnellement, je ne m'embête pas avec le RSS car la plupart des utilisateurs ne l'utilisent pas. Fournissez plutôt un flux de newsletter. Cela fait la même chose + vous obtenez des e-mails pour faire du marketing (si fait correctement). La majorité des gens sont plus susceptibles de s'abonner à un blog plutôt que de mettre un flux RSS en favori, d'après mon expérience. Il est donc préférable de désactiver le RSS. Vous pouvez le faire en utilisant WordPress SEO by Yoast, et divers autres plugins.
  
  Ensuite, si vous mettez également en œuvre les stratégies mentionnées ci-dessus, vous devriez être bon. Supprimez tous les en-têtes inutiles RSD WLM etc.
  
  Il y en aura quelques-uns capables de scraper efficacement, mais ces astuces en diminueront un grand nombre.
  
  Reply