Trusted WordPress tutorials, when you need them most.
Beginner’s Guide to WordPress
WPB Cup
25 Million+
Websites using our plugins
16+
Years of WordPress experience
3000+
WordPress tutorials
by experts

Comment optimiser votre WordPress Robots.txt pour le référencement

Chaque fois que nous auditons un site WordPress, l’une des premières choses que nous vérifions est le fichier robots.txt. Après avoir Avis des milliers de sites au fil des ans, nous avons trouvé que même les propriétaires de sites expérimentés négligent souvent ce composant SEO critique.

Nous avons appris qu’un fichier Robots.txt mal configuré peut nuire silencieusement à votre classement dans les moteurs de recherche. Pire encore, si vous ne savez pas quoi chercher, vous risquez de ne jamais vous rendre compte qu’il est à l’origine de vos problèmes de référencement.

Dans ce guide, nous partagerons notre approche éprouvée de l’optimisation des fichiers robots.txt de WordPress. Nous avons simplifié tout ce que nous avons appris en gérant des centaines de sites WordPress à succès en des étapes claires et réalisables que vous pouvez suivre dès aujourd’hui.

Optimizing robots.txt file for better SEO

Qu’est-ce qu’un fichier Robots.txt ?

Robots.txt est un fichier texte que les propriétaires de sites web peuvent créer pour indiquer aux moteurs de recherche comment explorer et indexer les pages de leurs sites.

Il est généralement stocké dans le répertoire racine (également appelé dossier principal) de votre site. Le format de base d’un fichier Robots.txt est le suivant :

User-agent: [user-agent name]
Disallow: [URL string not to be crawled]
 
User-agent: [user-agent name]
Allow: [URL string to be crawled]
 
Sitemap: [URL of your XML Sitemap]

Vous pouvez avoir plusieurs lignes d’instructions pour permettre ou interdire des URL spécifiques et ajouter plusieurs plans de site. Si vous n’interdisez pas une URL, les moteurs de recherche supposent qu’ils sont autorisés à l’explorer.

Voici à quoi peut ressembler un fichier d’exemple Robots.txt :

User-Agent: *
Allow: /wp-content/uploads/
Disallow: /wp-content/plugins/
Disallow: /wp-admin/

Sitemap: https://example.com/sitemap_index.xml

Dans l’exemple ci-dessus de robots.txt, nous avons permis aux moteurs de recherche d’explorer et d’indexer les fichiers de notre dossier de téléversement WordPress.

Ensuite, nous avons interdit aux robots de recherche d’explorer et d’indexer les extensions et les dossiers d’administration de WordPress.

Dernier point, nous avons indiqué l’URL de notre sitemap XML.

Avez-vous besoin d’un fichier Robots.txt pour votre site WordPress ?

Bien que votre site puisse fonctionner sans fichier Robots.txt, nous avons toujours trouvé que les sites dont les fichiers Robots.txt sont optimisés obtiennent de meilleurs résultats dans les résultats de recherche.

Dans le cadre de notre travail avec des clients de divers secteurs, nous avons constaté qu’une bonne gestion du budget d’exploration par le biais du fichier Robots.txt peut permettre d’accélérer l’indexation des contenus importants et d’améliorer les performances globales en matière de SEO.

Cela n’aura pas beaucoup d’impact lorsque vous démarrez un blog et que vous n’avez pas beaucoup de contenu.

Cependant, au fur et à mesure que votre site se développe et que vous ajoutez du contenu, vous souhaiterez probablement mieux contrôler la manière dont votre site est exploré et indexé.

Voici pourquoi.

Les moteurs de recherche attribuent à chaque site ce que Google appelle un “budget d’exploration”. Il s’agit du nombre de pages qu’ils vont explorer dans un délai donné.

Lors de nos tests sur des milliers de sites WordPress, nous avons trouvé que les grands sites bénéficient particulièrement de l’optimisation de ce budget grâce à une configuration stratégique du fichier robots.txt.

Par exemple, l’un de nos clients a constaté une amélioration de 40 % de l’efficacité de l’exploration après avoir mis en œuvre les optimisations que nous recommandons dans le fichier Robots.txt.

Vous pouvez empêcher les robots de recherche d’essayer d’explorer des pages inutiles comme les pages d’administration de WordPress, les fichiers d’extension et le dossier des thèmes.

En interdisant les pages inutiles, vous enregistrez votre quota d’exploration. Cela aide les moteurs de recherche à explorer encore plus de pages sur votre site et à les indexer le plus rapidement possible.

Une autre bonne raison d’utiliser un fichier Robots.txt est d’empêcher les moteurs de recherche d’indexer une publication ou une page de votre site.

Ce n’est pas le moyen le plus sûr de masquer un contenu au grand public, mais cela vous aidera à empêcher un contenu d’apparaître dans les résultats de recherche.

À quoi ressemble un fichier Robots.txt idéal ?

De nombreux blogs populaires utilisent un fichier Robots.txt très simple. Leur contenu peut varier en fonction des besoins du site concerné :

User-agent: *
Disallow:

Sitemap: https://www.example.com/post-sitemap.xml
Sitemap: https://www.example.com/page-sitemap.xml

Ce fichier robots.txt autorise tous les robots à indexer l’ensemble du contenu et leur fournit un lien vers les sitemaps XML du site.

Pour les sites WordPress, nous recommandons les règles suivantes dans le fichier robots.txt :

User-Agent: *
Allow: /wp-content/uploads/
Disallow: /wp-admin/
Disallow: /readme.html
Disallow: /refer/

Sitemap: https://www.example.com/post-sitemap.xml
Sitemap: https://www.example.com/page-sitemap.xml

Cela permet aux robots de recherche d’indexer toutes les images et tous les fichiers de WordPress. Il empêche les robots de recherche d’indexer la zone d’administration de WordPress, le fichier readme et les liens d’affiliation masqués.

En ajoutant des sitemaps au fichier robots.txt, vous permettez aux robots de Google de trouver facilement toutes les pages de votre site.

Maintenant que vous savez à quoi ressemble un fichier robots.txt idéal, voyons comment créer un fichier robots.txt dans WordPress.

Comment créer un fichier Robots.txt dans WordPress

Il y a deux façons de créer un fichier Robots.txt dans WordPress. Vous pouvez choisir la méthode qui vous convient le mieux.

Méthode 1 : Modifier le fichier Robots.txt à l’aide de All in One SEO

All in One SEO, également connu sous le nom d’AIOSEO, est la meilleure extension WordPress SEO sur le marché, utilisée par plus de 3 millions de sites. Il est facile à utiliser et est livré avec un générateur de fichiers Robots.txt.

Pour en savoir plus, consultez notre avis détaillé sur AIOSEO.

Si vous n’avez pas encore installé l’extension AIOSEO, vous pouvez consulter notre guide étape par étape sur l’installation d’une extension WordPress.

Note : Une version gratuite d’AIOSEO est également disponible et dispose de cette fonctionnalité.

Une fois l’extension installée et activée, vous pouvez l’utiliser pour créer et modifier votre fichier robots.txt directement depuis votre zone d’administration WordPress.

Il vous suffit d’aller dans All in One SEO ” Tools pour modifier votre fichier robots.txt.

Robots.txt file editor in All in One SEO

Tout d’abord, vous devez activer l’option de modification en cliquant sur le bouton “Enable Custom Robots.txt” (Activer les Robots.txt personnalisés), qui devient bleu.

En activant ce permutateur, vous pouvez créer un fichier Robots.txt personnalisé dans WordPress.

Enable custom robots.txt file

All in One SEO affichera votre fichier robots.txt existant dans la section ‘Prévisualisation Robots.txt’ en bas de votre écran.

Cette version affichera les règles par défaut qui ont été ajoutées par WordPress.

Robots.txt file preview in All in One SEO

Ces règles par défaut indiquent aux moteurs de recherche de ne pas explorer vos fichiers WordPress centraux, autorisent les robots à indexer tout le contenu et leur fournissent un lien vers les sitemaps XML de votre site.

Désormais, vous pouvez ajouter vos propres règles personnalisées pour améliorer votre Robots.txt pour le référencement.

Pour ajouter une règle, saisissez un agent utilisateur dans le champ “Agent utilisateur”. L’utilisation d’un * permet d’appliquer la règle à tous les agents utilisateurs.

Sélectionnez ensuite si vous souhaitez “Autoriser” ou “Désactiver” l’exploration par les moteurs de recherche.

Saisissez ensuite le nom du fichier ou le chemin du répertoire dans le champ “Chemin du répertoire”.

Add robots file rules

La règle sera automatiquement appliquée à votre Robots.txt. Pour ajouter une autre règle, il suffit de cliquer sur le bouton “Ajouter une règle”.

Nous vous recommandons d’ajouter des règles jusqu’à ce que vous créiez le format Robots.txt idéal dont nous avons parlé plus haut.

Vos règles personnalisées ressembleront à ceci.

Custom robots txt file preview

Une fois que vous avez terminé, n’oubliez pas de cliquer sur le bouton “Enregistrer les modifications” pour stocker vos modifications.

Méthode 2 : Modifier le fichier Robots.txt à l’aide de WPCode

WPCode est une puissante extension d’extraits de code qui vous permet d’ajouter du code personnalisé à votre site facilement et en toute sécurité.

Il comprend également une fonctionnalité très pratique qui vous permet de modifier rapidement le fichier robots.txt.

Note : Il existe également une extension WPCode gratuite, mais elle n’inclut pas la fonctionnalité d’éditeurs/éditrices de fichiers.

La première chose à faire est d’installer l’extension WPCode. Pour obtenir des instructions étape par étape, consultez notre guide du débutant sur l’installation d’une extension WordPress.

Une fois activé, vous devez vous rendre sur la page WPCode ” Éditeurs/éditrices de fichiers. Une fois sur cette page, il suffit de cliquer sur l’onglet ‘robots.txt’ pour modifier le fichier.

WPCode robots.txt Editor

Vous pouvez maintenant coller ou taper le contenu du fichier Robots.txt.

Une fois que vous avez terminé, n’oubliez pas de cliquer sur le bouton “Enregistrer les modifications” en bas de la page pour stocker les Réglages.

Méthode 3 : Modifier manuellement le fichier Robots.txt à l’aide du FTP

Pour cette méthode, vous devrez utiliser un client FTP pour modifier le fichier robots.txt. Vous pouvez également utiliser le gestionnaire de fichiers fourni par votre hébergeur WordPress.

Il suffit de se connecter aux fichiers de votre site WordPress à l’aide d’un client FTP.

Une fois à l’intérieur, vous pourrez voir le fichier Robots.txt dans le dossier racine de votre site.

Edit robots file via FTP

Si vous n’en voyez pas, il est probable que vous n’ayez pas de fichier Robots.txt.

Dans ce cas, vous pouvez simplement aller de l’avant et en créer un.

Create new robots file

Robots.txt est un fichier de texte brut, ce qui signifie que vous pouvez le télécharger sur votre ordinateur et le modifier à l’aide d’un éditeur de texte brut tel que Notepad ou TextEdit.

Après avoir enregistré vos modifications, vous pouvez téléverser le fichier Robots.txt dans le dossier racine de votre site.

Comment tester votre fichier Robots.txt ?

Il est fortement recommandé de tester votre fichier Robots.txt. Nous avons vu d’innombrables cas où un simple caractère mal placé dans le fichier Robots.txt a accidentellement bloqué un contenu important des moteurs de recherche.

C’est pourquoi nous utilisons toujours le testeur de robots.txt de Google Search Console avant de déployer toute modification. Cet outil nous a aidés à détecter les problèmes potentiels avant qu’ils n’aient un impact sur la visibilité de nos clients dans les moteurs de recherche.

Tout d’abord, vous devrez faire en sorte que votre site soit lié à Google Search Console. Si vous ne l’avez pas encore fait, consultez notre guide sur l ‘ajout de votre site WordPress à Google Search Console.

Ensuite, vous pouvez utiliser l’outil de test des robots de la Google Search Console.

Choose property

Il vous suffit de sélectionner votre bien dans la liste déroulante.

L’outil récupère automatiquement le fichier Robots.txt de votre site et met en évidence les erreurs et les avertissements qu’il trouve.

Robots Tester Tool

Réflexions finales

L’objectif de l’optimisation de votre fichier robots.txt est d’empêcher les moteurs de recherche d’explorer les pages qui ne sont pas accessibles au public. Par exemple, les pages de votre dossier wp-plugins ou les pages de votre dossier d’administration WordPress.

Un mythe répandu parmi les experts en référencement est que le blocage des catégories, des identifiants et des pages d’archives de WordPress améliorera le taux d’exploration et se traduira par une indexation plus rapide et un meilleur classement.

Ce n’est pas vrai. C’est également contraire aux consignes de Google pour les webmasters.

Nous vous recommandons de suivre le format Robots.txt ci-dessus pour créer un fichier Robots.txt pour votre site.

Guides d’experts sur l’utilisation de Robots.txt dans WordPress

Maintenant que vous savez comment optimiser votre fichier robots.txt, vous pouvez consulter d’autres articles relatifs à l’utilisation de robots.txt dans WordPress.

Nous espérons que cet article vous a aidé à apprendre comment optimiser votre fichier WordPress robots.txt pour le référencement. Vous pouvez également consulter notre guide ultime de référencement WordPress et nos choix d’experts pour les meilleurs outils de référencement WordPress pour développer votre site.

Si vous avez aimé cet article, veuillez alors vous abonner à notre chaîne YouTube pour obtenir des tutoriels vidéo sur WordPress. Vous pouvez également nous trouver sur Twitter et Facebook.

Disclosure: Our content is reader-supported. This means if you click on some of our links, then we may earn a commission. See how WPBeginner is funded, why it matters, and how you can support us. Here's our editorial process.

The Ultimate WordPress Toolkit

Get FREE access to our toolkit - a collection of WordPress related products and resources that every professional should have!

Reader Interactions

128 commentairesLeave a Reply

  1. Thanks for this informative post about robots.txt file.
    I didn’t know that websites should maintain this file in order to have a control over Google bots that how should they crawl over our pages and posts.
    for beginner websites just starting out, is there a need to have robots.txt file or is there a way like plugin which can a make a robots.txt file for our website?

    • Most SEO plugins help with setting up the robots.txt for a new site to prevent bots from scrolling sections they shouuldn’t.

      Admin

  2. Thanks to this article, I checked the robots.txt file and added URL addresses with sitemaps. At the same time, I had other problematic lines there, which were revealed by the validator. I wasn’t familiar with sitemaps in robots.txt until now. Thanks.

  3. Hi,

    Thanks for that post, it becomes clearer how to use the robots.txt file. On most websites that you find while looking for some advice regarding the robots.txt file, you can see that the following folders are explicitly excluded from crawling (for WordPress):
    Disallow: /wp-content/plugins
    Disallow: /wp-content/cache
    Disallow: /wp-content/themes

    I don’t really understand the reasons to exclude those folders (is there one actually?). What would be your take regarding that matter?

    • It is mainly to prevent anything in those folders from showing as a result when a user searches for your site. As that is not your content it is not something most people would want to appear for the site’s results.

      Admin

  4. Disallow: /wp-admin/
    Allow: /wp-admin/admin-ajax.php

    GSC show the coverage error for “Disallow: /wp-admin/” Is this wrong?

    • For most sites, you do not want anything from your wp-admin to appear as a search result so it is fine and expected to receive the coverage area when you deny Google the ability to scan your wp-admin.

      Admin

  5. I am creating my robots.txt manually as you instructed for my WordPress site.

    I have one doubt. when I write User-Agent: * won’t it allow another spamming robot to access my site?
    Should I write User-Agent: * or User-Agent: Googlebot.?

    • The User-Agent line is setting the rules that all robots should follow on your site, if you specify a specific bot on that line it would be setting rules for that specific bot and none of the others.

      Admin

  6. should we also disallow /wp-content/themes/ ?

    It is appearing in the search result when I run the command site:abcdef.com in google search

    • You would not want to worry about blocking your themes folder and as you write SEO-friendly content you should no longer see the themes as a search result.

      Admin

    • That means you’re telling search engines to not look at any referral links or the readme.html file.

      Admin

    • If you block your uploads folder then search engines would not normally crawl your uploaded content like images.

      Admin

  7. Sir i m very confused about robot.txt many time i submitted site map in blogger but the after 3,4 days coming the same issue what is the exactly robot.txt.. & how submit that please guide me

  8. Hi
    I have a question
    i receive google search console coverage issue warning for blocked by robots.txt
    /wp-admin/widgets.php
    My question is, can i allow for wp-admin/widgets.php to robots.txt and this is safe?

  9. Hello! I really like this article and as I’m a beginner with all this crawling stuff I would like to ask something in this regard. Recently, Google has crawled and indexed one of my websites on a really terrible way, showing the pages in search results which are deleted from the website. The website didn’t have discouraged search engine from indexing in the settings of WordPress at the beginning, but it did later after Google showed even 3 more pages in the search results (those pages also doesn’t exist) and I really don’t understand how it could happen with “discourage search engine from indexing” option on. So, can the Yoast method be helpful and make a solution for my website to Google index my website on the appropriate way this time? Thanks in advance!

    • The Yoast plugin should be able to assist in ensuring the pages you have are indexed properly, there is a chance before you discouraged search engines from crawling your site your page was cached.

      Admin

      • Well yes and from all pages, it cached the once who doesn’t exist anymore. Anyway, as the current page is on “discourage” setting on, is it better to keep it like that for now or to uncheck the box and leave the Google to crawl and index it again with Yoast help? Thanks! With your articles, everything became easier!

        • You would want to have Google recrawl your site once it is set up how you want.

  10. Hi I loved the article, very precise and perfect.
    Just a small suggestion kindly update the image ROBOTS.txt tester, as Google Console is changed and it would be awesome if you add the link to check the robots.txt from Google.

    • Thank you for the feedback, we’ll be sure to look into updating the article as soon as we are able.

      Admin

  11. My blog’s robots.txt file was:
    User-Agent: *
    crawl-delay: 10

    After reading this post, I have changed it into your recommended robots.txt file. Is that okay that I removed crawl-delay

  12. Thank you for sharing. This was really helpful for me to understand robots.txt
    I have updated my robots.txt to the ideal one you suggested. i will wait for the results now

  13. thanks for update information for me. Your article was good for Robot txt. file. It gave me a piece of new information. thanks and keep me updating with new ideas.

  14. My wordpress site is new and my robot.txt by default is
    user-agent: *
    Disallow: /wp-admin/
    Allow: /wp-admin/admin-ajax.php

    I want google to crawl and index my content. Is that robot.txt okay?

  15. Great Airticle…

    I was confused from so many days about Robots.txt file and Disallow links. Have copied the tags for robots file. Hope this will solve the issue of my Site

  16. The files in the screenshots of your home folder are actually located under the public_html folder under my home folder.

    I did not have a /refer folder under my public_html folder.

    I did not have post or page xml files anywhere on my WP account.

    I did include an entry in the robots.txt file I created to disallow crawling my sandbox site. I’m not sure that’s necessary since I’ve already selected the option in WP telling crawlers not to crawl my sandbox site, but I don’t think it will hurt to have the entry.

    • Some hosts do rename public_html to home which is why you see it there. You would want to ensure Yoast is active for the XML files to be available. The method in this article is an additional precaution to help with preventing crawling your site :)

      Admin

  17. User-agent: *
    Disallow: /wp-admin/
    Allow: /wp-admin/admin-ajax.php <– This is my robot.txt code but im confuse why my /wp-admin is index? How to no index it?

  18. This website really inspire me to start a blog .Thank you lost of tema.this website each and every article have rich of information and explanation.when i have some problem at first i visit this blog . Thank You

  19. I am trying to optimise robots for my website using Yoast. However Tools in Yoast does not have the option for ‘File Editor’.
    There are just two options
    (i) Import and Export
    (ii) Bulk editor
    May you please advise how this can be addressed. Could it be that I am on a free edition of Yoast?

    • The free version of Yoast still has the option, your installation may be disallowing file editing in which case you would likely need to use the FTP method.

      Admin

  20. I really find this article helpful because I really don’t know much on how robot.txt works but now I do.

    pls what I don’t understand is how do I find the best format of robot.txt to use on my site (I mean one that works generally)?

    I noticed lots of big blogs I check ranking high on search engine uses different robot.txt format..

    I’ll be clad to see a reply from you or just anyone that can help

    • Having a sitemap and allowing the areas that need to be allowed is the most important part. The disallow part will vary based on each site. We shared a sample in our blog post, and that should be good for most WordPress sites.

      Admin

  21. Well written article, I recommend the users to do sitemap before creating and enabling their ROBOTS text it will help your site to crawl faster and indexed easily.

    Jack

  22. I keep getting the error message below on google webmaster. I am basically stuck. A few things that were not clear to me on this tutorial is where do I find my site’s root files, how do you determine if you already have a “robots.txt” and how do you edit it?

    • Hi Cherisa,

      Your site’s root folder is the one that contains folders like wp-admin, wp-includes, wp-content, etc. It also contains files like wp-config.php, wp-cron.php, wp-blogheader.php, etc.

      If you cannot see a robots.txt file in this folder, then you don’t have one. You can go a head and create a new one.

      Admin

      • Thank you for your response. I have looked everywhere and can’t seem to locate these root files as you describe. Is there a path directory I can take that leads to this folder. Like it is under Settings, etc?

  23. I had a decent web traffic to my website. Suddenly dropped to zero in the month of May. Till now I have been facing the issue. Please help me to recover my website.

  24. Hello There Thank you For This Information, But I Have A Question
    That I Just Create The Sitemap.xml and Robots.txt File, & Its Crawling well. But How Can I Create “Product-Sitemap.xml”
    There is all list of product in sitemap.xml file. Do I Have To Create Product-sitemap.xml separately?

    and submit to google or bing again ?
    Can You please Help me out…
    Thank You

  25. I have a problem on robots.txt file setting. Only one robots.txt is showing for all websites. Please help me to show separate robots.txt file of all websites. I have all separate robots.txt file of all individual website. But only one robots.txt file is showing in browser for all websites.

  26. Please explain why did you include
    Disallow: /refer/
    in the beginner Robots.txt example? I do not understand the implications of this line. Is this important for the beginner? You have explained the other two Disallowed ones.

    Thanks.

  27. hey,,i am getting error in yoast seo regarding site map..once i click on fix it ,,,it’s coming again..my site html is not loading properly

  28. I’ve just been reviewing my Google Webmaster Tools account and using the Search Console, I’ve found the following:
    Page partially loaded
    Not all page resources could be loaded. This can affect how Google sees and understands your page. Fix availability problems for any resources that can affect how Google understands your page.

    This is because all CSS stylesheets associated with Plugins are disallowed by the default robots.txt.

    I understand good reasons why I shouldn’t just make this allowable, but what would be an alternative as I would suspect the Google algorithms are marking down the site for not seeing these.

  29. Hi,

    Whenever, I search my site on the google this text appears below the link: “A description for this result is not available because of this site’s robots.txt”

    How, can i solve this issue?

    Regards

    • Hi Suren,

      Seems like someone accidentally changed your site’s privacy settings. Go to Settings » Reading page and scroll down to ‘Search engine visibility’ section. Make sure that the box next to is unchecked.

      Admin

  30. Hello

    As i seen in webmaster tool, i got robot.txt file like below :

    User-agent: *
    Disallow: /wp-admin/
    Allow: /wp-admin/admin-ajax.php

    let me know is that okey ? or should i use any other ?

  31. I want to know, does it a good idea to block (disallow) “/wp-content/plugins/” in robots.tx? Every time i remove a plugin it shows 404 error in some pages of that plugin.

  32. I loved this explanation. As a beginner I was very confused about robot.txt file and its uses. But now I know what is its purpose.

Leave A Reply

Thanks for choosing to leave a comment. Please keep in mind that all comments are moderated according to our comment policy, and your email address will NOT be published. Please Do NOT use keywords in the name field. Let's have a personal and meaningful conversation.