Bloquer les robots d'exploration d'IA sur votre site
4 min
Dans cet article
- Utiliser le fichier robots.txt pour bloquer les robots d'exploration d'IA
- Utiliser les balises Meta pour les robots afin de bloquer les robots d'exploration d'IA
- FAQ
Contrôlez qui peut accéder à votre contenu et l'utiliser en bloquant les robots d'exploration d'IA sur votre site. Ceci est particulièrement utile pour les propriétaires de sites qui souhaitent empêcher que leur contenu ne soit utilisé pour entraîner les modèles de langues (LLM) sans autorisation. Par exemple, un propriétaire de site avec des articles de recherche uniques peut ne pas vouloir que son contenu soit récupéré et utilisé par l'IA sans consentement.
Utiliser le fichier robots.txt pour bloquer les robots d'exploration d'IA
Le fichier robots.txt de votre site contient des instructions pour autoriser ou refuser certaines demandes des moteurs de recherche. La commande « allow » indique aux robots d'exploration les liens qu'ils peuvent suivre, tandis que la commande « disallow » indique aux robots d'exploration les liens qu'ils ne peuvent pas suivre.
Pour configurer le fichier robots.txt afin de bloquer les robots d'exploration d'IA :
- Accédez à Optimisation pour les moteurs de recherche (référencement) dans le tableau de bord de votre site.
- Sélectionnez Éditeur de robots.txt sous Outils et paramètres.
- Cliquez sur Afficher le fichier.
- Cliquez sur le champ sous Votre fichier robots.txt.
- Ajoutez les informations de votre fichier robots.txt en écrivant les directives suivantes sous Ceci est votre fichier actuel :
- Agent utilisateur : CCBot
Disallow: / - Agent utilisateur : GPTBot
Disallow: / - Agent utilisateur : ChatGPT-User
Disallow: / - Agent utilisateur : BingAI
Disallow: /
- Agent utilisateur : CCBot
- Cliquez sur Enregistrer les modifications.
- Cliquez sur Enregistrer.

Suggestion :
Cette liste comprend certains robots d'exploration d'IA connus, mais vous pouvez toujours en ajouter d'autres si nécessaire.
Utiliser les balises Meta pour les robots afin de bloquer les robots d'exploration d'IA
Les balises Meta sont des morceaux de code HTML qui contiennent des informations sur la page que les navigateurs Web et les moteurs de recherche peuvent lire. La configuration des balises Meta pour les robots de votre site vous permet d'avoir un contrôle spécifique à la page sur la façon dont le HTML est exploré et indexé dans les résultats de recherche.
Pour utiliser des balises Meta afin de bloquer les robots d'exploration d'IA :
Éditeur Wix
Éditeur Studio
- Accédez à votre Éditeur.
- Cliquez sur Pages et menu
à gauche de l'éditeur.
- Cliquez sur l'icône Plus d'actions
à côté de la page concernée.
- Cliquez sur Bases de référencement.
- Cliquez sur l'onglet SEO avancé.
- Cliquez sur Balises Meta pour les robots.
- Cochez la case nosnippet pour empêcher que le contenu de votre page ne soit utilisé comme saisie directement pour les résumés de l'IA.

- Publiez votre site.
En savoir plus sur les balises Meta pour les robots de Google.
FAQ
Cliquez sur une question ci-dessous pour en savoir plus sur le blocage des robots d'exploration d'IA sur votre site.
Puis-je bloquer tous les robots d'exploration ?
Existe-t-il un moyen de bloquer complètement les robots d'exploration non autorisés ?
Le blocage des robots d'exploration affectera-t-il mon référencement ?
Comment savoir quels robots d'exploration bloquer ?