Le Scraping est-il légal ?

Le web scraping, ou extraction automatisée de données en ligne, soulève souvent des questions juridiques : est-ce légal ? Entre RGPD, droit d’auteur et décisions de justice, faisons le point sur ce que la loi autorise réellement en France, en Europe et dans le reste du monde.

6 novembre 2025

Chez Terros, nous développons des solutions sur mesure pour le web, le mobile… et aussi pour l’extraction automatisée de données (scraping).

Une question revient souvent chez nos clients :

« Est-ce que le scraping est légal ? »

Voici notre réponse claire, documentée et à jour des dernières positions de la CNIL (juin 2025) et de la jurisprudence européenne.


🔍 Qu’est-ce que le scraping ?

Le web scraping désigne l’automatisation de la collecte de données publiquement visibles sur des sites internet.

Contrairement au piratage, il n’y a ni intrusion ni contournement : on se contente de lire, de manière automatisée, des pages que tout internaute peut consulter.

Cette technique est omniprésente : moteurs de recherche, comparateurs de prix, outils de veille, agrégateurs ou IA génératives l’utilisent quotidiennement.


⚖️ Le scraping est-il légal ?

La réponse courte :

👉 Oui, le scraping est légal dans de nombreux cas, à condition de respecter certaines règles simples de loyauté, de respect des droits et de protection des données.


1️⃣ Les données publiques peuvent être extraites

En Europe, les tribunaux confirment régulièrement que l’extraction de données librement accessibles n’est pas interdite par défaut, tant que :

  • il n’y a pas de contournement d’un accès restreint (login, mot de passe, pare-feu) ;

  • les données ne sont pas protégées par un droit spécifique (droit d’auteur, droit sui generis) ;

  • l’usage reste loyal et proportionné à l’objectif poursuivi.

➡️ Jurisprudences clés :

  • CJUE, 15 janvier 2015, Ryanair / PR Aviation, C-30/14

    → Les données accessibles publiquement ne sont pas couvertes automatiquement par le droit sui generis ; il faut prouver un investissement substantiel pour interdire leur réutilisation.

  • TGI Paris, 19 novembre 2007, Keljob / Cadremploi

    → Le scraping d’offres d’emploi n’est pas illégal s’il ne reproduit pas la totalité d’une base et sert un objectif légitime (indexation, veille).

  • Cour d’appel de Paris, 5 avril 2018, Bourse Direct / France Télévisions

    → Pas d’infraction si les données sont publiques et si aucun dispositif technique n’est contourné.

💡 En résumé : scraper des informations publiques et non protégées, sans contourner d’accès ni copier intégralement une base, est licite.


2️⃣ Droit d’auteur et parasitisme : les limites classiques

Ce qu’il faut éviter :

  • Reproduire une œuvre originale (textes, photos, structure complète d’un site) ;

  • Copier massivement sans valeur ajoutée, ce qui peut être qualifié de parasitisme économique ou de concurrence déloyale.

➡️ Références :

  • Code de la propriété intellectuelle, articles L341-1 et s.

  • Cass. com., 22 mars 2011, n° 09-70.833 : la reprise systématique d’informations peut constituer un acte de concurrence déloyale selon le contexte.

👉 L’extraction ciblée, partielle, et transformée (veille, agrégation, analyse) est parfaitement admise.


3️⃣ Le scraping et le RGPD : attention aux données personnelles

Dès que les données collectées concernent une personne identifiable (nom, pseudo, photo…), le RGPD s’applique.

Mais là encore, ce n’est pas interdit : il faut juste une base légale et des mesures de protection.

Ce qu’exige la CNIL (juin 2025) :

  • Fonder la collecte sur l’intérêt légitime (article 6-1-f RGPD) ;

  • Limiter la collecte aux données strictement nécessaires (principe de minimisation) ;

  • Respecter les sites qui s’opposent explicitement au moissonnage (robots.txt, CAPTCHA, CGU claires) ;

  • Supprimer immédiatement les données sensibles (santé, religion, orientation…) si elles apparaissent par accident ;

  • Informer les personnes ou, a minima, publier une politique de transparence accessible.

➡️ Source : CNIL, fiche “Mesures à prendre en cas de collecte des données par moissonnage”, 19 juin 2025

Chez Terros, nous appliquons une approche “scraping éthique” :

  • filtrage automatisé des données personnelles ;

  • respect des signaux d’exclusion techniques (robots.txt, ai.txt, tdmrep.json) ;

  • anonymisation et pseudonymisation immédiates ;

  • documentation RGPD et assistance à la conformité pour nos clients.


4️⃣ Le scraping ne doit pas nuire au site cible

Les protections techniques (robots.txt, limites de fréquence, captchas, blocage d’IP) visent à réguler l’accès.

Les contourner de manière agressive ou répétée peut être assimilé à une atteinte à un système de traitement automatisé de données (article 323-1 du Code pénal).

Mais en pratique, tout dépend de l’intention et de l’impact technique :

un scraping mesuré, respectueux du serveur et conforme aux usages du web (comme celui des moteurs de recherche) ne pose aucun problème.

Chez Terros, nous :

  • respectons les temps de réponse et les limites serveurs ;

  • adaptons automatiquement la fréquence des requêtes ;

  • arrêtons les collectes en cas d’erreur répétée (HTTP 429, etc.) ;

  • assurons une empreinte réseau minimale.

👉 Résultat : nos robots sont souvent plus respectueux qu’un internaute humain qui recharge la même page vingt fois.

📚 Jurisprudences et sources utiles

  • CJUE, 15 janv. 2015, Ryanair / PR Aviation (C-30/14)

  • CA Paris, 5 avril 2018, Bourse Direct / France Télévisions

  • TGI Paris, 19 nov. 2007, Keljob / Cadremploi

  • CNIL, fiche “Moissonnage (web scraping) et intérêt légitime”, 19 juin 2025

  • RGPD, articles 5, 6, 13, 14

  • Code de la propriété intellectuelle, L341-1 et s.

  • Code pénal, article 323-1


💬 En conclusion

Le scraping responsable n’est ni du piratage, ni une zone grise : c’est une technologie essentielle à l’innovation, à la veille et à l’IA, dès lors qu’elle est encadrée et transparente.

Chez Terros, en tant qu'agence de Scraping, nous accompagnons nos clients pour scraper en toute légalité : données publiques, filtrées, respectueuses des règles, et conformes aux meilleures pratiques CNIL.

📩 Des questions ?

Nous comprenons que ces sujets peuvent sembler techniques.

Notre équipe est là pour vous conseiller et vous protéger juridiquement autant que techniquement.

Vous avez un projet de Scraping ? Discutons-en 🚀

Mettre en place une solution de Scraping