Les pratiques de scraping de Perplexity posent un gros problème
Alban Martin
- Il y a 3 heures
- 💬 Réagir
- 🔈 Écouter
Perplexity, une entreprise d’IA que Apple envisagerait d’acquérir pour combler une partie de son retard, fait face à des critiques croissantes pour ses pratiques de scraping web (récupération sauvage automatisée du contenu des sites) jugées contraires à l’éthique.
Perplexity ne se fait pas que des amis
Alors que la société avait répondu après les premières accusations l'an passé, un récent rapport de Cloudflare allègue que Perplexity contourne les mesures anti-scraping, ignorant le protocole d’exclusion des robots et utilisant des crawlers non déclarés pour accéder à des contenus restreints. Ces crawlers, déguisés en navigateurs génériques, alternent les adresses IP et les ASN pour échapper aux blocages, effectuant des millions de requêtes quotidiennes sur des milliers de domaines.

Le problème a émergé en juin 2024 lorsque Wired et d’autres ont accusé Perplexity de plagiat et de violation des normes de crawling web. Le PDG Aravind Srinivas a attribué le problème à un fournisseur tiers de crawling, qualifiant les accusations de malentendus sur la technologie et le droit de la propriété intellectuelle. Certains médias comme le New York Times et la BBC ont même menacé juridiquement la startup, intensifiant la controverse. La défense de Perplexity repose sur une question de sémantique, arguant que leur IA traite des URL fournies par les utilisateurs, sans crawler, mais les critiques n’y voient aucune différence lorsqu’il s’agit d’extraction massive de données.
Bien que Perplexity nie tout acte répréhensible, affirmant que ses pratiques sont conformes aux normes de l’industrie, les conclusions de Cloudflare suggèrent un contournement délibéré des restrictions explicites des serveurs. Cela n’est pas exclusif à Perplexity — OpenAI et Anthropic font face à des critiques similaires — mais les actions de Perplexity attirent particulièrement l’attention en raison de l’intérêt d’Apple.
Apple n'a pas intérêt à racheter Perplexity
Apple, connu pour son engagement envers la confidentialité et l’éthique, doit évaluer les risques d’acquérir une entreprise à la réputation aussi controversée. La technologie de Perplexity pourrait renforcer les capacités d’IA d’Apple, mais ses pratiques s’opposent aux principes de Tim Cook. Une acquisition pourrait indiquer qu’Apple compromet ses valeurs pour rivaliser dans la course à l’IA, ce qui pourrait décevoir les parties prenantes plus que son retard actuel en IA, le nouveau Siri contextuel étant repoussé à 2026. Bien qu’Apple puisse réformer les pratiques de Perplexity après l’acquisition, les agissements passés de l’entreprise seraient un fardeau.
Tout cela rappelle que l'IA est un danger pour les créateurs de contenu sur Internet, comme votre serviteur, se servant allègrement des informations afin d'attirer et de garder des utilisateurs.
Télécharger l'app gratuite Perplexity
