Que ce soit Apple, Google, OpenAI ou encore Meta, pour entrainer une intelligence artificielle générative, il faut lui donner de quoi apprendre. Si Apple a utilisé des médias en ligne (ce qui a créé une petite polémique au passage), Meta a utilisé ses ressources internes : les publications publiques de Facebook et Instagram. Un gigantesque atout qu'avait Meta et que ne possédaient pas ses principaux concurrents.

Meta a été malin pour entrainer son IA

En juin dernier, Mark Zuckerberg a présenté une nouvelle initiative majeure pour Meta : l'exploitation des données de deux de ses réseaux sociaux (Facebook et Instagram) pour former ses systèmes d'intelligence artificielle générative. Cependant, il s'avère que cette pratique était déjà en cours depuis des années, preuve que Meta n'a pas joué franc-jeu et a caché des informations sur l'utilisation des données d'utilisateurs.



Depuis 2007, toutes les publications publiques sur Facebook et Instagram, y compris les messages, photos et commentaires, ont été utilisées pour nourrir l'IA de Meta. Contrairement à ChatGPT, qui repose sur une base de données plus restreinte, Meta s'appuie sur une vaste quantité d'informations utilisateur, dépassant de loin les pratiques standards. Cette collecte massive de données, effectuée sans l'autorisation des utilisateurs, pose d'importantes préoccupations en matière de vie privée.

Melinda Claybaugh, directrice mondiale de la vie privée de Meta, a d'abord nié l'utilisation des publications des utilisateurs pour former l'IA. Toutefois, après des révélations plus approfondies, elle a admis que cela concernait bien les publications publiques. Si Meta affirme ne pas avoir utilisé les publications des comptes de mineurs de moins de 18 ans, il est avéré que des photos d'enfants publiées par leurs parents ont tout de même été incluses dans les données collectées.



La formation d'une intelligence artificielle générative est un processus complexe. Elle nécessite des quantités massives de données diversifiées pour entraîner le modèle, des algorithmes avancés pour interpréter ces informations et une infrastructure informatique capable de traiter ces données en temps réel. L'intervention humaine reste également cruciale pour superviser et éviter les biais ou les contenus inappropriés, tout en garantissant l'éthique et la confidentialité des données.



Les pratiques de Meta révèlent une utilisation des données utilisateur sans précédent, qui ne se limite pas seulement aux simples informations textuelles, mais s'étend également aux photos et autres contenus visuels partagés sur ses plateformes. La question de la confidentialité est donc plus pertinente que jamais, tandis que Meta continue de développer des systèmes d'IA de plus en plus modernes.



