Le PDG de Microsoft AI pense que vous avez accepté un « contrat social » pour la formation en IA

Consultez notre autre site internet Juexparc.fr pour plus d’actualités et d’informations sur les jeux

Kris Carlon / Autorité Android

TL;DR

Advertisement

  • Le PDG de Microsoft AI a suscité la controverse lorsqu’il a comparé Internet à un « logiciel gratuit » pour la formation de l’IA.
  • Il a suggéré que le « contrat social » d’Internet permet l’utilisation sans restriction du contenu public pour la formation de l’IA.
  • La communauté en ligne a vivement réagi, considérant sa position comme une mauvaise interprétation de l'usage loyal et un mépris des droits des créateurs de contenu.

Mustafa Suleyman, PDG de Microsoft AI, s'est récemment retrouvé au centre d'un débat houleux à la suite d'une déclaration controversée faite lors de l'Aspen Ideas Festival. Il a suggéré qu’Internet fonctionne essentiellement comme un « logiciel gratuit » pour entraîner des modèles d’IA, une affirmation qui a suscité de vives critiques de la part des créateurs de contenu et des utilisateurs en général.

Vers la 13e minute cette interviewl'animateur a soulevé des inquiétudes concernant la formation de l'IA utilisant du contenu en ligne, abordant la présence de nombreux auteurs dans le public et mentionnant l'utilisation par OpenAI de transcriptions de vidéos YouTube pour former ses modèles.

L'intervieweur s'est demandé qui devrait détenir la propriété intellectuelle (PI) dans de tels cas et comment les accords commerciaux autour de celles-ci devraient être structurés, laissant entendre que les sociétés d'IA pourraient « voler » la propriété intellectuelle mondiale.

Voici la réponse de Suleyman à la question :

Advertisement

En ce qui concerne le contenu qui est déjà sur le Web ouvert, le contrat social qui s'applique à ce contenu depuis les années 1990 est qu'il s'agit d'un usage équitable. N'importe qui peut le copier, le recréer, le reproduire. C'est ce qu'on appelle un « logiciel gratuit », c'est ce qu'on entend par là. Il existe une catégorie distincte dans laquelle un site Web, un éditeur ou un organisme de presse a explicitement demandé de ne pas explorer ou extraire son contenu pour toute autre raison que pour l'indexer afin que d'autres personnes puissent trouver ce contenu. C'est une zone grise, et je pense que les tribunaux vont régler cette question.

Les remarques de Suleyman suggèrent que les développeurs d’IA peuvent utiliser librement la grande quantité de données disponibles en ligne pour former leurs modèles. Cette vision semble ignorer les questions juridiques et éthiques complexes entourant la propriété du contenu et les droits d’utilisation. L’utilisation équitable autorise une utilisation limitée de matériel protégé par le droit d’auteur à des fins telles que la critique, l’enseignement ou la recherche. Cependant, l’utilisation de grandes quantités de contenu pour développer des modèles d’IA va au-delà de ces limites, en particulier lorsque des motifs commerciaux évidents sont en jeu.

Le commentaire n'a pas été très bien accueilli par la communauté en ligne, et de nombreux utilisateurs de X (anciennement Twitter) l'ont depuis republié la vidéo avec leurs prises Des personnalités éminentes du secteur technologique, comme Tom Warren, ont remis en question la politique de deux poids deux mesures de Microsoft, demandant si l'entreprise accepterait que son système d'exploitation Windows soit traité comme un logiciel gratuit.

D’autres, comme l’artiste Denman Rooke, ont souligné la différence entre le fait de visionner ou de télécharger une œuvre d’art en ligne et son utilisation à des fins commerciales sans autorisation, soulignant que cette dernière constitue un vol.

Internet regorge de contenus créés par des journalistes, des artistes et bien d’autres qui comptent sur l’argent qu’ils tirent de leur travail. Lorsque les entreprises d’IA utilisent ce contenu pour entraîner leurs modèles sans autorisation, elles leur enlèvent de la valeur sans rémunérer les créateurs d’origine. L'intervieweur a comparé cela à un auteur faisant référence à d'autres livres tout en écrivant le sien. Même si l'auteur ne paie pas les auteurs référencés, ils doivent quand même acheter les livres ou payer les frais de bibliothèque.

Advertisement

À cela, Suleyman a fait valoir que le coût de production de l’information tomberait bientôt à presque zéro grâce à l’IA. Traditionnellement, la création d’informations était coûteuse, mais les modèles d’IA peuvent potentiellement ramener le coût de production d’informations à presque rien.

Pour ce que ça vaut, OpenAI a récemment fait des pieds et des mains pour conclure des accords de licence de contenu avec de grandes maisons de médias et des plateformes en ligne, dont Reddit, afin d'utiliser leur contenu pour former ses modèles GPT.

Ce débat souligne le besoin urgent de lignes directrices et de normes éthiques claires dans le domaine de l’IA et soulève également des questions plus larges sur l’avenir de l’économie de l’information et la nécessité de s’adapter à un paysage technologique en évolution rapide.

Que pensez-vous de ce problème ? Partagez votre opinion dans les commentaires ci-dessous.

Vous avez un conseil ? Parlez-en avec nous ! Envoyez un e-mail à notre équipe à news@androidauthority.com. Vous pouvez rester anonyme ou obtenir le crédit pour l'information, c'est votre choix.

Advertisement