Le PDG de Microsoft en matière d'IA déclare que le contenu que vous publiez en ligne est un « logiciel gratuit » pour la formation en IA

Consultez notre autre site internet Juexparc.fr pour plus d’actualités et d’informations sur les jeux

Le PDG de la division IA de Microsoft s'est assis pour une interview au cours de laquelle il a abordé le sujet sensible de la provenance des données pour former les outils d'IA émergents populaires, tels que ChatGPT ou Copilot de Microsoft.

Jusqu'à présent, les données utilisées par des entreprises comme OpenAI pour entraîner ses réseaux neuronaux, qui alimentent ses outils d'IA les plus populaires, n'étaient pas suffisamment transparentes. L'ambiguïté autour de la provenance de ces grandes quantités de données par les entreprises d'IA a donné lieu à plusieurs poursuites judiciaires, les propriétaires de contenus en ligne affirmant qu'OpenAI et Microsoft avaient volé des contenus protégés par le droit d'auteur pour entraîner ses algorithmes d'IA, qui sont ensuite utilisés à des fins commerciales.

Advertisement

Deux auteurs ont déjà intenté un procès contre Microsoft et OpenAI pour avoir utilisé leurs travaux pour entraîner les modèles d’IA sans leur autorisation, tandis que huit journaux, ainsi que le New York Times, ont intenté des poursuites contre OpenAI et Microsoft. L’ambiguïté autour du contenu protégé par le droit d’auteur peut être attribuée à la zone grise des lois actuelles, sur laquelle les entreprises d’IA semblent s’appuyer pour s’en sortir en récupérant des données dans n’importe quelle zone d’Internet où elles le peuvent.

Mustafa Suleyman, PDG de Microsoft AI, a semblé faire allusion à cette lacune de la loi dans une récente interview avec CNBC, où il a déclaré qu'il existe une différence entre le contenu publié en ligne par des personnes et le contenu sauvegardé par les détenteurs de droits d'auteur.

« Je pense qu'en ce qui concerne le contenu qui est déjà sur le Web ouvert, le contrat social de ce contenu depuis les années 1990 est qu'il s'agit d'une utilisation équitable, » a-t-il déclaré. « N'importe qui peut le copier, recréer avec, reproduire avec. C'était un logiciel gratuit, si vous préférez. C'est ce que nous avons compris.« 

« Il existe une catégorie distincte dans laquelle un site Web, un éditeur ou une agence de presse a explicitement déclaré : « ne me grattez pas et ne m'explorez pas pour une autre raison que l'indexation », afin que d'autres personnes puissent trouver ce contenu, » il expliqua. « Mais c'est une zone grise. Et je pense que les tribunaux vont régler ce problème.« 

Advertisement