Il CEO di AI di Microsoft afferma che i contenuti pubblicati online sono “freeware” per la formazione sull'intelligenza artificiale

Il CEO della divisione AI di Microsoft si è seduto per un'intervista in cui ha toccato il delicato argomento della provenienza dei dati per addestrare i popolari strumenti emergenti di AI, come ChatGPT o Copilot di Microsoft.

Finora, non c'è stata alcuna trasparenza sui set di dati utilizzati da aziende come OpenAI per addestrare le sue reti neurali, che alimentano i suoi popolari strumenti di intelligenza artificiale. L'ambiguità su dove le aziende di intelligenza artificiale stanno acquisendo queste grandi quantità di dati ha portato a diverse cause legali, con i proprietari di contenuti online che sostengono che OpenAI e Microsoft hanno rubato contenuti protetti da copyright per addestrare i suoi algoritmi di intelligenza artificiale, che vengono poi utilizzati a fini commerciali.

Due autori hanno già citato in giudizio Microsoft e OpenAI per aver utilizzato il loro lavoro per addestrare modelli di intelligenza artificiale senza il loro permesso, mentre otto giornali, insieme al New York Times, hanno intentato causa contro OpenAI e Microsoft. L’ambiguità sui contenuti protetti da copyright può essere fatta risalire all’area grigia delle leggi attuali, che sembra essere ciò su cui le aziende di intelligenza artificiale fanno affidamento per cavarsela prelevando dati da qualsiasi area di Internet possano.

Mustafa Suleyman, CEO di Microsoft AI, sembra alludere a questa lacuna nella legge in una recente intervista con la CNBC, dove ha affermato che esiste una differenza tra il contenuto pubblicato online da persone e il contenuto supportato dai detentori del copyright.

Advertisement

Penso che per quanto riguarda i contenuti già presenti sul web aperto, il contratto sociale di tali contenuti sin dagli anni '90 sia stato il loro uso corretto,“ha opinato. “Chiunque può copiarlo, ricrearlo, riprodurlo. Se vuoi, è stato un freeware. Questa è stata l'intesa.

Esiste una categoria separata in cui un sito web, un editore o una testata giornalistica ha esplicitamente detto: “non prelevarmi o scansionarmi per nessun altro motivo se non indicizzarmi”, in modo che altre persone possano trovare quel contenuto,” Lui ha spiegato. “Ma questa è la zona grigia. E penso che questo si farà strada attraverso i tribunali.

(tagToTranslate)Microsoft

Advertisement