マイクロソフトのAI担当CEOは、オンラインで投稿するコンテンツはAIトレーニング用の「フリーウェア」であると述べている

マイクロソフトの AI 部門の CEO がインタビューに応じ、ChatGPT やマイクロソフトの Copilot など人気の新しい AI ツールをトレーニングするためのデータがどこから来るのかというデリケートな問題に触れた。

これまで、OpenAIなどの企業が、同社の人気AIツールの原動力となるニューラルネットワークのトレーニングに使用しているデータセットについては、透明性がまったくなかった。AI企業がこうした膨大なデータをどこから入手しているかが不明瞭なため、オンラインコンテンツの所有者は、OpenAIとMicrosoftが著作権で保護されたコンテンツを盗んでAIアルゴリズムをトレーニングし、それを商業的に利用していると主張し、複数の訴訟に発展している。

Advertisement

すでに2人の著者が、マイクロソフトとOpenAIが彼らの著作物を許可なくAIモデルのトレーニングに利用したとして訴訟を起こしており、ニューヨークタイムズ紙を含む8つの新聞社もOpenAIとマイクロソフトを相手取って訴訟を起こしている。著作権で保護されたコンテンツをめぐる曖昧さは、現行法のグレーゾーンにまで遡ることができる。AI企業は、インターネットのあらゆる場所からデータを取得しても罰せられないように、このグレーゾーンに頼っているようだ。

マイクロソフトAIのCEO、ムスタファ・スレイマン氏は、最近のCNBCとのインタビューでこの法律のギャップについて言及し、個人がオンラインで公開するコンテンツと著作権者によってバックアップされたコンテンツには違いがあると述べた。

すでにオープンウェブ上にあるコンテンツに関しては、1990年代以来、そのコンテンツの社会契約はフェアユースであるということだったと思います。「彼はそう意見した。」誰でもそれをコピーし、それを使って再作成し、複製することができます。いわば、それはフリーウェアでした。それが理解されていました。

ウェブサイトや出版社、ニュース組織が「インデックス作成以外の目的でスクレイピングやクロールをしないでください」と明示的に宣言し、他の人がそのコンテンツを見つけられるようにする別のカテゴリがあります。” 彼が説明した。 “しかし、それはグレーゾーンです。そして、それは裁判所で解決されると思います。

Advertisement