Foto: Unsplash

OpenAI a Google údajně použily k tréninku svých modelů umělé inteligence přepisy videí z YouTube

Společnosti OpenAI a Google trénovaly své modely umělé inteligence na textech přepsaných z YouTube videí, čímž potenciálně porušovaly autorská práva tvůrců, uvedl deník The New York Times.

Podle NYT použila společnost OpenAI svůj nástroj pro rozpoznávání řeči Whisper k přepisu více než jednoho milionu hodin videí z YouTube, která byla následně použita k tréninku GPT-4. The Information již dříve informoval, že společnost OpenAI použila k tréninku svých nástrojů umělé inteligence videa z YouTube a podcasty. ,,Neoprávněné vytahování [částí obsahu] nebo stahování [celého]obsahu YouTube” ale není povoleno, uvedl pro NYT mluvčí společnosti Google Matt Bryant, který také řekl, že společnost o žádném takovém použití ze strany OpenAI neví.

Zpráva však tvrdí, že ve společnosti Google byli lidé, kteří o tom věděli, ale proti OpenAI nezakročili, protože sám Google používal videa z YouTube k trénování vlastních modelů umělé inteligence. Společnost Google sdělila NYT, že tak činili pouze u videí od tvůrců, kteří s tím souhlasili.

Zpráva NYT také tvrdí, že společnost Google v červnu 2023 požádala tým, aby upravil zásady ochrany osobních údajů tak, aby se více vztahovaly na používání veřejně dostupného obsahu (včetně Dokumentů Google a Tabulek Google) k trénování jejích AI modelů. Bryant pro NYT uvedl, že tento typ dat je používán pouze se souhlasem uživatelů, kteří se rozhodnou pro testování experimentálních funkcí společnosti Google, a že společnost ,,na základě této slovní změny nezačala trénovat na dalších typech dat”. 

Zdroj: engadget.com