Deník N – rozumět lépe světu

Deník N

Učí počítače rozumět lidem: Do AI můžete nasypat, co chcete. Vytvoří věci na povrchu krásné, ale obsahově špatně

Věra Dvořák na koláži vytvořené AI. Zdroj: archiv Věry Dvořák
Věra Dvořák na koláži vytvořené AI. Zdroj: archiv Věry Dvořák

„AI vlastně jen napodobuje to, co už viděla, snaží se jen doplnit nejpravděpodobnější zakončení,“ říká lingvistka Věra Dvořák, která se v New Yorku zabývá strojovým učením jazykových dat a učí umělou inteligenci rozeznat správná data. V rozhovoru popisuje, proč počítač odpoví i v případě, že dobrá data nemá, a co je nyní pro týmy vylepšující AI největší problém. Dvořák také v Americe vyučuje děti češtinu a popisuje, proč je výuka u nás stále jako v dobách národního obrození.

Tento text pro vás načetl robotický hlas. Pokud najdete chybu ve výslovnosti, dejte nám prosím vědět. Audioverze článků můžete poslouchat v rámci klubového předplatného. Plné znění audioverzí článků je dostupné pouze pro předplatitele Klubu N. Upgradujte své předplatné. Plné znění audioverzí článků je dostupné pouze pro předplatitele Klubu N. Předplaťte si ho také.

Na co se v rozhovoru také ptáme:

  • Jak lze počítače učit jazyk a čím se to liší od ovládnutí mateřského jazyka u dětí.
  • Jaké chyby umělá inteligence dělá a v čem je nyní největší problém.
  • Kdy počítač halucinuje.
  • Proč je její odpověď pokaždé jiná.
  • Podle čeho AI vybírá informace do svých odpovědí.
  • Jak se do jejích odpovědí dostávají emoce.
  • Čím se liší výuka angličtiny v USA od výuky češtiny v Česku.
  • Proč by metoda výuky jazyka v kontextu fungovala v češtině ještě lépe než v angličtině.
  • Co je pro americké učitele skutečná chyba a jak s ní ve výuce pracují.

Jste lingvistka, zakotvila jste nicméně ve světě informačních technologií, kde pracujete jako manažerka strojového učení a anotování jazykových dat. Co si pod tím můžeme představit?

Žijeme ve světě, kde se čím dál více využívá umělá inteligence. Aby nám rozuměla, musíme ji naučit náš jazyk – tak, jako se lidé učí svůj mateřský jazyk, ale zároveň i druhý, třetí jazyk. Když to hodně zjednoduším, učím počítače rozumět lidskému jazyku.

Jak se umělá inteligence učí lidskému jazyku? Tím, že s ní komunikujeme? Nebo ji učíte strukturu jazyka a – poněkud s nadsázkou – slovíčka?

Řada lidí si klade otázku, zda počítač jazyk chápe stejně jako lidé. Jako lingvistka mohu říct, že ne. Je to založené na úplně jiné bázi. Počítače rozumí jazyku ne proto, že by chápaly jeho strukturu, syntax, morfologii, že by měly definovaný význam jednotlivých slov.

Fungují zcela odlišně než lidský mozek. Jako lingvistka jsem studovala, jak lidský mozek jazyk zpracovává a produkuje. Jak funguje komputační systém, který máme zabudovaný v hlavě a který způsobuje, že rozumíme vyřčenému a pak sami reagujeme ve slovech a větách, aniž musíme přemýšlet o tom, jak se to děje.

Počítače ale tento komputační systém nepoužívají. Jsou natrénované na velkém množství dat, a protože už něco velmi podobného viděly mnohokrát, vědí, jak na to zareagovat, jak tomu „rozumět“. Mají už kontext. Není to ale stejně porozumění, jaké máme my. Umělá inteligence, všechny různé „chytré“ aplikace jsou založené na učení z velkého množství dat. Moje práce jako lingvistky je dodávat tato data, ovšem kvalitní data, aby se umělá inteligence zlepšovala, lépe lidem rozuměla.

Čím častěji tedy umělá inteligence vidí nějaké věty v kontextu, tím je schopnější je dekódovat?

Ano. A je schopná sama odpovědět.

Jak moc se liší způsoby, jak se my učíme mateřský jazyk, a jak se učí jazyk umělá inteligence?

Dalo by se říct, že je to v úplném protikladu. U dětí se mluví o takzvaném Platónově problému, kdy děti dosud vyslechly velmi málo, mají tedy omezený (slovní) vstup, slyší od rodičů pořád stejné věty: tohle je autíčko, tohle je medvídek. Přesto posléze začnou produkovat věty, které vlastně nikdy neslyšely. Jsou v tom velmi tvořivé.

U umělé inteligence je to jiné, protože

Tento článek je exkluzivním obsahem pro předplatitele Deníku N.

Češi v Americe

Rozhovory

Školství

Umělá inteligence

Věda

V tomto okamžiku nejčtenější