AMD Radeon Instinct: nové grafické akcelerátory pro strojové učení

  • AMD představilo budoucnost v oblasti hardwaru a softwaru pro serverové nasazení
  • Společným jmenovatelem je strojové učení a neuronové sítě
  • Nové grafické akcelerátory budou konkurovat například i Tesla P100 od Nvidie

V oblasti akceleraci strojového učení, hlubokých neuronových sítí, big data nebo umělé inteligence obecně si Nvidia v posledních letech vybudovala velmi silnou pozici i s vlastním frameworkem CUDA a dalšími nástroji.

V segmentu serverů má tak AMD po stránce grafických akcelerátorů mnohem slabší pozici, ale to by se mohlo změnit s novými generacemi jak grafických akcelerátorů, tak i softwaru a kompletní řešení i s procesory Zen.

Radeon Instinct: kombinace hardwaru a softwaru

AMD pod označením Radeon Instinct zahrnuje dvě části – hardware v podobě nových grafických akcelerátorů a také otevřenou softwarovou platformu s označením ROCm (Radeon Open Compute Platform).

Klepněte pro větší obrázek
Stavení bloky Radeon Instinct

Výhodou je, že tato platforma už je na trhu přes rok, takže již existuje podpora řady nástrojů, knihoven a frameworků. Přehled můžete vidět na obrázku, je mezi nimi například Caffe nebo třeba i TensorFlow od Googlu.

Klepněte pro větší obrázek
Softwarová platforma ROCm

Oproti Nvidii, která staví na více uzavřené platformě, se tak AMD snaží vybudovat otevřenou variantu. Jak už jsme ale zmínili, Nvidia si za poslední roky vybudovala obří komunitu a v oblasti serverů a datacenter jsou akcelerátory Nvidia jedním z důvodů masivního růstu příjmů v posledních čtvrtletích. AMD tak z tohoto pohledu nic jiného, než otevřenost nezbývá, protože uzavřené řešení by nemohlo s Nvidií konkurovat.

Pasivně chlazení akcelerátory

AMD představilo tři modely grafických akcelerátorů Radeon Instinct. Jedná se o modely Instinct MI6, MI8 a MI25. Nejslabším modelem je Instinct MI6, který je postaven na moderním 14nm čipu s architekturou Polaris a v rámci TDP 150 W poskytuje výpočetní výkon 5,7 TFLOPS (SP, ve stylu Radeonu RX 480)). Karta je v tomto případě vybavená 16 GB paměti GDDR5 s propustností 224 GB/s.

Klepněte pro větší obrázek
Přehled akcelerátorů Radeon Instinct

Výkonnější model Instinct MI8 má zcela odlišnou konfiguraci, protože využívá ještě staršího 28nm čipu s architekturou Fiji, ale zároveň s 4 GB rychlé paměti HBM. Díky tomu je paměťová propustnost 512 GB/s. Celkový výpočetní výkon je 8,2 TFLOPS (SP) s TDP 175 W (podobně jako starší Radeon R9 Nano řady 300).

Klepněte pro větší obrázek

Nejvýkonnějším modelem bude Radeon Instinct MI25, který už bude mít čip založený na architektuře Vega. V rámci TDP 300 W poskytne výkon 12,5 TFLOPS (SP, při FP16 pak 25 TFLOPS). Další informace o tomto modelu zatím AMD bohužel neprozradilo. Tento model by měl ale přímo konkurovat nejvyššímu modelu od Nvidie – Tesla P100. Podle grafů je Radeon Instinct MI25 v testu DeepBench GEMM téměř dvakrát výkonnější, než nejnovější Titan X s architekturou Pascal od Nvidie.

Klepněte pro větší obrázekKlepněte pro větší obrázek

Ve všech případech jsou karty vybavené pouze pasivním chlazením, takže nemají žádné ventilátory. Generované teplo je ale pochopitelné nutné odvádět aktivním chlazením v rámci samotného serverového racku.

Kompletní řešení nejdříve v polovině příštího roku

I když nové výpočetní karty vypadají nadějně, AMD se potýká s problémem, který už trvá poměrně dlouho – dostupnost. Zatímco Nvidia už nové modely prodává, AMD by mělo možná stihnout první polovinu roku 2017, kdy už zase Nvidia může představit nejen nové modely, ale také klidně snižovat ceny a ještě více tak poškodit AMD.

Klepněte pro větší obrázek
Jeden procesor Zen dokáže díky podpoře 64 linek obsloužit čtyři karty napojené na PCI Express x16

AMD má ale oproti Nvidii šanci vytvořit kompletní serverovou platformu Naples na bázi čipů Zen, která by mohla cenově a výkonově konkurovat právě kombinaci Intel + Nvidia. Bude moci nabídnout celkem 64 linek PCI Express x16 v rámci jednoho procesoru, což znamená možnost připojit čtyři karty bez zpomalení propustnosti na sběrnici.

Klepněte pro větší obrázek

Ve výsledku tak může být kompletní řešení od AMD levnější, i když nelze předpokládat, že v oblasti procesoru bude výkonnější než Intel. Procesor je ale pro trénování hlubokých neuronových sítí a zpracování big data oproti výpočetním kartám stejně velmi neefektivní, takže v tomto případě záleží hlavně na výkonu akcelerátorů a celkové ceně a spotřebě platformy.

Váš názor Další článek: Google s chytrými automobily nekončí. Bude je vyvíjet startup Waymo, který spadá pod Alphabet

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , , ,