Verze z 9. 9. 2016, 13:47 editovat 77.240.176.172 (diskuse) Opraven odkaz na anglickou wikipedii - AMD FireStream značka: možný spam ← Přejít na předchozí porovnání		Verze z 20. 11. 2016, 22:14 editovat zrušit editaci Ian sedmik junior (diskuse \| příspěvky) Prověření uživatelé 7 894 editací aktualizace, stylistika, doplnění, typografie + přidáno logo Přejít na další porovnání →
Řádek 1: {{Infobox - software \| jméno = CUDA \| logo = NVIDIA-CUDA.jpg \| velikost loga = \| obrázek = Řádek 7: \| alt = \| popisek = \| vývojář = [[NVIDIA\|nVIDIA]] Corp. \| aktuální verze = 8.0.51<ref>[http://www.nvidia.com/object/macosx-cuda-8.0.51-driver.html NVIDIA CUDA 8.0 for MAC OS X release] {{en}}</ref><br /> ~~\| aktuální verze = 7.5~~ \| datum aktuální verze = [[~~září~~2. listopad]]u [[~~2015~~2016]] \| připravovaná verze = \| datum připravované verze = \| operační systém = [[Microsoft Windows\|MS Windows]],~~<br~~ />[[OS X\|~~Mac OS X~~macOS]],~~<br~~ />[[Linux\|GNU/Linux]] \| programovací jazyk = \| typ softwaru = [[GPGPU]] \| licence = [[freeware]] \| lokalizace = \| web = [http://www.nvidia.com/object/cuda_home_new.html ~~http://~~www.nvidia.com] }} '''CUDA''' ([[Akronym\|akronym]] z [[Angličtina\|angl.]] '''C'''ompute '''U'''nified '''D'''evice '''A'''rchitecture, výslovnost [ˈkjuːdə]) je hardwarová a softwarová architektura,<ref>{{Citace elektronické monografie \| titul = nVIDIA CUDA Programming Guide Version 1.1 \| url = http://docs.nvidia.com/cuda/index.html#axzz3wagwJWX1 Řádek 26: \| datum přístupu = 2011-12-01 \| vydavatel = nVIDIA \| jazyk = ~~anglicky~~en }}</ref>, která umožňuje na vybraných [[GPU]] spouštět programy napsané v jazycích [[C (programovací jazyk)\|C]]/[[C++]], [[FORTRAN]] nebo programy postavené na technologiích [[OpenCL]], [[DirectCompute]] a jiných. ~~Tato~~Použití ~~architektura~~této architektury je ~~dostupná~~omezeno pouze na [[Grafická karta\|~~grafických~~grafické ~~akcelerátorech~~akcelerátory]] společnosti [[~~nVIDIA\|~~nVIDIA]], která ji vyvinula. Konkurenční technologie společnosti [[Advanced Micro Devices\|AMD]] se nazývá [~~https~~http://en.wikipedia.org/wiki/AMD_FireStream AMD FireStream] (dříve Close To Metal). Obě společnosti jsou také členy [[Khronos Group]], která zajišťuje vývoj OpenCL. == Historie == Technologii představila společnost nVIDIA v roce 2006. Následujícího roku bylo uvolněno [[Software development kit\|SDK]] ve verzi 1.0 pro karty [[NVIDIA Tesla\|nVIDIA Tesla]] založené na architektuře G80. Ještě v prosinci téhož roku vyšla verze CUDA SDK 1.1, která přidala podporu pro ~~karty~~GPU série [[GeForce#GeForce 8\|GeForce 8]]. Se správným ovladačem grafické karty přibyla podpora pro překrývání paměťových přenosů výpočtem a podpora pro více GPU akcelerátorů. V~~ ~~ roce 2008 bylo vydáno současně s architekturou G200 SDK 2.0. Postupně s verzemi SDK 2.~~0 – 2~~0–2.3 přibývala podpora pro emulovaný výpočet s [[double precision\|dvojnásobnou přesností]] (double-precision) a podpora pro C++ šablony v rámci kernelu. V~~ ~~ roce 2010 jebylo ~~v souvislosti~~spolu s mikroarchitekturou Fermi vydáno SDK 3.0, ~~kde je již~~obsahující nativní ~~podpora~~podporu pro výpočty s dvojnásobnou přesností, ~~podpora~~podporu pro ukazatele na funkce a ~~podpora~~podporu rekurze. Vylepšeny ~~jsou~~byly ~~také~~též profilovací nástroje a [[Debugger\|debuggery]] pro CUDA / OpenCL. V~~ ~~ květnu 2011 byla vydána verze CUDA SDK 4.0. Největší změnou je zde unifikace paměťových prostorů a masivní podpora [[Scalable Link Interface\|MultiGPU]]. Nejnovější verzí je CUDA SDK 78.50 ze září roku ~~2015~~2016. == Mikroarchitektura GPU == [[Soubor:Cpu-gpu.svg\|thumb\|270px\|CPU vs. GPU]] Drtivou většinu plochy [[čip]]u grafického akcelerátoru od nVidie zabírá velké množství relativně jednoduchých [[Skalární procesor\|skalárních procesorů]] (na rozdíl od ~~architektury~~architektur konkurenční firmy AMD, jejíž ~~multiprocesory~~GPU jsou tvořeny [[Very long instruction word\|VLIW]] [[SIMD]], resp. [[RISC]] [[SIMD]] jednotkami, tzv. stream procesory), které jsou organizovány do větších celků zvaných [[Streaming multiprocesor\|streaming multiprocesory]]. Vzhledem k tomu, že se jedná o  [[Single Instruction Multiple Threads\|SIMT]] architekturu, řízení jednotek a plánování instrukcí je jednoduché a spolu s velmi malou [[Cache\|vyrovnávací pamětí]] zabírá malé procento plochy GPU čipu. To má bohužel za následek omezené predikce skoků a časté zdržení výpadky cache (některé typy pamětí dokonce nejsou opatřeny cache). Poslední významnou částí, která je rozměrově velice podobná CPU je [[RAM]] [[řadič]]. === Struktura multiprocesoru === Řádek 49: === Výpočetní možnosti (Compute capability) === Výpočetní možnosti popisují vlastnosti zařízení a množinu instrukcí, které jsou podporovány. Některé z těchto vlastností jsou shrnuty v tabulce níže, ostatní lze nalézt v oddílu F nVIDIA CUDA C Programming Guide.<ref name="r-PG4">{{Citace elektronické monografie \| titul = ~~nVIDIA~~ CUDA ~~C Programming Guide~~Toolkit ~~Version~~Documentation 4v8.0 \| url = http://~~developer.download~~docs.nvidia.com~~/compute~~/cuda/~~4_0/toolkit/docs/CUDA_C_Programming_Guide~~index.~~pdf~~html#axzz4QZxUCmXI \| datum vydání = ~~2011~~2016-0509-0627 \| datum přístupu = ~~2011~~2016-1211-0120 \| vydavatel = nVIDIA \| jazyk = ~~anglicky~~en }} ~~– neplatný odkaz !~~</ref>. {\| class="wikitable" style="text-align: center; margin: 0 auto;" Řádek 143: == Programovací model == [[Soubor:Block-thread.svg\|thumb\|270px\|Uspořádání vláken a bloků]] CUDA aplikace je složena z částí, které běží buď na ~~hostu~~host ([[Procesor\|CPU]]) nebo na CUDA zařízení (GPU). Části aplikace běžící na zařízení jsou spouštěny hostem zavoláním [[CUDA Kernel\|kernelu]], což je funkce, která je prováděna každým spuštěným [[Vlákno (program)\|vláknem]] (''thread''). ; Blok (''thread block'') : Vlákna jsou organizována do 1D, 2D nebo 3D bloků, kde vlákna ve stejném bloku mohou sdílet data a lze synchronizovat jejich běh. Počet vláken na jeden blok je závislý na výpočetních možnostech zařízení. Každé vlákno je v rámci bloku identifikováno unikátním indexem přístupným ve spuštěném kernelu přes zabudovanou [[Proměnná\|proměnou]] '''threadIdx'''. Řádek 274: == Spolupráce s OpenGL a Direct3D == Některé prvky [[OpenGL]] a [[Direct3D]] mohou být mapovány do adresního prostoru CUDA aplikace, což umožňuje výměnu dat bez nutnosti jejich přenosu do hlavní paměti. Pro spolupráci s s OpenGL lze mapovat OpenGL buffery, textury a renderbuffer objekty, pro spolupráci s Direct3D lze mapovat Direct3D buffery, textury a povrchy. Před samotným použitím v CUDA aplikaci je nutné nejprve prvek registrovat. Protože samotná registrace je výpočetně náročnou operací, je prováděna pouze jednou pro každý prvek. Registrované prvky lze poté podle potřeby přidávat a odebírat z adresního prostoru CUDA aplikace. == Přehled nástrojů pro debugging a profiling == Řádek 280: Profilovací nástroje: * [~~https~~http://developer.nvidia.com/nvidia-nsight-visual-studio-edition ~~nVIDIA Parallel~~NVIDIA Nsight Visual Studio Edition] * [~~https~~http://developer.nvidia.com/nvidia-visual-profiler nVIDIA Visual Profiler] * [http://www.cs.uoregon.edu/research/tau/home.php TAU Performance system] * [~~https~~http://www.vampir.eu Vampir 9.1 – Performace ~~Optimiyation~~Optimization] * [http://icl.cs.utk.edu/papi/index.html The PAPI CUDA Component] Nástroje pro debugging: * [http://developer.nvidia.com/nvidia~~-parallel~~-nsight-visual-studio-edition nVIDIA Parallel Nsight] * [~~https~~http://developer.nvidia.com/cuda-gdb CUDA-GDB] * [~~https~~http://developer.nvidia.com/~~CUDA~~cuda-~~MEMCHECK~~memcheck CUDA-MEMCHECK] * [http://www.roguewave.com/products-services/totalview/features/cuda-debugging TotalView] * [http://www.allinea.com/products/ddt/ Allinea DDT] == Reference ==

CUDA: Porovnání verzí