CUDA: Porovnání verzí

Smazaný obsah Přidaný obsah
m typo
Řádek 31:
== Architektura GPU ==
[[Soubor:Cpu-gpu.svg|thumb|270px|CPU vs. GPU]]
Drtivou většinu plochy [[čip|čipu]] grafického akcelerátoru zabírá velké množství relativně jednoduchých [[Skalární procesor|skalárních procesorů]] (na rozdíl od architektury konkurenční firmy AMD, jejižjejíž multiprocesory jsou tvořeny [[Very long instruction word|VLIW]] jednotkami), které jsou organizovány do větších celků zvaných [[Streaming multiprocesor|streaming multiprocesory]]. Vzhledem k tomu, že se jedná o [[Single Instruction Multiple Threads|SIMT]] architekturu, řízení jednotek a plánování instrukcí je jednoduché a spolu s velmi malou [[Cache|vyrovnávací pamětí]] zabírá malé procento plochy GPU čipu. To má bohužel za následek omezené predikce skoků a časté zdržení výpadky cache (některé typy pamětí dokonce nejsou opatřeny cache). Poslední významnou částí, která je rozměrově velice podobná CPU je [[RAM]] [[Řadič|řadič]].
 
=== Struktura multiprocesoru ===
Řádek 206:
; Paměť konstant : je paměť pouze pro čtení, stejně jako globální paměť je sdílená s tím rozdílem, že je pro ni na čipu multiprocesoru vyhrazena L1 cache. Podobně jako sdílená paměť umožňuje rozesílání výsledku broadcastem.
 
; PamětPaměť textur : je také sdílená mezi SMP, určena pro čtení a disponuje cache pamětí. Je optimalizována pro 2D prostorovou lokalitu, takže vlákna ve stejném warpu, které čtou z blízkých texturovacích souřadnic dosahují nejlepšího výkonu.
 
{| class="wikitable" style="text-align: center; margin: 0 auto;"