CUDA: Porovnání verzí

Smazaný obsah Přidaný obsah
mBez shrnutí editace
mBez shrnutí editace
Řádek 34:
 
=== Struktura multiprocesoru ===
[[Soubor:Fermi.svg|thumb|270px|Schéma streaming multiprocesoru architektury Fermi]]
Obecně se multiprocesor skládá z několika (dnes až ze 32) stream procesorů, pole registrů, sdílené paměti, několika load/store jednotek a Special Function Unit - jednotky pro výpočet složitějších funkcí jako [[Sinus|sin]], [[Kosinus|cos]], [[Přirozený logaritmus|ln]]. Viz [[:Soubor:Fermi.svg|schéma architektury Fermi streaming multiprocesoru]].
 
=== Výpočetní možnosti (Compute capability) ===
Řádek 55 ⟶ 56:
! 2.x
|-
|! Maximální dimenze mřížky bloků
| colspan="4" | 2
| 3
|-
|! Maximální x-, y- nebo z- rozměr mřížky bloků
| colspan="5" | 65535
|-
|! Maximální dimenze bloku vláken
| colspan="5" | 3
|-
|! Maximální x-, y- rozměr bloku vláken
| colspan="4" | 512
| 1024
|-
|! Maximální z-rozměr bloku vláken
| colspan="5" | 64
|-
|! Maximální počet vláken v bloku
| colspan="4" | 512
| 1024
|-
|! Velikost warpu
| colspan="5" | 32
|-
|! Maximální počet bloků přidělených na multiprocesor
| colspan="5" | 8
|-
|! Maximální počet warpů přidělených na multiprocesor
| colspan="2" | 24
| colspan="2" | 32
| 48
|-
|! Maximální počet vláken přidělených na multiprocesor
| colspan="2" | 768
| colspan="2" | 1024
| 1536
|-
|! Počet 32-bitových registrů na multiprocesor
| colspan="2" | 8 000
| colspan="2" | 16 000
| 32 000
|-
|! Maximální množství sdílené paměti na multiprocesor
| colspan="4" | 16 KB
| 48 KB
|-
|! Počet sdílených paměťových banků
| colspan="4" | 16
| 32
|-
|! Množství lokální paměti na vlákno
| colspan="4" | 16 KB
| 512 KB
|-
|! Velikost konstantní paměti
| colspan="5" | 64 KB
|-
|! Velikost cache pro konstantní paměť na multiprocesor
| colspan="5" | 8 KB
|-
|! Velikost cache pro texturovací paměť na multiprocesor
| colspan="5" | Závislé na zařízení, mezi 6 KB a 8 KB
|-
|! Maximální počet textur na jeden kernel
| colspan="5" | 128
|-
|! Maximální počet instrukcí na jeden kernel
| colspan="5" | 2 000 000
|-
|! Podpora výpočtů v double-precision
| colspan="3" | Ne
| colspan="2" | Ano
Řádek 174 ⟶ 175:
! Registry
| Na čipu
| style="background-color: #ff9090" | Ne
| Ne
| Čtení/Zápis
| 1 vlákno
Řádek 181 ⟶ 182:
! Lokální
| Mimo čip
|colspan style="6background-color: #ff9090" | *Ne od<ref name="cc" group="pozn">Od compute capabilities 2.0 je ukládání do cache umožněno</ref>
| Ne*
| Čtení/Zápis
| 1 vlákno
Řádek 188 ⟶ 189:
! Sdílená
| Na čipu
| style="background-color: #ff9090" | Ne
| Ne
| Čtení/Zápis
| Všechna vlákna v bloku
Řádek 195 ⟶ 196:
! Globální
| Mimo čip
| style="background-color: #ff9090" | Ne <ref name="cc" group="pozn"></ref>
| Ne*
| Čtení/Zápis
| Všechna vlákna a host
Řádek 202 ⟶ 203:
! Paměť konstant
| Mimo čip
| style="background-color: #90ff90" | Ano
| Ano
| Čtení
| Všechna vlákna a host
Řádek 209 ⟶ 210:
! Paměť textur
| Mimo čip
| style="background-color: #90ff90" | Ano
| Ano
| Čtení
| Všechna vlákna a host
| Do uvolnění
|-
| colspan="6" style="text-align: left;" | <references group="pozn" />
|colspan="6" | * od compute capabilities 2.0 je ukládání do cache umožněno
|}