Pascal (mikroarchitektura)

mikroarchitektura

Pascal je kódové označení pro GPU mikroarchitekturu společnosti Nvidia, která vyšla v dubnu roku 2016 jako nástupce architektury Maxwell. Byla pojmenována po francouzském matematikovi Blaisi Pascalovi.

Tato architektura je používána u spotřebitelských grafických karet GeForce série 10 a u grafických karet pro pracovní stanice, servery a superpočítače s označením Quadro a Tesla.

Architektura editovat

Prvním vydaným čipem architektury Pascal byl GP100 používaný především v modelu Tesla, který je cílen na datová centra, velké servery a superpočítače.[1]. Následoval grafický čip GP104, který se nachází ve výkonných grafických kartách a jehož shaderové jednotky jsou více podobné těm u Maxwellu.

Mezi vylepšení architektury čipu GP100 oproti Maxwellu patří:

  • Jedna renderovací jednotka (Render Output Unit - ROP) Pascalu má 64 CUDA jader. Pro srovnání, Maxwell jich měl 128, Kepler 192, Fermi 32 a Tesla pouze 8.
  • Podpora CUDA 6.0.
  • High Bandwidth Memory 2 - některé karty mají 16 GB HBM2 s 4096bitovou datovou sběrnicí a rychlostí paměti 720 GB/s.
  • Unified memory (unifikovaná paměť) - umožňuje CPU a GPU využívat jak paměť RAM, tak paměť VRAM za pomocí technologie Page Migration Engine.
  • NVLink - datová sběrnice vysoké rychlosti pro komunikaci mezi GPU a CPU nebo mezi více GPU. NVLink umožňuje mnohem vyšší přenosovou rychlost než má SLI Bridge. Podle odhadů 80-200 GB/s. NVLink se používá pouze u profesionálních karet (Quadro, Tesla) nebo u nové "herní" generace Turing (RTX 2080 Ti atd.).[2]
  • 16bitové operace (FP16) s desetinnými čísly jsou dvakrát rychlejší než s 32bitovými čísly (FP32) a čtyřikrát rychlejší než s 64bitovými čísly (FP64).
  • Dvakrát více registrů na každé CUDA jádro než měl Maxwell.
  • Více sdílené paměti.
  • Dynamic Load Balancing Scheduling system. Umožňuje rozplánovat využití GPU pro různé operace, což umožňuje plné využití grafické karty.

Mezi vylepšení architektury čipu GP104 patří:

  • Podpora CUDA 6.1
  • GDDR5X - nový paměťový standard podporující přenos dat rychlostí 10 Gbit/s navíc s vylepšenou kontrolou paměti.
  • Simultaneous Multi-Projection - vytváření více projekcí jediného geometrického obrazu.
  • DisplayPort 1.4, HDMI 2.0b.
  • Delta Color Compression čtvrté generace.
  • Enhanced SLI Interface - zrychlení rozhraní SLI oproti předchozím verzím
  • Hardwarové dekódování HEVC Main10, Main12 a VP9.
  • NVENC Hardwarové kódování HEVC Main10.
  • Podpora HDCP 2.2 pro přehrávání DRM chráněného 4K obsahu.
  • GPU Boost 3.0.

Čipy editovat

  • GP100 - Využíván v modelech Nvidia Tesla P100 a Quadro GP100. Je určen pro GPGPU aplikace, které často počítají s 64bitovými (a také jednoduššími) desetinnými čísly, nebo pro deep learning. Využívají HBM2 paměť.
  • GP102 - Využíván v modelech TITAN Xp, Titan X, GeForce GTX 1080 Ti, které disponují pamětí GDDR5X, a také v modelech Quadro P6000 a Tesla P40.
  • GP104 - Využíván v modelech GeForce GTX 1070 a GTX 1080. GTX 1070 má čtvrtinu shaderových jednotek deaktivovanou a na rozdíl od GTX 1080, která disponuje GDDR5X pamětí, má paměť GDDR5.
  • GP106 - Využíván v modelu GTX 1060 s pamětí GDDR5 a v modelu Quadro P2000.
  • GP107 - Využíván modely GTX 1050, GTX 1050 Ti, Quadro P1000, Quadro P600 a Quadro P400.
  • GP108 - Využíván v modelu GeForce GT 1030.

Seznam produktů GeForce série 10 editovat

Desktopové editovat

Model Proces
(nm)
Tranzistory
(miliardy)
Rozhraní Počet
CUDA jader
Takt Paměť Tepelný
výkon
(W)
Základní
takt
jádra
(MHz)
Boost
takt
jádra
(MHz)
Takt
paměti
(MT/s)
Velikost
(GB)
Typ Šířka
sběrnice
(bit)
GeForce
GT
1030
14 1,8 PCIe 3.0
x4
384 1227 1468 6000 2 GDDR5 64 30
GeForce
GTX
1050
3,3 PCIe 3.0
x16
640 1354 1455 7000 128 75
GeForce
GTX
1050 Ti
768 1290 1392 7000 4
GeForce
GTX
1060 3GB
16 4,4 1152 1506 1708 8000/
9000
3 192 120
GeForce
GTX
1060 6GB
1280 6
GeForce
GTX
1070
7,2 1920 1683 8000 8 256 150
GeForce
GTX
1080
2560 1607 1733 10000/
11000
GDDR5X 180
GeForce
GTX
1080 Ti
11.8 3584 1481 1582 11008 11 352 250
NVIDIA
TITAN
X
1417 1531 10008 12 384
NVIDIA
TITAN
Xp
3840 1405 1582 11408

Odkazy editovat

Reference editovat

Externí odkazy editovat