Pascal (architecture de carte graphique)

L'architecture Pascal est une architecture de processeur graphique développée par NVidia pour ses cartes graphiques, qui a succédé au cours de l'année 2016 à l'architecture Maxwell annoncé en mars 2014[1]. Elle est nommée en l'honneur du mathématicien, physicien et philosophe français du XVIIe siècle Blaise Pascal[2].

Logo de la série GeForce 10, caractérisée par l'arrivée de l'architecture Pascal
Carte graphique GeForce GTX 1070.

Architecture

L'architecture Pascal inaugure une nouvelle technique de fabrication appelée FinFET (Fin Field Effect Transistor), afin de passer à une finesse de gravure de 16 nm[3]. Le nombre de transistors par unité de surface sera donc plus élevé.

Elle devrait aussi à terme supporter la mémoire HBM 2.

Améliorations

Les améliorations prévues sont :

  • Le multiprocesseur en continu (SM, streaming multiprocessor) qui se compose de 64 cœurs CUDA, un nombre identique à celui d'AMD GCN UC (unité de calcul). Maxwell en comptait 128, Kepler 192, Fermi 32 et Tesla ne comportait que seulement 8 cœurs CUDA dans une SM ; le GP100 SM est partitionné en deux blocs de traitement, ayant chacun 32 cœurs CUDA simple-précision (single-precision), un tampon d'instruction, un programmateur de chaîne, et deux unités d'expédition.
  • 16 Go HBM 2 en quatre piles avec un bus de 4096 bits et une bande passante mémoire de 720 Go/s.
  • Mémoire unifiée - architecture mémoire unifiée afin que le CPU et le GPU puissent accéder à la fois à la mémoire principale du système et à la mémoire de la carte graphique à l'aide d'une technologie appelée Page Migration Engine.
  • NVLink - un bus à haute vitesse de puissance efficace entre le CPU et le GPU, et entre plusieurs GPU. Il permet des vitesses de transfert beaucoup plus élevées que celles pouvant être atteintes en utilisant PCI Express ; estimée à fournir entre 80 et 200 Go/s[4],[5].
  • Les opérations en virgule flottante 16 bits (half precision) peuvent être exécutées deux fois plus vite que celles en virgule flottante 32 bits (single precision)[6] et les opérations en virgule flottante 64 bits (double precision) exécutées en moitié moins de temps que les opérations en virgule flottante 32 bits (Maxwell taux 1/32)[7].

Modèles

Sous la marque GeForce

Modèles GeForce GT 1030 GeForce GTX 1050 [8],[9],[10] GeForce GTX 1050 Ti [8],[9],[10] GeForce GTX 1060 3Go
[11],[12],[13]
GeForce GTX 1060 6Go
[11],[12],[13]
GeForce GTX 1070
[11],[12],[14]
GeForce GTX 1070 Ti GeForce GTX 1080
[11],[12],[15]
GeForce GTX 1080 Ti Titan X (Pascal)[16],[17] Titan Xp
Finesse de gravure 14 nm 16 nm
Code de la puce GP108-300 GP107-300 GP107-400 GP106-300 GP106-400 GP104-200 GP104-300 GP104-400 GP102-350 GP102-400 GP102-450
Surface de la puce 74 mm² 135 mm2 200 mm2 314 mm2 [18] 471 mm2 [19]
Nombre de transistors ~1.8 G 3,3 G 4,4 G 7,2 G 12 G
Fréquence 1228 MHz 1354 MHz 1290 MHz 1506 MHz 1506 MHz 1506 MHz 1607 MHz 1607 MHz 1480 MHz 1417 MHz 1405 MHz
Fréquence Turbo 1468 MHz 1455 MHz 1392 MHz 1708 MHz 1708 MHz 1683 MHz 1683 MHz 1733 MHz 1584 MHz 1531 MHz 1582 MHz
Cœurs CUDA 384 640 768 1152 1280 1920 2432 2560 3584 3584 3840
Unités de texture 24 40 48 72 80 120 152 160 224 224 240
ROP 16 32 32 48 48 64 64 64 88 96 96
Cache L2 1024 Ko 1536 Ko 2048 Ko 2816 Ko 3072 Ko
Type de mémoire GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5X GDDR5X GDDR5X GDDR5X
Capacité mémoire 2 Go 2 Go 4 Go 3 Go 6 Go 8 Go 8 Go 8 Go 11 Go 12 Go 12 Go
Vitesse mémoire 6 Gbits/s 7 Gbits/s 7 Gbits/s 8 Gbit/s 8 Gbit/s 8 Gbit/s 8 Gbit/s 10 Gbit/s 11 Gbits/s 10 Gbits/s 11 Gbits/s
Largeur du bus mémoire 64 bits 128 bits 128 bits 192 bits 192 bits 256 bits 256 bits 256 bits 352 bits 384 bits 384 bits
Débit mémoire 48 Go/s 112 Go/s 112 Go/s 192 Go/s 192 Go/s 256 Go/s 256 Go/s 320 Go/s 484 Go/s 480 Go/s 547 Go/s
Fréquence mémoire 1502 MHz 1752 MHz 1752 MHz 2000 MHz 2000 MHz 2000 MHz 2000 MHz 1251 MHz 1375 MHz 1251 MHz 1425 MHz
Enveloppe thermique (TDP) 30 W 75 W 75 W 120 W 120 W 150 W 180 W 180 W 220 W 250 W 250 W
Calcul FP16 17 GFLOPs
Calcul FP32 1.1 TFLOPs 1,9 TFLOPS 2,1 TFLOPS 3,9 TFLOPS 4,4 TFLOPS 6,5 TFLOPS 8.2 TFLOPS 8,9 TFLOPS 11 TFLOPS 11 TFLOPS 12 TFLOPS
Calcul FP64 35 GFLOPS
Date de sortie

Sous la marque Quadro

Modèles Quadro P400 Quadro P600 Quadro P1000 Quadro P2000 Quadro P4000 Quadro P5000[20],[21],[22] Quadro P6000[20],[21],[22] Quadro GP100
Finesse de gravure 14 nm 16 nm
Code de la puce GP107 GP106 GP104 GP102 GP100
Surface de la puce 132 mm² 200 mm² 314 mm² 471 mm² 610 mm²
Nombre de transistors 3.3 G 4.4 G 7.2 G 12 G 15.3 G
Fréquence 1228 MHz 1354 MHz 1266 MHz 1370 MHz 1202 MHz 1607 MHz 1506 MHz 1380 MHz
Fréquence Turbo 1328 MHz 1455 MHz 1354 MHz 1470 MHz 1480 MHz 1733 MHz 1645 MHz 1441 MHz
Cœurs CUDA 256 384 640 1024 1792 2560 3840 3584
Unités de texture 16 24 40 64 112 160 240 224
ROP 16 16 32 40 64 64 96 96
Cache L2 512 Ko 1024 Ko 1280 Ko 2048 Ko 3072 Ko 4096 Ko
Type de mémoire GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5X GDDR5X HBM2
Capacité mémoire 2 Go 2 Go 4 Go 5 Go 8 Go 16 Go 24 Go 16 Go
Vitesse mémoire 1000 MHz 1000 MHz 1250 MHz 2000 MHz 1900 MHz 1127 MHz 1127 MHz 900 MHz
Largeur du bus mémoire 64 bits 128 bits 128 bits 160 bits 256 bits 256 bits 384 bits 4096 bits
Débit mémoire 32 Go/s 64 Go/s 80 Go/s 160 Go/s 243 Go/s 288 Go/s 432 Go/s 921 Go/s
Enveloppe thermique (TDP) 30 W 40 W 47 W 75 W 105 W 180 W 250 W 250 W
Calcul INT8 2.7 TIOPS 4.4 TIOPS 6.9 TIOPS 12 TIOPS 21.2 TIOPS 35.5 TIOPS 50.5 TIOPS
Calcul FP16 10 GFLOPS 17 GFLOPS 27 GFLOPS 47 GFLOPS 83 GFLOPS 138 GFLOPS 187 GFLOPS 20 TFLOPS
Calcul FP32 680 GFLOPS 1.1 TFLOPS 1.7 TFLOPS 3 TFLOPS 5.3 TFLOPS 8.9 TFLOPS 12 TFLOPS 10 TFLOPS
Calcul FP64 21 GFLOPS 35 GFLOPS 54 GFLOPS 94 GFLOPS 166 GFLOPS 277 GFLOPS 395 GFLOPS 5 TFLOPS
Date de sortie

Sous la marque Tesla

Modèles Tesla P4 Tesla P40 Tesla P100 PCIe 12GB Tesla P100 PCIe 16GB Tesla P100 SXM2
Finesse de gravure 16 nm
Code de la puce GP104-995-A1 GP102 GP100 GP100-893-A1
Surface de la puce 314 mm² 471 mm² 610 mm²
Nombre de transistors 7.2 G 12 G 15.3 G
Fréquence 810 MHz 1303 MHz 1328 MHz 1328 MHz 1328 MHz
Fréquence Turbo 1063 MHz 1531 MHz 1480 MHz 1480 MHz 1480 MHz
Cœurs CUDA 2560 3840 3584 3584 3584
Unités de texture 160 240 224 224 224
ROP 64 96 96 96 96
Cache L2 2048 Ko 3072 Ko 3072 Ko 4096 Ko
Type de mémoire GDDR5 GDDR5 HBM2 HBM2 HBM2
Capacité mémoire 8 Go 24 Go 12 Go 16 Go 16 Go
Vitesse mémoire 1500 MHz 1250 MHz 704 MHz 704 MHz 704 MHz
Largeur du bus mémoire 256 bits 384 bits 3072 bits 4096 bits 4096 bits
Débit mémoire 192 Go/s 480 Go/s 540 Go/s 721 Go/s 721 Go/s
Enveloppe thermique (TDP) 75 W 250 W 300 W 300 W 300 W
Calcul INT8 21.7 TIOPS 47 TIOPS
Calcul FP16 85 GFLOPS 183 GFLOPS 21.2 TFLOPS 21.2 TFLOPS 21.2 TFLOPS
Calcul FP32 5.4 TFLOPS 11.7 TFLOPS 10.6 TFLOPS 10.6 TFLOPS 10.6 TFLOPS
Calcul FP64 170 GFLOPS 367 GFLOPS 5.3 TFLOPS 5.3 TFLOPS 5.3 TFLOPS
Date de sortie

Notes et références

  1. (en) « NVIDIA Developer Blog / Technical content : For developers, by developers », sur NVIDIA Developer Blog (consulté le ).
  2. (en) « NVIDIA Updates GPU Roadmap; Announces Pascal / The Official NVIDIA Blog », sur The Official NVIDIA Blog, (consulté le ).
  3. « Architecture de GPU | NVIDIA », sur www.nvidia.fr
  4. (en) « Inside Pascal : NVIDIA’s Newest Computing Platform / NVIDIA Developer Blog », sur NVIDIA Developer Blog, (consulté le ).
  5. (en) « NVLink, Pascal and Stacked Memory : Feeding the Appetite for Big Data / NVIDIA Developer Blog », sur NVIDIA Developer Blog, (consulté le ).
  6. (en) « NVIDIA Pascal GPU Architecture to Provide 10X Speedup for Deep Learning Apps / NVIDIA Blog », sur The Official NVIDIA Blog, (consulté le ).
  7. « The NVIDIA GeForce GTX Titan X Review », sur anandtech.com (consulté le ).
  8. « The New GeForce GTX 1050 graphics card », sur www.geforce.com (consulté le )
  9. « Les GTX 1050 et 1050Ti sont officielles ! », Le Comptoir du Hardware, (lire en ligne, consulté le )
  10. « Jour J pour les cartes Nvidia GeForce GTX 1050 Ti et GTX 1050 », sur www.lesnumeriques.com (consulté le )
  11. (en) Ryan Smith, « NVIDIA Announces GeForce GTX 1060: Starting at $249, Available July 19th » (consulté le )
  12. « Test NVIDIA GeForce GTX 1060 : le milieu de gamme mieux qu'une GTX 980 ? », sur clubic.com,
  13. (en) « The New GeForce GTX 1060 graphics card », sur www.geforce.com (consulté le )
  14. (en) « The New GeForce GTX 1070 Graphics Card », sur www.geforce.com (consulté le )
  15. (en) « GeForce GTX 1080 Graphics Card », sur www.geforce.com (consulté le )
  16. Damien Triolet, « Nouvelle Nvidia Titan X: GP102, 11 Tflops, 480 Go/s - Cartes Graphiques - HardWare.fr », sur hardware.fr,
  17. (en) « NVIDIA TITAN X Graphics Card with Pascal | GeForce », sur www.geforce.com (consulté le )
  18. « Nvidia Pascal : premiers clichés du GPU GP104 avec GDDR5X », sur www.lesnumeriques.com (consulté le )
  19. (en-US) Usman Pirzada, « Nvidia's 'GTX 1080 Ti' Pascal Flagship Will Be Based On The GP102 GPU - Reports Indicate 'Halfway' Point Between a GP104 and the GP100 », sur wccftech.com,
  20. David Feugey, « Nvidia dévoile ses Quadro P5000 et P6000 « Pascal » », sur silicon.fr,
  21. David Civera, « NVIDIA Quadro P6000 et P5000 : 3840 cœurs, 24 Go de RAM, de la 4K à 240 Hz ! », sur tomshardware.fr,
  22. (en) « NVIDIA Quadro P6000 and P5000 pictured | VideoCardz.com », sur videocardz.com,

Annexes

Article connexe

  • Portail de l’informatique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.