Características y Diferencias entre Arquitecturas Turing y Ampere de Nvidia

/

En lo que respecta a la tecnología Turing y Ampere son realmente dos arquitecturas de GPU avanzadas que Nvidia utiliza para sus series de tarjetas gráficas RTX. Estas tecnologías tienen una mejora significativa con respecto a las arquitecturas anteriores de Volta y Pascal. 

Ampere es la última arquitectura actual de Nvidia para la última generación de tarjetas gráficas Nvidia, incluida la serie RTX30, mientras que Turing sirve para la serie RTX20 de tarjetas gráficas. La arquitectura Ampere tiene algunas características actualizadas y mejoras en comparación con la arquitectura Turing.

Características y Diferencias entre Arquitecturas Turing y Ampere de Nvidia
Características y Diferencias entre Arquitecturas Turing y Ampere de Nvidia

Comparación entre las arquitecturas Turing y Ampere

ArquitecturaAmpereTuring
Fabricantenvidianvidia
Proceso de manufactura8 nm (Samsung)12 nm (TSMC)
Versión CUDA87.5
Núcleo RTSegunda generaciónPrimera generación
Núcleo tensorTercera generaciónSegunda generación
Multiprocesador de transmisión2x FP321x FP32
DLSSDLSS 2.0DLSS 1.0
Soporte de memoriaHBM2, GDDR6XGDDR6, GDDR5, HBM2
Compatibilidad con PCIePCIe Gen 4PCIe Gen 3
Codificador NVIDIA (NVENC)7ma generación7ma generación
Códec Nvidia (NVDEC)5ta generación4ta generación
DirectX 12IncluidoIncluido
Realidad virtualIncluidoIncluido
Compatibilidad con varias GPUNVLink 3.0NVLink 2.0
Eficiencia energeticaMejor que turingMejor que voltios
Salida de vídeoHDMI 2.1, DisplayPort 1.4aHDMI 2.0b, DisplayPort 1.4a
Tarjeta graficaSerie RTX 30Serie RTX 20, serie GTX 16
SolicitudJuegos, estaciones de trabajo, inteligencia artificial (IA)Juegos, estaciones de trabajo, inteligencia artificial (IA)

Características en arquitectura GPU Turing

Turing es el sucesor directo de la arquitectura predecesora Volta. Esta arquitectura se basa en un proceso de fabricación de 12 nm y admite subprocesos GDDR5, HBM2 y GDDR6. La arquitectura de Turing incluye núcleos CUDA, minerales RTC y núcleos Tensor en un solo chip de GPU (excepto las tarjetas de la serie GTX16). 

Es la primera arquitectura compatible con el trazado de rayos en tiempo real para crear imágenes fotorrealistas, sombras, reflejos y otros efectos de iluminación avanzados. Además, la arquitectura de Turing es compatible con DLSS (Deep Learning Supersampling), una tecnología basada en IA que utiliza Tensor Cores para aumentar la velocidad de fotogramas de los juegos sin comprometer la calidad de la imagen o los gráficos. 

Pero es importante tener en cuenta que para aprovechar ambas tecnologías, el juego en sí debe tener trazado de rayos y DLSS. La arquitectura Turing ofrece hasta 6 veces más rendimiento que la antigua arquitectura Pascal, lo que supone un gran salto. Las tarjetas gráficas basadas en la arquitectura Turing incluyen la serie GeForce RTX20 y la serie GTX16. 

Pero las tarjetas gráficas de la serie GTX16 no vienen con RT Cores y Tensor Cores. Las tarjetas gráficas de la serie RTX20 también son compatibles con VirtualLink a través del conector USB Type-C para conectar auriculares VR de próxima generación en el puerto USB Type-C para una increíble experiencia VR. La arquitectura Turing también se utiliza en tarjetas gráficas para estaciones de trabajo, incluidas Quadro RTX4000, Quadro RTX5000, Quadro RTX6000 y Quadro RTX8000.

Características en arquitectura GPU Ampere

Ampere es el sucesor de la arquitectura Turing. Este está basado en el proceso de fabricación de 8 nm, admite memorias GDDR6, HBM2 y GDDR6X. En la cual GDDR6X es actualmente la memoria de video más rápida, con una velocidad de hasta 21 Gbps y un ancho de banda de hasta 1 TB/s. La arquitectura Ampere ofrece una mejora significativa con respecto a Turing y está equipada con núcleos RT de segunda generación y núcleos Tensor de tercera generación. 

Estos nuevos núcleos RT y Tensor proporcionan aproximadamente el doble de rendimiento o rendimiento en comparación con los núcleos RT y Tensor de la generación anterior utilizados en la arquitectura de Turing. Esto significa que obtendrá mejoras significativas en el rendimiento de los juegos y otras aplicaciones cuando el juego o la aplicación sea compatible con el trazado y la tecnología de IA.

La arquitectura Ampere ahora es compatible con el estándar PCIe Gen4, que duplica el ancho de banda de la interfaz PCIe Gen3. La arquitectura es compatible con la versión 8.0 de CUDA e incluye 2 multiprocesadores de transmisión FP32, lo que significa el doble de rendimiento de FP32 en comparación con Turing. La arquitectura Ampere es compatible con NVLink 3.0 para aumentar la potencia informática de los sistemas que utilizan varias GPU. 

En comparación con la arquitectura Turing, el rendimiento por vatio de la arquitectura Ampere mejora hasta 1,9 veces. Otra adición importante a Ampere es la compatibilidad con HDMI2.1, que admite resoluciones ultra altas y frecuencias de actualización de 8K a 60Hz y 4K a 120Hz. También es compatible con Dynamic HDR y HDMI2.1 admite un ancho de banda total de 48 Gbps. 

El RTX IO es otra característica nueva introducida por la arquitectura Ampere que reduce la sobrecarga de E/S de la CPU y reduce significativamente los tiempos de carga del juego mediante el uso de la GPU para descomprimir texturas/datos del juego en la memoria de la GPU. Esta función se utiliza junto con la API de almacenamiento directo de Microsoft Windows. Las tarjetas gráficas que utilizan la arquitectura Ampere son tarjetas gráficas de la serie RTX 30, incluidas GeForce RTX 3090, RTX 3080, RTX 3070, etc.

Conclusiones de las arquitecturas GPU de Nvidia

La realidad es que la arquitectura Ampere va a ofrecernos mejoras significativas en el trazado de rayos y DLSS. Pero incluso sin estas características, las ganancias de rendimiento de Ampere son mayores que las de Turing. Otra gran característica que favorecer la arquitectura Ampere es la compatibilidad con PCIe de Gen 4 que proporciona un mayor ancho de banda, lo cual es muy decisivo.