La creación de GPU a partir de obleas completas podría impulsar el rendimiento y la eficiencia

Troquel y oblea de silicio de 22 nm (Intel, Knights Ferry)

Un nuevo documento técnico que explora métodos innovadores para construir GPU pide a los fabricantes que revivan una línea de investigación que terminó en la década de 1980: el procesamiento a escala de obleas. Como su nombre lo indica, un procesador a escala de oblea es un chip construido sobre una oblea de silicio completa, o al menos la mayor parte de una. Según el documento, una GPU construida de esta manera tendría una escala muy superior a cualquier disposición alternativa, y un sorprendente conjunto de características de rendimiento.

La ventaja teórica del procesamiento a escala de obleas era la capacidad de implementar un diseño de chip completo en una sola pieza de silicio, incluidas las E / S y los circuitos de alimentación. Los cuellos de botella en la comunicación son un problema importante en los diseños de microprocesadores modernos, y compañías como AMD, Nvidia e Intel han gastado una gran cantidad de dinero en tecnologías como Foveros, EMIB, HBM y HMC (ahora desaparecidas) para acercar la memoria a la CPU. reduzca el consumo de energía de la interconexión y mejore el rendimiento. En teoría, todos estos componentes podrían instalarse en la misma oblea de silicio utilizando una tecnología llamada SI-IF (Tela de interconexión de silicio). SI-IF se puede utilizar para unir dielets en una plataforma de silicio:

Si-IF



Si bien EMIB y TSMC Chip on Wafer on Substrate (CoWoS) ofrecen integración de múltiples troqueles, ninguno puede escalar a tamaños similares a los de SI-IF. Y aunque la integración a escala de obleas fracasó en la década de 1980 debido a las dificultades de fabricación y los bajos rendimientos, los rendimientos de silicio hoy son mucho más altos de lo que eran antes, mientras que la tecnología de fabricación ha mejorado sustancialmente.

El equipo de investigación en cuestión armó un prototipo de oblea de 100 mm con diez2 La GPU muere. Luego, estos troqueles se unieron al sustrato de la oblea a través de SI-IF y se conectaron con 40.000 pines de E / S de cobre, con una relación de rendimiento del 100 por ciento. Luego, el equipo comparó los beneficios de su propio sistema propuesto a escala de obleas con la construcción de una sola GPU unificada o varias propuestas de GPU conectadas a través de MCM (módulos de múltiples chips):

Comparación de latencia

Las GPU de escala de obleas son teóricamente superiores a los enfoques MCM en ancho de banda, latencia y energía por bit. Curiosamente, el enfoque de GPU a escala de obleas también cambia por completo las limitaciones relevantes del sistema. A través de una oblea completa de 300 mm (70.000 mm2) los límites principales del sistema son los requisitos de suministro de energía de la 'red' de la GPU en lugar de los puntos calientes térmicos. La arquitectura de red para los distintos bloques de GPU también es crítica: solo ciertos tipos de conectividad se escalarían hasta el tamaño de una oblea, aunque son posibles configuraciones de malla 3D y toroides.

El hallazgo general es que una GPU a escala de oblea escalaría mucho mejor que cualquier configuración alternativa. Los investigadores modelaron una configuración de 24 GPM (módulo GPU) y 40 GPM. Las configuraciones por encima de 40 GPU no eran factibles debido a la dificultad de utilizar una oblea completa de 300 mm para una sola GPU (aunque nos referimos a esto como procesamiento a escala de oblea, el equipo sugiere que 40 GPU en lugar de 100 GPU teóricas por oblea es actualmente un máximo práctico). El rendimiento en una variedad de pruebas fue 2,97 veces más rápido que la configuración MCM equivalente en promedio para una configuración de 24 GPM y 5,2 veces más rápido para una configuración de 40 GPM.

No quiero que parezca que se trata de una especie de innovación llave en mano. La construcción a escala de oblea solo sería útil para empresas como Google o Amazon, con la infraestructura para proporcionar los kilovatios de potencia que requeriría una GPU a escala de oblea. Pero también hemos escuchado rumores de vez en cuando sobre AMD y Nvidia explorando varias ideas para mejorar la GPU rendimiento y escalabilidad, y esto ciertamente parece un método potencial. Una ventaja de este enfoque es que el producto final todavía solo Mira como una GPU para el usuario final.

Y quizás lo más interesante de todo es la forma en que este enfoque podría encajar con los juegos en la nube y los tipos de mejoras en los niveles de detalle que los jugadores dicen que quieren. Con este tipo de modelo, se podría lanzar mucho más de una GPU en caballos de fuerza en una sesión de juego, alcanzando niveles de rendimiento que ningún oído humano podría soportar en una consola de sala de estar. No esperaría ningún anuncio a corto plazo, pero dada la dificultad de obtener un nuevo rendimiento del silicio existente, veremos este tipo de enfoques alternativos en algunos contexto en algún momento. Punta de sombrero a Siguiente plataforma para detectar el documento.

Copyright © Todos Los Derechos Reservados | 2007es.com