Análisis del núcleo de Denver de 64 bits de Tegra K1: ¿Están escondidos los esfuerzos x86 de Nvidia?

Tegra K1: un chip, dos versiones (Cortex-A15 y Denver ARMv8 de 64 bits)

Anoche en el CES 2014, Nvidia sorprendió a todos al revelar que su núcleo ARM interno de 64 bits, Project Denver, llegaría este año al Tegra K1 (Tegra 5 / Logan), en lugar del próximo año al Tegra 6 (Parker ). El Tegra K1 se enviará en dos versiones: primero habrá un K1 bastante estándar con una CPU Cortex-A15 de cuatro núcleos (4 + 1) (al igual que Tegra 4), pero luego en la segunda mitad de 2014 habrá Ser un K1 que cuenta con una CPU ARMv8 Denver de doble núcleo de 64 bits. Excepto la CPU y los cachés más grandes en la versión de 64 bits, ambas variantes del K1 SoC parecen ser idénticas: ambas tienen la monstruosa GPU Kepler de 192 núcleos (1 SMX). Si bien la GPU es emocionante, y discutiremos sus ramificaciones a su debido tiempo, es el núcleo Denver de 64 bits de Nvidia lo que veremos en esta historia.

ARMv8, superescalar de 7 vías, hasta 2,5 GHz

Nvidia mencionó por primera vez el Proyecto Denver en 2011, también en CES. En ese momento, Nvidia se burló de Denver como una especie de súper núcleo que revolucionaría las PC y los servidores, pero, curiosamente, no los teléfonos inteligentes y las tabletas. Ahora parecería que los dispositivos móviles están de nuevo sobre la mesa, pero dependerá en gran medida de la cantidad de energía que consuman los núcleos de Denver (más sobre esto más adelante). Los núcleos de Denver (y el resto del SoC) se fabrican en el proceso HPM de 28 nm de TSMC y tienen una frecuencia de hasta 2,5 GHz. Parece que ambos núcleos compartirán 128 KB de caché de instrucciones L1 y 64 KB de caché de datos L1.

Tegra K1Hasta aquí todo bien. Sin embargo, mucho más interesante que las velocidades de reloj y las cachés es el soporte de Denver para el conjunto de instrucciones ARMv8 de 64 bits y una arquitectura increíblemente amplia de 'superescalar de 7 vías'. Superscalar, en términos de computación, es un tipo de arquitectura de CPU que permite el paralelismo a nivel de instrucción, es decir, puede llevar a cabo múltiples instrucciones en un solo ciclo de reloj. Un procesador superescalar simple podría ser capaz de obtener y decodificar dos instrucciones por ciclo de reloj. Para hacer esto, el procesador necesita tener varias unidades que sean capaces de buscar / decodificar / ejecutar / etc simultáneamente.



Cuando Nvidia dice que cada núcleo de Denver es superescalar de 7 vías, significa que tiene los recursos de hardware para realizar siete instrucciones por ciclo de reloj. Nvidia no ha dicho exactamente cuáles son esos recursos de hardware (si puede decodificar siete instrucciones por ciclo, nos sorprendería), pero está bastante claro en este punto que Team Green ha construido un chip absolutamente monstruoso que debería ser capaz de un rendimiento impresionante. . ¿Quizás la afirmación de Nvidia de que Denver es un 'Súper Núcleo' no es solo una pifia de marketing?

Sin embargo, tal rendimiento tiene un costo, tanto en términos de consumo de energía como de tamaño de la matriz. Todavía no tenemos un tamaño de dado exacto, pero el núcleo de Denver va a ser enorme. Teniendo en cuenta que las dos variantes de Tegra K1 serán compatibles con pines, y siguiendo las diapositivas publicadas por Nvidia, un núcleo de Denver tiene el doble de tamaño que un núcleo Cortex-A15, que a su vez es 3-4 veces más grande que un núcleo Cortex-A9. . Agregue 192 núcleos de GPU, un controlador de memoria y todos los demás bits y piezas, y el Tegra K1 será un chip muy grande. En términos de consumo de energía, el paralelismo a nivel de instrucción de siete vías será muy costoso.

Troquel Tegra K1 (estilizado)

Troquel Tegra K1 (estilizado). Esta es la versión Cortex-A15 (4 + 1 núcleos), pero es tan bonita que la incluiremos de todos modos.

¿Denver es la reencarnación de los esfuerzos x86 de Nvidia?

Si todo eso no fue lo suficientemente emocionante, hay una teoría interesante, propuesta por Charlie Demerjian y secundado por AnandTech - que Denver es en realidad una reencarnación de los planes de Nvidia para construir una CPU x86, que estaba en curso a mediados de la década de 2000 pero nunca llegó al mercado. Para solucionar los problemas de licencias x86, el chip de Nvidia utilizaría esencialmente una capa de abstracción de software para capturar el código de máquina x86 entrante (del sistema operativo y sus aplicaciones) y convertirlo / transformarlo en instrucciones que puedan ser entendidas por el hardware subyacente. Esta no es una idea completamente nueva:Transmeta lo intentó y falló con sus CPU Crusoe y Efficeon.

Transmeta

CPU Crusoe de Transmeta. Q.E.P.D.

En este caso, por supuesto, la capa de abstracción captaría el código de máquina ARMv8, en lugar de x86. Además, si toma esa capa de abstracción e inserta mucha inteligencia de programación y paralelismo, puede simplificar de manera correspondiente el hardware, lo que reduce el tamaño de la matriz y el consumo de energía. La tubería superescalar de 7 vías también tendría más sentido en una configuración de este tipo.

Si Denver es realmente una CPU funky que emula / cambia el código, entonces la versión de 64 bits del Tegra K1 podría ser un chip muy interesante. Dado el tamaño de la matriz y la complejidad (esperada) del núcleo de Denver, Nvidia tendrá que hacer algo verdaderamente mágico (como una capa de abstracción realmente eficiente) para que encaje en la envolvente de energía de un teléfono inteligente o tableta. En realidad, como Nvidia aún no ha especificado a qué mercado se dirigirá con el Tegra K1 de Denver, es probable que la propia compañía todavía esté realizando muchas pruebas y optimizaciones para determinar si se trata de un chip móvil o un chip de servidor.

Se espera que el Tegra K1, con sede en Denver, llegue al mercado en la segunda mitad de 2014. Esperemos que sea tan emocionante como suena, y no solo otro consumidor de energía de alto rendimiento, es fácil para construir esos.

Copyright © Todos Los Derechos Reservados | 2007es.com