Analizando Bulldozer: por qué el chip de AMD es tan decepcionante

Muere AMD FX swoosh y Bulldozer

El Bulldozer de AMD finalmente está aquí, después de años de desarrollo, y su rendimiento es significativamente peor de lo que nadie esperaba. La situación es lo suficientemente desagradable como para explicar por qué tantos ejecutivos dejaron AMD en los últimos doce meses, y por qué la empresa se mantuvo tan callada sobre su partida. El rendimiento general de Bulldozer ha sido ampliamente cubierto; nuestro objetivo aquí es profundizar en por qué la CPU funciona como lo hace en lugar de cubrirla en una amplia gama de escenarios del mundo real.

Nota: El Turbo Core de AMD y el Modo Turbo de Intel se desactivaron en todos los chips, para evitar que ajustaran la velocidad del reloj de la CPU y arrojaran resultados. Como consecuencia, los resultados aquí serán más bajos que en una revisión estándar, particularmente para el rendimiento de un solo hilo.

Lo primero que hay que entender acerca de Bulldozer es que aprovecha aspectos de subprocesos múltiples simultáneos para combinar las funciones de lo que normalmente serían dos núcleos discretos en un solo paquete (AMD se refiere a esta combinación como 'módulo“). Cada módulo contiene lo que Windows identifica como dos núcleos, pero la combinación de la programación de instrucciones y los recursos de la CPU tiene un impacto en el escalado de la CPU en las pruebas de subprocesos múltiples en comparación con los mismos programas que se ejecutan en procesadores de múltiples núcleos 'tradicionales'.



Bulldozer AMD

Cuando AMD diseñó Bulldozer, tenía como objetivo una CPU que fuera más fácil de subir a frecuencias más altas mientras se mantenía el mismo IPC (instrucciones por ciclo de reloj) que su predecesor de seis núcleos. Para alcanzar velocidades de reloj más altas, AMD alargó la tubería de la CPU y aumentó las latencias en toda la arquitectura. El concepto de construir chips para frecuencias más altas ha tenido una mala reputación desde el desastroso Prescott Pentium 4; Después de ver el rendimiento general de Bulldozer, es posible que la decisión de AMD de tomar esta ruta no haya sido muy buena. Tal como están las cosas, el FX-8150 lucha por superar a Thuban en una serie de pruebas, mientras que su IPC definitivamente se vio afectado.

Bulldozer AMD

Sin embargo, antes de profundizar en la arquitectura de la CPU, hay un factor del sistema operativo que discutir. Según AMD, Windows 7 no comprende muy bien la asignación de recursos de Bulldozer. Windows 7 “ve” ocho núcleos de CPU independientes, a pesar de que cada módulo comparte recursos de programación y ejecución. A veces tiene más sentido hacer girar los hilos en núcleos inactivos antes de programarlos en núcleos que ya están ocupados con otra cosa. Otras veces, es mejor hacer girar dos hilos relacionados en el mismo núcleo. Aparentemente, Windows 8 será mucho más competente para programar cargas de trabajo donde tenga más sentido ejecutarlas.

Este problema tiene un impacto práctico en el rendimiento de la CPU debido a la forma en que se implementa el Turbo Core de AMD. El nuevo sabor de Turbo Core está destinado a aumentar la velocidad máxima del reloj hasta en dos grados de velocidad si solo se habilitan cuatro núcleos. Sin embargo, dado que Windows 7 no entiende qué núcleos apagar, es menos probable que la CPU aumente su velocidad de reloj tanto como lo haría de otra manera. Las velocidades 'Turbo' fueron originalmente introducidas por Intel como una forma de exprimir más rendimiento de las cargas de trabajo de un solo subproceso o de un solo subproceso, pero la arquitectura de Bulldozer hace que esos megahercios adicionales sean particularmente importantes.

Rendimiento de la topadora AMD

Rendimiento de la topadora AMD

Verificamos el impacto del programador de Windows 7 midiendo el rendimiento de la CPU en Maxwell Render 1.7 y Cinebench 11.5. Ambos programas permiten al usuario definir un número específico de hilos (cuatro, en nuestro caso). La etiqueta 4M / 8C significa que los ocho núcleos están activos, 4M / 4C significa que los cuatro módulos están activos, con un núcleo operativo por módulo, y 2M / 4C denota una configuración de módulo dual / quad-core. Ambas pruebas muestran que una disposición 4M / 4C supera en rendimiento a un sistema 4M / 8C en aproximadamente un ocho por ciento cuando se utilizan cuatro hilos. Esto sugiere que las ineficiencias del programador de hecho podrían estar dañando el rendimiento general de Bulldozer en cargas de trabajo que no pueden aprovechar los ocho núcleos.

Copyright © Todos Los Derechos Reservados | 2007es.com