La demanda de AMD sobre la comercialización falsa de chips Bulldozer es falsa

Una nueva demanda colectiva contra AMD sostiene que la empresa incurrió en fraude y marketing engañoso cuando afirmó que sus procesadores Bulldozer tenían ocho núcleos. La demanda, Dickey vs. aspectos del núcleo en un módulo y compartir recursos constituye una práctica engañosa.

Si el artículo en Legalnewsline.com es remotamente preciso , la demanda carece totalmente de mérito técnico. La demanda supuestamente alega que debido a que Bulldozer comparte ciertos recursos centrales, los núcleos ya no pueden funcionar de forma independiente y el chip ya no es capaz de ejecutar ocho instrucciones simultáneamente. Si ese es el gancho en el que Dickey espera colgar su demanda, eligió una mala. Si bien es cierto que AMD compartió recursos centrales dentro de Bulldozer, el chip no funciona de la forma en que Dickey alega que lo hace.



Zambullirse en 'Dozer

Hace cuatro años, nosotros publicó una investigación sobre cómo Bulldozer manejó escenarios de subprocesos múltiples y qué tipo de penalización tomó el chip al ejecutar dos subprocesos en el mismo módulo. Nuestras investigaciones mostraron que Bulldozer tuvo un impacto de rendimiento de aproximadamente un 20% al escalar hasta ocho núcleos en comparación con el escalado que esperaríamos ver en un procesador de diseño convencional.



Escalado Cinebench cuando se utilizan cuatro hilos.

Escalado Cinebench cuando se utilizan cuatro hilos. La velocidad del reloj se bloqueó en 3,6 GHz.

El gráfico anterior muestra el rendimiento de la excavadora cuando se le ha dicho a Cinebench que use solamente cuatro hilos en cada caso. Luego controlamos dónde se ejecutaban los hilos. La prueba 4M / 4C significa que bloqueamos un hilo en cada módulo. La prueba 4M / 8C significa que especificamos cuatro subprocesos, pero dejamos que se ejecuten en cualquier núcleo. La prueba 2M / 4C significa que bloqueamos los cuatro subprocesos para que se ejecuten en un solo módulo. Los resultados muestran que el modo 4M / 4C es claramente más rápido que el modo 2M / 4C, aproximadamente un 18% más rápido.



Bulldozer's total Sin embargo, el rendimiento con los ocho núcleos habilitados fue aún mayor que el modo 4M / 4C, como se muestra a continuación:

Rendimiento de Cinebench cuando los ocho subprocesos se ejecutan en ocho núcleos. La velocidad del reloj de la CPU se bloqueó en 3.6GHz.

Rendimiento Cinebench cuando los ocho subprocesos se ejecutan en ocho núcleos. La velocidad del reloj se bloqueó en 3,6 GHz.

Un Bulldozer de ocho núcleos era capaz de ofrecer aproximadamente el mismo rendimiento que un Thuban de seis núcleos. El impacto en el rendimiento de combinar y compartir núcleos, en otras palabras, no se acercó al 50% que alega Dickey.



Desde que se envió Bulldozer, AMD ha hecho modestas mejoras a la eficiencia y el rendimiento generales de la CPU. Kaveri reducir a la mitad la penalización por subprocesos múltiples , de ~ 20% a 10% en comparación con el escalado de núcleo típico. Si AMD no se hubiera visto obligado a reducir las velocidades de reloj para compensar su proceso de fabricación de 28 nm, Kaveri habría superado a Richland en todos los ámbitos. La penalización del 10-20% por el multihilo en comparación con los diseños de núcleo convencionales no se acerca a la reducción a la mitad que alega Dickey.

Ahora bien, es absolutamente cierto que la familia de productos Bulldozer ha tenido un rendimiento de subproceso único mucho menor que las CPU AMD anteriores (en muchos casos) o los chips Intel (en prácticamente todos los casos). Pero esta demanda no parece argumentar que AMD comercializó mal sus CPU porque el rendimiento de un solo subproceso fue más débil de lo esperado, sino porque multiproceso el escalado se vio gravemente perjudicado por la decisión de compartir varios aspectos de la arquitectura subyacente. El rendimiento de un solo subproceso débil y el alto consumo de energía crearon una situación en la que BD no podía alcanzar sus frecuencias de reloj objetivo ni sus objetivos IPC. Fundamentalmente, estos problemas no desaparecen cuando la CPU se ejecuta en modo de un subproceso por módulo.

La demanda de Dickey también está equivocada en otras áreas de hecho. Bulldozer comparte un solo bloque de FPU por unidad de trabajo, pero las cargas de trabajo de los consumidores rara vez son pesadas por FPU. Cada módulo de CPU hace contienen las ocho canalizaciones enteras que esperaría en un chip convencional de doble núcleo típico (4 ALU + 4 AGU por módulo). Dickey se refiere a Bulldozer como incapaz de “realizar ocho cálculos simultáneamente”, pero este es un lenguaje impreciso e inexacto que no refleja la complejidad de cómo una CPU ejecuta el código. Bulldozer es absolutamente capaz de ejecutar ocho subprocesos simultáneamente, y ejecutar ocho subprocesos en un FX-8150 de ocho núcleos es más rápido que ejecutar ese mismo chip en un modo de cuatro subprocesos y cuatro módulos. Bulldozer puede decodificar 16 instrucciones por reloj (no ocho) y puede mantener muchas más de ocho instrucciones en vuelo simultáneamente.

Los tribunales no pueden definir núcleos

Esta demanda básicamente le pide a un tribunal que defina qué es un núcleo y cómo las empresas deben contarlo. Por molesto que sea ver a los proveedores abusar ocasionalmente de los recuentos básicos en nombre de estrategias de marketing dudosas, pedirle a un tribunal que haga declaraciones sobre el desempeño relativo entre empresas es una cura mucho peor que la enfermedad. Desde los grandes mercados de empresas de hierro hasta los dispositivos móviles, las empresas implementan arquitecturas muy diferentes para resolver diferentes tipos de problemas. Un SoC móvil de ocho núcleos basado en Cortex-A7 es una bestia muy diferente de una configuración Big.Little Cortex-A57 / Cortex-A53 de ocho núcleos. Ese chip es muy diferente de un Oracle M7 o el SPARC T5. El T5 no tiene el rendimiento por núcleo de los Xeons de 18 núcleos de Intel o Power8 de IBM.

Escalado de CPU

Como deja claro este gráfico, el IPC de la CPU y la velocidad del reloj varían ampliamente, incluso dentro de los productos Intel a lo largo del tiempo.

Bulldozer puede tener realizado más como un chip de cuatro núcleos de Intel, pero eso no significa que en realidad estaba un chip de cuatro núcleos. Los beneficios de rendimiento de ejecutar la CPU en una configuración equivalente a cuatro núcleos no eran lo suficientemente grandes como para hacer esa afirmación. El argumento podría sostenerse si AMD hubiera comercializado BD con un excelente rendimiento de punto flotante, pero las divulgaciones y los informes de la compañía indicaron claramente que BD tendría solo cuatro unidades de punto flotante. Nadie comprar el sistema para el trabajo de FPU habría sabido eso mucho antes de que se enviara el hardware.

AMD, en un sentido muy real, ha sido severamente castigada por la CPU que lanzó al mercado en 2011, y esta demanda presenta afirmaciones que no resisten el escrutinio técnico.

Copyright © Todos Los Derechos Reservados | 2007es.com