IBM presenta el ataque pincer Power8 y OpenPower en el monopolio del servidor x86 de Intel

IBM Power8 die shot, alta resolución

IBM ha quitado las envolturas de los primeros servidores que funcionan con sus monstruosamente poderosas CPU Power8. Con más de 4 mil millones de transistores, empaquetados en un troquel estúpidamente grande de 650 milímetros cuadrados construido con el nuevo proceso SOI de 22 nm de IBM, la CPU Power8 de 12 núcleos (96 hilos) es una de las más grandes y probablemente la más poderosa jamás construida. . En un movimiento separado, IBM está abriendo toda la arquitectura y la documentación técnica de Power8 a través de OpenPower Foundation, lo que permite a terceros fabricar chips basados ​​en Power (muy parecido al modelo de licencia de ARM) y permitir la creación de coprocesadores especializados (GPU, FPGA, etc.) que se enlazan directamente con el espacio de memoria de la CPU utilizando la nueva interfaz CAPI de IBM. No le sorprenderá saber que Nvidia, Samsung y Google, tres grandes jugadores entre cientos más que están en deuda con el monopolio de servidores de Intel, son miembros centrales de la Fundación OpenPower. La CPU Power8 y la OpenPower Foundation son las piedras angulares de un plan muy grande y bien orquestado para finalmente poner fin al reinado de x86 y colocar una más justa, más poderoso arquitectura a la cabeza de la mesa de servidores.

Primero, deberíamos hablar del nuevo chip Power8. Hay 12 núcleos de CPU, cada uno con 512 KB de L2 SRAM y 8 MB de L3 EDRAM, para un total de 6 MB de caché L2 y 96 MB L3 respectivamente. Luego, hay otros 230 GB / s de ancho de banda por 1 TB de DRAM. Mientras que cada núcleo Intel Xeon es capaz de subprocesos simultáneos bidireccionales, y los núcleos Power7 + pueden hacer cuatro subprocesos, Power8 sube la apuesta a ocho subprocesos simultáneos (SMT). Como era de esperar, otras partes del chip se han expandido de manera similar para satisfacer el paralelismo masivo de Power8: hay ocho decodificadores (en lugar de 6), seis despachos por ciclo de reloj, una duplicación de las unidades de carga (4), los datos la caché ahora puede procesar cuatro transacciones de 128 bits por ciclo, y el ancho del bus entre L2 y la caché de datos ahora es de 512 bits. Eche un vistazo al diagrama de bloques a continuación y sorpréndase con su enorme paralelismo y rendimiento.

Diagrama de bloques de microarquitectura IBM Power8

Diagrama de bloques de microarquitectura IBM Power8 (Crédito de la imagen: The Linley Group)



Esperamos que el Power8 eventualmente sea capaz de alcanzar velocidades de reloj de alrededor de 4.5GHz, con un TDP en la región de 250 vatios. A esta velocidad, la CPU Power8 será aproximadamente un 60% más rápida que la Power7 + en aplicaciones de un solo subproceso, y más de dos veces más rápido en tareas multiproceso. En ciertos casos, IBM dice que el Power8 es capaz de analizar cargas de trabajo de Big Data entre 50 y 1,000 veces más rápido que los sistemas x86 comparables (la misma cantidad de RAM, la misma cantidad de núcleos).

En comparación con sus competidores (Power 7+, Oracle Sparc T5, Intel Xeon), Power8 tiene entre dos y tres veces más potencia de procesamiento por socket. Esto se debe principalmente al recuento masivo de subprocesos (96 frente a 30 para el último Xeon E7-8890 v2 de 15 núcleos) y al ancho de banda de memoria completamente insano (230 GB / seg frente a 85 GB / seg). Sin embargo, en términos de rendimiento por vatio, el Xeon (~ 150W TDP) probablemente esté un poco por delante del Power8, pero en general, cuando se habla de servidores, el consumo de energía generalmente juega un papel secundario en la densidad de rendimiento (cuántos gigaflops puede exprimir de un solo servidor).

Disparo de CPU IBM Power8, etiquetado

Dado de CPU IBM Power8, etiquetado

Más allá del rendimiento SPECint y SPECfp en bruto, Power8 también presenta CAPI (interfaz de procesador de conexión de coherencia). CAPI es un enlace directo a la CPU, lo que permite que los periféricos y coprocesadores se comuniquen directamente con la CPU, evitando (sustancialmente) los gastos generales del sistema operativo y del controlador. CAPI es similar al QPI de Intel, pero donde QPI es cerrado y patentado, IBM está abriendo CAPI a terceros. El CTO de Power Systems de IBM, Satya Sharma, me dijo en una entrevista que en el caso de la memoria flash adjunta a través de CAPI, la sobrecarga se reduce en un factor de 20. Sin embargo, lo que es más importante, CAPI se puede utilizar para conectar coprocesadores (GPU, FPGA) directamente a la CPU Power8 para aumentar el rendimiento de una carga de trabajo realmente increíble. Gracias a estos coprocesadores conectados a CAPI, un sistema Power8 puede ser 1.000 veces más rápido que un sistema x86 comparable.

Lo que nos lleva claramente a la Fundación OpenPower.

Copyright © Todos Los Derechos Reservados | 2007es.com