AMD destruye Nvidia en la minería de Bitcoin, ¿se puede cerrar la brecha alguna vez?

Logotipo de nvidia

Si normalmente sigue el rendimiento de la GPU en relación con los juegos, pero siente curiosidad por la minería de Bitcoin, probablemente se haya dado cuenta y se haya sorprendido por el hecho de que las GPU de AMD son los líderes indiscutibles en rendimiento del mercado. Esto está en marcado contraste con el negocio de gráficos para PC, donde la serie HD 7000 de AMD ha estado jugando un juego defensivo contra la familia de productos GK104 / GeForce 600 de Nvidia. En la minería de Bitcoin, la situación se invierte casi por completo: la Radeon 7970 es capaz de 550MHash / segundo, mientras que la GTX 680 es aproximadamente 1/5 más rápida.

Hay un artículo en Bitcoin Wiki que intenta explicar la diferencia, pero la pieza original se escribió en 2010-2011 y no se ha actualizado desde entonces. Se refiere a las arquitecturas VLIW de Fermi y AMD e implica que el mejor rendimiento de AMD se debe a que tiene muchos más núcleos de sombreado que las tarjetas Nvidia equivalentes. Esto no es del todo exacto y no explica por qué la GTX 680 es más lento que la GTX 580 en la minería BTC, a pesar de tener muchos más núcleos. Este artículo explicará la diferencia, abordará si mejores mineros CUDA cambiarían drásticamente el delta de rendimiento entre AMD y Nvidia, y abordará si el rendimiento GPGPU de Nvidia es generalmente comparable al de AMD en estos días.

Temas no discutidos aquí incluyen:



  • Burbujas
  • Oportunidad de inversión
  • Ya sean ASIC o no, cuando lleguen próximo mes, este verano, en el futuro destruirá el mercado minero de GPU.

Estas son preguntas importantes, pero no son el tema central de este artículo. Nosotros será discuta la eficiencia energética y Mhash / vatio hasta cierto punto, porque estos factores tienen un impacto en la comparación del rendimiento de minería de AMD frente a Nvidia.

La mecánica de la minería

La minería de Bitcoin es una implementación específica del algoritmo SHA2-256. Una de las razones por las que las tarjetas AMD se destacan en la minería es porque las GPU de la empresa tienen una serie de características que mejoran su rendimiento de enteros. En realidad, esto es algo extraño; Históricamente, las cargas de trabajo de GPU han sido pesadas en coma flotante porque las texturas se almacenan con precisión a la mitad (FP16) o completa (FP32).

El problema se vuelve más confuso por el hecho de que cuando Nvidia comenzó a impulsar CUDA, enfatizó el descifrado de contraseñas como una de las principales fortalezas de sus tarjetas. Es cierto que las GPU GeForce, comenzando con G80, ofrecían un rendimiento criptográfico significativamente mayor que las CPU, pero el hardware de AMD ahora supera al de Nvidia. Fuera del agua.

La primera razón por la que las tarjetas AMD superan a sus contrapartes de Nvidia en la minería de BTC (y la entrada actual de Bitcoin lo hace cubrir esto) se debe a que el algoritmo SHA-256 utiliza una operación de rotación a la derecha de entero de 32 bits. Esto significa que el valor entero se desplaza (explicación aquí), pero los bits que faltan se vuelven a adjuntar al valor. En una rotación a la derecha, los bits que caen de la derecha se vuelven a unir a la izquierda. Las GPU de AMD pueden realizar esta operación en un solo paso. Antes del lanzamiento de la GTX Titan, las GPU de Nvidia requerían tres pasos: dos turnos y una adición.

Decimos 'antes de Titan', porque una de las características que Nvidia introdujo con Compute Capability 3.5 (solo compatible con GTX Titan y Tesla K20 / K20X) es una palanca de cambios de embudo. El cambiador de embudo puede combinar operaciones, reduciendo significativamente la penalización de 3 ciclos de Nvidia. Veremos cuánto mejora el rendimiento momentáneamente, porque esta no es la única mejora de GK110 sobre GK104. GK110 también es capaz de hasta 64 cambios enteros de 32 bits por SMX (Titan tiene 14 SMX). GK104, por el contrario, solo podía manejar 32 cambios enteros por SMX, y tenía solo ocho bloques SMX.

Capacidad de instrucción de Kepler

Hemos destacado la diferencia de capacidad de desplazamiento de enteros de 32 bits entre CC 3.0 y CC 3.5.

AMD juega cosas cerca del pecho cuando se trata de las capacidades enteras de 32 bits de Graphics Core Next (GCN), pero la compañía ha confirmado que GCN ejecuta código INT32 a la misma velocidad que el punto flotante de doble precisión. Esto implica una tasa máxima teórica de despacho int32 de 64 por reloj por CU, el doble de la tasa base de GK104. Sin embargo, la otra ventaja de AMD es la gran cantidad de Unidades de Computación (CU) que componen una GPU. El Titan, como hemos dicho, tiene 14 SMX, en comparación con los 32 CU del HD 7970. Compute Unit / SMX puede ser mucho más importante que el número total de núcleos en estos contextos.

Copyright © Todos Los Derechos Reservados | 2007es.com