Comentarios de AMD sobre problemas de programación de Threadripper 2990WX

Característica de desgarrador de hilos de segunda generación

Desde que AMD lanzó su Threadripper 2990WX, ha habido dudas sobre la eficacia con la que podría escalar en cargas de trabajo de subprocesos múltiples. Inicialmente, las caídas y ralentizaciones en el rendimiento en ciertas cargas de trabajo se atribuían a la configuración del controlador de memoria asimétrica; solo algunos troqueles Threadripper tienen acceso directo a los controladores de memoria, mientras que otros se conectan solo indirectamente. Esto pareció causar una pérdida significativa de rendimiento en ciertos puntos de referencia.



Pero rápidamente surgió información que sugería que el problema no estaba en el hardware. Bajo Linux, el 2990WX mantuvo altos niveles de rendimiento, incluso cuando se hundió en la misma configuración en Windows. Claramente, había más en la historia. Anandtech, que ha estado cooperando con Wendell de Level1Tech's, ha publicado su propia actualización sobre la situación.

2990WX-Acceso a memoria



Parece que Windows está diseñado para mantener una configuración de 'Mejor nodo NUMA' e intenta ejecutar subprocesos en esos núcleos. El programador intenta mover los nodos a estas posiciones con la mayor frecuencia posible, pero eliminará los subprocesos anteriores que se suponía que también estaban asignados a este clúster principal.



Esto crea una enorme contención central a medida que diferentes subprocesos compiten por la posición y el sistema operativo intenta sin pensar meter todo en el mismo nodo sobreutilizado. Una aplicación de múltiples subprocesos podría pasar hasta el 50 por ciento de su tiempo barajando datos sin cesar (que, al parecer, es exactamente lo que sucede). los punto de este sistema era originalmente para máquinas virtuales, de modo que cada máquina virtual tendría su propio tiempo de ejecución y se asignará al 'mejor' nodo NUMA, independientemente de dónde se encuentre. En algún momento, Microsoft se dio cuenta de que esta disputa central eterna es un problema importante y creó un parche que deshabilitaría el problema del 'mejor nodo NUMA' en cualquier sistema NUMA de dos nodos. Es por eso que Threadripper 1950X y 2950X no se ven afectados.

coreprio_ui

Los sistemas con tres o más nodos, sin embargo, son sigue afectado, por lo que vemos que el problema afecta tanto a Epyc 7551 como a Threadripper 2990WX. La razón por la que el disociador CorePrio NUMA funciona es que analiza el software activo cada pocos segundos y ajusta la afinidad de subprocesos mientras la aplicación se está ejecutando. Piense en ello como una operación de clasificación manual que se ejecuta periódicamente para garantizar que el planificador integrado del sistema operativo funcione correctamente.



Según AMD, tiene tickets abiertos con Microsoft y está explorando métodos para resolver este problema lo más rápido posible. La comprensión de Wendell del problema es supuestamente 'muy cercana' a lo que realmente está sucediendo, pero no se dieron detalles sobre las diferencias. Se dice que Microsoft ahora está trabajando en una solución, aunque el cronograma para la inclusión no está claro. El siguiente punto lógico de inclusión para la actualización sería Redstone 6, también conocido como la próxima actualización de Windows que se lanzará en la primera mitad de 2019.

Ha habido mucha especulación entre los usuarios sobre de quién es la 'culpa'. Hasta cierto punto, la pregunta está mal formulada. AMD puede informar a Microsoft de un problema con la programación en cualquier momento, pero esto no significa automáticamente que Microsoft marque el problema para su resolución, particularmente en el contexto de una CPU recién lanzada en la cima del mercado con una base de usuarios insignificante.

Sabemos que AMD ahora tiene una línea de comunicación abierta a Microsoft y podemos hacer algunas conjeturas sobre cuándo las soluciones podrían llegar al mercado. Ciertamente no afectará en nada que las CPU de rendimiento avanzado Cascade Lake de Intel, con hasta 48 núcleos y un diseño de chiplet, salgan al mercado este año. Desde la perspectiva de Microsoft, puede haber tenido más sentido esperar e introducir todos los ajustes necesarios para admitir una gama de nuevas configuraciones NUMA, incluido Threadripper 2990WX, al mismo tiempo, debutando así un soporte más sólido para 7nm Epyc, 32 núcleos y anteriores CPU Threadripper, Cascade Lake AP y productos futuros de Intel en la misma actualización.



Los usuarios con un 2990WX deben descargar la versión modificada de CorePrio para mejorar el rendimiento, tendremos que esperar y ver qué introduce la versión formal del soporte del programador para ver si puede mejorar el rendimiento más allá de la aplicación.

Copyright © Todos Los Derechos Reservados | 2007es.com