El coste real de las vulnerabilidades a nivel de hardware: Dinero, rendimiento y confianza
Las vulnerabilidades a nivel de hardware son una pesadilla en el mundo de las TI, infundiendo temor en los corazones de profesionales y empresas por igual. Desde los primeros ejemplos hasta los descubrimientos más recientes, estos problemas han asolado la industria, dejando un rastro de dinero malgastado y rendimiento comprometido.
Breve historia
El infame fallo Intel Pentium F00F de finales de los 90 (conocido como "operando no válido con instrucción CMPXCHG8B bloqueada" por sus amigos) sirve como sorprendente recordatorio de cómo un fallo de hardware puede afectar a toda una industria. Las innovadoras características del Pentium se vieron empañadas por vulnerabilidades como ésta y el fallo fallo FDIVlo que generó desconfianza y escepticismo.
Al entrar en el nuevo milenio, nos encontramos con el error "TLB" de AMD Phenomque afectaba a la función Translation Lookaside Buffer. Esto afectó a la primera CPU de 4 núcleos disponible de forma masiva, ralentizando el rendimiento en casi un 20%.
Y la historia no acaba ahí.
Una nueva era de complejidad
En la última década se ha producido un aumento de la complejidad del hardware y, con ello, de las vulnerabilidades. Los sitios Spectre/Meltdown introducidas en 2018 abrieron nuevas puertas a problemas de seguridad a través de la ejecución especulativa.
Ejemplos recientes como "Downfallde AMDInception de AMD," "Zenbleedy la filtración de datos "divide por cero en la arquitectura Zen 1 de AMD demuestran que el problema está lejos de desaparecer. De hecho, el error de división por cero fue tan bueno que se arregló dos veces. Quizá esta vez se mantenga.
Impacto económico
La verdadera pregunta es, ¿por qué las vulnerabilidades a nivel de hardware importan tanto más que los bugs típicos? La respuesta es sencilla: las implicaciones financieras.
Dinero malgastado y nuevo hardware
Pensemos en la evolución de la arquitectura Zen 1 a Zen 2 de AMD. Aunque la mejora real del rendimiento es discutible, una estimación aproximada la sitúa en el 13%. estimación aproximada la sitúa en un 13 (las propias cifras de AMD apuntan a un 29% en algunas cargas de trabajo). Comparemos esto con el impacto en el rendimiento de la corrección para Inception de AMD, que alcanza el 54%..
Estos fallos a nivel de hardware no son sólo fallos de software, sino que existen en el propio silicio. Para solucionarlos, a menudo hay que desactivar ciertas funciones mediante actualizaciones del microcódigo, lo que inevitablemente conlleva una pérdida de rendimiento.
Pagar una prima por un rendimiento antiguo
El verdadero problema oculto es el coste. Cuando pagas un sobreprecio por un hardware de última generación, esperas un rendimiento de primera. Pero cuando se aplica una corrección a nivel de hardware, se obtiene esencialmente rendimiento de la generación anterior a precios de nueva generación.
La corrección de RetBleed es un ejemplo de esto, trayendo consigo un impacto en el rendimiento de entre el 14% y el 39. El resultado es una máquina que rinde como sus predecesoras, pero que cuesta lo último y más caro.
Notas finales
Las vulnerabilidades a nivel de hardware no son sólo problemas técnicos. Son una carga financiera y rompen la confianza. A medida que siguen apareciendo nuevas vulnerabilidades, el sector se enfrenta al enorme reto de encontrar un equilibrio entre seguridad, rendimiento y coste.
La verdadera razón por la que la gente se preocupa, se enfada y vacila a la hora de desplegar inmediatamente las medidas de mitigación no es sólo la pérdida de rendimiento; es el dinero. Cuando la confianza en la tecnología punta se ve quebrantada por vulnerabilidades imprevistas, el efecto dominó alcanza a clientes, fabricantes y a la economía en general.
Y, en este caso concreto, no se trata sólo del aspecto de la seguridad, con sus implicaciones financieras a veces difíciles de comprender. El coste de cada vulnerabilidad que afecta al silicio repercute directamente en la cuenta de resultados. ¿Necesitaba más rendimiento para cumplir sus objetivos de producción? ¿Quería agilizar las tareas de cálculo? Ahora tendrá que volver a pagar por más hardware para volver a estar donde estaba.
O dicho sin rodeos: es la economía, tonto.


