Amazon Web Services (AWS) anunció la disponibilidad general de las nuevas instancias Amazon Elastic Compute Cloud (Amazon EC2) impulsadas por procesadores personalizados de 4ta generación de Intel® Xeon Scalable.
Este lanzamiento es el más reciente en una creciente lista de instancias impulsadas por procesadores de 4ta generación de Xeon que ofrecen un liderazgo en el costo total de propiedad (TCO) y la mayor cantidad de aceleradores integrados en cualquier CPU para impulsar cargas de trabajo clave como IA, bases de datos, redes y aplicaciones empresariales.
«Intel colaboró estrechamente con AWS para llevar los procesadores Xeon de 4ta generación a sus clientes de nube, muchos de los cuales han obtenido beneficios en su rendimiento y valor durante meses en versiones privadas y públicas. Hoy, nos complace llevar ese mismo valor real al mundo de los clientes de la nube en todo el mundo”, menciona, Lisa Spelman, Vicepresidenta Corporativa de Intel y Directora General del Grupo de Productos y Soluciones Xeon.
¿Por qué es importante?
Estas nuevas instancias de Amazon EC2: Amazon EC2 M7i-flex y M7i, llevan los motores aceleradores de la 4th Gen Xeon a las masas a través de la amplia presencia global de AWS.
Los aceleradores incorporados como las Intel® Advanced Matrix Extensions (Intel® AMX) ofrecen una alternativa muy necesaria en el mercado para los clientes con una creciente demanda de cargas de trabajo de inteligencia artificial.
El Intel® Xeon® de 4ta generación con AMX también puede cumplir con las métricas de rendimiento de inferencia para modelos de lenguaje grandes (LLMs) con menos de 20 mil millones de parámetros, lo que hace que los LLMs sean rentables y sostenibles para ejecutar en infraestructura general.
En un sentido más amplio, Intel y AWS ofrecen a los clientes una serie de opciones de productos para que se adapten mejor a sus cargas de trabajo, necesidades de rendimiento y precios, junto con la facilidad y flexibilidad para abordar las futuras demandas de infraestructura digital.
Instancias de AWS
Las instancias M7i-flex y M7i están disponibles en las siguientes regiones de AWS: este de EE. UU. (Ohio), este de EE. UU. (N. Virginia), oeste de EE. UU. (Oregón) y Europa (Irlanda).
Las instancias M7i-flex ofrecen diseños para ejecutar sin problemas cargas de trabajo generales, como servidores web y de aplicaciones, escritorios virtuales, procesamiento por lotes, microservicios, bases de datos y aplicaciones empresariales, y una relación precio-rendimiento hasta un 19 % mejor en comparación con las instancias M6i.
Por su parte, las instancias M7i ofrecen tamaños de instancia más grandes (hasta 192 vCPUs y 768 GiB de memoria).
Nuevos aceleradores incorporados que permiten la descarga eficiente y la aceleración de operaciones de datos que ayudan a optimizar el rendimiento para cargas de trabajo de bases de datos, cifrado y compresión, y gestión de colas, además de una relación desempeño-precio hasta un 15 % mejor en comparación con las instancias M6i.