Intel Xeon de 5ª geração traz aceleradores de IA em todos os núcleos
Daniel Trefilio
Intel Xeon de 5ª geração traz aceleradores de IA em todos os núcleos

Na última quinta-feira (14), a Intel lançou os processadores Intel Xeon de 5ª geração para servidores com aceleradores de IA embarcados em todos os núcleos. Além de dispensar aceleradores discretos, isso garante aos novos Xeon até 42% mais desempenho de inferência e latências inferiores a 100 ms executando modelos LLM de até 20 bilhões de parâmetros.

Os novos Xeon utilizam o mesmo socket FCLGA4677 da geração anterior , permitindo uma atualização robusta sem a substituição de servidores. Isso reduz consideravelmente o investimento necessário para clientes com infraestrutura Intel Xeon migrarem suas plataformas para a nova geração.

“Desenvolvidos para IA, os processadores Intel Xeon de 5ª geração oferecem maior desempenho aos clientes que implantam recursos de IA na nuvem, na rede ou em dispositivos nas bordas. Como resultado do nosso trabalho de longa data junto a clientes, parceiros e o ecossistema de desenvolvedores, estamos lançando o Intel Xeon de 5ª geração em uma base comprovadamente sólida que permitirá rápida adoção e escala com menor TCO", disse Sandra Rivera, vice-presidente executiva da Intel e gerente geral do Grupo de Data Centers e IA

-
CT no Flipboard : você já pode assinar gratuitamente as revistas Canaltech no Flipboard do iOS e Android e acompanhar todas as notícias em seu agregador de notícias favorito.
-

Mais desempenho, segurança e escalabilidade

Em comparação a geração anterior, os aceleradores de IA embarcados nos núcleos dos Xeon de 5ª geração dão até 21% mais desempenho geral e 36% mais desempenho por Watt na mesma plataforma. No caso de clientes com infraestruturas mais antigas, o ganho no custo total de operação (TCO) pode chegar a até 77%.

As plataformas LGA-4677 tiveram um portfólio relativamente reduzido na geração dos Sapphire Rapids, atuando apenas nos segmentos flagship (XCC / contagem de núcleos extrema) e intermediários (MCC / contagem de núcleos mediana).

Novo segmento e mais núcleos

Para os novos Emerald Rapids, a Intel está investindo em expandir não apenas a contagem de núcleos nos topo de linha , como também introduzir servidores de entrada com foco em eficiência energética (EE LCC). Esses produtos são ideias para ecossistemas computacionais menos intensos que exigem o máximo de desempenho por Watt, como soluções de borda para IoT e cidades inteligentes.

Em termos de arquitetura de die, os Xeon MCC mantêm a contagem de até 32 núcleos, e os EE LCC trazem configurações com até 20 núcleos, ambos com dies monolíticos. Os modelos CXX, topo de linha, reestruturam o chip de quatro blocos e até 60 núcleos, para dois blocos maiores em empacotamento mais complexo.

O novo formato oferece uma área maior, possibilitando arranjos de até 64 núcleos e até 320 MB de cache. Os novos interconectores Intel Ultra Path 2.0 (UPI) ficam alocados nos cantos de cada bloco, com os chiplets de memória nas laterias e os PCIe intercalados pelos aceleradores integrados.

Maior "throughput" e 10x mais desempenho/W

Os interconectores UPI 2.0 elevam a largura de banda para até 20 GT/s. O padrão de memória também foi atualizado de DDR5-4800 para até DDR5-5600 em até 8 canais, variando sob demanda conforme o fabricante OEM. A nova estrutura com IA embarcada traz um salto geracional com até 70% mais throughput em cargas de trabalho de armazenamento e rede, 40% em HPC e 42% em inferências.

Uma das maiores vantagens de trazer os aceleradores de IA embarcados no próprio núcleo, no lugar de soluções obrigatoriamente discretas, é que isso permite otimizar todos os processos e não apenas cargas de trabalho específicas. Dessa forma, o sistema como um todo é otimizado, impactando profundamente latências, alocação de instruções e, principalmente, consumo de energia.

De maneira geral, o desempenho por Watt é o dobro em relação aos Emerald Rapids sem aceleradores de IA embarcados e chega a ser 10 vezes mais tarefas utilizando matrizes Intel AMX de processamento de linguagem natural (NLP).

Virtualização com segurança em tempo real

Muitas soluções de encriptação em VMs operam apenas nos processos de transferência de comunicação cliente e host, deixando os dados protegidos durante o processamento nas VMs. Introduzida originalmente nos Xeon Sapphire Rapids, a funcionalidade Intel Trust Domain Extesions (Intel TDX) eleva os níveis de privacidade para encriptação em tempo real ao nível, oferecendo mais segurança em processos de virtualização .

Da nuvem à borda

Atualmente, praticamente toda a infraestrutura instalada de servidores em IA se baseia em soluções CUDA , consideravelmente caras para organizações menores. A chegada dos Intel Xeon de 5ª geração é uma das estratégias da Intel para quebrar o domínio da concorrência nos serviços de Inteligência Artificial, trazendo cargas de trabalho para plataformas mais versáteis, acessíveis, e sem depender de implementações dos softwares para arquiteturas ARM , mais complexas de programar.

Com produtos de processamento de IA via CPU, otimizados por ferramentas e LLM de código aberto para arquiteturas x86, é possível criar um portfólio robusto. Isso possibilita atender desde infraestruturas de nuvem e HPC altamente intensas a computação de borda, focando em pulverizar os serviços embarcados em diferentes níveis de mercado, levando a IA, literalmente, a todos os lugares.

Processadores Escaláveis Intel Xeon de 5ª Geração
Dual Socket de Uso Geral (Desempenho)
SKU

Núcleos/ Threads

Frequência (GHz)

Cache L3 (MB) TDP (W)

Sockets

Memória DDR5 (MT/s)

UPI

Disponíveis

Preço Sugerido (US$)
8592+ 64/128 1,9 / 3,9 320 350 2 5600 4 11.600
8580 60/120 2 / 4 300 350 2 5600 4 10.710
8570 56/112 2,1 /4 300 350 2 5600 4 9.595
8568Y+ 48/96 2,3 / 4 300 350 2 5600 4 6.497
8562Y+ 32/64 2,8 / 4,1 60 300 2 5600 3 5.945
6548Y+ 32/64 2,5 / 4,1 60 250 2 5200 3 3.726
6542Y 24/48 2,9 / 4,1 60 250 2 5200 3 2.878
6544Y 16/32 3,6 / 4,1 45 270 2 5200 3 3.622
6526Y 16/32 2,8 / 3,9 37,5 195 2 5200 3 1.517
6534 8/16 3,9 / 4,2 22,5 195 2 4800 3 2.816
5515+ 8/16 3,2 / 4,1 22,5 165 2 4800 3 1.099
Dual Socket de Uso Geral (Mainline)
8558 48/96 2,1 / 4,0 260 330 2 5200 4 4.650
6538Y+ 32/64 2,2 / 4,0 60 225 2 4522 3 3.141
6530 32/64 2,1 / 4,0 160 270 2 4800 3 2.128
5520+ 28/56 2,2 / 4,0 52,5 205 2 4800 3 1.640
4516Y+ 24/48 2,2 / 3,7 45 185 2 4400 2 1.295
4514Y 16/32 2,0 / 3,4 30 150 2 4400 2 780
4510 12/24 2,4 / 4,1 30 150 2 4400 2 563
4509Y 8/16 2,6 / 4,1 22,4 125 2 4400 2 563
Uso Geral com Arrefecimento Líquido
8593Q 64/128 2,2 / 3,9 320 385 2 5600 4 12.400
6558Q 32/64 3,2 / 4,1 60 350 2 5200 3 6.416
Single Socket de Uso Geral
8558U 48/96 2,0 / 4,0 260 300 1 4800 0 3.720
5512U 28/56 2,1 / 3,7 52,5 185 1 4800 0 1.230
3508U 8/16 2,1 / 2,2 22,5 125 1 4400 0 415
Otimizado para Rede (5G)
8571N 52/104 2,4 / 4,0 300 300 1 4800 0 6.839
6548N 32/64 2,8 / 4,1 60 250 2 5200 3 3.875
6538N 32/64 2,1 / 4,1 60 205 2 5200 3 3.351
Nuvem IaaS (Infraestrutura) / SaaS (Software)
8592V 64/48 2,0 / 3,9 320 330 2 4800 3 10.995
8558P 48/96 2,7 / 4,0 260 350 2 5600 3 6.759
8581V 60/120 2,0 / 3,9 300 270 1 4800 0 7.568
Armazenamento e Infraestrutura Hiperconvergida
6554S 36/72 2,2 / 4,0 180 270 2 5200 4 3.157

🛒 Compre processadores Intel pelo melhor preço!

🛒 Compre notebooks com CPUs Intel pelo melhor preço!

Leia a matéria no Canaltech .

Trending no Canaltech:

    Mais Recentes

      Comentários

      Clique aqui e deixe seu comentário!