Em dezembro passado, a HPE anunciou o lançamento de uma plataforma de computação em memória modular com os maiores recursos de escalabilidade do mundo - o HPE Superdome Flex. Esta é uma inovação na computação para suportar aplicativos de missão crítica, análises em tempo real e computação de alto desempenho com processamento intensivo de dados.
A plataforma
HPE Superdome Flex possui vários recursos que a tornam única no setor. Oferecemos uma tradução do artigo no blog
Servers: The Right Compute , que discute a arquitetura modular e escalável da plataforma.

Escalabilidade além da Intel
Como a maioria dos fornecedores de servidores x86, a HPE usa os mais recentes processadores escaláveis Intel Xeon, com o nome de código Skylake, em seus servidores de última geração, incluindo o HPE Superdome Flex. A arquitetura de referência da Intel para esses processadores usa a nova tecnologia UltraPath Interconnect (UPI), com dimensionamento de até oito soquetes. A maioria dos fornecedores que usam esses processadores usa um método de conexão não colada em seus servidores, mas o HPE Superdome Flex usa uma arquitetura modular exclusiva com escalabilidade além dos recursos da Intel: de 4 a 32 soquetes em um único sistema.
Essa arquitetura é usada porque vimos a necessidade de plataformas com escalabilidade além de oito soquetes Intel; Isso é especialmente verdade hoje, quando os volumes de dados estão aumentando a uma taxa sem precedentes. Além disso, como a Intel desenvolveu a UPI principalmente para servidores com dois e quatro soquetes, servidores com oito soquetes "sem cola" estão enfrentando problemas de largura de banda. Nossa arquitetura fornece alto rendimento, mesmo quando o sistema cresce para sua configuração máxima.
Relação qualidade / preço como vantagem competitiva

A arquitetura modular do HPE Superdome Flex é baseada em um chassi de quatro soquetes que pode escalar até oito chassis e
32 soquetes em um único sistema de servidor . Uma grande variedade de processadores está disponível para uso no servidor: dos modelos Gold de baixo custo às séries Platinum de ponta da família de processadores Xeon Scalable.
Essa capacidade de escolher entre processadores Gold e Platinum em toda a faixa de zoom oferece excelentes vantagens de preço / desempenho em relação aos sistemas básicos. Por exemplo, em uma configuração típica de 6 TB, o Superdome Flex oferece uma solução mais barata e mais produtiva do que as ofertas concorrentes de quatro soquetes. Porque Devido à arquitetura, outros fabricantes de sistemas com 4 processadores são forçados a usar DIMMs de 128 GB e processadores mais caros, com suporte para 1,5 TB por soquete. Isso é significativamente mais caro do que usar os DIMMs de 64 GB no Superdome Flex com oito soquetes. Graças a isso, a plataforma Superdome Flex com oito soquetes e 6 TB de memória fornece o dobro da capacidade de computação, o dobro da largura de banda da memória e o dobro da capacidade de E / S, e ainda será mais econômico do que produtos concorrentes com quatro soquetes e 6 TB de memória.
Da mesma forma, para uma configuração de 8 processadores com 6 TB de memória, a plataforma Superdome Flex pode fornecer uma solução mais barata e mais eficiente com oito soquetes. Como Outros fabricantes de sistemas com 8 processadores são forçados a usar processadores Platinum mais caros, enquanto o Superdome Flex com oito soquetes pode usar processadores Gold baratos, fornecendo a mesma quantidade de memória.
De fato, entre plataformas baseadas na família de processadores escaláveis Intel Xeon,
apenas o Superdome Flex pode suportar processadores Gold mais econômicos em configurações com 8 ou mais soquetes (a arquitetura “sem cola” da Intel suporta 8 soquetes apenas com processadores Platinum caros). Também oferecemos uma grande variedade de processadores com diferentes números de núcleos, de 4 a 28 por processador, permitindo correlacionar o número deles com os requisitos para cargas de trabalho.
A importância do dimensionamento no mesmo sistema
A capacidade de escalar verticalmente em um único sistema, ou escalar, oferece várias vantagens para cargas de trabalho e bancos de dados de missão crítica para os quais o HPE Superdome Flex é mais adequado. Isso inclui bancos de dados tradicionais e na memória, análises em tempo real, ERP, CRM e outros aplicativos transacionais. Para esses tipos de cargas, é mais fácil e barato gerenciar um ambiente verticalmente escalável do que um cluster de escala horizontal; além disso, reduz significativamente a latência e melhora o desempenho.
Confira a postagem do blog
Velocidade de operações para dimensionamento horizontal e vertical com o SAP S / 4HANA para ver por que o dimensionamento vertical é muito mais eficiente que o horizontal (clustering) para esses tipos de cargas de trabalho. De fato, trata-se de velocidade e capacidade de trabalhar no nível necessário para essas aplicações críticas.
Alto desempenho consistente até configurações máximas
O Superdome Flex é altamente escalonável graças ao exclusivo chipset HPE Superdome Flex ASIC que conecta o chassi individual de 4 processadores, conforme mostrado nas Figuras 1 e 2. Ao mesmo tempo, todos os ASICs são interconectados diretamente (com uma única distância), garantindo atrasos mínimos de acesso recursos remotos e desempenho máximo. A tecnologia HPE Superdome Flex ASIC fornece roteamento adaptável para equilibrar a carga da malha do comutador e otimizar a latência e a taxa de transferência, o que melhora o desempenho e a disponibilidade do sistema. O ASIC integra o chassi a uma fábrica de matrizes coerente com o cache e mantém a consistência do cache em todos os processadores, usando um diretório grande com entradas de estado da linha de cache que são criadas diretamente no ASIC. Esse esquema de coerência desempenha um papel crucial, fornecendo ao Superdome Flex a capacidade de oferecer suporte à escala de desempenho quase linear de 4 a 32 soquetes. As opções típicas da arquitetura “sem cola” demonstram uma escala de desempenho já mais limitada (variando de quatro a oito soquetes) devido a solicitações de serviço de transmissão para garantir coerência.

Fig. 1. Diagrama de conexão da matriz do switch HPE Flex Grid para um servidor Superdome Flex de 32 soquetesFig. Chassi de 2,4 processadoresMemória compartilhada
Semelhante aos recursos do processador, a quantidade de memória pode ser aumentada adicionando um chassi ao sistema. Cada chassi possui 48 slots DDR4 DIMM nos quais podem ser instalados módulos de memória de 32 GB RDIMM, 64 GB LRDIMM ou 128 GB 3DS LRDIMM, o que fornece uma capacidade máxima de memória de 6 TB no chassi. Assim, a quantidade total de RAM HPE Superdome Flex na configuração máxima com 32 soquetes atinge 48 TB, o que permite trabalhar com os aplicativos mais exigentes usando a tecnologia na memória.
Alta flexibilidade de E / S
Quanto à E / S, cada chassi Superdome Flex pode ser equipado com uma cesta com 16 ou 12 slots de E / S para fornecer um grande número de opções de instalação para placas PCIe 3.0 padrão e a flexibilidade de manter o equilíbrio do sistema para qualquer carga de trabalho. Em qualquer versão do cesto, os slots de E / S são conectados diretamente aos processadores sem o uso de repetidores ou extensores de barramento, o que pode aumentar o tempo de atraso ou reduzir a taxa de transferência. Isso fornece o desempenho mais alto possível para cada placa de E / S.
Baixa latência
O acesso de baixa latência a todo o espaço de memória compartilhada é um fator chave no alto desempenho do Superdome Flex. Independentemente de os dados estarem na memória local ou no controle remoto (em outro chassi), uma cópia deles pode estar no cache de diferentes processadores no sistema. Um mecanismo de coerência do cache garante que as cópias em cache sejam consistentes quando um processo altera os dados. O tempo de atraso para o processador acessar a memória local é de cerca de 100 ns. A latência de acesso a dados na memória de outro processador via canal UPI é de cerca de 130 ns. Os processadores que acessam dados na memória de outro chassi viajam entre dois ASICs Flex (sempre conectados diretamente) com um atraso menor que 400 ns, independentemente do chassi em que o processador estiver. Graças a isso, o Superdome Flex fornece uma largura de banda entre duas metades da matriz (bi-seção) de mais de 210 GB / s em uma configuração com 8 soquetes, mais de 425 GB / s em uma configuração com 16 soquetes e mais de 850 GB / s em uma configuração com 32 soquetes. Isso é mais do que suficiente para as cargas de trabalho mais exigentes e exigentes.
Por que os recursos de alta escala modular são importantes?
Não é segredo que a quantidade de dados está aumentando a uma taxa sem precedentes; isso significa que a infraestrutura deve lidar com solicitações cada vez mais exigentes de processamento e análise de dados críticos e em constante expansão. Mas as taxas de crescimento podem ser imprevisíveis.
Ao implantar aplicativos que usam memória intensivamente, você pode perguntar: qual será o
próximo TB de memória ? O Superdome Flex permite expandir a memória sem alterar o hardware, pois você não está limitado aos slots DIMM em um chassi. Além disso, com um aumento no número de usuários, os aplicativos de missão crítica sempre exigem alto desempenho, independentemente da carga.
Atualmente, os bancos de dados em memória requerem plataformas de hardware de baixa latência e alta largura de banda. Graças à sua arquitetura inovadora, a plataforma HPE Superdome Flex oferece desempenho excepcionalmente alto, alto rendimento e latência consistentemente baixa, mesmo nas maiores configurações. Além disso, você pode obter tudo isso para suas cargas críticas e bancos de dados com uma relação preço / desempenho muito atraente em comparação com sistemas de outros fabricantes.
Você pode aprender sobre os recursos exclusivos de tolerância a falhas (RAS) do servidor
Superdome Flex no blog do
HPE Superdome Flex: Recursos exclusivos do RAS e
folha de dados do
HPE Superdome Flex: Arquitetura do servidor e recursos do RAS . Também foi publicada uma
atualização recente do
HPE Superdome Flex anunciada no HPE Discover.
Neste artigo, você pode aprender como o HPE Superdome Flex é usado para resolver problemas de cosmologia, bem como como a plataforma está preparada para a computação orientada a memória, uma nova arquitetura de computação baseada em memória.
Você também pode se familiarizar com a plataforma em mais detalhes em
uma entrada de webinar .