O que torna o novo UCS C480 ML M5 interessante - servidor de aprendizado de máquina da Cisco

Em março deste ano, a Cisco lançou o blade de servidor Cisco UCS B480 M5. Com base nesse sistema, implantamos um novo pool de recursos em São Petersburgo e estamos nos preparando para lançar um pool semelhante em Moscou. Porém, apenas seis meses depois (em setembro), a gigante de TI lançou outro novo produto - o UCS C480 ML M5, "aprimorado" por trabalhar com sistemas de inteligência artificial. Contamos o que está dentro e por que tudo isso é feito para os data centers.


/ Wikimedia / Tibigc / CC

O que há dentro


Um novo desenvolvimento da empresa é uma versão modificada do servidor C480 M5 . Para acelerar o processamento dos algoritmos de aprendizado de máquina, dois slots para a CPU nesse servidor foram substituídos por slots para a GPU. Os aceleradores gráficos Tesla V100-32G da NVIDIA foram colocados nesses slots.

O número total de cartões chega a oito. O desempenho de cada um dos aceleradores é 47 vezes maior que o desempenho dos processadores tradicionais para tarefas de aprendizado profundo. Os dados são trocados através da interface NVLink integrada - são 200 GB / s por GPU.

O C480 ML M5 também possui dois processadores Intel Xeon, cada um com suporte para até 28 núcleos e 3 TB de RAM. Ao mesmo tempo, até 24 HDD ou SSD podem ser conectados ao servidor via interfaces SAS ou SATA.

Por que preciso de um novo servidor


Segundo a Cisco, o servidor deve simplificar o trabalho com modelos de aprendizado de máquina em todas as etapas de seu desenvolvimento: da coleta e análise de dados à saída dos resultados do processamento. Ao mesmo tempo, é adequado para trabalhar com aplicativos em pipeline em ambientes com várias nuvens. Essas são as estruturas Hadoop e Spark, bem como TensorFlow e PyTorch. Além disso, a Cisco está negociando uma parceria com a plataforma Anaconda e também está trabalhando com Kubeflow em colaboração com o Google.

"O novo ML M5 simplificará o trabalho com sistemas de inteligência artificial para provedores de nuvem e empresas que possuem data centers", comentou Sergey Belkin, chefe de desenvolvimento da 1cloud . - As tecnologias de aprendizado de máquina podem ser usadas para avaliar todos os processos que ocorrem no data center. Esses aplicativos já existem no ecossistema da Cisco. Por exemplo, o Tetration Analytics coleta dados de telemetria de sensores de software e hardware e os processa usando métodos MO. ”

A Cisco sugere que, até 2019, 70% dos ataques de hackers usarão criptografia de tráfego, portanto, na opinião deles, os recursos adicionais do novo servidor também desempenharão um papel importante na proteção da infraestrutura de TI dos data centers. Para esse fim, a gigante de TI também tem sua própria solução: Análise de Tráfego Criptografado. O sistema identifica vulnerabilidades na infraestrutura e detecta padrões maliciosos mesmo no tráfego criptografado.


/ Wikimedia / Ponto de acesso global / PD

Observe que o lançamento do C480 ML M5 afetará o trabalho de organizações que processam grandes quantidades de dados - por exemplo, médicos e financeiros. Será mais fácil para analistas e desenvolvedores nessas organizações extrair informações úteis do Big Data. O novo servidor Cisco acelerará o processo de processamento de grandes conjuntos de informações e localização de padrões (por exemplo, ao analisar imagens médicas).

Segundo a Cisco, 80% das empresas globais já implementaram serviços baseados em tecnologias de inteligência artificial ou implementarão essas soluções até 2020. E até 2035, as tecnologias MO ajudarão a aumentar a produtividade das organizações em 40%.

Perspectivas e planos para o futuro


O diretor de pesquisa da Gartner, Chirag Dekate, acredita que o C480 ML M5 será procurado por clientes novos e antigos. Ao mesmo tempo, Scott Mohr, diretor de relações com parceiros, disse que a Cisco continuará melhorando suas soluções de serviços de rede neural, e a experiência do cliente desempenhará um papel importante nesse processo. Portanto, agora o novo produto está sendo testado por cinquenta parceiros da Cisco.

Posteriormente, o sistema será disponibilizado a todos os parceiros certificados da empresa. Apesar dos testes em andamento, ainda não é possível dizer nada sobre a eficácia do novo servidor. Os especialistas da Cisco (ao contrário da mesma NetApp) decidiram não fornecer os resultados dos testes de desempenho da Resnet ou Alexnet, porque, segundo eles, eles não refletem o estado das coisas ao trabalhar em projetos reais de aprendizado de máquina.

O pedido C480 ML M5 estará disponível no final deste ano.

Some 1cloud Corporate Blog Conteúdo relacionado

Source: https://habr.com/ru/post/pt424849/


All Articles