Cluster Management (PT-BR)
Gerenciar seu Cluster e agendar trabalhos em seu Cluster de GPU pode ser simples e intuitivo com soluções líderes de mercado agora com suporte a GPU NVIDIA.
![](https://cdn.statically.io/img/d29g4g2dyqv443.cloudfront.net/sites/default/files/akamai/cuda/images/bright-cluster-manager-standard-rs2.jpg)
Bright Cluster Manager
Uma solução totalmente integrada e única para implantação, teste, provisão, monitoramento e gerenciamento de clusters de GPU. Com o Bright Cluster Manager, um administrador de cluster pode facilmente instalar e gerenciar vários clusters simultaneamente.
![](https://cdn.statically.io/img/d29g4g2dyqv443.cloudfront.net/sites/default/files/akamai/cuda/images/Ganglia-logo-small-rs.jpg)
Ganglia
Um sistema de monitoramento distribuído, escalável e de código aberto para sistemas de computação de alto desempenho, tais como clusters e Grids. É cuidadosamente projetado para atingir custos gerais por nó muito baixos e alta concorrência. Gânglios está atualmente em uso em milhares de clusters ao redor do mundo e pode ser dimensionado para lidar com clusters com vários milhares de nós.
NVIDIA DCGM
Um conjunto de ferramentas para gerenciamento e monitoramento Tesla™ GPUs em ambientes de cluster.
![](https://cdn.statically.io/img/d29g4g2dyqv443.cloudfront.net/sites/default/files/akamai/cuda/images/product_logos/SpectrumLSF_1000x1000x300_white.png)
IBM Spectrum LSF
Uma poderosa plataforma de gerenciamento de carga de trabalho para ambientes HPC exigentes e distribuídos. Ela fornece um conjunto abrangente de recursos de programação inteligentes e orientados por políticas que permitem utilizar todos os recursos de sua infra-estrutura computacional e garantir um ótimo desempenho da aplicação.
![](https://cdn.statically.io/img/d29g4g2dyqv443.cloudfront.net/sites/default/files/akamai/cuda/images/product_logos/Altair_PBSWorks_RGB_horizontal-220b.jpg)
Altair PBS Professional
O gerenciador de carga de trabalho e agendador de tarefas Altair® PBS Professional® líder da indústria para HPC e computação de alta produtividade foi projetado para melhorar a produtividade, otimizar a utilização e a eficiência e simplificar a administração de clusters, nuvens e supercomputadores. PBS Professional automatiza a programação de trabalhos, gerenciamento, monitoramento e relatórios, e é a solução confiável para sistemas complexos Top500, bem como para clusters menores.
![](https://cdn.statically.io/img/d29g4g2dyqv443.cloudfront.net/sites/default/files/akamai/cuda/images/product_logos/Altair_PBSWorks_RGB_horizontal-220b.jpg)
Altair Grid Engine
Altair® Grid Engine® é um sistema de gerenciamento de recursos distribuídos líder para otimizar cargas de trabalho e recursos em milhares de centros de dados, melhorando o desempenho e aumentando a produtividade e eficiência. Ele ajuda as organizações a melhorar o ROI e fornecer melhores resultados mais rapidamente, otimizando o rendimento e o desempenho de aplicações, contêineres e serviços, enquanto maximiza os recursos computacionais compartilhados entre as infraestruturas locais, híbridas e em nuvem.
![](https://cdn.statically.io/img/d29g4g2dyqv443.cloudfront.net/sites/default/files/akamai/cuda/images/adaptive_logo_horiz_2C_440.jpg)
Moab HPC Suite
Moab® HPC Suite é uma plataforma de orquestração de carga de trabalho e recursos que automatiza decisões complexas e otimizadas de programação de carga de trabalho e ações de gerenciamento com políticas multidimensionais que imitam a tomada de decisões do mundo real. Estas políticas equilibram a maximização do trabalho e a utilização com o cumprimento de SLAs e prioridades. Com um histórico comprovado de gerenciamento dos sistemas mais avançados, diversos e intensivos em dados do mundo, o Moab HPC Suite continua a ser a solução preferida de gerenciamento de carga de trabalho para instalações de HPC de próxima geração.
![](https://cdn.statically.io/img/d29g4g2dyqv443.cloudfront.net/sites/default/files/akamai/cuda/images/product_logos/slurm-logo-340.jpg)
SLURM
Slurm é um gerente de carga de trabalho de código aberto projetado especificamente para satisfazer as necessidades exigentes da computação de alto desempenho. Slurm está em uso difundido em laboratórios governamentais, universidades e empresas em todo o mundo. A partir da lista dos 500 melhores computadores de novembro de 2014, a Slurm estava realizando o gerenciamento de carga de trabalho em seis dos dez computadores mais potentes do mundo, incluindo o gigante da GPU Piz Daint, utilizando mais de 5.000 GPUs NVIDIA.
![runai logo](https://cdn.statically.io/img/d29g4g2dyqv443.cloudfront.net/sites/default/files/akamai/runai-logo-transparent.png)
Run:AI
Run:A Plataforma de Gerenciamento de Computação da AI automatiza a orquestração, programação e gerenciamento de recursos de GPU para cargas de trabalho de AI. A plataforma baseada em Kubernetes dá aos cientistas de dados acesso a todo o poder de computação compartilhado que eles precisam para acelerar a IA - no local ou na nuvem. As equipes de TI e MLOps ganham visibilidade e controle sobre a programação e o provisionamento dinâmico das GPUs, realizando mais de 2X ganhos na utilização da infra-estrutura existente.
Procurando ajuda com seu GPU Cluster?
Entre em contato com especialistas da indústria e engenheiros da NVIDIA nos fóruns CUDA Developer