Gerenciar seu Cluster e agendar trabalhos em seu Cluster de GPU pode ser simples e intuitivo com soluções líderes de mercado agora com suporte a GPU NVIDIA.

Bright Cluster Manager

Uma solução totalmente integrada e única para implantação, teste, provisão, monitoramento e gerenciamento de clusters de GPU. Com o Bright Cluster Manager, um administrador de cluster pode facilmente instalar e gerenciar vários clusters simultaneamente.

Ganglia

Um sistema de monitoramento distribuído, escalável e de código aberto para sistemas de computação de alto desempenho, tais como clusters e Grids. É cuidadosamente projetado para atingir custos gerais por nó muito baixos e alta concorrência. Gânglios está atualmente em uso em milhares de clusters ao redor do mundo e pode ser dimensionado para lidar com clusters com vários milhares de nós.

NVIDIA DCGM

Um conjunto de ferramentas para gerenciamento e monitoramento Tesla™ GPUs em ambientes de cluster.

IBM Spectrum LSF

Uma poderosa plataforma de gerenciamento de carga de trabalho para ambientes HPC exigentes e distribuídos. Ela fornece um conjunto abrangente de recursos de programação inteligentes e orientados por políticas que permitem utilizar todos os recursos de sua infra-estrutura computacional e garantir um ótimo desempenho da aplicação.

Altair PBS Professional

O gerenciador de carga de trabalho e agendador de tarefas Altair® PBS Professional® líder da indústria para HPC e computação de alta produtividade foi projetado para melhorar a produtividade, otimizar a utilização e a eficiência e simplificar a administração de clusters, nuvens e supercomputadores. PBS Professional automatiza a programação de trabalhos, gerenciamento, monitoramento e relatórios, e é a solução confiável para sistemas complexos Top500, bem como para clusters menores.

Altair Grid Engine

Altair® Grid Engine® é um sistema de gerenciamento de recursos distribuídos líder para otimizar cargas de trabalho e recursos em milhares de centros de dados, melhorando o desempenho e aumentando a produtividade e eficiência. Ele ajuda as organizações a melhorar o ROI e fornecer melhores resultados mais rapidamente, otimizando o rendimento e o desempenho de aplicações, contêineres e serviços, enquanto maximiza os recursos computacionais compartilhados entre as infraestruturas locais, híbridas e em nuvem.

Moab HPC Suite

Moab® HPC Suite é uma plataforma de orquestração de carga de trabalho e recursos que automatiza decisões complexas e otimizadas de programação de carga de trabalho e ações de gerenciamento com políticas multidimensionais que imitam a tomada de decisões do mundo real. Estas políticas equilibram a maximização do trabalho e a utilização com o cumprimento de SLAs e prioridades. Com um histórico comprovado de gerenciamento dos sistemas mais avançados, diversos e intensivos em dados do mundo, o Moab HPC Suite continua a ser a solução preferida de gerenciamento de carga de trabalho para instalações de HPC de próxima geração.

SLURM

Slurm é um gerente de carga de trabalho de código aberto projetado especificamente para satisfazer as necessidades exigentes da computação de alto desempenho. Slurm está em uso difundido em laboratórios governamentais, universidades e empresas em todo o mundo. A partir da lista dos 500 melhores computadores de novembro de 2014, a Slurm estava realizando o gerenciamento de carga de trabalho em seis dos dez computadores mais potentes do mundo, incluindo o gigante da GPU Piz Daint, utilizando mais de 5.000 GPUs NVIDIA.

runai logo

Run:AI

Run:A Plataforma de Gerenciamento de Computação da AI automatiza a orquestração, programação e gerenciamento de recursos de GPU para cargas de trabalho de AI. A plataforma baseada em Kubernetes dá aos cientistas de dados acesso a todo o poder de computação compartilhado que eles precisam para acelerar a IA - no local ou na nuvem. As equipes de TI e MLOps ganham visibilidade e controle sobre a programação e o provisionamento dinâmico das GPUs, realizando mais de 2X ganhos na utilização da infra-estrutura existente.

Procurando ajuda com seu GPU Cluster?
Entre em contato com especialistas da indústria e engenheiros da NVIDIA nos  fóruns CUDA Developer