|
A Sun traz a HPC pronta para produção para a empresa tradicional
A High Performance Computing (HPC) (Computação de Alto Desempenho) tem sido há muito tempo vital para o sucesso das instituições de educação e pesquisa, mas conforme a necessidade de computação complexa aumenta através de uma gama de indústrias, mais e mais organizações estão considerando a HPC como uma ferramenta essencial. Por exemplo:
- Os técnicos nas empresas de fabricação que necessitam executar simulações computacionalmente complexas sobre um novo design
- Os analistas financeiros que desejam executar mais e mais rapidamente análises de risco “em tempo real” para otimizar os lucros
- Os geofísicos tentando identificar campos produtivos de petróleo e gás, e determinar a maneira para extrair com recursos com melhor custo-benefício
- Os cientistas de ciências da vida que necessitam de seqüências de DNA ou descoberta de drogas mais rápidas e mais eficientes em termos de custos
Como você sabe se está pronto para HPC num ambiente de produção? Como a Sun pode ajudá-lo chegar lá?
O Sun Inner Circle se reuniu com Bjorn Andersson, diretor de HPC e sistemas integrados na Sun, para aprender sobre como a Sun está tornando a HPC disponível para o datacenter de empresa e o anúncio recente do Sistema Constellation da Sun, a primeira arquitetura de peta-escala aberta do mundo na exposição International Supercomputing (ISC) (Supercomputação Internacional) na Alemanha no mês de junho.
INNER CIRCLE: O que a Sun quer dizer com HPC pronta para produção?
ANDERSSON: A HPC pronta para produção é um meio para fornecer aos nossos clientes as capacidades de supercomputação que os pesquisadores acadêmicos e cientistas tradicionalmente têm usufruído — reduzindo, ao mesmo tempo, as dores de cabeça e os custos da execução desses sistemas complexos. Isto significa proporcionar a disponibilidade, a confiabilidade e a segurança que os clientes Sun esperam – numa arquitetura de HPC.
O objetivo é tornar a HPC mais simples, mais rentável e mais facilmente implementável pelas empresas através de um gama de indústrias, com uma arquitetura que pode ser estendida de simples racks a um supercomputador de grande escala com incríveis velocidades computacionais.
IC: De que a arquitetura consiste?
ANDERSSON: A nossa abordagem é visualizar o cluster todo como um sistema, significando que, por exemplo, os servidores individuais ou o software usado são componentes de um sistema maior. Os componentes chave da nossa arquitetura de HPC incluem servidores Sun x64 e armazenamento um novo comutador Sun InfiniBand, o Sistema operacional Solaris 10, e Sun Grid Engine para a gestão de carga de trabalho através de um cluster. Una isto com a nossa oferta de Sun HPC Services e capacite a fábrica para configurar e oferecer soluções prontas para execução, o que minimiza os custos e o tempo para preparar um ambiente de HPC e executar.
A Sun detêm o recorde de uma instalação de HPC de porte médio — em dois dias, a partir da chegada dos caminhões de entrega até o funcionamento de um cluster de 512 nós na produção — na Universidade do Estado de Mississipi.s
IC: Quanto tempo leva para preparar um sistema Sun de HPC para funcionar?
ANDERSSON: Para sistemas de HPC de ponta, o padrão da indústria é há vários meses, gradualmente até chegar ao modo de produção. No médio porte, normalmente são várias semanas para uma instalação completa. Mas a Sun constantemente supera essas médias e está entregando HPC pronta para produção em tempo recorde.
No high-end, a Sun instalou um cluster bem grande, servindo acima de 10.000 estudantes na Tokyo Tech, cerca de um ano atrás — o cluster estava pronto e funcionando em um mês. No médio porte, a Universidade do Estado de Mississipi é um grande exemplo onde a Sun detêm o recorde de uma instalação de HPC — em dois dias, a partir da chegada dos caminhões de entrega até o funcionamento de um cluster de 512 nós na produção.
IC: Quais são os indícios de que uma empresa está pronta para HPC? Esse tipo de computação não é na verdade ainda do domínio de educação e pesquisa?
ANDERSSON: Em última análise, as necessidades comerciais impulsionam a HPC. Modelar e resolver problemas mais e mais complexos é parte de fazer negócios para muitas organizações. Acho interessante que não são apenas os que pensamos ser os usuais interessados, indústria automobilística, energética e farmacêutica, que olham para a HPC atualmente. Os serviços financeiros e de seguros estão cada vez mais se voltando para a HPC para análises complexas de riscos e de portfólios de estoque. A indústria do entretenimento está olhando para a HPC para renderizar filmes animados. E para empresas de todas as áreas, a HPC proporciona uma plataforma escalável para otimizar os processos comerciais.
Uma vez estabelecida a necessidade de negócio, a empresa precisa examinar como a HPC responde aos itens da lista de verificação do datacenter, tais como custo, escalabilidade e a facilidade de gerenciamento — junto com os requisitos de energia e espaço.
Tradicionalmente, a barreira para começar a usar HPC tem sido razoavelmente alta. Mas com os novos sistemas de HPC baseados em padrões, as empresas numa variedade de indústrias têm a HPC ao seu alcance e podem começar agora. Pelo fato da HPC trazer produtos ao mercado mais rápido, ela ajuda as empresas irem à frente da competição. A HPC está se tornando rapidamente essencial aos seus processos comerciais, de design e de análises. A HPC é tão crucial para as suas operações quanto um robô soldador é para um fabricante de carros.
IC: Que tipos de capacidades de computação a Sun está oferecendo na HPC?
ANDERSSON: Isso depende da situação. Podemos fazer pequenas instalações e podemos estender os limites do que é fisicamente possível. Agora, o Texas Advanced Computing Center (TACC) na Universidade do Texas em Austin está implantando um cluster composto do novo Sistema Sun Constellation e componentes padrões da Sun para acima de 500 TeraFLOPs de capacidade — 500 trilhões de cálculos por segundo.
Um candidato mais provável para um datacenter comercial poderá ser um único rack ou dois dos servidores que o TACC está usando, ou um servidor Sun Fire X4600 M2 com um quarto de TB de memória num espaço 4U compacto. Ambos os tipos de implementação são baseados em componentes padrão e interfaces abertos que permitem graduar a partir de um rack pequeno inteiramente até o desempenho de supercomputador de peta-escala.
IC: Como este tipo de desempenho se encaixa com o que a maioria das empresas está procurando na HPC?
ANDERSSON: A escalabilidade é algo que os clientes Sun esperam — e eles podem esperar o mesmo da HPC. É importante entender que a HPC está se movendo além das suas raízes em educação e pesquisa. A maioria das empresas que investem nesses sistemas quer alto desempenho e confiabilidade a baixo custo, assim como sistemas que podem ser instalados rapidamente e assistidos como outros investimentos em TI. Felizmente, a Sun tem décadas de experiência nessas áreas.
IC: Existem vantagens quanto à energia e refrigeração em usar servidores Sun como a “coluna vertebral” de um sistema de HPC?
ANDERSSON: Os Sistemas x64 e blade Sun são extraordinariamente eficientes em termos de energia, com características de design que ajudam assegurar que não haja nenhuma queda de velocidade de conexão do CPU para satisfazer os envelopes de temperatura, assim os clientes Sun obtêm a eficiência de velocidade e energia. Além disso, os nossos servidores blade proporcionam novos níveis de eficiência de energia acima da maioria dos sistemas montados em rack. Para os ambientes de HPC, a Sun fornece uma configuração de 48 blade por rack — a qual, em conjunto com a gestão de carga de trabalho do Sun Grid Engine, pode aumentar a utilização até 98 por cento.
IC: De que outro modo a Sun reduz a complexidade de execução de ambientes de HPC dentro do datacenter tradicional?
ANDERSSON: O Sun Grid Engine 6.1 ajuda reduzir o tempo e a despesa da gestão de HPC distribuindo cargas de trabalho através de múltiplas máquinas e grades de HPC. Essencialmente, o Grid Engine equilibra o trabalho a ser feito com os recursos de computação disponíveis, de maneira que os projetos sejam executados rapidamente sem deixar as máquinas inativas ou sobrecarregá-las.
Quanto à configurabilidade, o Sun Grid Engine permite que os scripts sejam ligados e os comportamentos anulados conforme os desejos do usuário, graças ao seu gerente de recursos distribuídos (DRM). Esse DRM foi uma das razões para o TACC escolher o Sun Grid Engine para gerenciar a sua infra-estrutura de HPC. Além disso, a API para envio, monitoração e controle de trabalho é de linguagem agnóstica, o que permite aos desenvolvedores escrever aplicações que integram com uma grade de supercomputação e são portáteis entre outros DRM APIs.
IC: Como o Sun Grid Engine gerencia múltiplos clusters?
ANDERSSON: Pelo fato das organizações com freqüência acabarem exigindo mais capacidade de computação, faz pouco sentido adicionar a HPC ao datacenter se a capacidade de gestão se tornar cada vez mais difícil conforme o cluster escalar. O Grid Engine permite que todos os clusters sejam guiados por uma única política principal, que traça linhas virtuais entre as máquinas. Isso também pode ajudar a assegurar que a maioria dos projetos importantes continue obtendo prioridade conforme cresce a necessidade de HPC dentro de uma organização.
IC: Como o Sun Grid Engine se compara com os produtos concorrentes no mercado?
ANDERSSON: Isto é uma questão de suporte e custo. Não há nenhum outro software livre equivalente sendo implementado na produção, e a concorrência (proprietário) com menos recursos custa várias vezes mais que o Sun Grid Engine. O Grid Engine está licenciado para um grande número de CPUs, enquanto que a concorrência (proprietário) baseia a venda dos seus produtos por núcleo. Mais, alguns dos recursos no Grid Engine, essenciais para computação empresarial e de utilitário, não estão disponíveis nos produtos da concorrência. Esses recursos incluem tornar disponíveis as informações de contabilidade através de um banco de dados SQL e proporcionar uma visão geral das atividades de grade com consultas simples.
IC: Onde o Solaris OS se encaixa na arquitetura de HPC da Sun?
ANDERSSON: Hoje, nós entregamos muitos ambientes de HPC de educação e pesquisa usando Linux, mas o Solaris é simplesmente melhor para um ambiente de produção. Ele é concebido para gerenciar complexidade de nós e a latência, tal como num ambiente de supercomputação. Quando você precisa suportar blades com quatro processadores — e cada um desses processadores tem quatro núcleos — a complexidade de gerenciar todos os 16 núcleos aumenta.
Quando havia apenas dois CPUs com os quais se preocupar, havia uma chance de 50 por cento de a memória ser anexada ao CPU certo executando uma tarefa, o que normalmente resultava em bom desempenho. Mas, com múltiplos processadores e núcleos, todas as apostas estão fora. Com o seu recurso de otimização da colocação de memória, o Solaris assegura que o processador certo cuide do trabalho certo e isso aumenta a eficiência da HPC e diminui a latência.
IC: Como o Solaris se compara ao Linux em escalabilidade num ambiente de HPC?
ANDERSSON: O Solaris tem muitos anos de capacidade demonstrados para escalar em sistemas de multiprocessadores de mais alto nível, o que realmente compensa nesses sistemas de vários núcleos. Na HPC, é muito importante focar na relação da largura da banda e operações de ponto flutuante, para manter os processadores alimentados com dados e ter tão pouco overhead quanto possível. Por exemplo, com as suas capacidades de memória virtual, o Solaris também suporta até uma página de 1 GB de tamanho, enquanto que o Linux está limitado a uma página de 8000 bytes de tamanho. Isso habilita o Solaris para manipular mais eficientemente o total de dados que as aplicações de HPC esperam. Nas instalações tais como do TACC, o sistema operacional controla os gerenciadores da estrutura de comutadores InfiniBand, os nós de computação e o armazenamento. A arquitetura de HPC da Sun pode facilmente ser executada num Linux, mas todos os recursos avançados do Solaris 10 estão disponíveis sem custos na OpenSolaris.org.
IC: O armazenamento é um componente chave de qualquer cluster de supercomputação. Como a arquitetura HPC da Sun se compara nesta área?
ANDERSSON: Uma única opção para o armazenamento de HPC é o servidor de dados da Sun. O servidor Sun Fire X4500 com discos de 1TB pode fornecer quase a metade de um petabyte de armazenamento em único rack — e na instalação do TACC, esse servidor será usado para fornecer 1.7 petabytes de armazenamento. Esse total de armazenamento pode ser excedido, também. A Organização Européia para Pesquisa Nuclear está usando acima de 100 servidores Sun Fire X4500 para armazenar acima de 2.5 petabytes de dados. Muitas empresas estarão satisfeitas com um ou dois servidores, cada um com 24 a 48 TBs de dados num espaço de rack de 4U. Além disso, a Sun fornece uma storage solution completa a partir do armazenamento conectado de cluster de alto desempenho, para soluções de arquivo de dados empresariais e fitas seguras.
Devo acrescentar também que o Solaris desempenha um grande papel como o sistema operacional para armazenamento, porque nesses ambientes enormes, é demasiadamente difícil colocar um petabyte ou mais de dados em uma rede de área de armazenamento. Por exemplo, o TACC consegue colocar o armazenamento diretamente na rede InfiniBand usando o Solaris como a plataforma para executar esse servidor de armazenamento.
IC: Como a Sun prevê a escalabilidade da sua arquitetura de HPC na tecnologia de ponta?
ANDERSSON: Agora, alguns dos maiores supercomputadores, conforme a lista Top 500, são construídos com muitos processadores lentos, memória pequena por nó e interconexões proprietárias. Compare isso com o Sun Constellation System (Sistema Constellation da Sun), no qual estamos usando os processadores industriais mais rápidos disponíveis e tem um total de memória por nó líder da indústria. Além disso, usamos banda larga de padrão industrial e interconexões de baixa latência.
Isso nos permite tirar proveito total dos investimentos da indústria e dominar a curva de custos dos componentes de commodity e isso proporciona escolha para os nossos clientes. Estamos trazendo inovação a nível de sistema ao mercado com o Sun Constellation System. Inovações que têm o cluster completo como o ponto de design e estão focados na verdadeira escala, de dentro de um único rack em um TeraFLOP ou abaixo, até bem acima de um PetaFLOP, um fator de escala maior que 1000x dentro da mesma arquitetura compatível.
IC: Porque uma empresa deveria estar interessada em HPC de peta-escala?
ANDERSSON: A computação de peta-escala está na margem das necessidades da maioria das empresas, mas em alguns anos, será quase inevitavelmente comum. A necessidade de modelar e resolver problemas mais complexos é parte de fazer negócios para muitas organizações e estou sendo pressionado para ver este ímpeto diminuir. Mas, a pressão competitiva entre as empresas irá é acelerar essa tendência. Eu acredito que um caminho escalável para mais capacidade de computação é algo que será crucial para muitas empresas no futuro.
|