https://repositorio.ufjf.br/jspui/handle/ufjf/10019
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
alexandretavaresdeoliveira.pdf | 1.19 MB | Adobe PDF | Visualizar/Abrir |
Tipo: | Dissertação |
Título: | Uma plataforma de rede definida por software para ambientes de computação paralela e distribuída |
Autor(es): | Oliveira, Alexandre Tavares de |
Primeiro Orientador: | Vieira, Alex Borges |
Co-orientador: | Gomes, Antônio Tadeu Azevedo |
Co-orientador: | Ziviani, Artur |
Membro da banca: | Correia, Luiz Henrique Andrade |
Membro da banca: | Dantas, Mario Antonio Ribeiro |
Resumo: | O crescimento no volume e na diversidade dos dados causado pelo fenômeno Big Data tem revolucionado os negócios e a ciência, ao mesmo tempo que requer capacidade cada vez maior dos recursos computacionais. As plataformas de computação de alto desempenho (HPC), tradicionalmente empregadas em simulações numéricas massivamente paralelas, oferecem capacidade computacional que pode ser aproveitada na análise de Big Data. No entanto, a confluência de Big Data e HPC, embora pareça ser natural, deve ser examinada sob diversos aspectos, o que envolve a adequação de vários de seus elementos. Em particular, a infraestrutura de rede precisa ser eficiente e flexível para ajustar-se às demandas bem distintas das aplicações típicas desses ambientes de computação paralela e distribuída. O paradigma de rede definida por software (SDN) pode favorecer essa integração, graças à sua visão global e seu maior nível de programabilidade, que simplificam a gerência da rede e a tornam mais adaptável e efetiva. Nesse contexto, este trabalho apresenta uma plataforma SDN capaz de suprir os requisitos de desempenho de rede de aplicações Big Data e HPC. A plataforma busca otimizar a comunicação dos dados, identificando o tráfego de rede por meio de uma API e aplicando dinamicamente mecanismos de roteamento mais adequados a cada perfil de tráfego. Essa abordagem evidencia um modelo de rede ciente da aplicação que permite a diminuição no tempo de execução de aplicações. Avaliações mediante simulações em cenários específicos demonstram a viabilidade e a aplicabilidade da plataforma, ao reduzir o tempo médio de execução de aplicações reais MPI em cerca de 11%, e Hadoop em torno de 6%. |
Abstract: | The growth in the volume and diversity of data caused by the Big Data phenomenon has revolutionized business and science, at the same time as it demands ever-increasing computational resources. High-performance computing (HPC) platforms tailored to massively parallel numerical simulations offer computational capacity that can be leveraged by Big Data Analytics solutions. Nevertheless, the confluence of Big Data and HPC, although it appears to be natural, should be examined in several aspects, which involves the suitability of several of its elements. In particular, the network infrastructure needs to be efficient and flexible to fit the very distinct demands of typical applications of such parallel and distributed computing environments. The software-defined network paradigm (SDN) may favor this integration, thanks to its global view and its higher level of programmability, which simplify network management and make it more adaptive and effective. In this context, this work presents an SDN platform capable of supplying the network performance requirements of Big Data and HPC applications. The platform seeks to optimize data communication by identifying network traffic through an API and dynamically applying the most appropriate routing mechanisms to each traffic profile. This approach evidences an application-aware network model that allows the decrease in the execution time of applications. Evaluations through simulations in specific scenarios demonstrate the feasibility and applicability of the platform, by reducing the average execution time of MPI applications by about 11%, and of Hadoop applications by around 6%. |
Palavras-chave: | Redes definidas por software Computação paralela Computação distribuída Software-defined network Parallel computing Distributed computing |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal de Juiz de Fora (UFJF) |
Sigla da Instituição: | UFJF |
Departamento: | ICE – Instituto de Ciências Exatas |
Programa: | Programa de Pós-graduação em Ciência da Computação |
Tipo de Acesso: | Acesso Aberto |
URI: | https://repositorio.ufjf.br/jspui/handle/ufjf/10019 |
Data do documento: | 26-Fev-2019 |
Aparece nas coleções: | Mestrado em Ciência da Computação (Dissertações) |
Os itens no repositório estão protegidos por licenças Creative Commons, com todos os direitos reservados, salvo quando é indicado o contrário.