Uma estrutura para execução de redes neurais evolutivas na GPU

Mandoju, Jorge Rama Krsna

Pantheon Repositório Institucional da UFRJ

Coleta, preserva e divulga a produção acadêmica digital em todas as áreas do conhecimento.
São os ativos do repositório, além de teses e dissertações da UFRJ, artigos científicos, livros eletrônicos, capítulos de livros e trabalhos apresentados em eventos por professores, pesquisadores, funcionários administrativos e alunos de mestrado e doutorado.

Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11422/14045

Tipo:	Dissertação
Título:	Uma estrutura para execução de redes neurais evolutivas na GPU
Título(s) alternativo(s):	A structure for evolutionary neural networks in GPU
Autor(es)/Inventor(es):	Mandoju, Jorge Rama Krsna
Orientador:	Silva, Geraldo Zimbrão da
Resumo:	[PT] Em neuroevolução, redes neurais são treinadas utilizando algoritmos evolutivos ao invés de utilizar o método do gradiente descendente. Uma das vantagens em relação ao método do gradiente descendente, é que torna possível além de definir o valor dos pesos de uma rede neural, também sua estrutura. Na otimização de redes neurais evolutivas com mesmo peso, são avaliadas todas as redes neurais de uma população para verificar qual é o valor da função fitness que cada rede neural irá possuir e com este valor, verificar quais são as redes neurais que irão passar para a próxima geração. O GPU (Graphic Processor Unit) é bastante utilizado nos treinos de redes neurais, devido a sua alta capacidade de paralelismo [1]. Porém, devido a sua arquitetura ser diferente de um processador comum, alguns algoritmos precisam ser executados de maneira diferente para aproveitar o aumento de desempenho que a arquitetura pode oferecer. Neste trabalho é criada uma arquitetura que seja capaz de diminuir o tempo de treino das redes neurais evolutivas através da junção dos pesos de toda população por camada fazendo com que cada camada represente os pesos de toda população. Desta forma é possível vetorizar as funções de avaliação de redes neurais. No treino para classificar o dataset MNIST, esta estrutura conseguiu obter um ganho de desempenho de até 64% nas redes neurais MLP e um speedup de 20 no cálculo do fitness.
Resumo:	[EN] In neuroevolution, neural networks are trained using evolutionary algorithms instead of the gradient descent method. One of the advantages over the gradient descent method is that it makes it possible not only to define the value of the weights of a neural network, but also its structure. In the optimization of evolutionary neural networks with the same weight, all neural networks of a population are evaluated to verify what is the value of the fitness function that each neural network will possess and with this value, to verify which are the neural networks that will move on to the next generation. The GPU (Graphic Processor Unit) is widely used in neural network training due to its high parallelism capability [1]. However, because their architecture is different from a common processor, some algorithms need to be executed differently to take advantage of the increased performance that the architecture can provide. In this work an architecture is created that is able to reduce the training time of evolutionary neural networks by joining the weights of all population by layer making each layer represent the weights of the entire population. In this way it is possible to vectorize the evaluation functions of neural networks. In training to classify the MNIST dataset, this structure has achieved a performance gain of up to 64% in neural networks MLP and a speedup of 20 in fitness calculation.
Palavras-chave:	Redes neurais evolutivas GPU CUDA
Assunto CNPq:	CNPQ::ENGENHARIAS
Programa:	Programa de Pós-Graduação em Engenharia de Sistemas e Computação
Unidade produtora:	Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Editora:	Universidade Federal do Rio de Janeiro
Data de publicação:	Ago-2019
País de publicação:	Brasil
Idioma da publicação:	por
Tipo de acesso:	Acesso Aberto
Aparece nas coleções:	Engenharia de Sistemas e Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
JorgeRamaKrsnaMandoju.pdf		3.44 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas