Please use this identifier to cite or link to this item: http://hdl.handle.net/11422/13552
Type: Dissertação
Title: Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada
Other Titles: Discovering user traffic profiles: an unsupervised approach
Author(s)/Inventor(s): Streit, Ananda Görck
Advisor: Leão, Rosa Maria Meri
Abstract: As redes domésticas estão cada vez mais complexas. Portanto, é essencial a elaboração de estratégias inovadoras para caracterizar essa nova demanda. Em particular, entender as características do tráfego gerado pelos usuários é de suma importância para o planejamento da rede. Trabalhos anteriores focam principalmente na Inspeção Profunda de Pacotes (DPI) e/ou consideram padrões predeterminados para classificar os fluxos de tráfego e determinar a aplicação sendo utilizada pelos usuários. Neste trabalho utilizam-se técnicas não supervisionadas de aprendizado de máquina com o objetivo de entender o per l de tráfego dos usuários. Em parceria com um Provedor de Serviço Internet (ISP), foram coletados dados do tráfego de download e upload de mais de 2.000 roteadores domésticos. Em seguida, é aplicada uma técnica de decomposição de tensores (PARAFAC) para extrair fatores relevantes de uso da rede. Mostra-se como os resultados do PARAFAC e de um algoritmo de clusterização hierárquica simplificam a tarefa de agrupamento de séries temporais com padrões de tráfego diário similares. Também se mostra como novos usuários podem ser classificados a partir da árvore de decisão obtida com a clusterização. Para caracterizar o comportamento dos usuários em períodos maiores que um dia, utiliza-se a informação dos clusters e de um Modelo de Markov Oculto (HMM). Resultados do modelo indicam que os usuários tendem a manter um padrão específico ao longo do tempo, facilitando tarefas de planejamento e gerenciamento da rede.
Abstract: The increasing complexity of home networks calls for novel strategies towards e cient network management and workload characterization. In particular, understanding the characteristics of the tra c generated by users is of paramount importance for network planning. Previous work focuses primarily on Deep Packet Inspection (DPI) and/or considers pre-determined patterns to classify tra c ows and detect the application being accessed by users. In this work we use unsupervised machine learning techniques with the objective of discovering users’ tra c pro les. In partnership with an Internet Service Provider (ISP) we collected the download and upload tra c of more than 2,000 home routers of the ISP clients. We then use a tensor decomposition technique (PARAFAC) to extract relevant features from our network traces. We show how the results of PARAFAC and a hierarchical clustering algorithm simplify the task of grouping time series with similar daily tra c patterns. We also show how new users can be classi ed from the decision tree obtained with clustering. To characterize users’ behavior over periods longer than a day, we use the information of the clusters and a Hidden Markov Model (HMM). The results indicate that users tend to maintain a speci c pattern over time, facilitating network planning and management tasks.
Keywords: Redes de acesso residencial
Perfis de tráfego
Aprendizado de máquina
Subject CNPq: CNPQ::ENGENHARIAS
Program: Programa de Pós-Graduação em Engenharia de Sistemas e Computação
Production unit: Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Publisher: Universidade Federal do Rio de Janeiro
Issue Date: Feb-2019
Publisher country: Brasil
Language: por
Right access: Acesso Aberto
Appears in Collections:Engenharia de Sistemas e Computação

Files in This Item:
File Description SizeFormat 
AnandaGorckStreit.pdf2.48 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.