Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/11422/13552
Type: | Dissertação |
Title: | Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada |
Other Titles: | Discovering user traffic profiles: an unsupervised approach |
Author(s)/Inventor(s): | Streit, Ananda Görck |
Advisor: | Leão, Rosa Maria Meri |
Abstract: | As redes domésticas estão cada vez mais complexas. Portanto, é essencial a elaboração de estratégias inovadoras para caracterizar essa nova demanda. Em particular, entender as características do tráfego gerado pelos usuários é de suma importância para o planejamento da rede. Trabalhos anteriores focam principalmente na Inspeção Profunda de Pacotes (DPI) e/ou consideram padrões predeterminados para classificar os fluxos de tráfego e determinar a aplicação sendo utilizada pelos usuários. Neste trabalho utilizam-se técnicas não supervisionadas de aprendizado de máquina com o objetivo de entender o per l de tráfego dos usuários. Em parceria com um Provedor de Serviço Internet (ISP), foram coletados dados do tráfego de download e upload de mais de 2.000 roteadores domésticos. Em seguida, é aplicada uma técnica de decomposição de tensores (PARAFAC) para extrair fatores relevantes de uso da rede. Mostra-se como os resultados do PARAFAC e de um algoritmo de clusterização hierárquica simplificam a tarefa de agrupamento de séries temporais com padrões de tráfego diário similares. Também se mostra como novos usuários podem ser classificados a partir da árvore de decisão obtida com a clusterização. Para caracterizar o comportamento dos usuários em períodos maiores que um dia, utiliza-se a informação dos clusters e de um Modelo de Markov Oculto (HMM). Resultados do modelo indicam que os usuários tendem a manter um padrão específico ao longo do tempo, facilitando tarefas de planejamento e gerenciamento da rede. |
Abstract: | The increasing complexity of home networks calls for novel strategies towards e cient network management and workload characterization. In particular, understanding the characteristics of the tra c generated by users is of paramount importance for network planning. Previous work focuses primarily on Deep Packet Inspection (DPI) and/or considers pre-determined patterns to classify tra c ows and detect the application being accessed by users. In this work we use unsupervised machine learning techniques with the objective of discovering users’ tra c pro les. In partnership with an Internet Service Provider (ISP) we collected the download and upload tra c of more than 2,000 home routers of the ISP clients. We then use a tensor decomposition technique (PARAFAC) to extract relevant features from our network traces. We show how the results of PARAFAC and a hierarchical clustering algorithm simplify the task of grouping time series with similar daily tra c patterns. We also show how new users can be classi ed from the decision tree obtained with clustering. To characterize users’ behavior over periods longer than a day, we use the information of the clusters and a Hidden Markov Model (HMM). The results indicate that users tend to maintain a speci c pattern over time, facilitating network planning and management tasks. |
Keywords: | Redes de acesso residencial Perfis de tráfego Aprendizado de máquina |
Subject CNPq: | CNPQ::ENGENHARIAS |
Program: | Programa de Pós-Graduação em Engenharia de Sistemas e Computação |
Production unit: | Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia |
Publisher: | Universidade Federal do Rio de Janeiro |
Issue Date: | Feb-2019 |
Publisher country: | Brasil |
Language: | por |
Right access: | Acesso Aberto |
Appears in Collections: | Engenharia de Sistemas e Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
AnandaGorckStreit.pdf | 2.48 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.