https://repositorio.ufjf.br/jspui/handle/ufjf/19385
File | Description | Size | Format | |
---|---|---|---|---|
leonardoazalimdeoliveira.pdf | PDF/A | 5.22 MB | Adobe PDF | View/Open |
Type: | Dissertação |
Title: | User equipment traffic classification in the 5G core |
Author: | Oliveira, Leonardo Azalim de |
First Advisor: | Silva, Edelberto Franco |
Co-Advisor: | Chaves, Luciano Jerez |
Referee Member: | Vieira, Alex Borges |
Referee Member: | Lima, Michele Nogueira |
Referee Member: | Mattos, Diogo Menezes Ferrazani |
Resumo: | A quinta geração de redes celulares (5G), que é especificada pelo 3 rd Generation Partnership Program (3GPP), se distingue das gerações anteriores de redes móveis principalmente pela adoção de uma arquitetura baseada em serviços (do inglês, Service Based Architecture (SBA)). Ao aproveitar da flexibilidade desse novo paradigma arquitetural, este trabalho investiga a viabilidade da implementação de um mecanismo de Network Data Analytics Function (NWDAF) para a classificação de dispositivos 5G. Consoante com a normatização do 3GPP, o International Telecommunication Union (ITU) define três eixos de serviço 5G: Enhanced Mobile Broadband (eMBB), Ultra Reliable and Low Latency Communications (URLLC) e Massive Machine-Type Communications (mMTC). Esses eixos concentram principalmente aplicações que necessitam de altas taxas de vazão, baixa latência com alta disponibilidade e transmissões de baixo gasto energético com milhares de dispositivos de Internet of Things (IoT) conectados, respectivamente. Então, a classificação de diferentes tipos de dispositivos é crucial, uma vez que cada eixo do 5G está associado a restrições distintas, que influenciam a alocação de recursos no Núcleo 5G (do inglês, 5G Core (5GC)). Definido pelo 3GPP na Release 15 como responsável pela análise de dados em redes 5G, o NWDAF permanece subexplorado na literatura. Então, para explorar essa lacuna, este trabalho utiliza um ambiente 5G simulado que emprega Software Livre (SL). Este ambiente engloba o UERANSIM, que é um simulador de Radio Access Network (RAN) e User Equipment (UE); o free5GC, que é uma implementação de 5GC; e um gerador de tráfego de rede customizável. Dois conjuntos de dados 5G reais, foram utilizados para treinar onze diferentes modelos de Machine Learning (ML) — Linear Regression (LR), Histogram-based Gradient Boosting (HGB), Light Gradient Boosting Machine (LGBM), Multilayer Perceptron (MLP), Random Forest (RF), Linear Support Vector Classification (SVC), eXtreme Gradient Boosting (XGB), Decision Tree (DT), AdaBoost, Stacking, e Voting — com o objetivo de classificar os UEs nos eixos a partir do tráfego de rede observado. No pipeline de ML implementado, os modelos alcançaram até 99.91% de F1-score para a classe eMBB ao utilizar RF, LGBM e XGB. Para a classe URLLC, os melhores resultados foram de 99.99% de F1-score com o SVC. Em contraste, devido à natureza esparsa dos dados da classe mMTC, enquanto o AdaBoost alcançou 99.99% de F1-score no cenário de burst, a performance ficou limitada em 2.74% no cenário probabilístico. Mesmo após empregar técnicas que incluíram o balanceamento dos dados de treinamento, os modelos sofreram de overfitting. Inspirado pelo movimento de ciência aberta, tanto o software utilizado quanto o conjunto de dados criado para a inferência estão acessíveis publicamente. Essa abordagem garante a reprodutibilidade e estabelece bases para investigações futuras sobre análise de dados conforme especificado pelo 3GPP. |
Abstract: | The fifth generation of cellular network (5G), specified by the 3 rd Generation Partnership Program (3GPP), distinguishes itself from previous mobile network generations primarily through the adoption of a Service Based Architecture (SBA). By leveraging the flexibility of this new architectural paradigm, this work investigates the feasibility of implementing a Network Data Analytics Function (NWDAF) mechanism for classifying 5G devices. Following the 3GPP specifications, the International Telecommunication Union (ITU) defines three 5G service axes: Enhanced Mobile Broadband (eMBB), Ultra Reliable and Low Latency Communications (URLLC), and Massive Machine-Type Communications (mMTC). These axes focus on applications that require high throughput, low latency with high availability, and low-energy transmissions with thousands of connected Internet of Things (IoT) devices, respectively. Therefore, the classification of different device types is crucial, as each 5G axis is associated with distinct constraints, which influence resource allocation in the 5G Core (5GC). Defined by the 3GPP in Release 15 as responsible for data analysis in 5G networks, the NWDAF remains considerably underexplored in existing literature. To address this gap, this work employs a simulated 5G environment utilizing Free/Libre and Open Source Software (FLOSS). This environment incorporates UERANSIM, a Radio Access Network (RAN) and User Equipment (UE) simulator; free5GC, a 5GC implementation; and a custom network traffic generator. Two real-world 5G datasets were used to train eleven different Machine Learning (ML) models — Linear Regression (LR), Histogram-based Gradient Boosting (HGB), Light Gradient Boosting Machine (LGBM), Multilayer Perceptron (MLP), Random Forest (RF), Linear Support Vector Classification (SVC), eXtreme Gradient Boosting (XGB), Decision Tree (DT), Adaboost, Stacking, and Voting — to classify UEs in the axes based on their observed network traffic. In the implemented ML pipeline the model inference performance results achieved up to 99.91% F1-score for the eMBB class using RF, LGBM, and XGB. For the URLLC class the best results were 99.99% F1-score with SVC. In contrast, due to the sparse data points of the mMTC class, while Adaboost achieved a 99.99% F1-score in the burst scenario, the performance was limited to 2.74% in the probabilistic scenario. Despite using techniques that include balancing the training dataset, the models suffered from overfitting. Inspired by the open science movement, both the software used and the dataset created for inference are publicly accessible. This approach ensures reproducibility and establishes a foundation for future investigations into data analysis as specified by 3GPP. |
Keywords: | 5G Tráfego de rede Classificação Network traffic Classification |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA |
Language: | eng |
Country: | Brasil |
Publisher: | Universidade Federal de Juiz de Fora (UFJF) |
Institution Initials: | UFJF |
Department: | ICE – Instituto de Ciências Exatas |
Program: | Programa de Pós-graduação em Ciência da Computação |
Access Type: | Acesso Aberto Attribution 3.0 Brazil |
Creative Commons License: | http://creativecommons.org/licenses/by/3.0/br/ |
URI: | https://repositorio.ufjf.br/jspui/handle/ufjf/19385 |
Issue Date: | 11-Jun-2025 |
Appears in Collections: | Mestrado em Ciência da Computação (Dissertações) |
This item is licensed under a Creative Commons License