DC Field | Value | Language |
dc.contributor.advisor1 | Silva, Edelberto Franco | - |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/3987091765361506 | pt_BR |
dc.contributor.advisor-co1 | Chaves, Luciano Jerez | - |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/7521861928465039 | pt_BR |
dc.contributor.referee1 | Vieira, Alex Borges | - |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/9037224811267705 | pt_BR |
dc.contributor.referee2 | Lima, Michele Nogueira | - |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/7862253799240671 | pt_BR |
dc.contributor.referee3 | Mattos, Diogo Menezes Ferrazani | - |
dc.contributor.referee3Lattes | http://lattes.cnpq.br/6177045546956476 | pt_BR |
dc.creator | Oliveira, Leonardo Azalim de | - |
dc.creator.Lattes | http://lattes.cnpq.br/7749238753232176 | pt_BR |
dc.date.accessioned | 2025-09-12T10:55:02Z | - |
dc.date.available | 2025-09-09 | - |
dc.date.available | 2025-09-12T10:55:02Z | - |
dc.date.issued | 2025-06-11 | - |
dc.identifier.uri | https://repositorio.ufjf.br/jspui/handle/ufjf/19385 | - |
dc.description.abstract | The fifth generation of cellular network (5G), specified by the 3
rd Generation
Partnership Program (3GPP), distinguishes itself from previous mobile network generations
primarily through the adoption of a Service Based Architecture (SBA). By leveraging
the flexibility of this new architectural paradigm, this work investigates the feasibility of
implementing a Network Data Analytics Function (NWDAF) mechanism for classifying 5G
devices. Following the 3GPP specifications, the International Telecommunication Union
(ITU) defines three 5G service axes: Enhanced Mobile Broadband (eMBB), Ultra Reliable
and Low Latency Communications (URLLC), and Massive Machine-Type Communications
(mMTC). These axes focus on applications that require high throughput, low latency with
high availability, and low-energy transmissions with thousands of connected Internet of
Things (IoT) devices, respectively. Therefore, the classification of different device types is
crucial, as each 5G axis is associated with distinct constraints, which influence resource
allocation in the 5G Core (5GC). Defined by the 3GPP in Release 15 as responsible
for data analysis in 5G networks, the NWDAF remains considerably underexplored in
existing literature. To address this gap, this work employs a simulated 5G environment
utilizing Free/Libre and Open Source Software (FLOSS). This environment incorporates
UERANSIM, a Radio Access Network (RAN) and User Equipment (UE) simulator;
free5GC, a 5GC implementation; and a custom network traffic generator. Two real-world
5G datasets were used to train eleven different Machine Learning (ML) models — Linear
Regression (LR), Histogram-based Gradient Boosting (HGB), Light Gradient Boosting
Machine (LGBM), Multilayer Perceptron (MLP), Random Forest (RF), Linear Support
Vector Classification (SVC), eXtreme Gradient Boosting (XGB), Decision Tree (DT),
Adaboost, Stacking, and Voting — to classify UEs in the axes based on their observed
network traffic. In the implemented ML pipeline the model inference performance results
achieved up to 99.91% F1-score for the eMBB class using RF, LGBM, and XGB. For the
URLLC class the best results were 99.99% F1-score with SVC. In contrast, due to the
sparse data points of the mMTC class, while Adaboost achieved a 99.99% F1-score in the
burst scenario, the performance was limited to 2.74% in the probabilistic scenario. Despite
using techniques that include balancing the training dataset, the models suffered from
overfitting. Inspired by the open science movement, both the software used and the dataset
created for inference are publicly accessible. This approach ensures reproducibility and
establishes a foundation for future investigations into data analysis as specified by 3GPP. | pt_BR |
dc.description.resumo | A quinta geração de redes celulares (5G), que é especificada pelo 3
rd Generation
Partnership Program (3GPP), se distingue das gerações anteriores de redes móveis principalmente pela adoção de uma arquitetura baseada em serviços (do inglês, Service Based
Architecture (SBA)). Ao aproveitar da flexibilidade desse novo paradigma arquitetural,
este trabalho investiga a viabilidade da implementação de um mecanismo de Network
Data Analytics Function (NWDAF) para a classificação de dispositivos 5G. Consoante
com a normatização do 3GPP, o International Telecommunication Union (ITU) define
três eixos de serviço 5G: Enhanced Mobile Broadband (eMBB), Ultra Reliable and Low
Latency Communications (URLLC) e Massive Machine-Type Communications (mMTC).
Esses eixos concentram principalmente aplicações que necessitam de altas taxas de vazão,
baixa latência com alta disponibilidade e transmissões de baixo gasto energético com
milhares de dispositivos de Internet of Things (IoT) conectados, respectivamente. Então,
a classificação de diferentes tipos de dispositivos é crucial, uma vez que cada eixo do 5G
está associado a restrições distintas, que influenciam a alocação de recursos no Núcleo 5G
(do inglês, 5G Core (5GC)). Definido pelo 3GPP na Release 15 como responsável pela
análise de dados em redes 5G, o NWDAF permanece subexplorado na literatura. Então,
para explorar essa lacuna, este trabalho utiliza um ambiente 5G simulado que emprega
Software Livre (SL). Este ambiente engloba o UERANSIM, que é um simulador de Radio
Access Network (RAN) e User Equipment (UE); o free5GC, que é uma implementação de
5GC; e um gerador de tráfego de rede customizável. Dois conjuntos de dados 5G reais,
foram utilizados para treinar onze diferentes modelos de Machine Learning (ML) — Linear
Regression (LR), Histogram-based Gradient Boosting (HGB), Light Gradient Boosting
Machine (LGBM), Multilayer Perceptron (MLP), Random Forest (RF), Linear Support
Vector Classification (SVC), eXtreme Gradient Boosting (XGB), Decision Tree (DT),
AdaBoost, Stacking, e Voting — com o objetivo de classificar os UEs nos eixos a partir
do tráfego de rede observado. No pipeline de ML implementado, os modelos alcançaram
até 99.91% de F1-score para a classe eMBB ao utilizar RF, LGBM e XGB. Para a classe
URLLC, os melhores resultados foram de 99.99% de F1-score com o SVC. Em contraste,
devido à natureza esparsa dos dados da classe mMTC, enquanto o AdaBoost alcançou
99.99% de F1-score no cenário de burst, a performance ficou limitada em 2.74% no cenário
probabilístico. Mesmo após empregar técnicas que incluíram o balanceamento dos dados
de treinamento, os modelos sofreram de overfitting. Inspirado pelo movimento de ciência
aberta, tanto o software utilizado quanto o conjunto de dados criado para a inferência
estão acessíveis publicamente. Essa abordagem garante a reprodutibilidade e estabelece
bases para investigações futuras sobre análise de dados conforme especificado pelo 3GPP. | pt_BR |
dc.language | eng | pt_BR |
dc.publisher | Universidade Federal de Juiz de Fora (UFJF) | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | ICE – Instituto de Ciências Exatas | pt_BR |
dc.publisher.program | Programa de Pós-graduação em Ciência da Computação | pt_BR |
dc.publisher.initials | UFJF | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.rights | Attribution 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/br/ | * |
dc.subject | 5G | pt_BR |
dc.subject | Tráfego de rede | pt_BR |
dc.subject | Classificação | pt_BR |
dc.subject | Network traffic | pt_BR |
dc.subject | Classification | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA | pt_BR |
dc.title | User equipment traffic classification in the 5G core | pt_BR |
dc.type | Dissertação | pt_BR |
Appears in Collections: | Mestrado em Ciência da Computação (Dissertações)
|