Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufjf.br/jspui/handle/ufjf/12727
Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
isabelalopespenna.pdfisabelalopespenna940.62 kBAdobe PDFVista previa
Visualizar/Abrir
Clase: Trabalho de Conclusão de Curso
Título : Seleção de modelos de regressão linear em bases de alta dimensão
Autor(es): Penna, Isabela Lopes
Orientador: Ferreira, Clécio da Silva
Miembros Examinadores: Ferreira, Clécio da Silva
Miembros Examinadores: Zeller, Camila Borelli
Miembros Examinadores: Magalhães, Tiago Maia
Resumo: Em diversos casos é preciso lidar com bases de dados com um grande número de variáveis, bases essas denominadas Big Data. Em algumas situações se faz necessário reduzir o número dessas variáveis, seja para se ter um modelo apenas com as variáveis significativas ou para sanar problemas como multicolinearidade. Com isso surgiram vários métodos para solucionar os casos acima. Esse trabalho se propôs a estudar os diferentes métodos de seleção em modelos de regressão linear múltipla, como métodos de seleção de subconjuntos de variáveis, métodos de regularização e métodos de redução de dimensionalidade. Procedimentos de validação cruzada foram utilizados nos processos de regularização para seleção dos modelos. Aplicações em dados reais foram realizadas utilizando o software R Core Team (2018).
Resumen : In many cases, it is necessary to deal with databases with a large number of variables, bases called Big Data. In some situations it is necessary to reduce the number of these variables, either to have a model with only the significant variables or to solve problems such as multicollinearity. With this, several methods have emerged to solve the above cases. This work proposed to study the different selection methods in multiple linear regression models, such as methods of selecting subsets of variables, methods of regularization and methods of dimensionality reduction. Cross-validation procedures were used in the regularization processes for selecting the models. Real data applications were performed using the R Core Team software (2018).
Palabras clave : Seleção de Variáveis Regressoras
Selection of Regressor Variables
Mínimos Quadrados Parciais
Ridge Regression
Regressão Ridge
LASSO Regression
Regressão LASSO
Regressão de Componentes Principais
Partial Least Squares
Principal Component Regression
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Idioma: por
País: Brasil
Editorial : Universidade Federal de Juiz de Fora (UFJF)
Sigla de la Instituición: UFJF
Departamento: ICE – Instituto de Ciências Exatas
Clase de Acesso: Acesso Aberto
Licenças Creative Commons: http://creativecommons.org/licenses/by-nc-nd/3.0/br/
URI : https://repositorio.ufjf.br/jspui/handle/ufjf/12727
Fecha de publicación : 17-mar-2021
Aparece en las colecciones: Estatística - TCC Graduação



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons