Please use this identifier to cite or link to this item: https://repositorio.ufjf.br/jspui/handle/ufjf/12234
Files in This Item:
File Description SizeFormat 
filipeoliveirafernandes.pdfFilipe Oliveira Fernandes1.59 MBAdobe PDFThumbnail
View/Open
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Vieira, Marcel de Toledo-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1980385021266418pt_BR
dc.contributor.referee1Vieira, Marcel de Toledo-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/1980385021266418pt_BR
dc.contributor.referee2Souza, Augusto Carvalho-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/4948010017164625pt_BR
dc.contributor.referee3Freguglia, Ricardo da Silva-
dc.contributor.referee3Latteshttp://lattes.cnpq.br/1290479848909932pt_BR
dc.creatorFernandes, Filipe Oliveira-
dc.creator.Latteshttp://lattes.cnpq.br/2546732169146022pt_BR
dc.date.accessioned2021-01-20T21:53:24Z-
dc.date.available2021-01-01-
dc.date.available2021-01-20T21:53:24Z-
dc.date.issued2018-12-03-
dc.identifier.urihttps://repositorio.ufjf.br/jspui/handle/ufjf/12234-
dc.description.abstractNew technologies of the XXI century provided a great increase in the production of data, which caused the phenomenon known as Big Data. Increasingly complex and difficult- to-analyse databases are emerging that require new infrastructure and increased computational processing power. A solution to this problem would be the use of probabilistic sampling techniques. The purpose of this study was to carry out a simulation study considering different sample designs through the software R and with the assistance of a server. Simple and complex sample designs were compared based on the standard error and coverage level in order to obtain estimates with the best properties from reduced sample sizes in order to allow data analysis also to the user of a desktop. In this study, data from the CadÚnico (Single Register for Social Programs of the Government), which has more than 20 million records and is distinguished as the platform for access to Bolsa Família, were considered. Simple Random Sampling has stood out as the fastest and most accurate method even in the smallest sample sizes.pt_BR
dc.description.resumoAs novas tecnologias do século XXI propiciaram um grande aumento na produção de dados, o que ocasionou no fenômeno conhecido como Big Data. Surgem bancos de dados cada vez mais complexos e difíceis de serem analisados, que requerem uma nova infraestrutura e capacidade maior de processamento computacional. Uma solução para esse problema seria o uso de técnicas de amostragem probabilística. A proposta deste estudo foi a realização de um estudo de simulação considerando diferentes desenhos amostrais através do software R e com o auxílio de um servidor. Planos amostrais simples e complexos foram comparados quanto ao erro padrão e nível de cobertura, na finalidade de obter estimativas com as melhores propriedades a partir de tamanhos de amostra reduzidos, a fim de possibilitar a análise dos dados também ao usuário de um desktop. Nesse estudo foram considerados dados do CadUnico (Cadastro Único para Programas Sociais do Governo), que possui mais de 20 milhões de registros e distingue-se como a plataforma de acesso ao Bolsa Família. A Amostragem Aleatória Simples destacou-se como o método mais rápido e também o mais preciso inclusive nos menores tamanhos de amostra.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Juiz de Fora (UFJF)pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentICE – Instituto de Ciências Exataspt_BR
dc.publisher.initialsUFJFpt_BR
dc.rightsAcesso Abertopt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectamostragempt_BR
dc.subjectCadÚnicopt_BR
dc.subjectbig datapt_BR
dc.subjectSamplingpt_BR
dc.subjectCadÚnicopt_BR
dc.subjectBig Datapt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICApt_BR
dc.titleAvaliação da eficiência de planos amostrais em big data de registros administrativospt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
Appears in Collections:Estatística - TCC Graduação



This item is licensed under a Creative Commons License Creative Commons