https://repositorio.ufjf.br/jspui/handle/ufjf/12298
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
brunocaetanovidigal.pdf | Bruno Caetano Vidigal | 238.08 kB | Adobe PDF | Visualizar/Abrir |
Tipo: | Trabalho de Conclusão de Curso |
Título: | Análise de correspondência para avaliação de indicadores socioeconômicos, demográficos e de mortalidade |
Autor(es): | Vidigal, Bruno Caetano |
Primeiro Orientador: | Bastos, Ronaldo Rocha |
Membro da banca: | Bastos, Ronaldo Rocha |
Membro da banca: | Ferreira, Clécio da Silva |
Membro da banca: | Vieira, Marcel de Toledo |
Resumo: | Esse trabalho apresenta um estudo sobre as associações, similaridades ou dissimilaridades de alguns indicadores socioeconômicos, demográficos e de mortalidade para todos os estados e regiões brasileiras a partir da técnica estatística multivariada denominada Análise de Correspondência (AC). Esses indicadores foram retirados do IDB-2009 (Indicadores e Dados Básicos-2009), e também do site do Instituto de Pesquisa Econômica Aplicada (IPEA). Inicialmente, calculamos algumas estatísticas descritivas para os indicadores referentes aos estados brasileiros e fizemos gráficos box-plot para cada variável (indicador). Para a aplicação aqui apresentada, já que a Análise de Correspondência (AC) é estritamente desenvolvida para trabalhar com variáveis categóricas ou categorizadas, e os indicadores estudados são de natureza numérica, utilizamos dois métodos a fim de agrupá-los em categorias ordinais quanto aos estados e regiões - método das k-Médias e dos percentis. Apresentamos em nossa análise o método das k-Médias pois este possibilitou uma maior explicação da variância do sistema ao aplicarmos a AC. Contudo, o resultado utilizando o método dos percentis também foi bastante satisfatório e similar ao primeiro. Recodificamos os valores da matriz obtida pelo método das k-Médias através da correção chamada doubling e obtivemos resultados similares àqueles quando não fizemos tal correção, embora a visualização das similaridades e associações tenha ficado mais direta. Desta forma, pudemos analisar a posição relativa dos estados, suas similaridades em termos dos indicadores e quais indicadores são similares para os estados brasileiros, assim como a associação entre os estados e determinadas categorias dos indicadores. A utilização de AC foi escolhida em função da possibilidade de analisar tais similaridades e associações de forma gráfica, o que caracteriza esta técnica. Todos os cálculos e gráficos foram obtidos através do software livre R. |
Abstract: | We present a study of the associations, similarities or dissimilarities among selected socioeconomic, demographic and mortality indicators for all states and regions in Brazil, through the adoption of a multivariate statistical technique called Correspondence Analysis (CA). The indicators were gathered from IDB-2009 (Indicators and Basic Data- 2009) and also from IPEA (Applied Economic Research Institute). Some descriptive statistics for all indicators used in the analysis are presented, along with corresponding box-plots. As CA was strictly developed for categorical data, and the indicators we selected were all numerical variables, two grouping methods were used in order to categorize such variables: k- means and percentiles. The analysis of the categorized variables through the k-means method presented a solution which best explained the overall variance in the CA solution and was therefore adopted. However, the results obtained through the percentiles method presented similar results. The scaling correction known as “doubling” was then applied to the k-means generated data and another CA solution was obtained. These results were similar to the previous one, but the visual interpretation was more straightforward. We could thus analyze the relative position of states, their similarities in terms of the indicators adopted and their association with such indicators. AC was selected for its unique feature of presenting the solution in a clear, easy-to-interpret graphic form. All calculations were made in the open- source programming code R. |
Palavras-chave: | Análise de Correspondência Análise Multivariada Indicadores Sociais Correspondence Analysis Multivariate Analysis Social Indicators |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal de Juiz de Fora (UFJF) |
Sigla da Instituição: | UFJF |
Departamento: | ICE – Instituto de Ciências Exatas |
Tipo de Acesso: | Acesso Aberto Attribution-NonCommercial-NoDerivs 3.0 Brazil |
Licenças Creative Commons: | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
URI: | https://repositorio.ufjf.br/jspui/handle/ufjf/12298 |
Data do documento: | 6-Dez-2010 |
Aparece nas coleções: | Estatística - TCC Graduação |
Este item está licenciado sob uma Licença Creative Commons