Por favor, use este identificador para citar o enlazar a este item: http://hdl.handle.net/10261/248282
COMPARTIR / EXPORTAR:
logo share SHARE BASE
Visualizar otros formatos: MARC | Dublin Core | RDF | ORE | MODS | METS | DIDL | DATACITE

Invitar a revisión por pares abierta
Título

Analysis of residential mobility patterns in Spain using classification trees

Otros títulosAnálisis de los patrones de movilidad residencial en España mediante árboles de clasificación
AutorKhakpour, Matin
DirectorMatorras, Francisco CSIC ORCID; de Cos Guerra, Olga
Palabras claveDemographic sources
Internal migration
Machine learning
Classification Trees
Fuentes demográficas
Migraciones interiores
Aprendizaje automático
Árboles de clasificación
Fecha de publicación23-jul-2021
EditorConsejo Superior de Investigaciones Científicas (España)
Universidad de Cantabria
Universidad Internacional Menéndez Pelayo
CSIC-UC - Instituto de Física de Cantabria (IFCA)
Resumen[EN] This paper studies a principal demographic resource in Spain, the Residential Variation Statistics (EVR in Spanish); an annual report compiled by the National Institute of Statistics (INE) which covers all residential changes reported by individuals when there is a change in their municipality of residence. Using Data Science tools, a descriptive analysis of this source is carried out. Then proceeds to its aggregation with more than 70 demographic and territorial variables gathered from census and municipal registers. Applying a series of Machine Learning techniques, specifically Decision Trees, as a supervised learning method, an attempt is made to detect the most influential patterns of migration flows between Spanish municipalities. We try to increase the predictive power through different models, sampling, and categorizations. Finally, a couple of variables with relative importance on the pattern of changes toward big and small municipalities are introduced.
[ES] Este trabajo estudia una fuente demográfica principal en España, las Estadísticas de Variaciones Residenciales (EVR); un informe anual del Instituto Nacional de Estadística (INE) que abarca todos los residenciales comunicados por los individuos cuando hay modificación en su municipio de residencia. Usando las herramientas de Ciencia de Datos se realiza un análisis descriptivo de esta fuente. Después se procede a enlazarlo con más de 70 variables censales, padronales y territoriales. Aplicando una serie de técnicas de Machine Learning, en concreto los árboles de decisión, como un método de aprendizaje supervisado, se intenta detectar los patrones más influyentes a los flujos migratorios entre los municipios españoles. Se intenta aumentar el poder predictivo mediante diferentes modelos, muestreos y categorizaciones. Al final se detectan un par de variables con relativa importancia sobre el patrón de cambios hacia municipios grandes y pequeños.
DescripciónTrabajo fin de Máster defendido en la Facultad de Ciencias de la Universidad de Cantabria, el 23 de julio de 2021 - Curso 2020-2021 - Máster Interuniversitario en Ciencia de Datos / Master in Data Science (UIMP-UC-CSIC)
URIhttp://hdl.handle.net/10261/248282
Aparece en las colecciones: (POSTGRADO) Trabajos Fin de Máster CSIC-UIMP
(IFCA) Tesis




Ficheros en este ítem:
Fichero Descripción Tamaño Formato
TFM_Matin_Khakpour.pdf2,42 MBAdobe PDFVista previa
Visualizar/Abrir
Mostrar el registro completo

CORE Recommender

Page view(s)

110
checked on 18-abr-2024

Download(s)

157
checked on 18-abr-2024

Google ScholarTM

Check


Este item está licenciado bajo una Licencia Creative Commons Creative Commons