Por favor, use este identificador para citar o enlazar a este item:
http://hdl.handle.net/10261/248282
COMPARTIR / EXPORTAR:
SHARE BASE | |
Visualizar otros formatos: MARC | Dublin Core | RDF | ORE | MODS | METS | DIDL | DATACITE | |
Título: | Analysis of residential mobility patterns in Spain using classification trees |
Otros títulos: | Análisis de los patrones de movilidad residencial en España mediante árboles de clasificación | Autor: | Khakpour, Matin | Director: | Matorras, Francisco CSIC ORCID; de Cos Guerra, Olga | Palabras clave: | Demographic sources Internal migration Machine learning Classification Trees Fuentes demográficas Migraciones interiores Aprendizaje automático Árboles de clasificación |
Fecha de publicación: | 23-jul-2021 | Editor: | Consejo Superior de Investigaciones Científicas (España) Universidad de Cantabria Universidad Internacional Menéndez Pelayo CSIC-UC - Instituto de Física de Cantabria (IFCA) |
Resumen: | [EN] This paper studies a principal demographic resource in Spain, the Residential Variation Statistics (EVR in Spanish); an annual report compiled by the National Institute of Statistics (INE) which covers all residential changes reported by individuals when there is a change in their municipality of residence. Using Data Science tools, a descriptive analysis of this source is carried out. Then proceeds to its aggregation with more than
70 demographic and territorial variables gathered from census and municipal registers. Applying a series of Machine Learning techniques, specifically Decision Trees, as a supervised learning method, an attempt is made to detect the most influential patterns of migration flows between Spanish municipalities. We try to increase the predictive power through different models, sampling, and categorizations. Finally, a couple of
variables with relative importance on the pattern of changes toward big and small municipalities are introduced. [ES] Este trabajo estudia una fuente demográfica principal en España, las Estadísticas de Variaciones Residenciales (EVR); un informe anual del Instituto Nacional de Estadística (INE) que abarca todos los residenciales comunicados por los individuos cuando hay modificación en su municipio de residencia. Usando las herramientas de Ciencia de Datos se realiza un análisis descriptivo de esta fuente. Después se procede a enlazarlo con más de 70 variables censales, padronales y territoriales. Aplicando una serie de técnicas de Machine Learning, en concreto los árboles de decisión, como un método de aprendizaje supervisado, se intenta detectar los patrones más influyentes a los flujos migratorios entre los municipios españoles. Se intenta aumentar el poder predictivo mediante diferentes modelos, muestreos y categorizaciones. Al final se detectan un par de variables con relativa importancia sobre el patrón de cambios hacia municipios grandes y pequeños. |
Descripción: | Trabajo fin de Máster defendido en la Facultad de Ciencias de la Universidad de Cantabria, el 23 de julio de 2021 - Curso 2020-2021 - Máster Interuniversitario en Ciencia de Datos / Master in Data Science (UIMP-UC-CSIC) | URI: | http://hdl.handle.net/10261/248282 |
Aparece en las colecciones: | (POSTGRADO) Trabajos Fin de Máster CSIC-UIMP (IFCA) Tesis |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
TFM_Matin_Khakpour.pdf | 2,42 MB | Adobe PDF | Visualizar/Abrir |
CORE Recommender
Page view(s)
110
checked on 18-abr-2024
Download(s)
157
checked on 18-abr-2024
Google ScholarTM
Check
Este item está licenciado bajo una Licencia Creative Commons