Notas sobre Índice Subnacional de Desarrollo Humano (SHDI) a través del portal globaldatalab.org

Author
Published

September 13, 2024

Objetivo

Antes de empezar a usar un recurso, suelo realizar un trabajo de aproximación que me permita conocer sus características y lo hago experimentando con algunas de las bases de datos que dicho recurso puede ofrecer. En este caso, tenía interés en encontrar datos del Índice de Desarrollo Humano en una escala inferior que la nacional y encontré las bases de datos de SHDI (Subnational Human Development Indicators), disponibles en https://globaldatalab.org/, un centro independiente de datos e investigación de la Escuela de Administración de Nijmegen de la Universidad de Radboud.

El portal globaldatalab

Se trata de un grande repositorio de datos e indicadores de todo tipo: más de 500 datasets donde se pueden comparar datos a nivel más granular que el de Country para más de 160 países: en muchos casos (por ejemplo el del IDH), se llega a nivel regional (comparable al NUTS2 de EUROSTAT).

Los que trabajamos para obtener datos más próximos a nuestras realidades locales, sabemos la importancia tener cierta granularidad, aspecto que puede ser aún más crítico para países extraeuropeos, en los que la obtención de datos con dicho detalle puede ser muy difícil y donde existen diferencias dramáticas entre distintas regiones (obervar, por ejemplo, aquí abajo la diferencia de IDH entre Luanda y Kuanza Sul, en Angola). Administraciones locales y organizaciones de desarrollo se pueden beneficiar mucho de este recurso que les va a permitir realizar mejores análisis y planificaciones.

Si bién es verdad que sería posible obtener dichos datos de otras fuentes (por ejemplo, EUROSTAT, en el caso de Europa), el valor añadido del portal es el trabajo de condensar en una sola fuente datos regionales referidos a la mayoría de países del mundo.

Índice subnacional de Desarrollo Humano (SHDI)

Un dataset muy importante disponible en el portal es el Subnational Human Development Database que contiene los índices de desarrollo humano subnacional/regional para más de 160 países. Para analizar el desarrollo, este es un indicador de primaria importancia, ya que recoge las dimensiones de salud (años de esperanza de vida), educación (años de escolarización), y creación de riqueza (renta media per cápita). Sin querer entrar en los detalles de cómo se elabora, sólo queremos destacar que la metodología utilizada en la elaboración de la base de datos es rigurosa y transparente, tal y como se puede comprobar en este artículo de la revista Nature.

Además de los índices de desarrollo humano ya integrados, el dataset contiene los índices que componen el IDH y los indicadores originarios. Además, los tenemos por género. Lo que genera unas 26 tablas de diferentes indicadores! tal i como se puede comprobar en la siguiente lista:

Data retrieved from the Subnational HDI Database of the Global Data Lab, https://globaldatalab.org/shdi/, version v7.0.

Como además se incluye una tabla de población, esto permite, si quisieramos, comprobar la validez de los SHDI calculados para las distintas regiones,

Las tablas de indicadores tienen la siguiente configuración:

Data retrieved from the Subnational HDI Database of the Global Data Lab, https://globaldatalab.org/shdi/, version v7.0.

La tabla contiene una columnas de clasificación y unas columnas de valores, en este caso, los del SHDI. Particolarmente importante es la columna GDLCODE, con la que se codifican las regiones, ya que permite la fusión con otras tablas (por ejemplo las cartográficas).

Casos prácticos

Para destacar sus principales características y potencialidades de este recurso, hemos elaborado algunos ejemplos con los datos disponibles en el portal.

Caso 1: IDH por comunidades autónomas de España y por año


En este caso podemos contar con el Índice de Desarrollo Humano por CCAA, desde el año 1991. Este indicador está disponible a nivel de PNUD, para los países, pero no para las regiones. EUROSTAT dispone de muchas bases de datos de indicadores nacionales, regionales (NUTS2) y de un inivel aún más detallado, comparable a la provincia de España (NUTS3). Sin embargo, no dispone de datos regionales sobre IDH, seguramente porque está invirtiendo mucho esfuerzo en la creación de un índice específico de calidad de vida para todos los países de la UE. Las mismas consideraciones valen para el caso del INE. Con lo cual, si quisiéramos obtener el dato regional para todas la CCAA de España, deberíamos acudir a las diferentes oficinas e institutos estadísticos autonómicos.

Caso 2: IDH de Angola por provincias y año


Las subdivisiones administrativas de Angola tienen tres niveles: Provincias, Municipios y Comunas. globaldatalab nos permite realizar un análisis del mismo indicador por provincias de este país, donde podemos comprobar las enormes diferencias que existen entre ellas y cómo dichas diferencias se han ido ensanchando a lo largo del tiempo (p.ej. entre Luanda/Cabinda y Kuanza Sul…).

Analizar un indicador de un país en su globalidad puede ser muy engañoso cuando, como en este caso, existen diferencias de esta envergadura.

Caso 3: Mapa del IDH por regiones de España y Portugal

Data retrieved from the Subnational HDI Database of the Global Data Lab, https://globaldatalab.org/shdi/, version v7.0.

En globaldatalab podemos encontrar asimismo documentos en formato shapefile que disponen de los ID necesarios para incorporar los datos de las cartografías.

De esta manera, podemos poner en un mapa los datos de regiones pertenecientes a estados distintos, de manera similar a las operaciones que se realizan con los datos de EUROSTAT.

Un aspecto que me queda por investigar es la factibilidad de integrar de manera programada la codificación de las tablas de este recursos con la de EUROSTAT (NUTS2), que es diferente.

Caso 4 Comparación de la situación y de la evolución del IDH en diferentes regiones de diferentes países: Angola y Namibia

Data retrieved from the Subnational HDI Database of the Global Data Lab, https://globaldatalab.org/shdi/, version v7.0.


La doble visión horizontal y longitudinal que aportan los datos nos permite identificar las diferencias actuales entre regiones de dos países contíguos; al mismo tiempo, podemos apreciar las tendencias: en este caso, el hecho de que las diferencias entre regiones de ambos han ido disminuyendo por el crecimiento importante del IDH en muchas regiones de Angola -por lo menos hasta 2016-, y el estancamiento de este indicador en Namibia desde los años 90.

La visión más detallada y longitudinal que nos aportan esos datos es, en definitiva, su gran ventaja diferencial y el valor añadido de los datos de Globaldatalab.

La librería de R gdldata

Desde el 25 de Septiembre de 2023, existe una librería de R que nos permite obtener datos e indicadores utilizando un API que nos conecta directamente con ellos, sin tener que entrar a descargarlos desde el portal: https://globaldatalab.org/. La librería se puede instalar con el orden install.pakages("gdldata").

# install.packages("gdldata")
library(gdldata)

Previamente, hay que abrir una cuenta en el portal en el registro. Una vez registrados se puede obtener el token que utilizaremos para crear las sesiones.

Crear la sesión

Una vez que disponemos del token, creamos la sesión con la función gdl_session().

session <- gdl_session("GDL_TOKEN")

Funciones para obtener los datos

La sesión abierta nos permite obtener los datos, utilizando diversas funciones:

  • set_dataset(): nos permite obtener el dataset que queremos. En nuestro caso, para obtener uno de los 26 indicadores que forman parte de la base de datos de IDH, debemos llamar al dataset shdi.
  • set_indicator(): indica cuál de las 26 tablas queremos usar.
  • Para obtener el país existen 3 diferentes funciones: set_country() en el que hay que indicar el ìso_code del país que queremos con el parametro country=; set_countries(), en que podemos entrar un vector de diferentes iso_codes en mismo parámentro; por último, disponemos de set_countries_all(), con el que podemos llamar a todos los países, para filtrar los que interesan, como en el caso siguiente:
df <- session %>% 
   set_dataset('shdi') %>%  
   set_indicator('shdi') %>% 
   set_countries_all() %>% 
   gdl_request()

DT::datatable(head(df[df$Country=="Angola",c(1:6,37:38)]))

Data retrieved from the Subnational HDI Database of the Global Data Lab, https://globaldatalab.org/shdi/, version v7.0.

Cómo ver los listados de indicadores disponibles

Una operación importante es ver las tablas de indicadores disponibles. Para ello, disponemos de la función gdl_indicators(). En el caso de los indicadores del dataset shdi, que hemos visto arriba, el listado de indicadores se puede visualizar de la manera siguiente:

session %>% 
  set_dataset('shdi') %>% 
  gdl_indicators() %>% 
  DT::datatable()

Para el resto de indicadores, la visualización se realiza sin necesidad de llamar ningún dataset:

session %>% 
  gdl_indicators() %>% 
  DT::datatable()

Data retrieved from the Subnational HDI Database of the Global Data Lab, https://globaldatalab.org/shdi/, version v7.0.

Utilizando el listado de arriba podemos obtener la tabla sobre promedio de años de educación en adultos (indicator: edyr25) en Angola:

# Mean years education of adults aged 25+

agoedyr25 <- session %>% 
  set_indicators('edyr25') %>% 
  set_country('AGO') %>% 
  gdl_request()

agoedyr25 %>% select(1:6, 34) %>% DT::datatable()

Data retrieved from the Subnational HDI Database of the Global Data Lab, https://globaldatalab.org/shdi/, version v7.0.

Página específica de la librería

Para saber más sobre la librería de R gdldata, ver este enlace. Hemos comprobado que el administrador atiende las dudas bastante rápidamente y de manera pertinente.



Vuelve a analysis.cat.