Usando el conocimiento actual

¿Podemos predecir con acierto dónde y cómo estarán las especies en las próximas décadas?

Por Alejandra Morán-Ordóñez (Centre Tecnològic Forestal de Catalunya, España).

Figura 1. Ejemplo de los grupos taxonómicos incluidos en nuestro estudio. Las especies que se muestran son (de izquierda a derecha y de arriba abajo): Litoria peroni (Fotógrafo: Geoff Heard), Tachyglossus aculeatus (Fotógrafo: José J. Lahóz-Monfort); Chlamydera guttata (Fotógrafo: Alejandra Morán-Ordóñez); Morelia kinghorni (Fotógrafo: Geoff Heard).

Figura 1. Ejemplo de los grupos taxonómicos incluidos en nuestro estudio. Las especies que se muestran son (de izquierda a derecha y de arriba abajo): Litoria peroni (Fotógrafo: Geoff Heard), Tachyglossus aculeatus (Fotógrafo: José J. Lahóz-Monfort); Chlamydera guttata (Fotógrafo: Alejandra Morán-Ordóñez); Morelia kinghorni (Fotógrafo: Geoff Heard).

Los modelos de distribución de especies (MDE) son herramientas estadísticas ampliamente utilizadas en Ecología y Biogeografía que permiten entender los patrones espaciales y temporales de la distribución de las especies en el planeta. Los MDE nos informan sobre cómo las especies se relacionan con su medio biótico y abiótico, esto es, permiten inferir qué factores ambientales determinan dónde se puede encontrar una especie, dónde no y porqué (ej., condiciones climáticas y de hábitat, presencia/ausencia de competidores). Sobre esta información, los MDE se pueden usar para predecir qué otras partes del territorio de interés pueden reunir condiciones ambientales potencialmente idóneas para el desarrollo de la especie tanto en el momento actual (predicción espacial/geográfica), así como en otros horizontes temporales (predicciones futuras o pasadas de la distribución de especies).

Las aplicaciones predictivas de los MDE son múltiples: predicción de expansión geográfica de especies invasoras, análisis de la distribución potencial de enfermedades infecciosas, identificación de zonas óptimas para la reintroducción de especies amenazadas, etc. Uno de los usos más ampliamente extendidos de los MDE es sin duda la predicción de la respuesta de las especies frente a la actual amenaza del cambio global (principalmente cambio climático y cambio en los usos del suelo). Desde el punto de vista de la conservación de la biodiversidad, conocer con precisión la respuesta de las especies a condiciones ambientales futuras (ej., incremento de temperaturas, períodos prolongados de sequía, fragmentación de hábitat) permitiría implementar dicha información en la toma de decisiones actual, y por tanto, aplicar medidas tempranas de gestión/adaptación dirigidas a aquellas especies para las que las condiciones ambientales futuras supongan una mayor amenaza. El principal problema de usar las predicciones de la distribución de las especies futuras en la toma de decisiones actualmente es que no sabemos que tan buenas son dichas predicciones, dado el poco éxito que la comunidad científica ha tenido hasta el momento en desarrollar una máquina del tiempo que nos permita viajar hacia el futuro y validar dichas predicciones (ver si las especies estarán allí donde el modelo predice o no).

En este contexto, nos planteamos evaluar qué aspectos pueden condicionar la capacidad predictiva de los MDE. A falta de datos de validación futuros, recogimos una extensa base de datos de localizaciones con presencia de 318 especies australianas de vertebrados terrestres (anfibios, reptiles, mamíferos y aves) para el período 1950-2013 (Figura 1). Dividimos los datos en cuatro períodos de tiempo (t1: 1950-1980, t2: 1981-1990, t3:1991-2000 y t4: 2001-2012), asegurándonos que en todos ellos disponíamos de un número suficiente de datos de presencia para cada especie como para garantizar que el tamaño de la muestra no representase un problema en el proceso de modelación. Nos pusimos en los zapatos de un modelador que quisiese ajustar un MDE para cada una de las especies con los datos disponibles a finales de cada uno de los períodos y proyectarlos en los otros períodos (ej., un modelador en t1 usaría los datos disponibles entre 1950-1980 para ajustar los modelos y haría predicciones ‘futuras’ hacia t2, t3 y t4). La ventaja de esta aproximación es que en este caso sí disponíamos de datos de presencia de la especie para validar las predicciones en t2, t3 y t4 y, por tanto, evaluar que tan buenas son nuestras predicciones.

Observamos que, si bien en términos generales los MDE se transferían relativamente bien hacia períodos de tiempo futuros (esto es, la capacidad predictiva del modelo se podía considerar satisfactoria, incluso cuando el modelo era proyectado 40 años), existe una marcada variabilidad de resultados entre especies (Figura 2). Exploramos qué factores podrían explicar dicha variabilidad: (1) factores intrínsecos de los datos de distribución usados para ajustar y validar los modelos (ej., tamaño de la muestra de datos, rango ambiental cubierto con los datos de entrenamiento); (2) el período de tiempo entre el ajuste del modelo y la predicción futura; (3) rasgos funcionales intrínsecos de las especies (ej., grupo taxonómico, amplitud de nicho, tipo de hábitat o tamaño corporal). Con este análisis buscamos definir para qué especies y bajo qué condiciones de modelización cabe esperar que nuestras predicciones futuras de distribución de especies sean fiables.

Figura 2. Capacidad predictiva de los modelos para el período de tiempo en el que han sido entrenados (t1.cv, t2.cv, t3.cv y t4.cv), así como de sus predicciones en períodos de tiempo ‘futuros’ (t1.t2, t1.t3, t1.t4, t2.t3, t2.t4, t3.t4). Por ejemplo, los valores para t1.t2 corresponden a la capacidad predictiva de modelos ajustados en t1 y evaluados con datos del período t2. La capacidad predictiva de los modelos la estimamos con el indicador AUC (Area Under the ROC Curve) cuyos valores oscilan entre 0-1: se considera que un modelo con AUC = 0.5 no es mejor que un modelo aleatorio; modelos con AUC > 0.7 se consideran útiles y generalmente, modelos con AUC > 0.9 se les consideran de excelente capacidad predictiva. Esta capacidad predictiva es una medida de la capacidad que tiene el modelo de discriminar entre zonas buenas para la presencia de la especie y el conjunto de condiciones ambientales de la zona de estudio (background). Los modelos basados en los mismos datos de entrenamiento se representan en la misma escala de grises. Las cajas delimitan el rango intercuartil de los valores de AUC (diferencia entre el tercer y el primer cuartil); las barras delimitan ± 2 desviaciones estándar; las muescas de las cajas están centradas en la mediana (línea horizontal en negrita); los valores medios de AUC se muestran con un círculo sólido negro y los valores extremos con círculos vacíos. El número de especies evaluadas dentro de cada grupo funcional se indica al lado del nombre del grupo entre paréntesis. La línea horizontal punteada muestra valores medios de AUC calculados a través de los cuatro períodos de tiempo y para cada grupo taxonómico de modo individual.

Figura 2. Capacidad predictiva de los modelos para el período de tiempo en el que han sido entrenados (t1.cv, t2.cv, t3.cv y t4.cv), así como de sus predicciones en períodos de tiempo ‘futuros’ (t1.t2, t1.t3, t1.t4, t2.t3, t2.t4, t3.t4). Por ejemplo, los valores para t1.t2 corresponden a la capacidad predictiva de modelos ajustados en t1 y evaluados con datos del período t2. La capacidad predictiva de los modelos la estimamos con el indicador AUC (Area Under the ROC Curve) cuyos valores oscilan entre 0-1: se considera que un modelo con AUC = 0.5 no es mejor que un modelo aleatorio; modelos con AUC > 0.7 se consideran útiles y generalmente, modelos con AUC > 0.9 se les consideran de excelente capacidad predictiva. Esta capacidad predictiva es una medida de la capacidad que tiene el modelo de discriminar entre zonas buenas para la presencia de la especie y el conjunto de condiciones ambientales de la zona de estudio (background). Los modelos basados en los mismos datos de entrenamiento se representan en la misma escala de grises. Las cajas delimitan el rango intercuartil de los valores de AUC (diferencia entre el tercer y el primer cuartil); las barras delimitan ± 2 desviaciones estándar; las muescas de las cajas están centradas en la mediana (línea horizontal en negrita); los valores medios de AUC se muestran con un círculo sólido negro y los valores extremos con círculos vacíos. El número de especies evaluadas dentro de cada grupo funcional se indica al lado del nombre del grupo entre paréntesis. La línea horizontal punteada muestra valores medios de AUC calculados a través de los cuatro períodos de tiempo y para cada grupo taxonómico de modo individual.

Del conjunto de factores explorados, el número de regiones biogeográficas en que una especie está presente (como medida de amplitud de su rango geográfico) resultó ser el factor con mayor influencia en la capacidad predictiva de un modelo en el futuro. En particular, cuanto más amplio sea el rango geográfico de una especie, más cabe esperar que la capacidad predictiva de los modelos ajustados hoy para esa especie (especies generalistas y ampliamente distribuidas), tengan una baja capacidad predictiva en el futuro. Por el contrario, las especies más especialistas o de rango geográfico estrecho mostraron elevada capacidad predictiva en el momento de ajuste del modelo y elevada transferibilidad de predicciones hacia el futuro. En términos generales, la capacidad predictiva de los modelos de especies generalistas es siempre menor que la de las especies especialistas, dado que en el caso de las primeras (especies ubicuas) al modelo le cuesta mucho discriminar las zonas de idoneidad alta para la especie de las zonas menos idóneas (todas las zonas son potencialmente idóneas). También observamos que existe una interacción entre el rango geográfico de una especie y el período de tiempo transcurrido entre el ajuste y la predicción futura del modelo, de modo que para las especies generalistas, cuanto mayor sea el intervalo de tiempo entre el ajuste y la proyección del modelo, menor será la capacidad predictiva de dicho modelo. En términos generales, cuanto más lejano sea el horizonte temporal al que se proyecten los modelos, se debe esperar una menor capacidad predictiva de los mismos (Figura 2). Otros rasgos funcionales específicos de las especies evaluadas (tamaño corporal, grupo taxonómico, hábitat preferente) no resultaron relevantes para explicar la capacidad predictiva actual o futura de nuestros MDE.

Otro factor con elevada influencia en la capacidad predictiva del modelo, tanto en el momento actual como futuro, es la relación entre el número de datos de presencia de la especie y el número de datos de background (en MAXENT, puntos que recogen información del rango de condiciones ambientales disponibles en la zona modelada). En concreto, y considerando un número de puntos de background constante (manteniendo el denominador de la relación constante) la capacidad predictiva de los modelos se reduce a medida que se incrementa el número de datos de presencia. Este resultado puede simplemente – y de nuevo – reflejar la dificultad de modelar la distribución geográfica de especies generalistas, para las que en términos generales se dispone de un mayor número de datos de presencia. Una de las condiciones que se debería cumplir a la hora de ajustar un MDE es que los datos de presencia con los que se cuenta para modelar, sean representativos de todo el rango de condiciones ambientales en los que puede desarrollarse la especie (rango climático, de elevación, de hábitats, etc). Esta condición es especialmente importante cuando se usan MDE basados sólo en presencias y para los que no se dispone de información de zonas no ocupadas por la especie (‘ausencias’). Un sesgo en el muestreo (ej., todos los datos disponibles para la especie se han recogido en zonas de pastizal, mientras que la especie también usa ambientes forestales), puede reducir la capacidad predictiva del modelo a nuevos ambientes (en el ejemplo anterior, el modelo no sería capaz de predecir bien que la especie puede encontrar hábitat idóneo en zonas forestales). En nuestro estudio observamos que una buena cobertura ambiental de los datos de presencia, puede ser tan importante o más que el esfuerzo de muestreo (número de datos de presencia disponibles) a la hora de determinar la capacidad predictiva del modelo (la capacidad predictiva del modelo crece al aumentar el rango ambiental cubierto por los datos disponibles para el ajuste del modelo).

En resumen, nuestro estudio destaca que, la capacidad predictiva de los modelos, a la hora de hacer proyecciones futuras, puede mejorarse incrementando los esfuerzos de muestreo (para garantizar que los datos de presencia de la especie cubren el rango de condiciones ambientales en que la especie puede desarrollarse), así como, ampliando los esfuerzos relativos a identificación y mapeo de los factores ambientales que explican la distribución geográfica de especies generalistas. Si bien nosotros contamos con la ventaja de conocer con certeza los cambios climáticos acontecidos en el período de tiempo evaluado (1950-2013), los estudios que hacen predicciones futuras ante diferentes escenarios de cambio global tienen que tener en cuenta (e integrar en el proceso de modelización si es posible), la incertidumbre asociada a la potencial respuesta de las especies frente a contextos climáticos o de uso del territorio nuevos (¿migración?, ¿adaptación?, ¿extinción?). Mientras todo este desarrollo experimental avanza, seguiremos teniendo la esperanza de ese viaje en la máquina del tiempo, que nos permita resolver todas estas dudas con nuestros propios ojos.

Más información: Alejandra Morán (alejandra.moran@ctfc.es).

Referencia

Morán-Ordóñez, A., Lahoz-Monfort, J. J., Elith, J. and Wintle, B. (2017). Evaluating 318 continental-scale species distribution models over a 60-year prediction horizon: what factors influence the reliability of predictions? Global Ecology and Biogeography 26: 371-384.

Leave a Reply