Resumen
En el estudio sistemático y ecológico se hace un uso intensivo de la Estadística. Lo que por supuesto ocurre también en Zoología.
La Ecología y la Biología de la Conservación son disciplinas basadas en la contrastación de hipótesis, qué ráramente se enmarcan en modelos matemáticos explícitos. Aunque el uso de teorías establecidas en Ecología y Evolución es muy frecuente, siendo las más utilizadas:
Metapoblaciones. Lotka-Volterra (predador presa y competencia), Genética evolutiva y Filogenias
El uso de la Estadística es la moneda de cambio en la contrastación de hipótesis, generalmente verbalizadas (lo que se denomina “lenguaje natural”).
Sin embargo desde hace pocos años se está popularizando el uso de R (como herramienta de computación científica multipropósito). El uso de R abre nuevas y prometedoras vías de difusión de las matemáticas y la informática en Ecología y Biología de la Conservación. Ya que R no es un “programa estadístico al uso“, sino una potente herramienta de programación informática y cálculo numérico (además de estadístico).
R es un marco de trabajo ideal en el proceso de “democratización” de las matemáticas entre los zoólogos (tradicionalmente interesados sólo por la Estadística, para el análisis de datos).
Aunque las matemáticas son el lenguaje de la Ecología teórica, aún existe cierto rechazo por la comunidad de naturalistas, hacia áreas de la Matemática distintas de la Estadística. Esto genera una brecha nada deseable entre teoría y aplicaciones pŕacticas en gestión y conservación de la biodiversidad.
Abstract
Mathematics and Computer Science applied to Ecology and Zoology. Is R-Language an opportunity?
In systematic and ecological studies there is a intensive use of statistics. Which of course also occurs in animal studies. Ecology and Conservation Biology are disciplines based on hypothesis testing, but rarely there is an explicit mathematical models framework. Although the use of established theories in Ecology and Evolution is very common, being the most used:Metapopulations, Lotka-Volterra (predator prey and competition), Phylogeny and Evolutionary Genetics
The use of statistics is the currency in hypothesis testing generally spoken (what is called “natural language”). But a few years ago is being popularized the use of R (as a multipurpose scientific computing tool). The use of R is a promising framework for dissemination of mathematics and computer science in Ecology and Conservation Biology. Since R is not a exclusively “statistical software”, but a tool for computer programming and numerical calculation (besides statistical).
R is an ideal working environment in the process of “democratization” of mathematics among zoologists (traditionally interested only in the statistics for data analysis).
The rejection among naturalists to use mathematical models is not comparable with the explosive use of statistics. While Mathematics is the language of Theoretical Ecology, creating a gap between theory and applications.
In this brief review we show that the same work environment (based on R), can catalyze the application to conservation biology and ecology, not only statistics, unless other mathematical skills not so “traditionals”.
There are different fields of mathematics, that correctly focused and applied to problems can enrich hypothesis generation and deduction from established ecological theories.
Introducción
Con esta pequeña revisión, pretendemos mostrar, que el mismo entorno de trabajo, basado en el lenguaje R (Team, RDevelopment Core 2005), puede catalizar la aplicación en Ecología y Biología de la Conservación, de técnicas estadísticas y no estadísticas (poco “tradicionales” y menos usadas).
Entre estas técnicas no necesariamente estadísticas se encuentran los modelos ecológicos de dinámica poblacional (ecuaciones, sistemas y matrices, Soetaert et al. 2010) así como de Genética evolutiva y Filogenia (Paradis 2010 y 2011).
Existen diferentes campos de la Matemática, que correctamente enfocados y aplicados a problemas ecológicos enriquecen la generación de hipótesis y la deducción de las mismas a partir de teorías ecológicas establecidas (Begon, Townsend & Harper 2009) Así podemos encontrar un gran desarrollo matemático en teoría de metapoblaciones (Dolrenry 2014), interacciones basadas en Lotka-Volterra, tanto de predador-presa (Choo 2014) como de competencia (Casanovas et al. 2012 y Lozano et al. 2013) , así como epidemiología para enfermedades infecciosas o parasitarias (Muroya et al. 2013). También la moderna teoría evolutiva tiene un alto grado de formalización. (Hofbauer y Sigmund 2003)
A pesar de ello los investigadores no suelen retroalimentar dichas teorías con nuevos desarrollos, sino que existe un cuerpo de literatura verbalizada de cuya comprensión se deducen de un modo las hipótesis a contrastar con el uso de tomas de datos y estadística. (Martínez–Abraín, 2013) Aunque existe también una tendencia generalizada a tomar los datos antes de saber que hipótesis a priori va a ser contrastada (lo que evidentemente constituye una mala práctica Casanovas 1996).
En el escenario actual, en el que el lenguaje libre (GNU) R, está siendo generalizado en campos tradicionalmente poco formales. Nos encontramos con la oportunidad de introducir de un modo más natural conceptos como el de sistema de ecuaciones diferenciales, o el de programación informática. Y además R facilita el que en un mismo entorno de desarrollo, podamos combinar toda una serie de herramientas computacionales, más allá de la mera aplicación “recetaria” del uso de un paquete estadístico convencional (Salas 2008).
Afortunadamente y gracias a la popularización del Software Libre (no necesariamente en entorno Linux). R se está expandiendo gracias a su licencia GNU/GPL lo que conlleva libertad y gratuidad en el uso y distribución ilimitada de copias del software (Stallman 2004). Todo lo anteriormente expuesto a lo que conlleva es a que no se deba confundir R con un programa de Estadística, sino más bien de un lenguaje informático propiamente dicho, con un propósito específico en Estadística pero mucho más abierto que los programas comerciales que tradicionalmente se vienen utilizando desde hace pocas décadas (Salas 2008).
En este breve artículo no se pretende hacer un texto de Matemáticas o Informática , por lo que se omiten deliberadamente fórmulas y códigos informáticos (para lo que existe una abundante bibliografía). No se quiere complicar al lector con modelos ni algoritmos. Tampoco hacer un Manual más de R, al contrario se busca la curiosidad y el acercamiento a R como herramienta, con el fin último de “democratizar” la aplicación de las matemáticas a los estudios sobre animales y otros organismos (Casanovas 1996).
¿Porqué usar el Lenguaje R?
Al igual que el Sistema Operativo GNU/Linux, R está bajo licencia GNU/GPL, lo que quiere decir que no se paga por la copia, distribución y modificación, ni del lenguaje ni de los entornos de desarrollo más frecuentes (Kumar 2006). Actualmente hay mucha documentación, también libre, para aprender a aplicar R en diferentes ámbitos. Desde modelos basados en ecuaciones diferenciales, hasta complejos análisis multivariantes, pasando por sencillos test paramétricos y no paramétricos.
Se puede encontrar una buena introducción a los modelos predictivos aplicados a Mamíferos carnívoros en Casanovas (1996).
Sin embargo la gratuidad, no debe ser nunca el único motivo para utilizar R (aunque pueda ser suficiente). Al ser R un marco de trabajo abierto y colaborativo, cada usuario puede aportar libremente programas o materiales sin miedo a que la Licencia del software le prive de esa libertad. Eso por si sólo debería ser motivo para usarlo, ya que aunque R sea libre, no está restringida la venta de manuales o de cursos específicos (presenciales o no) sobre R. Como afirma Stallman (2004), no se debe confundir libertad con precio.
Habitualmente el científico está acostumbrado a que con la compra de un determinado programa de estadística comercial, el conjunto de análisis que este le permite hacer sea necesariamente limitado a una serie de comandos o menús. Eso no ocurre con R, ya que el investigador o estudiante puede acceder a los códigos de dichos análisis e incluso generar sus propios índices o test. También es muy útil R para que no haya usuarios, sino programadores, y la experiencia de R sea excitante y llena de retos.
La brecha entre la Teoría y los estudios de campo
La teoría ecológica está bien establecida, aunque es en gran parte ignorada en los detalles matemáticos, por los naturalistas. Esto se debe a razones comprensibles y prácticas, como que es muy difícil estimar parámetros con datos de campo y contrastar hipótesis obtenidas directamente de modelos teóricos (Casanovas 1996). Sin embargo cada vez es más frecuente encontrar modelos matemáticos de los que se deducen hipótesis contrastadas (Caut et al. 2007).
Normalmente los ecólogos teóricos (de formación matemática o física) hacen publicaciones en revistas especializadas de su campo, mientras los zoólogos leen estudios empíricos y suelen utilizar sus propias revistas.
Esto genera una brecha, poco o nada deseable, para el avance de la Zoología y Biología de la Conservación. Muchos animales por su condición de especies estrella, bandera y/o paraguas (Tellería 2012), son especialmente importantes en Biología de la Conservación ya que se trata de especies clave en la movilización social, o son bioindicadores (Tellería 2012). Por lo que su estudio riguroso y conectado con la Teoría ecológica y evolutiva, es muy necesario.
Por otro lado, las especies de animales se ven implicadas en numerosos problemas, que por su importancia, trascienden a la sociedad. Ya sea por motivos de ordenación del territorio (creación de infraestructuras), y/o de competencia por recursos naturales (daños a la ganadería, caza, pesca, explotaciones agrícolas etc.). El conocimiento de los animales y sus patrones de distribución y abundancia, deben conectarse urgentemente con las teorías de metapoblaciones y Lotka-Volterra (predador presa y competencia). También es muy importante la Genética cuantitativa (Falconer 1975) y Filogenias (para el cálculo de la consanguinidad, heredabilidad de caracteres relacionados con rasgos reproductivos y por tanto para el cálculo de poblaciones mínimas viables).
No se pretende decir aquí que esto no se esté haciendo ya, cosa que sería falsa. Pero si es cierto, que hay escasa conexión entre el cruce de las publicaciones en revistas teóricas y de Zoología o Ecología de campo.
R y las vertientes de sus aplicaciones
Es muy habitual entre los investigadores confundir la aplicación de Matemáticas en Zoología, con el uso exclusivo de la Estadística. Esto no ocurre en el caso de otros organismos que se pueden poner en condiciones experimentales, plantas o unicelulares (Gause 1932).
De hecho la mayor parte de la teoría antes comentada, ha sido contrastada con este segundo grupo de organismos y no con los animales (cuyas implicaciones prácticas ya han sido comentadas).
Esto debe ser remediado lo antes posible, considerando que existen otras herramientas Matemáticas distintas a la Estadística, muy necesarias para el estudio aplicado de los animales. Así, la dinámica de poblaciones se basa en Ecuaciones diferenciales o en diferencias finitas, y la obtención de índices requiere el uso de cálculos matriciales repetitivos y tediosos (que una vez programados reducen el riesgo de cometer errores de cálculo y optimizan la velocidad de los cálculos).
Es cierto que algunas de las funcionalidades de las hojas de cálculo son explotadas en este sentido, pero la estructura de algoritmo es explícita en R, y la potencia no tiene comparación. Siendo además también posible conectar R con bases de datos y hojas de cálculo.
ESTE ARTÍCULO ESTÁ DEDICADO A LA MEMORIA DEL BIÓLOGO ESPAÑOL D. PEDRO JOSÉ MARTÍNEZ DÍAZ (1972-2013).
BIBLIOGRAFÍA
Begon, M., Townsend, C. R., & Harper, J. L. (2009). Ecology: from individuals to ecosystems. John Wiley & Sons.
Casanovas J. G. (1996). Aplicación de modelos predictivos a la consrvación de carnívoros. Carnívoros, Evolución, Ecología y Conservación. SECEM
Casanovas, J. G., Barrull, J., Mate, I., Zorrilla, J. M., Ruiz-Olmo, J., Gosàlbez, J., & Salicrú, M. (2012). Shaping carnivore communities by predator control: competitor release revisited. Ecological research, 27(3), 603-614
Caut, S., Casanovas, J. G., Virgos, E., Lozano, J., Witmer, G. W., & Courchamp, F. (2007). Rats dying for mice: modelling the competitor release effect. Austral Ecology, 32(8), 858-868.
Choo, S. (2014). Global stability in n-dimensional discrete Lotka-Volterra predator-prey models. Advances in Difference Equations, 2014(1), 11.
Dolrenry, S., Stenglein, J., Hazzah, L., Lutz, R. S., & Frank, L. (2014). A Metapopulation Approach to African Lion (Panthera leo) Conservation. PloS one, 9(2), e88081.
Falconer, D. S. (1975). Introducción a la genética cuantitativa. Editorial continental.”Traductor: Fidel márquez sánchez 5.
Gause, G. F. (1932). Experimental studies on the struggle for existence I. Mixed population of two species of yeast. Journal of experimental biology, 9(4), 389-402.
Hofbauer, J., & Sigmund, K. (2003). Evolutionary game dynamics. Bulletin of the American Mathematical Society, 40(4), 479-519.
Kumar, S. (2006). Enforcing the Gnu GPL. U. Ill. JL Tech. & Pol’y, 1.
Lozano, J., Casanovas, J. G., Virgós, E., & Zorrilla, J. M. (2013). The competitor release effect applied to carnivore species: how red foxes can increase in numbers when persecuted. Anim Biodivers Conserv, 36(1), 37-46.
Martínez–Abraín, A. (2013). Why do ecologists aim to get positive results? Once again, negative results are necessary for better knowledge accumulation. Animal Biodiversity and Conservation, 36(1), 33-36.
Muroya, Y., Enatsu, Y., & Kuniya, T. (2013). Global stability of extended multi-group sir epidemic models with patches through migration and cross patch infection. Acta Mathematica Scientia, 33(2), 341-361.
Paradis, E. (2010). pegas: an R package for population genetics with an integrated–modular approach. Bioinformatics, 26(3), 419-420
Paradis, E. (2011). Analysis of Phylogenetics and Evolution with R. Springer.
Salas, C. (2008). ¿ Por qué comprar un programa estadístico si existe R?.Ecología austral, 18(2), 223-231.
Soetaert, K., Petzoldt, T., & Setzer, R. W. (2010). Solving differential equations in R: Package deSolve. Journal of Statistical Software, 33(9), 1-25.
Stallman, R. (2004). Software libre para una sociedad libre. Madrid: Traficantes de Sueños, 2004.
Team, R. C. (2005). R: A language and environment for statistical computing. R foundation for Statistical Computing.
Tellería, T. J. (2012). Introducción a la conservación de las especies. V. J. Hernández (Ed.). Tundra.
I’ve noticed articles on this subject before, but never really paid attention to any of them. What caught my eye on this one was the use of many ideas to form one very strong conclusion!