Distancia

Índices de similitud cuantitativos. Distancia euclidiana .... Expresión geométrica del coeficiente de correlación. Especie. Coseno=correlación=distancia.
5MB Größe 15 Downloads 187 vistas
COMPARACIÓN DE COMUNIDADES ASOCIACIÓN DE ESPECIES. FUNCIONES DE SEMEJANZA. DENDROGRAMAS. Objetivos: Inferir la complejidad en comparaciones de comunidades biológicas Aprender a ordenar datos en matrices primarias y derivadas Aplicar índices de asociación de especies Relacionar la información de la comunidad con factores ambientales. Interpretar gráficos

Heterogeneidad de la vegetación

Vegetación: Describir la heterogeneidad espacial y temporal de la vegetación y entender cuáles son los factores determinantes

Un gradiente y una especie

Un gradiente y varias especies

¿Se diferencian las comunidades?

1. “Escuela organísmica" (Clements, 1916 y Tansley) superorganismo", “cuasiorganismo” con límites discretos organización cerrada.

¿Se diferencian las comunidades?

2. “Concepto individualista (Gleason & Whittaker) organización abierta.

Ecotono: zona de transición entre comunidades con reposición rápida de especies a lo largo del gradiente

La heterogeneidad de la vegetación

Clement

Gleason

Visión individualista (Gleason)

Enfoque organísmico (Clement)

La comunidad como agregado de organismos. Sps conviven en un mismo lugar y momento. Sin cohesión, independientes entre sí

La comunidad como un superorganismo.Sistema viviente distintivo con su propia organización y estructura, relaciones, desarrollo y función. Sistema coordinado y autorregulado.

Entidades distintivas, reconocibles. Asociaciones en sistemas jerárquicos

Límites- Stands

especies distribuidas independientemente en gradientes ambientales. Continuo

Intergradación- gradientes

Muestreos en áreas homogéneas

Muestreo en áreas heterogéneas

Escuela fitosociológica (BraunBlanquet)

Escuela del continuum (CurtisWhittaker)

Clasificación

Ordenamiento

Clasificación

Ordenamiento

Agrupamiento de casos con propiedades en común. Se basa en índices de similitud.

Disposición de casos a lo largo de ejes de variación contínua. Estudia los gradientes ambientales

Calidad de ribera, arroyo Tafí y Las Cañadas

Análisis multivariados: gradiente ambiental Matriz de datos Datos en espacio dimensional

Ordenación

Análisis multivariados: gradiente ambiental Matriz de datos

Datos en espacio dimensional

Análisis de cluster

Ejemplo 2: estructura de la comunidad Matriz de datos

ordenación

Especies en espacio dimensional

estructura de la comunidad Matriz de datos Especies en espacio dimensional

Análisis de cluster

estructura de la comunidad Matriz de datos

Ordenación

Espacio muestral dimensional

Matriz de datos

Espacio de los datos en una dimensión

Estadística Multivariada • La estadística multivariada involucra un cjto de variables que se

consideran dependientes sobre factores desconocidos pero subyacentes.

• Todos los problemas multivariados pueden ser representados por una

matriz de datos de doble entrada en la cual las filas representan las entidades de muestreo y las columnas representan las variables

• Todos los problemas multivariados pueden ser geométricamente

conceptualizados como una nube de datos en un espacio P dimensional, donde las dimensiones (o ejes) son definidos por las p variables de interés donde se grafican las unidades de interés.

Matríz básica de datos de arroyo Las Cañitas y subcuenca arroyo Tafí

sitios/es pecies

Acacia macracant ha Humb. & Bonpl. ex Willd.

Allophylus ed

Anadenant hera colub

……

………

………

…………..

……….

……..

Celtis iguan

Acacia praecox Griseb.

JMRO

0

0

0

0

0

0

0

0

0

0

0

MAT

0

0

0

0

1

0

0

0

0

0

0

EFCI

1

0

0

0

0

1

0

1

0

0

0

VILL

1

1

0

0

0

0

0

1

0

0

1

TOME

0

0

0

1

0

0

0

1

0

1

1

SAUC

1

1

1

0

0

0

0

1

0

1

1

TONU

1

0

1

0

0

0

1

1

0

1

1

CORZ

1

1

1

0

0

0

1

1

1

1

1

CITR

0

0

0

0

1

1

0

0

0

0

0

GACI

0

0

1

1

1

1

0

0

0

0

1

ATUS

1

0

0

0

0

1

0

0

0

0

0

VCOL

1

0

1

0

0

1

0

0

0

1

0

CEDR

1

0

1

0

0

0

1

1

0

1

1

LAUR

0

0

1

0

0

0

0

1

0

0

1

FAG

0

0

0

0

0

0

0

1

0

1

1

SACÑ

1

0

1

0

0

0

0

1

0

0

1

Técnicas de clasificación o clustering Agrupan a los sitios que comparten gran parte de las especies, en clases a las que denominan tipos de comunidad. •Se puede organizar 6 entidades de muestreo en clases discretas, tal que la similitud dentro del grupo sea maximizada y la similitud entre grupos sea minimizada (maximizar la disimilitud) de acuerdo algún criterio.

Los métodos de clasificación permiten el reconocimiento de tipos de comunidades como abstracción a partir de la matriz original de muestreos por especie.

Análisis de cluster: el conjunto de datos Cjto único de variables sin distinción entre variables independientes y dependientes. Variables contínuas, categóricas o de conteos usualmente en la misma escala. Cada entidad de muestra debe ser medida sobre el mismo cjto de variables.

Puede haber menos muestras (filas) que la cantidad de variables (columnas) (matriz no tiene rango total).

Análisis de cluster: el conjunto de datos

Datos ecológicos en dos vías: ¾ variables ambientales por sitios ¾ nichos por especie ¾ características ambientales por especie ¾ características por especímenes por muestras de especies.

Un buen método de clasificación o clustering debería identificar agrupamientos que tengan entre sí:

-Alta similaridad intraclase, dentro de un grupo de especies o sitios. -Baja similaridad interclase, entre grupos de especies o sitios.

Las clasificaciones buscan agrupar sitios con mayor similitud de especies La calidad del método de clustering depende de la medida de similitud

La forma de representación de un claster puede afectar el resultado.

Clasificación jerárquica Indices de similitud Datos cualitativos

Datos cuantitativos

apareamiento simple (simple matching) Jaccard Roggers y Tanimoto Sorensen Sokal y Sneath Índice de información

Bray Curtis Canberra Czekanowski Distancia ecuclidea Distancia euclidea cuadrada Distancia Blok o manhatan Morisita Coeficiente de correlación

Indices de similitud, datos cualitativos Tabla de contingencia Censo A Presentes Ausentes Censo B

Presentes Ausentes

Jaccard

IS = a / (a+b+c) Sorensen IS = 2a/(2a + b + c)

a c

b d

No contempla ausencias conjuntas, datos binarios.Da igual peso a una especie común que a una rara.

Enfatiza coincidencias

Índices de similitud cuantitativos Distancia euclidiana Coeficiente de correlación

Matriz de similitud según índice de Jaccard, la matríz formada es de los sitios. JMR O

TOM E

CITR

SAU C

TON U

COR Z

0

0.57

0.64

0.81

0.85

0.87

0.92

0.88

0.83

0.38

0.56

0.86

0.62

0.93

0.91

0.89

CITR

0.57

0

0.78

0.8

0.84

0.92

0.93

0.89

0.84

0.45

0.68

0.88

0.58

0.92

0.87

0.88

GACI

0.64

0.78

0

0.7

0.69

0.78

0.78

0.78

0.76

0.69

0.75

0.75

0.76

0.76

0.74

0.81

ATUS

0.81

0.8

0.7

0

0.68

0.8

0.77

0.74

0.85

0.85

0.67

0.74

0.85

0.69

0.73

0.8

0.85

0.84

0.69

0.68

0

0.7

0.72

0.82

0.74

0.86

0.79

0.76

0.88

0.71

0.65

0.73

0.87

0.92

0.78

0.8

0.7

0

0.55

0.5

0.53

0.84

0.79

0.69

0.76

0.64

0.46

0.53

0.92

0.93

0.78

0.77

0.72

0.55

0

0.62

0.6

0.86

0.86

0.75

0.76

0.5

0.41

0.45

0.88

0.89

0.78

0.74

0.82

0.5

0.62

0

0.59

0.85

0.79

0.72

0.69

0.55

0.64

0.54

0.83

0.84

0.76

0.85

0.74

0.53

0.6

0.59

0

0.78

0.8

0.74

0.78

0.53

0.54

0.53

0.38

0.45

0.69

0.85

0.86

0.84

0.86

0.85

0.78

0

0.66

0.86

0.45

0.86

0.81

0.76

0.56

0.68

0.75

0.67

0.79

0.79

0.86

0.79

0.8

0.66

0

0.79

0.58

0.8

0.83

0.81

0.86

0.88

0.75

0.74

0.76

0.69

0.75

0.72

0.74

0.86

0.79

0

0.73

0.7

0.67

0.69

0.62

0.58

0.76

0.85

0.88

0.76

0.76

0.69

0.78

0.45

0.58

0.73

0

0.78

0.75

0.7

0.93

0.92

0.76

0.69

0.71

0.64

0.5

0.55

0.53

0.86

0.8

0.7

0.78

0

0.5

0.39

TONU

0.91

0.87

0.74

0.73

0.65

0.46

0.41

0.64

0.54

0.81

0.83

0.67

0.75

0.5

0

0.36

CORZ

0.89

0.88

0.81

0.8

0.73

0.53

0.45

0.54

0.53

0.76

0.81

0.69

0.7

0.39

0.36

0

JMRO

Procedimiento general para un método de clasificación

estandarización

similitud

ligamiento

grupo

Subgrupo

núcleo

Resultados de estudio de calidad de Ribera. Uso del Programa Infostat tudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estud

Encadenamiento Simple (Single linkage) Ver Versión Estudiantil Versión Estudiantil Versión Estudiantil Distancia: (Jaccard (1-S)) Versión Estud tudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver VILL TOME Versión Estudiantil Versión Estudiantil Versión Estud tudiantil SACÑ Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver FAG tudiantil Versión Estudiantil Versión Estudiantil Versión Estud LAUR Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver SAUC CORZ Versión Estudiantil Versión Estudiantil Versión Estud tudiantil TONU Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver CEDR tudiantil VCOL Versión Estudiantil Versión Estudiantil Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver EFCI ATUS Versión Estudiantil Versión Estudiantil Versión Estud tudiantil GACI Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver MAT tudiantil CITR Versión Estudiantil Versión Estudiantil Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver JMR tudiantil

Versión Estudiantil Versión Estudiantil Versión Estud 0.00 0.18 0.36 0.53 0.71 Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver di

il



di

il



di

il



d

tudiantil

El corte en el dendrograma para establecer la cantidad de grupos es subjetivo. Lo establece el investigador. En este caso, se podrían diferenciar dos grupos: Mat, CITR y JMR (sitios altamente contaminados) del resto de sitios.

Versión Estudiantil

Versión Estudiantil

Versión Estud

(AverageVersión linkage) Versión Estudiantil Promedio Versión Estudiantil Estudiantil Ver Distancia: (Jaccard (1-S)) Versión Estud tudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver TOME VILL Versión Estudiantil Versión Estudiantil Versión Estud tudiantil FAG Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver SACÑ tudiantil Versión Estudiantil Versión Estudiantil Versión Estud SAUC Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver LAUR CORZ Versión Estudiantil Versión Estudiantil Versión Estud tudiantil TONU Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver CEDR tudiantil EFCI Versión Estudiantil Versión Estudiantil Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver ATUS VCOL Versión Estudiantil Versión Estudiantil Versión Estud tudiantil GACI Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver MAT tudiantil CITR Versión Estudiantil Versión Estudiantil Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver JMR tudiantil

Versión Estudiantil Versión Estudiantil Versión Estud 0.00 0.21 0.43 0.64 0.85 Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver di

il



di

il



di

il corte ió

d

Análisis de agrupamiento. Cláster

Agrupa a los censos similares en cuanto a las especies que aparecen en ellos. Estos grupos se suelen denominar tipos de comunidad(o comunidades). La técnica permite reconocer tipos de comunidades como abstracción a partir de la matriz original de muestreos por especie. Los grupos florísticos serían aquellos conjuntos de especies que coinciden en su presencia y/o abundancia en el conjunto de los muestreos.

Técnicas de ordenamiento para análisis de gradientes Ordenan los muestreos en relación a unas pocas variables, que son combinaciones de las variables originales. Se buscan las variables que más discriminen o separen los grupos (más peso) condensando una gran cantidad de variables en unas pocas variables en nuevos ejes o dimensiones.

Análisis directo de gradiente Los censos son ordenados a lo largo de uno o más gradientes de factores ambientales que se miden: ACC

Análisis indirecto de gradiente Los gradientes ambientales no son estudiados directamente sino que se infieren a partir de la identificación de gradientes de variación en la composición de la vegetación: ACP, AC, NMDS

Ordenamiento Los métodos de ordenación son parte del análisis de gradientes. Estas técnicas son un grupo de métodos para la exploración y reducción de los datos, a partir de lo cual se pueden generar hipótesis.

Las entidades de muestreo (por ej, especies, sitios, observaciones) se organizan a lo largo de gradientes ecológicos continuos.

Los métodos son esencialmente descriptivos y permite formular ideas sobre la estructura de las comunidades vegetales, y las • posibles relaciones causales entre la variación de la vegetación o fauna y su ambiente.

Métodos de ordenamiento. Matriz original de datos

ACP: La matriz de datos

• Datos ecológicos en dos vías:

¾ sitios por especie. ¾ nicho por especie. ¾Características ambientales por especie ¾ Características de especímenes de especies por especie.

Muchos análisis multivariados de ordenamiento requieren cumplir supuestos • Supuesto de

Normalidad multivariada

Ordenamiento en muestras

Medida de asociación entre muestras

Expresión geométrica del coeficiente de correlación Especie Coseno=correlación=distancia

Al ser correlación cero implica que dos ejes perpendiculares entre sí son independientes y esos ejes separan más los grupos

La extracción de los ejes o componentes debe ser de tal manera que maximice la no correlación entre sitios, para separarlos o discriminarlos (x eso ejes perpendiculares).

Matriz de datos y matriz de distancias

El análisis de Componentes principales de tablas florísticas de presencia-ausencia como herramienta para análisis de gradientes ambientales. Un estudio de caso en la quebrada de Vaquerías (Valle Hermoso, Córdoba). Montaña, C. Ezcurra E., 1991. Ecología Austral 1:56-69.

Continuación trabajo anterior

Los dos primeros ejes sintetizan más la estructura de datos (explican la mayor variabilidad, por lo menos un 50 o 60%). Debe luego observarse cual variable (especie, o sitio) tiene “más peso” para explicar cada eje . Similar a un coeficiente o pendiente en una regresión lineal.

Análisis de componentes principales

Ordena los conteos a lo largo de un eje en cuanto a las especies que aparecen en ellos La técnica permite realizar un análisis indirecto de gradiente. El gradiente ambiental se infiere al identificar la variación en la presencia y/o abundancia de las especies. El gradiente estaría asociado a variaciones espaciales en factores ambientales

Otro método de ordenamiento

MDS:multidimensional Scaling

El objeto: detectar dimensiones significativas que permitan explicar similitudes o desigualdades observadas (distancias) entre los objetos investigados, en este caso, los sitios trabajados.

Matriz de datos

Matriz de similitud

Correlación de Pearson

Método de ordenamiento

Distancia Bray Curtis

Variables ambientales medidas en cada sitio de trabajo de calidad de Ribera

sitio

ALT

TRAM

E

% sps EXóticas

I

% sps arbóre as

N sps

JMR

635

3.00

11.57

1.00

4.00

4.00

4.00

11.46

1.60

71.43

57.14

7

CITR

697

3.00

7.70

1.00

3.00

2.00

3.00

19.22

3.28

50.00

0.00

4

GAC

714

3.00

EFCI

733

3.00

VILL

746

2.00

10.00

TOME

761

2.00

12.00

688

3.00

11.00

751

2.00

26.50

769

3.00

16.01

863

1.00

6.00

814

2.00

35.50

832

2.00

10.00

855

1.00

100.00

872

1.00

100.00

10

886

1.00

100.00

12

929

1.00

100.00

15

CORZ

Ordenamiento de los sitios de estudio en dos ríos de la zona montañosa de San Javier según variables ambientales (método multivariado NMDS)

Tabla IV.4. Valores de correlación de Spearman y significancia de los ejes extraídos del ordenamiento multidimensional scaling (NMDS1, NMDS2) y las variables exógenas y endógenas (ns:no significativa; * valores de correlación >0,05) Variable

NMDS1

NMDS2

Altitud Tipo de Tramo Distancia más cercana Ganadería Sólidos urbanos Extracción áridos Construcciones en el lecho fluvial Ancho del cauce Bankfull Riqueza específica % especies exóticas % especies arbóreas

0.99* -0.87* 0.62* 0.22 ns -0.81* -0.55* -0.49 ns -0.07ns -0.19ns 0.81* -0.86* -0.22ns

0.07ns -0.18ns 0.22ns -0.11ns -0.02ns 0.07ns 0.04ns 0.22ns -0.02ns -0.11ns -0.05ns -0.86*

Bibiliografía •Manly B. Multivariate Statistical Methods. 1995. Chapman & Hall •Matteuci S. y Colma A. 1982. Metodología para el estudio de la vegetación. Serie monográfica N° 22. Secretaría Gral de la Organización de los Estados Americanos. Programa Regional de Des. Cient. Y Tecnol. •Montaña, C. Ezcurra E., 1991. El análisis de Componentes principales de tablas florísticas de presencia-ausencia como herramienta para análisis de gradientes ambientales. Un estudio de caso en la quebrada de Vaquerías (Valle Hermoso, Córdoba). Ecología Austral 1:56-69.