matriz intermedia

ACP,. NMDS, CA. CCA, RDA. Clasificación. Agrupamiento de casos con propiedades en común. Se basa en índices de similitud. Análisis de Cluster ...
5MB Größe 15 Downloads 121 vistas
COMPARACIÓN DE COMUNIDADES ASOCIACIÓN DE ESPECIES. FUNCIONES DE SEMEJANZA. DENDROGRAMAS. Objetivos: Inferir la complejidad en comparaciones de comunidades biológicas Ordenar correctamente datos en matrices primarias y derivadas Aplicar índices de asociación de especies Relacionar la información de la comunidad con factores ambientales. Interpretar gráficos

Heterogeneidad de la vegetación

Vegetación: Describir la heterogeneidad espacial y temporal de la vegetación y entender cuáles son los factores determinantes

Un gradiente y una especie

Un gradiente y varias especies

¿Se diferencian las comunidades?

1. “Escuela organísmica" (Clements, 1916 y Tansley) superorganismo", “cuasiorganismo” con límites discretos organización cerrada.

¿Se diferencian las comunidades?

2. “Concepto individualista (Gleason & Whittaker) organización abierta.

Ecotono: zona de transición entre comunidades con reposición rápida de especies a lo largo del gradiente y presenta mayor diversidad

Anímese a definir Comunidad

La heterogeneidad de la vegetación

Clement

Gleason

Visión individualista (Gleason)

Enfoque organísmico (Clement)

La comunidad como agregado de organismos. Sps conviven en un mismo lugar y momento. Sin cohesión, independientes entre sí

La comunidad como un superorganismo. Sistema viviente distintivo con su propia organización y estructura, relaciones, desarrollo y función. Sistema coordinado y autorregulado.

Entidades distintivas, reconocibles. Asociaciones en sistemas jerárquicos Límites- Stands (ecotono)

especies distribuidas independientemente en gradientes ambientales. Continuo Intergradación- gradientes

Muestreos en áreas homogéneas

Muestreo en áreas heterogéneas

Escuela fitosociológica (BraunBlanquet)

Escuela del continuum (CurtisWhittaker)

Clasificación

Ordenamiento

¿Qué factores o condiciones tendrías en cuenta al momento de definir una comunidad? ¿Cuáles y porqué?

Clasificación

Ordenamiento

Agrupamiento de casos con propiedades en común. Se basa en índices de similitud.

Disposición de casos a lo largo de ejes de variación contínua. Estudia los gradientes ambientales. ACP, NMDS, CA. CCA, RDA

Análisis de Cluster

estructura de la comunidad. Gradiente ambiental Matriz de datos En filas se encuentran los objetos que se ordenarán y en columnas las variables (especies) sobre las que se ordenarán los objetos.

Especies en espacio dimensional

ordenación

estructura de la comunidad Matriz de datos No es lo mismo ordenar muestras (sitios) que ordenar especies. Depende de posición de filas y columnas. Si se gira 90° la matriz siguiente, todo cambia y lo que se ordenan son las especies en función de las muestras.

Espacio muestral dimensional

Ordenación

Estadística Multivariada

• Todos los problemas multivariados pueden ser representados por una

matriz de datos de doble entrada en la cual las filas representan los objetos a ordenar o agrupar y las columnas representan las variables en base a las cuales se ordenó o agruparon los objetos. • Todos los problemas multivariados pueden ser geométricamente

conceptualizados como una nube de datos en un espacio P dimensional, donde las dimensiones (o ejes) son definidos por las p variables de interés donde se grafican las unidades de interés.

Calidad de ribera, arroyo Tafí y Las Cañadas

Matríz básica de datos de arroyo Las Cañitas y subcuenca arroyo Tafí Matriz (N X M) N = filas = sitios M= columnas = variables = especies Celda = dato cualitativo = 0 (ausencia); 1(presencia) sitio

Acacia macracant

Allophylus ed

Acacia praecox Griseb.

Anadenanther a colub

… …

…… …

…… …

…… …… ..

… … ….

……..

Celtis iguan

JMRO

0

0

0

0

0

0

0

0

0

0

0

MAT

0

0

0

0

1

0

0

0

0

0

0

EFCI

1

0

0

0

0

1

0

1

0

0

0

VILL

1

1

0

0

0

0

0

1

0

0

1

TOME

0

0

0

1

0

0

0

1

0

1

1

SAUC

1

1

1

0

0

0

0

1

0

1

1

TONU

1

0

1

0

0

0

1

1

0

1

1

CORZ

1

1

1

0

0

0

1

1

1

1

1

CITR

0

0

0

0

1

1

0

0

0

0

0

GACI

0

0

1

1

1

1

0

0

0

0

1

ATUS

1

0

0

0

0

1

0

0

0

0

0

VCOL

1

0

1

0

0

1

0

0

0

1

0

CEDR

1

0

1

0

0

0

1

1

0

1

1

LAUR

0

0

1

0

0

0

0

1

0

0

1

FAG

0

0

0

0

0

0

0

1

0

1

1

Técnicas de clasificación o clustering Agrupan a los sitios que comparten gran parte de las especies, en clases a las que denominan tipos de comunidad.

•Se puede organizar 6 entidades de muestreo en clases discretas, tal que la similitud dentro del grupo sea maximizada y la similitud entre grupos sea minimizada (maximizar la disimilitud) de acuerdo algún criterio.

Los métodos de clasificación o agrupamiento permiten el reconocimiento de tipos de comunidades como abstracción a partir de la matriz original de muestra (especies X muestras) o (muestras x especies).

Resultado finales un gráfico tipo árbol denominado dendrograma donde las entidades que están en filas de matriz se agrupan según las similitudes en las variables ubicadas en columnas.

Análisis de agrupamiento: el conjunto de datos Cjto único de variables sin distinción entre variables independientes y dependientes. Variables contínuas, categóricas o de conteos usualmente en la misma escala. Cada entidad de muestra (fila) debe ser medida sobre el mismo cjto de variables.

Puede haber menos muestras (filas) que la cantidad de variables (columnas) (matriz no tiene rango total).

Análisis de cluster: el conjunto de datos Datos ecológicos en dos vías:  variables ambientales por sitios  nichos por especie  características ambientales por especie  características por especímenes por muestras de especies.

Un buen método de clasificación o clustering debería identificar agrupamientos que tengan entre sí:

-Alta similitud intraclase, dentro de un grupo de especies o sitios. -Baja similitud interclase, entre grupos de especies o sitios.

Las clasificaciones buscan agrupar sitios con mayor similitud de especies o viceversa. La calidad del método de clustering depende de la medida de similitud

La forma de representación de un cluster puede afectar el resultado.

Procedimiento general para un método de clasificación Entrada= matriz de datos originales Estandarización o no según tipo de datos

Salida=Gráfico : dendrograma

Índices de similitud

Tipo de ligamiento

Clasificación jerárquica Indices de similitud Datos cualitativos

Datos cuantitativos

apareamiento simple (simple matching) Jaccard Roggers y Tanimoto Sorensen Sokal y Sneath Índice de información

Bray Curtis Canberra Czekanowski Distancia ecuclidea Distancia euclidea cuadrada Distancia Blok o manhatan Morisita Coeficiente de correlación

Indices de similitud, datos cualitativos . Presencia de especies Tabla de contingencia sitio 1

Sitio 2

Presente s

Ausentes

Presentes

a

b

Ausentes

c

d

Jaccard

IS = a / (a+b+c) Sorensen IS = 2a/(2a + b + c)

Se basa en especies que comparten entre dos sitios

No contempla ausencias conjuntas, datos binarios .Da igual peso a una especie común que a una rara.

Enfatiza coincidencias

Índices de similitud - datos cuantitativos Distancia euclidiana Coeficiente de correlación

Matriz de similitud triangular intermedia según índice de Jaccard (matriz intermedia) = fila X fila (sitio X sitio) JMRO

CITR

0

0.57

0.64

0.81

0.85

0.87

0.92

0.88

0.83

0.38

0.56

0.86

0.62

0.93

0.91

0.89

CITR

0.57

0

0.78

0.8

0.84

0.92

0.93

0.89

0.84

0.45

0.68

0.88

0.58

0.92

0.87

0.88

GACI

0.64

0.78

0

0.7

0.69

0.78

0.78

0.78

0.76

0.69

0.75

0.75

0.76

0.76

0.74

0.81

ATUS

0.81

0.8

0.7

0

0.68

0.8

0.77

0.74

0.85

0.85

0.67

0.74

0.85

0.69

0.73

0.8

0.85

0.84

0.69

0.68

0

0.7

0.72

0.82

0.74

0.86

0.79

0.76

0.88

0.71

0.65

0.73

0.87

0.92

0.78

0.8

0.7

0

0.55

0.5

0.53

0.84

0.79

0.69

0.76

0.64

0.46

0.53

0.92

0.93

0.78

0.77

0.72

0.55

0

0.62

0.6

0.86

0.86

0.75

0.76

0.5

0.41

0.45

0.88

0.89

0.78

0.74

0.82

0.5

0.62

0

0.59

0.85

0.79

0.72

0.69

0.55

0.64

0.54

0.83

0.84

0.76

0.85

0.74

0.53

0.6

0.59

0

0.78

0.8

0.74

0.78

0.53

0.54

0.53

0.38

0.45

0.69

0.85

0.86

0.84

0.86

0.85

0.78

0

0.66

0.86

0.45

0.86

0.81

0.76

0.56

0.68

0.75

0.67

0.79

0.79

0.86

0.79

0.8

0.66

0

0.79

0.58

0.8

0.83

0.81

0.86

0.88

0.75

0.74

0.76

0.69

0.75

0.72

0.74

0.86

0.79

0

0.73

0.7

0.67

0.69

0.62

0.58

0.76

0.85

0.88

0.76

0.76

0.69

0.78

0.45

0.58

0.73

0

0.78

0.75

0.7

0.93

0.92

0.76

0.69

0.71

0.64

0.5

0.55

0.53

0.86

0.8

0.7

0.78

0

0.5

0.39

TONU

0.91

0.87

0.74

0.73

0.65

0.46

0.41

0.64

0.54

0.81

0.83

0.67

0.75

0.5

0

0.36

CORZ

0.89

0.88

0.81

0.8

0.73

0.53

0.45

0.54

0.53

0.76

0.81

0.69

0.7

0.39

0.36

0

JMRO

TOME

SAUC

TONU

CORZ

A partir de matriz intermedia (basada en medida de similitud) se utiliza un método de ligamiento para llegar a construir en dendrograma. Ejemplo inferior con ligamiento tipo simple ( o vecino más cercano, empezando por dos entidades con mayor similitud se unen para formar un primer núcleo.

Dendrograma. Especies agrupadas según los sitios

Diferentes criterios de corte

grupo

Subgrupo

núcleo

Resultados de estudio de calidad de Ribera. Uso del Programa Infostat Dendrograma

n Estudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estudiantil

Encadenamiento Simple (Single linkage) Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Distancia: (Jaccard (1-S)) Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

n Estudiantil

n Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil VILL Versión Estudiantil TOME Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil SACÑ n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil FAG Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil LAUR n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil SAUC Versión Estudiantil CORZ Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil TONU n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil CEDR Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil VCOL n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil EFCI ATUS Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil GACI n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil MAT Versión Estudiantil CITR Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil JMR Versión Estudiantil

n Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil 0.00 0.18 0.36 0.53 0.71 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estudiantil

Versión Estudiantil

Ver

Versión Estud

(AverageVersión linkage) Versión Estudiantil Promedio Versión Estudiantil Estudiantil Ver Distancia: (Jaccard (1-S)) Versión Estud Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil

El corte en el dendrogramaVersión para Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver TOME establecer la cantidad de Versión Estudiantil VILL Versión Estudiantil Versión Estudiantil Versión Estud grupos es subjetivo. Lo FAG Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver establece el investigador. SACÑ Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estud En este caso, se podrían SAUC Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver diferenciar dos grupos: LAUR Versión Estudiantil CORZ Versión Estudiantil Versión Estudiantil Versión Estud Mat, CITR y JMR (sitios TONU altamente contaminados) Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver CEDR del resto de sitios. Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estud

EFCI Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver Puede haber Versión coeficiente de ATUS VCOL Versión Estudiantil Versión Estudiantil Versión Estud correlación cofenético Versión Estudiantil GACI (mide cuantoVersión el modelo Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver MAT propuesto se asemeja aVersión la Estudiantil CITR Versión Estudiantil Versión Estudiantil Versión Estud base datos original. Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver JMR Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estud 0.00 0.21 0.43 0.64 0.85 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Ver Versión Estudiantil

Versión Estudiantil

Versión Estudiantil corte Versión Estud

Análisis de agrupamiento. Cluster

�Agrupa

a los censos similares en cuanto a las especies que aparecen en ellos. �Estos grupos se suelen denominar tipos de comunidad(o comunidades). �La técnica permite reconocer tipos de comunidades como abstracción a partir de la matriz original de muestreos por especie. �Los grupos florísticos serían aquellos conjuntos de especies que coinciden en su presencia y/o abundancia en el conjunto de los muestreos.

Técnicas de ordenamiento para análisis de gradientes Ordenan los muestreos en relación a unas pocas y nuevas variables (ejes o dimensiones), que son combinaciones de las variables originales. Se buscan las variables que más discriminen o separen los grupos, que posean “mayor peso”.

Análisis directo de gradiente En gral, se analiza si hay asociación entre una matriz de sitios X especies con una matriz de sitios X factores ambientales: ACC, RDA.

Análisis indirecto de gradiente Los gradientes ambientales no son estudiados directamente sino que se infieren a partir de la identificación de gradientes de variación en la composición de la vegetación o fauna, matriz sitiosXespecies: ACP, AC, NMDS

Ordenamiento Los métodos de ordenación son parte del análisis de gradientes. Estas técnicas son un grupo de métodos para la exploración y reducción de los datos, a partir de lo cual se pueden generar hipótesis. Las entidades de muestreo ( especies, sitios, observaciones colocadas en las filas de una matriz de datos) se organizan u ordenan a lo largo de gradientes ecológicos continuos. Los métodos son esencialmente descriptivos y permite formular ideas sobre la estructura de las comunidades vegetales, y las • posibles relaciones causales entre la variación de la vegetación o fauna y su ambiente.

Métodos de ordenamiento. Matriz original de datos

Método ordenamiento de gradiente indirecto • Datos ecológicos en dos vías (filas X columnas):

 sitios por especie.  nicho por especie. Características ambientales por especie  Características de especímenes de especies por especie.

Gradiente ambiental - Ordenamiento de muestras

Salida: gráfico de biplot

X1 = cobertura canopy, X2 = densidad; X3 = altura del canopy. PC1= está más representado por X1 y X2 (variables con más peso) PC2= está más representado por X3 (variable con más peso). PC2 vs PC1 se conoce como gráfico biplot

El análisis de Componentes principales de tablas florísticas (presencia-ausencia) como herramienta para análisis de gradientes ambientales. Un estudio de caso en la quebrada de Vaquerías (Valle Hermoso, Córdoba). Montaña, C. Ezcurra E., 1991. Ecología Austral 1:56-69.

Los dos primeros ejes sintetizan más la estructura de datos (explican la mayor variabilidad, por lo menos un 50 o 60%). Debe luego observarse cual variable (especie, o sitio) tiene “más peso” para explicar cada eje . Similar a un coeficiente o pendiente en una regresión lineal.

¿Cuántas comunidades quedarían representadas?

Esquema conceptual

Heterogeneidad de vegetación

Gradiente ambiental

Según Clement

Áreas

(Superorganismo)

homogéneas

Límites, ecotono

Agrupamiento (clasificación) Cluster

Comunidad Según Gleason (individualismo)

Áreas heterogéneas

Gradiente ambiental

Ordenamiento ACP

Matriz básica de datos (N X M) N=filas, unidades a ordenar o clasificar M= columnas, variables Clasificación

Ordenamiento

Alta similitud dentro de grupo y baja similitud entre grupos.

maximizar la diferenciación (ausencia de correlación) entre entidades a ordenar.

Matriz intermedia Índices de similitud Datos cualitativos

Matriz intermedia de distancias

Datos cuantitativos

Métodos de ligamiento Gráfico: Dendrograma

Gráfico: Biplot

Bibiliografía •Manly B. Multivariate Statistical Methods. 1995. Chapman & Hall Matteuci S. y Colma A. 1982. Metodología para el estudio de la vegetación. Serie monográfica N° 22. Secretaría Gral de la Organización de los Estados Americanos. Programa Regional de Des. Cient. Y Tecnol. •Montaña, C. Ezcurra E., 1991. El análisis de Componentes principales de tablas florísticas de presencia-ausencia como herramienta para análisis de gradientes ambientales. Un estudio de caso en la quebrada de Vaquerías (Valle Hermoso, Córdoba). Ecología Austral 1:56-69.

Actividades prácticas 1) Mediante el uso de la planilla en excel de un matriz especies X sitios, en el archivo ¨planilla de yungas argentinas.xls¨, realice un dendrograma en el programa infostat. 2) Para la elaboración final de dendrograma, tenga en cuenta el agrupamiento de sitios y agrupamiento de especies, detecte diferencias con uso de distintos ligamientos. 3) Concluya.