1 votos

¿cómo probar la variable más frecuente entre los grupos?

Tengo diferentes grupos de delfines, algunos con crías, otros sin ellas. Contaré cuántos tipos de vocalizaciones emitió cada grupo, y quiero averiguar si hay una diferencia estadística entre los grupos con y sin crías.

Mi conjunto de datos es algo así como

Group_number    Vocal1  Vocal2  Offspring
Gr01    5   3   0
Gr02    7   3   0
Gr03    4   4   0
Gr04    1   6   0
Gr05    7   9   0
Gr06    6   2   1
Gr07    2   4   1
Gr08    2   6   1
Gr09    9   7   1
Gr10    8   8   1

¿Tengo que hacer esto un tipo de vocalización a la vez (tengo algunas decenas de tipos)? ¿O puedo hacerlo todo en una sola ejecución (como una regresión lineal múltiple)? Alguien me dijo que hiciera un chi-cuadrado, pero no estoy seguro de cómo hacerlo, o si es apropiado. T-student, ANOVA, MANOVA, GLM, ¿cuáles son los pros y los contras de cada método, suponiendo que mis datos se distribuyen normalmente? ¿Y si no lo están? Lo siento si parece una pregunta tonta y vaga, pero tal vez alguien pueda indicarme un tutorial sencillo o algo así.

Gracias de antemano.

1voto

Gyongyeee Puntos 38

En primer lugar, sus datos no se distribuyen normalmente porque toman valores discretos. Pero, si hay suficiente rango en los datos, se puede decir que se aproxima a una distribución normal. Es una suposición que debes verificar.

La pregunta es vaga porque se trata de una pregunta de extracción de datos/análisis de datos, y muchos métodos le proporcionarán muchos resultados (similares pero diferentes). No hay pros/contras aquí, ya que todos comprueban cosas diferentes. Para los métodos que has mencionado, he aquí una breve descripción:

  1. Chi-cuadrado. Esto le dirá si hay una relación entre sus grupos. Supongo que la prueba será de crías frente a todas las vocalizaciones. Usted puede encontrar significación pero no estar seguro de dónde viene. Si encuentras una relación, tienes que profundizar para encontrar el origen. Evite tener grupos con pocas observaciones, de lo contrario esta prueba no será válida.
  2. Prueba T (Student), o prueba de equivalencia de medias. Se compara el valor medio de dos poblaciones, frente a la hipótesis alternativa de que no son iguales. Tendrá que probar cada vocalización individualmente.
  3. ANOVA. Usted está probando si la varianza se explica a través de diferentes factores (crías). Esto debe hacerse para cada variable diferente. La idea es observar la varianza de la variable continua dentro de cada clase $s_i$ y compararlo con la varianza total st. El coeficiente de correlación para una clase comparada con el total es entonces $\nu_i=s_i/s_t$ . Esta prueba también asume la normalidad.
  4. MANOVA. Se trata de comprobar si el factor cualitativo (descendencia) tiene un efecto sobre TODAS las demás variables. Es una generalización del ANOVA para múltiples variables, lo que parece apropiado para su estudio. Todavía tenemos el supuesto de normalidad.
  5. GLM. La modelización también puede mostrarle las relaciones en sus datos, pero necesita tener una variable de predicción definida de antemano. (¿Infancia?)

Otras ideas: Si lo que busca es ver cómo se relacionan sus vocalizaciones sólo con las crías, entonces intente quizás un análisis discriminante (supuesto de normalidad de nuevo) o una regresión logística (sin supuesto de normalidad).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X