1 votos

Diferencias estadísticas entre datos longitudinales y transversales

Me gustaría iniciar un debate de seguimiento de una pregunta existente sobre la validación cruzada: Diferencia entre el diseño longitudinal y las series temporales .

La mayoría de las respuestas tienden a hacer distinciones entre los conjuntos de datos en sí mismos y no entre el análisis o el modelado realizado con los datos. ¿Hay distinciones entre el tratamiento de los datos, y no los datos en sí?

Por ejemplo, ¿hay alguna diferencia en los métodos inferenciales utilizados en los datos transversales y longitudinales, o la única diferencia entre ambos es la interpretación de los resultados y la verborrea que se utiliza para describir el estudio?

1voto

Sean Hanley Puntos 2428

El nombres se aplican en gran medida en función de las características estructurales del conjunto de datos. Citando a @JeromyAnglim respuesta allí:

Si pensamos en diseños formados por $n$ casos medidos en $k$ ocasiones, entonces la siguiente definición suelta me parece descriptiva de la distinción:

  • diseños longitudinales: alto $n$ , baja $k$
  • serie temporal: baja $n$ , alto $k$

A estas dos posibilidades, podemos añadir sección transversal conjuntos de datos. Sólo tienen una ocasión de medición por caso (es decir, $k=1$ pero $N>1$ y espero que sea razonablemente grande).


Sin embargo, no cabe duda de que debemos tener en cuenta esas características al analizar los datos, independientemente de cómo los llamemos. El aspecto clave desde el punto de vista estadístico es que los datos longitudinales/de series temporales no son independientes, mientras que los datos transversales pueden serlo. Si no se tiene en cuenta la no independencia existente, cualquier inferencia será inválida (por ejemplo, los intervalos de confianza pueden ser demasiado estrechos).

  • Si tiene datos transversales, los análisis estándar de nivel estadístico 101 (por ejemplo, un $t$ -test), se puede aplicar.
  • Si tiene datos de series temporales ( $n=1$ , grande $k$ ), los analistas suelen utilizar ARIMA métodos para identificar los términos autorregresivos, integradores y de media móvil.
  • Con datos longitudinales ( $k>1$ pero pequeño), no suele haber suficiente información para estimar los términos ARIMA. En su lugar, la gente suele utilizar modelos de efectos mixtos .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X