1 votos

¿Qué similitud tienen mis dos conjuntos de datos?

Me encuentro con una pregunta fácil:

Tengo dos conjuntos de datos con datos experimentales. Los conjuntos de datos no tienen el mismo tamaño. Me gustaría demostrar que estos conjuntos de datos provienen posiblemente del mismo experimento.

Probé una muestra de dos $t$ -prueba; muestra que los datos son significativamente diferentes. ¿Hay alguna manera de generar algo como un $p$ -¿valor de la similitud en lugar de la diferencia?

Actualización:
Aquí un ejemplo:
Conjunto de fechas 1 (Vector): 1 1 2 3 1 2 1 3 4 1 Media: 1.9
Conjunto de datos 2 (Vector): 2 2 1 2 1 1 2 3 2 2 Media: 1.83

¿Cómo demostrarías ahora que estos conjuntos de datos proceden de un solo experimento?

4voto

REX Puntos 43

Necesitamos un ejemplo o más detalles sobre los conjuntos de datos:

  • ¿hay más de una variable?
  • ¿cuántos individuos por conjunto de datos?
  • ¿la hipótesis gaussiana es válida para su problema?

La prueba t responderá a la pregunta: ¿es la media la misma entre las dos clases?

Para comprobar si los dos conjuntos de datos proceden de la misma distribución, puede aplicar, por ejemplo, una prueba de Kolmogorov Smirnov (ks.test en R). Y hay pruebas alternativas de Kolmogorov Smirnov multivariantes si tiene dos o más variables [ Lopes et al., 2007 ].

Con el conjunto de datos de ejemplo:

 x <- unlist(read.table(text="1 1 2 3 1 2 1 3 4 1",sep=" "))
 y <- unlist(read.table(text="2 2 1 2 2 1 1 2 2 3 2 2",sep=" "))
 maxi <- max(c(x,y)) 
 xfac <- factor(x,levels=1:maxi)
 yfac <- factor(y,levels=1:maxi)
 # Plot
 layout(1:2)
 barplot(table(xfac))
 barplot(table(yfac))

Bar plots of the 2 samples

# Two sample test on the median
wilcox.test(x, y) # Similar medians
# Two sample Kolmogorov-Smirnov Test
ks.test(x, y) # Do not trust the p-value because the data is discrete
# Alternative?

Teniendo en cuenta la trama y los resultados de las pruebas, ¡puede que quieras aumentar el número de individuos!

0voto

Ewan Makepeace Puntos 1254

La prueba de Kolmogorov-Smirnov, y otras pruebas no paramétricas, le dirán si las muestras proceden de la misma distribución. La prueba KS, en particular, no requiere un número igual de muestras, y el estadístico puede convertirse en un valor p.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X