5 votos

¿Cómo se puede (o debe) prueba que la observación A tiende a ser mayor que la observación B para cada tema?

He medido 2 de sedimentos parámetros en varios lagos. El contenido de materia orgánica en el sedimento/agua de la interfaz surfOM y la media del contenido de materia orgánica en el núcleo entero meanOM.

surfOM <- c(34.4600, 42.1700, 48.6700, 18.4711, 19.5300, 18.4238, 20.5601, 28.2800, 19.1739)
meanOM <- c(31.23571, 37.57117, 43.47832, 18.47110, 17.18266, 17.42377, 19.96015, 25.09943, 19.37392)

Las dos medidas se correlacionan > cor(surfOM, meanOM) [1] 0.9967266 y surfOM es generalmente mayor que meanOM:

 > surfOM - meanOM
[1]  3.22429  4.59883  5.19168  0.00000  2.34734  1.00003  0.59995  3.18057
[9] -0.20002

Al informar sobre los resultados me dicen:

"La superficie por ciento de la materia orgánica y el porcentaje medio de materia orgánica de los mismos se correlacionan altamente con la ligeramente mayor superficie por ciento de la materia orgánica en la mayoría de los lagos."

Yo inicialmente no se sienten como la diferencia necesaria una prueba estadística porque simplemente es lo que es, pero ambos revisores le pidió una prueba que demuestre que surfOM tiende a ser mayor que meanOM en un lago.

Mi primer pensamiento fue para calcular el intervalo de confianza de surfOM - meanOM y demostrar que no contienen 0, pero no estoy seguro si este es el enfoque más adecuado.

Preguntas:

  • Hace la diferencia entre las dos variables es necesario un estadístico de prueba?
  • ¿Cuál es la forma apropiada de pruebas de esta diferencia?

(Nota: esto es sólo un subconjunto de los datos. El conjunto de datos completo tiene 23 lagos)

5voto

Berek Bryan Puntos 349

Usted puede hacer una prueba de t pareada.

En R,t.test(surfOM,meanOM,paired=TRUE)

Le dará un valor de p y un intervalo de confianza para la media de las diferencias. Estos sólo tiene sentido si los lagos son una muestra de una población más grande de los lagos, no se si tienes datos en todos los lagos en su población (por ejemplo, todos los lagos en cierta zona geográfica o todos los lagos de un determinado tipo de interés).

3voto

jerhinesmith Puntos 5425

Cuando escucho la frase "Una tiende a ser mayor que B" suena como a es mayor que B, un montón de tiempo, por ejemplo, más del 50% del tiempo. Esto puede suceder cuando se $\mu_{A}$ es mayor que $\mu_{B}$, pero también puede suceder que $\mu_{A}$ es mayor que $\mu_{B}$... sin embargo,$P(A > B) < 0.50$.

(Para un ejemplo concreto de lo que estoy diciendo, vamos a B de forma idéntica 1/2, y dejar de poner probabilidad de $1 - p$ cero con el resto de la probabilidad de $p$ en algunos entero $n \geq 1$. Podemos hacer $P(A > B)$ tan pequeño como nos gusta dejando $p \to 0$, sin embargo, podemos hacer $\mu_{A}$ tan grande como nos gusta dejando $n \to \infty$.)

Encima de todo esto, es que se parece a la "B" es de por sí un "medio", lo que complica el idioma.

Por lo tanto, mi primer pensamiento es para tratar de averiguar si usted estaría más interesado en $\mu_{A} > \mu_{B}$ o si prefieres estar más interesados en $P(A > B) > 0.50$. Si usted está interesado en los medios, a continuación, la prueba de t debe estar muy bien.

Si usted está más interesado en $P(X > Y)$, usted podría considerar la posibilidad de la Prueba del Signo. Es un test no paramétrico de la prueba, es la luz de los supuestos, y no necesitas estar tan preocupado por los valores atípicos. Si, además, podría decir que la distribución de las diferencias de materia orgánica fue simétrica, se podría hacer uno mejor y para ir a por la de Wilcoxon Signed Rank test.

De todos modos, supongamos que se puede decir nada más sobre las distribuciones, y supongo que son apropiados para la Prueba del Signo. Los datos anteriores había 8 de los 9 pares con Una mayor que B. Para estos datos, en R, lo haría

binom.test(8, 9, alt = "greater")

La salida sería dar un p-valor y un 95% unilateral Clopper-Pearson intervalo de confianza (que generalmente es conservador).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X