1 votos

Cómo definir la unidad de muestreo. Prueba t vs prueba de proporción

En mi caso particular, estoy comparando la fruta dañada en varios campos de tratamiento frente a varios campos de control

Para simplificar:

Tanto el tratamiento como el control tienen 10 arbustos cada uno. Se toma un racimo de fruta de cada arbusto (los racimos varían de tamaño). Se anota la proporción de frutos dañados de cada racimo. (Tengo acceso al número original de frutos por racimo)

Para cada arbusto tengo la proporción de frutos dañados.

Cuando realizo una prueba me gustaría comparar

H0: "Proportion damaged fruit in" treatment <= Proportion damaged fruit in 
control
Ha: "" treatment > "" control 

(el tratamiento es un señuelo que se supone que atrae el daño)

He realizado una prueba t(propoción.dañada ~ tratamiento) porque estoy comparando la media (proporción de daños en el tratamiento) con la media (proporción de daños en el control)

Sin embargo, se me ocurre que

mean(proportion.damaged) = 1/n*sum(proportion.damaged) = (total damaged fruit)/(all the fruit)

¿Significa esto que debo realizar una prueba de proporciones?

prop.test((damaged fruit treatment/total fruit treatment) vs. (damaged fruit control/total fruit control)

La diferencia aquí sería que mi unidad de muestreo en el escenario de la prueba t es un arbusto. Mientras que en el escenario de la prueba de proporciones mi unidad de muestreo sería una fruta.

Muchas gracias por su ayuda.

2voto

Sal Mangiafico Puntos 26

Creo que ha formulado la pregunta correctamente. El enfoque del análisis depende de si se considera la unidad de observación como un racimo o como una fruta individual. Es decir, si considera cada fruta como una unidad contable o no.

Normalmente, en horticultura, las mediciones como el "porcentaje de enfermos" o el "porcentaje de control" se tratan como una proporción o un porcentaje inherente. Es decir, no hay necesariamente una unidad contable subyacente al porcentaje. Imagine una parcela de césped. Se podría decir que tiene un 50% de inspección de manchas de dólares --- y se podrían tener algunas herramientas para hacer esta medición más precisa --- pero no hay un área contable que se pueda tratar como una unidad de observación.

Del mismo modo, en su caso podría tener sentido tratar cada racimo o cada arbusto como la unidad experimental.

Mi inclinación en este caso sería no utilizar cada fruta como unidad experimental. Para mí, eso no coincidiría con la forma en que las personas o las plagas interactúan con los racimos de fruta.

1voto

Chris Komuves Puntos 11

Debería utilizar la regresión logística de efectos mixtos.

Formato de los datos:

         Cluster  damaged  count treatment 
            1         1      2       1
            1         0      98      1
            2         1      15      1
            2         0      75      1
           ....

dañado = 1 significa dañado y = 0 significa no dañado. count = # de frutos. Tratamiento es un código para dos tratamientos (tratamiento y control).

El modelo sería $$\log\left (\frac {\Pr(Y_{ij}=1)}{\Pr(Y_{ij}=0)} \right) = \beta_0 +\beta_1 X_{i} + \gamma_i$$

Dónde $Y_{ij}$ = 1 si la j-ésima fruta de la i-ésima agrupación está dañada, = 0 en caso contrario. $X_i$ es el tratamiento recibido en el i-ésimo grupo. $\gamma_i \sim N(0,\sigma^2)$ es el intercepto rnadom para el cluster $i$ .

En el programa se debe utilizar la información de la columna count. los enunciados comunes son: weight, count, freq, ...

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X