5 votos

Tamaño para la regresión múltiple de la muestra: ¿Cuánto más no los datos que necesito?

Estoy tratando de poner a prueba una predicción de un modelo computacional con un experimento biológico.

El modelo predice una dependencia lineal entre el tamaño de la celda y de la asimetría. He realizado un experimento que se sabe que afectan al tamaño de la celda, y tiene un buen significativo de la pendiente cuando la regresión de la asimetría en el tamaño de celda.

Sin embargo, en biología, rara vez hay una perfectamente limpio experimento. Para dar cuenta de posibles otros efectos de la perturbación, he añadido una variable ficticia para la perturbación a la regresión. El coeficiente de la dummy no es significativa (p=0.5), pero el coeficiente de tamaño de la célula deja de ser significativa, (p=0.1).

Suponiendo que el modelo de predicción es correcta, ¿cómo puedo yo, teniendo en cuenta los resultados de mi regresión, calcular el número de mediciones adicionales necesarios para desempeñar de manera que el coeficiente del tamaño de la célula sigue siendo significativo incluso en la presencia de la confusión ficticio?

26voto

pauly Puntos 932

Considere esto: dado ninguna población en efecto, y dada una muestra inicial efecto clasificados como significativos y una 2ª etapa del efecto (control de variable ficticia) clasificados como no significativo, ¿cuál es la probabilidad de que un investigador se continúan acumulando más observaciones hasta el punto donde el efecto en cuestión parece significativo? Yo sospecho que es muy alta, pero eso no arrojar mucha luz sobre tu pregunta de investigación. La literatura sobre los errores de Tipo I, investigador de sesgo, y el Cajón de Archivo Problema va a ser relevante aquí. Me doy cuenta de que esto no parece responder directamente a tu pregunta, pero espero que revelan un problema con la pregunta y le pedirá adicionales pensamiento sobre el papel de las pruebas de significación.

Más directamente al punto: usted puede tratar el parcial coeficiente de correlación obtenida cuando el control de la ficticia como la mejor estimación y puede entonces llevar a cabo un jardín-variedad de análisis del poder para ver lo que el tamaño de la muestra sería necesario para un coeficiente de correlación que aparecen significativamente diferentes de cero. Hay un montón de en línea de correlación de poder calculadoras que le permitirá hacer esto (por ejemplo, en el Vassar del sitio), o puede descargar el programa gratuito GPower. Si usted necesita una comprensión más profunda de la uncertaintly que rodea a este poder de la pregunta, puede llevar a cabo una simulación de Monte Carlo en el que tanto su focal variable y las maquetas de los coeficientes que pueden variar en proporción a sus errores estándar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X