4 votos

Calcular el 90% de los intervalos de confianza de la regresión para identificar los datos erróneos

He estado buscando la respuesta para un problema con los intervalos de confianza para un largo tiempo ahora, así que espero que alguien pueda ayudar!

Los dos psicológica papeles a continuación se realiza el mismo análisis de regresión de los irregulares de lectura de la palabra en nonword de lectura para los controles, y el trazado de estas regresiones con el 90% de intervalos de confianza, antes de la superposición de los disléxicos a los participantes a encontrar los valores atípicos. Sin embargo, un documento en el que se ha de línea recta intervalos, la otra curva intervalos. Por qué? (He incluido enlaces a los documentos de modo que pueda observar las parcelas).

He buscado tanto en los libros de texto y recursos en línea, y sólo las descripciones de los intervalos de confianza que he encontrado son para los intervalos de confianza de la línea de regresión, de los cuales se estima un área en la que hay una determinada probabilidad de que la línea de regresión se caiga. Esto no es lo que los estudios por debajo de utilizar, sin embargo. Se utiliza lo que se puede, creo, se denomina 'intervalos de predicción' y describir un área en la que un determinado porcentaje de los datos que va a caer (que luego, en este tipo de investigación, se utiliza para indicar una zona de lo "normal" el rendimiento en una tarea). Alguien puede ayudar con estas distinciones, y/o proporcionar un cálculo de este tipo de intervalo?

Lo curioso es que el SPSS/PASW se trazan los intervalos de confianza para mí, pero no ofrece ninguna explicación de dónde vienen, ni puedo editar la parcela.

Cualquier ayuda, por pequeña que sea, será muy apreciada!

Referencias: Manis, F. R., Seidenberg, M. S., Doi, L. M., McBride-Chang, C. & Petersen, A. (1996). Sobre la base de dos subtipos de dislexia del desarrollo. Cognición: 58, 157-195. ENLACE: http://lcnl.wisc.edu/publications/archive/45.pdf Stanovich, K. E., Siegel, L. S. & Gottardo, A. (1997). La convergencia de las pruebas para fonológica y la superficie de los subtipos de dislexia. Revista de Psicología de la Educación: 89, 114-127. ENLACE: http://web.mac.com/kstanovich/Site/Research_on_Reading_files/RdJEdPsy97.pdf

2voto

Auron Puntos 2123

Greg Nieve de la descripción es buena, pero habría que añadir que, probablemente, usted debe utilizar un mínimo de productos tipo de regresión en lugar de la normal de mínimos cuadrados porque ambos ejes están sujetos a (supongo) un grado equivalente de error. El estándar de mínimos cuadrados de la regresión de los privilegios del eje x, la variable y, a menudo conduce a la regresión de la línea de tener una menor pendiente de lo que debería, un problema que puede ser visto en la figura 1 de la segunda de papel que se han vinculado.

Juan Ludbrook ha escrito sobre esto un par de veces: http://www.cytel.com/papers/Ludbrook-Special-2002.pdf

0voto

Eero Puntos 1612

La fórmula para el intervalo de predicción se pueden encontrar en muchos libros de texto sobre la regresión. Aquí es un conjunto de notas en la web que se adentra en los detalles matemáticos (otros resultados de una búsqueda en la web muestran el concepto, pero no todos muestran la matemática).

La idea básica es que usted agregue la estimación de la varianza para los valores de y alrededor de la línea para la estimación de la varianza se utilizan para el intervalo de confianza y el uso que para la creación de un nuevo intervalo. Tiene 2 fuentes de incertidumbre, la línea en sí misma (como se ve en la confianza de las bandas) y la variación de los puntos alrededor de la línea. El trazado de la predicción de bandas en general, muestran una curva, pero dependiendo de los datos y el rango de la tramaban puede ser difícil saber la diferencia entre la curva y una línea recta. Así que la trama puede estar mostrando las curvas que son casi lineales, o que podría estar utilizando un método diferente que busca líneas rectas para los límites.

Tenga en cuenta que los supuestos de normalidad e igualdad de varianzas son mucho más importantes para los intervalos de predicción que los de las otras inferencias sobre los modelos de regresión, por lo que si estos supuestos no se mantenga para tu caso, entonces los intervalos de predicción van a ser menos útil (o incluso sin sentido). También tenga en cuenta que si usted está utilizando estos para la detección de valores atípicos, a continuación, usted también tiene el problema de las comparaciones múltiples.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X