5 votos

Es válida para dividir los datos por una constante para hacer la estimación de la beta más grande / más interpretable?

En el análisis de mis datos, me parece un problema similar al descrito en la interpretación de esta regresión coeficiente. Estoy usando análisis de regresión para construir un humano el gasto de energía de la estimación del modelo utilizando un sensor de movimiento. Dependiendo de la intensidad del movimiento, la de la salida del sensor puede ser de hasta 1,000 a 2,000 cuentas por minuto, y mis datos muestran un promedio de 900-1,100 cuentas por minuto. He utilizado estos datos para desarrollar un modelo, con el gasto de energía como la variable dependiente y el sensor de movimiento de salida como la variable independiente. El resultado fue que el modelo fue estadísticamente significativa ($p<0.01$), pero el coeficiente no estandarizado para mi variable independiente se mostró como $0.000$. He intentado dividir el resultado por 100 y el coeficiente de convertirse $0.021$. Me pregunto si lo que hice es estadísticamente / matemáticamente válida? Si es así, hay una referencia (documento académico, etc.) que establece este?

7voto

Nick Cox Puntos 22819

Sea cual sea el software que utilizan era evidentemente informes de los coeficientes de a 3.d.p. Así 0.000 sólo significaba <0.0005.

Esto tiene el sentido perfecto para utilizar las unidades de medida que los coeficientes de rendimiento que no es inconveniente grande o pequeño. No hay estadística principio es violado por ello. Usted no necesita una referencia o autoridad para respaldar esto: está bien que elija (por ejemplo) mm o m o km o millas, pies o pulgadas para longitudes dependiendo de un problema y de que las unidades están familiarizados en su campo.

En su caso, acerca de cómo dividir por 60 para obtener los conteos por segundo? ¿La gente en su campo de uso alguna vez que como una unidad?

1voto

nikolaMM94 Puntos 38

Una manera de ver esto es la siguiente. Si cambia las unidades de todas las variables independientes (manteniendo las mismas unidades de la variable dependiente), a continuación, usted debe esperar que los coeficientes de regresión para el cambio. La más pequeña de las unidades, lo que implica valores más grandes, los más pequeños de los coeficientes. Ningún documento académico haría tal punto básico, pero si usted necesita una justificación podría referirse a la matriz de forma coeficiente de la fórmula:

$\beta = (X^{T}X)^{-1}X^{T}{\bf{y}}$

Aquí la matriz de valores de las variables independientes $X$ aparece como el inverso de un cuadrado plazo de veces un unsquared plazo, el efecto neto que unidades más pequeñas, lo que implica mayores valores en $X$, reducir el valor de los coeficientes.

En la práctica las cosas son un poco más complicados, donde la regresión incluye un término constante, que requiere de una columna de 1 dentro de $X$. Cambiar las unidades de las variables independientes no va a cambiar la constante (que iba a cambiar sólo si las unidades de la variable dependiente se han cambiado).

Por el contrario, el p-valor de un coeficiente que es una unidad libre de medida de la significación (de su diferencia de cero) y no va a cambiar cuando las unidades de la variable cambia.

1voto

dan90266 Puntos 609

Me gusta pensar en esto como un problema en la elección de representante o de otra manera sensata los valores de x1 y x2 para un predictor X, y obtener predicciones de Y cuando X=x2 menos predicho de Y cuando X=x1. Es fácil obtener un intervalo de confianza para la diferencia (en R esta es una característica de la rms paquete). Se encarga de las no-linealidades en la X efecto. No me gusta para recodificar los datos para facilitar la obtención de los valores de la predicción. Me gusta especificar exactamente lo que estoy estimación. A menudo puedo elegir x1=percentil 25 de X, x2=percentil 75.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X