4 votos

¿Por qué elegir Regresión lineal?

En primer lugar me gustaría decir que yo no soy un estadista ni soy bueno en el campo.

He estado recopilando datos para más de un período de correo.g 100 días y cada día tiene una cantidad variable de datos que pude recopilar. Así, por ejemplo ayer me recogido 10 y mañana yo podría recoger 20 o 2 etc.

He recopilado todos estos datos y el hecho de que un gráfico en excel, que básicamente muestra el flujo.

Ahora, yo quería ver cómo basada en todos los datos que tengo hasta ahora, ¿qué puedo esperar en el futuro?

Excel proporciona algunos (haga clic en y producir) tendencia opciones, como la exponencial, regresión lineal, etc. Así que, aunque no entiendo bien cómo funcionan, he utilizado la regresión lineal de la tendencia. En mi informe borrador, mi maestro insiste en saber el por qué de regresión lineal, pero no sé de un derecho de defensa.

Fue mediante regresión lineal a la derecha y si es así, ¿cómo puedo defender la uso en mi escenario ?

Por favor, utilice la imagen de abajo como referencia.

enter image description here

2voto

Duncan Puntos 650

La imagen definitivamente ayuda. Mediante regresión lineal en una situación como esta es generalmente apropiado si una de las dos cosas es cierta:

1) Usted tiene una creencia razonable de que la relación entre el tiempo y sus datos es lineal. Usted puede globo ocular esto, o hacer la línea de regresión. Si usted tiene un montón de puntos que están lejos de su línea, o si los puntos de datos parece que se ajuste a una curva de mejor o son más aleatoria, entonces no utilizar la regresión lineal. Una vez que usted hace la línea de regresión, también puede buscar en "R al cuadrado", el coeficiente de determinación, el cual ayudará a determinar si la línea se explica la información que usted tiene. El más cerca de R cuadrado es 1, el mejor.

Aquí están las instrucciones sobre la ejecución de regresión y obtener el R cuadrado valor en Excel:

http://office.microsoft.com/en-us/excel-help/perform-a-regression-analysis-HA001111963.aspx

2) Si los valores de tiempo de alguna manera son independientes el uno del otro. Esto no suele ser cierto. Por ejemplo, contar el número de nubes en el cielo. Obviamente, si se recogen datos a las 9 am y las 9:05am, los números serán muy similares, probablemente, mucho más cerca de los datos recogidos en las 9am y 9pm.

Si la regresión lineal no coincide con uno de los dos criterios mencionados, entonces yo sugeriría hacer análisis de series de tiempo en su lugar. Serie de tiempo de acuerdo con la información que tiene un determinado orden temporal, como el tuyo parece. Parte de la razón por esto es importante es que el rendimiento a partir del minuto-a-minuto (o el día a día o lo que sea su período de tiempo) no pueden ser independientes. En la imagen de arriba, una muy buena semana pueden ser más propensos a conducir a un no-tan-buena semana. También, debido a compras generales, las tendencias, las semanas que están más cerca juntos pueden tener más valores similares a los de semanas que están más lejos (piensa en ello de esta manera - un montón de personas de la tienda al por menor en el noviembre-diciembre del plazo debido a las vacaciones de ventas y la entrega de regalos de vacaciones, mientras que menos gente va a comprar en enero-febrero, ya que sólo gastan un montón de dinero).

Serie de tiempo de la gráfica es bastante sencillo en Excel (http://www.mrexcel.com/articles/excel-time-series-chart.php), pero que le dará la limitada capacidad predictiva, ya que a sólo un gráfico. Análisis de series de tiempo le permitirá predecir el valor del mañana, pero es mucho más complicado en Excel. Aquí hay un sitio que se ve bien basado en una rápida búsqueda en google:

http://web.calstatela.edu/faculty/hwarren/a503/forecast%20time%20series%20within%20Excel.htm

Usted también puede tratar de una búsqueda en google de "Análisis de Series de Tiempo en Excel" para otros recursos - hay un 10 minutos en youtube un vídeo que puede ayudar, y un par de otros académicas y/o de gobierno de los recursos que se muestran en los primeros 10-20 resultados.

1voto

Marc Puntos 3385

Esta es una pregunta que siempre es difícil. Si quieres hacerlo completamente correcto, debe determinar por su conocimiento del proceso subyacente qué tipo de relación crees que hay entre el $y$ $x$ variable y, a continuación, utilizar esta relación en su regresión (sin mirar en los datos). Sin embargo, esta mayoría de las veces no sucede, por lo que (omitiendo algunas discusiones filosóficas y matemáticas opciones) sólo debe mirar a sus datos y determinar por su 'forma' ¿qué relación describe mejor la $y$'s en términos de la $x$'s. Sin embargo, siempre ten en mente lo que ya sabes sobre el proceso e incluir este conocimiento en su elección.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X