6 votos

En una regresión lineal, ¿debo incluir variables independientes que ya se sabe que predicen la variable dependiente?

Tengo una tienda online y estoy intentando encontrar los factores que podrían predecir la rentabilidad de una mercancía. Para ello, he realizado una regresión lineal con el beneficio como variable dependiente. Para las variables independientes, he utilizado todos los datos que tengo registrados sobre cada mercancía, que incluyen cosas como el número de competidores, los precios de los competidores, el año de producción, etc. La idea es crear una lista de criterios para determinar si debo o no vender una mercancía determinada.

Sin embargo, el resultado es siempre obvio: el precio de venta y el coste de compra son los únicos predictores significativos (hay otras variables estadísticamente significativas, pero su beta es muy baja). Dado que obviamente afectarían al beneficio, ¿debo excluirlas?

He intentado excluirlos y el resultado es mucho más interesante, pero no sé si son válidos. También he probado a cambiar la variable dependiente del beneficio por el precio de venta y los resultados son idénticos.

0 votos

La prueba y el error son esenciales. Pruebe a dividir los datos originales en conjuntos de "entrenamiento" y "pruebas", de modo que pueda utilizar los conjuntos de $\beta$ de su modelo para predecir futuros resultados fuera de juego. A continuación, puede utilizar ambos modelos para ver cuál es mejor en la predicción. Como ampliación, estudie la regresión por mínimos cuadrados parciales (PLS), la regresión por red elástica y la regresión por componentes principales (PCR) como formas de tratar la agrupación, y la regresión LASSO (un caso aislado de EN) para la selección de covariables.

0 votos

¿Cómo se calcula el beneficio? ¿Es simplemente profit = selling - buying ?

2 votos

Sin hacer referencia a los aspectos específicos de su pregunta, en general es una mala idea omitir predictores conocidos debido al efecto de sesgo de variable omitida ver también La paradoja de Simpson (aunque propiamente se utiliza un nombre diferente para el caso continuo y-continuo x). Sin embargo, si existe una relación funcional obvia y directa con algunos predictores, es posible que desee considerar la posibilidad de ajustar la respuesta (ver lo que queda después de eliminar el efecto conocido de esas variables).

4voto

icelava Puntos 548

$$ \text{profit} = (\text{price}-\text{cost})\times\text{sales}. $$

No creo que tenga sentido retrotraer el beneficio al precio o al coste. O de las ventas. Nosotros conozca la relación anterior.

En su lugar, trabaje para comprender los tres factores anteriores. Por ejemplo, en una primera aproximación, podemos considerar que el coste es fijo, ya que es posible que sólo podamos negociarlo a medio plazo. Eso nos deja con el precio de venta y las ventas.

Y, por supuesto, el precio influirá en las ventas.

Así que yo recomendaría prever las ventas futuras, utilizando el precio como motor, por ejemplo, utilizando regresión . Experimenta con diferentes puntos de precio posibles y encuentra el que maximice el beneficio según la fórmula anterior. Siéntase libre de incluir otros factores, como los precios de sus competidores, en la previsión de ventas (pero tenga en cuenta que, por supuesto, tendrá que previsión precios de los futuros competidores).

El problema: si está realizando este análisis para determinar si debe o no vender una determinada mercancía, lo más probable es que aún no disponga de datos sobre el producto concreto que está analizando. Así que un enfoque de regresión directa no le ayudará. En su lugar, busque productos "similares" con ventas históricas conocidas para entrenar sus modelos.

0 votos

Ya tengo el historial de ventas de productos similares. De hecho, la mayor parte de mi mercancía son libros y podría consultar ese libro concreto en Amazon para ver las ventas históricas. También las he incluido siempre que ha sido posible en la regresión. ¿Significa eso que una regresión directa sería válida en este caso?

0 votos

Aún así, habría que trasladar los efectos de un libro "establecido" a uno nuevo. También podría haber patrones de ciclo de vida.

3voto

Manuel Puntos 6

Creo que algo que podría ayudar es reformular ligeramente la pregunta. Estoy de acuerdo en que, para la rentabilidad, la mayor diferencia entre el precio de compra y el de venta sería un buen indicador (o tal vez el único indicador que podría necesitar), pero eso no es muy perspicaz. Lo que yo haría es normalizar el beneficio por los precios de compra o venta. Por ejemplo, para cada producto, calcular algo como

Beneficio/(precio de compra) o Beneficio/(precio de venta)

Y retroceder en los otros hechos. Así, un coeficiente grande te diría ahora qué es importante para obtener más beneficios por cada dólar en el precio de compra/venta.

0 votos

Creo que Beneficio/(Precio de compra) es igual a Rendimiento de la inversión, mientras que Beneficio/(Precio de venta) es igual a Margen de beneficio. He probado ambos en mi cálculo original y el efecto del precio de compra y el precio de venta se hizo aún más fuerte. No obstante, seguiré utilizándolos en mis próximos intentos, por si surge algo interesante.

0 votos

Lo siento, puede que no haya sido claro. Una vez calculado el rendimiento de la inversión o el margen de beneficio, yo eliminaría tanto el precio de compra como el de venta de tus datos y volvería a hacer la regresión. Dado que el precio de compra y el de venta están muy correlacionados, no me sorprende en absoluto que la relación sea aún mayor. El objetivo original de calcular estos valores es normalizar el precio de compra o de venta y estudiar el efecto relativo de las demás variables.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X