4 votos

Estructura básica de la ecuación de regresión lineal para la curva de respuesta en forma de s

¿Puede alguien aclararme la estructura de la ecuación para el siguiente escenario teórico básico (aunque común)?

Ventas, $S$ están relacionados con "Publicidad", $A$ , de tal manera que cuando $A$ es pequeño $S$ crece exponencialmente, y cuando $A$ es grande, $S$ crece más lentamente hasta que en algún momento cualquier aumento de $A$ produce un aumento nulo de $S$ . Así pues, una típica respuesta en forma de S a la publicidad.

El número total de ventas realizadas en cualquier periodo en el mercado es $T$ . Así que nuestra cuota de mercado media es de $\Sigma S/\Sigma T$ . Cuando la publicidad es cero, nuestras ventas son estáticas en algún nivel $s$ (es decir, el efecto de alguna otra influencia de apoyo que no sea la publicidad).

Sé que esto se puede resolver a través de la regresión lineal mediante la transformación de las variables, pero estoy luchando para conseguir mi cabeza alrededor de la versión más básica de esto - esencialmente $f(S) =\gamma+ \beta g(A)+\epsilon $ (con $\gamma$ siendo alguna intercepción (posiblemente $0$ ) y $\epsilon$ siendo residuales), pero ¿qué es lo que $f$ y $g$ y, por tanto, cómo es la ecuación que tengo que resolver para estimar $S$ ?

EDITAR

Para mostrar cómo se vería la ecuación final, tengo en mente la transformación logit, así que estoy buscando cómo se aplica la transformación logit usando los parámetros en la pregunta, y luego cómo se vería la ecuación final con las transformaciones en su lugar.

Además, estoy buscando específicamente una forma de resolver a través de la regresión lineal rater que cualquier cosa no lineal.

1voto

IWS Puntos 126

Las posibles transformaciones en forma de S son el logit ( $log(x/(1-x))$ ) y el log-log complementario ( $log(-log(x))$ ) por nombrar un par. Véase https://en.wikipedia.org/wiki/Sigmoid_function para más.

En su caso, es difícil decir si transformar el resultado ( $S$ ) o el predictor ( $A$ ) sin ver los datos. Si se empezara por transformar el predictor mediante la transformación logit y luego se ajustara el modelo, la fórmula de regresión final sería así:

$S=γ+β*log(A/(1-A))+ϵ$ *

*Nótese que la transformación logit y cloglog tendrá problemas con los datos fuera del $[0,1]$ rango. Esto ocurre con la mayoría de las funciones sigmoides. Para utilizar estas transformaciones, tendrá que transformar los datos si el rango de datos está fuera del $[0,1]$ . Por sugerencia del OP:

$A$ pueden ser llevados a la $[0,1]$ alcance por: $A′=(A+1)/(max(A)+2)$

la fórmula de regresión completa sería entonces:

$S=γ+β*log(A′/(1-A′))+ϵ$

$= γ+β*log(((A+1)/(max(A)+2))/(1-((A+1)/(max(A)+2))))+ϵ$

Un enfoque más directo de esta asociación no lineal entre la publicidad y las ventas sería utilizar una función spline. De este modo, no se depende tanto de la elección "accidental" de una transformación que se ajuste más o menos bien y no es necesario el preprocesamiento. La implementación de splines en modelos de regresión puede hacerse en R utilizando, por ejemplo, el paquete rms.

0 votos

Gracias - la transformación logit que he encontrado y esto es lo que tengo en mente, pero no el log-log (voy a leer más sobre esto). Lo que busco es la forma final de la ecuación - sólo para unir los puntos, que es lo que me cuesta. He leído en muchísimos textos que debo "aplicar la transformada abc", pero sin ver la forma de la ecuación después de hacer esto. Por eso he preguntado sobre qué $f(.)$ y $g(.)$ y cómo es la ecuación final.

0 votos

He editado mi respuesta para mostrar lo que quería decir.

0 votos

¡Brillante! Tu frase "En tu caso, es difícil decir si hay que transformar el resultado (S) o el predictor (A) sin ver los datos" creo que explica por qué me ha costado tanto entender esto: hasta ahora he creído que hay una respuesta "correcta" al respecto independientemente de los datos. ¿Tienes algún ejemplo de algo encontrado en los datos que ayude a tomar esta decisión?

1voto

Jay Vyas Puntos 16

Un enfoque que se utiliza a veces es el modelo ADBUDG propuesto por John Little del MIT. El modelo supone que:

$$S = b + (a-b) \frac{A^c}{d+A^c}$$

El modelo genera una curva en forma de s para $c>1$ y las ventas están limitadas entre $b$ y $a$ . La estimación del modelo requiere el uso de mínimos cuadrados no lineales donde se minimiza la suma cuadrada de los errores residuales entre las ventas reales y las ventas estimadas utilizando la función anterior.

La implementación de lo anterior debería ser posible en Excel (utilizando sus rutinas de optimización incorporadas) u otras plataformas como R, Python, etc.

0 votos

Gracias @Srikant, aunque estoy buscando un enfoque lineal para esta pregunta, definitivamente investigaré el modelo ADBUDG.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X