6 votos

Cómo encontrar el punto dulce

En R he data donde head(data) da

day   new_users   promotion
1        33        20.8
2        23        17.1  
3        19         1.6  
4        37        20.8    

Ahora day es simplemente el día (y es en este orden). promotion es de la promoción para el día - es simplemente el costo de los anuncios en la televisión. new_users el número de nuevos usuarios que recibimos ese día.

En R I graficar los datos plot(data$promotion, data$new_users, col="darkgreen") y llegamos enter image description here

La trama nos indican que tenemos una correlación positiva, es decir, más de la promoción tenemos más usuarios. En R I prueba de correlación positiva:

cor.test(data$promotion, data$new_users, method="kendall", alternative="greater") 

lo que nos da un muy bajo valor de p, es decir, tenemos que existe una correlación positiva.

Encontrar el punto dulce

Quiero encontrar un punto dulce, que es un punto donde el aumento de promotion no efecto (o no aumento) new_users.

# Setting the promotion-value to 24
promotion_rate = 24
# Sub setting data so we only have promotion-value higher than 24
data_new =  subset(data, data$promotion > 24)
# Testing for positive correlation
cor.test(data_new$promotion, data_new$new_users, method="kendall", alternative="greater" )

He hecho esto para diferentes valores de promotion_rate. Los resultados son para todos los de la promoción de los valores por debajo de 24 que obtiene un bajo valor de p, es decir, tenemos la correlación positiva que existe en estos casos. Para la promoción de valores superiores a los 24 obtenemos un p-valor mayor que 0,05, es decir, no tenemos una correlación positiva en estos casos.

Ahora es válido concluir que el 24 es el punto dulce ?

Actualización

Ahora he trazado la suma acumulativa de new_users - en R I tipo

plot(cumsum(data$new_users), xlab="days", ylab="cumulative sum of new_users", col="darkred")

enter image description here

Similar he trazado la suma acumulativa de promotion. El azul es new_users y el naranja es promotion.

plot(cumsum(data$new_users),xlab="days",col="blue")
points(cumsum(data$promotion), col="darkorange")

enter image description here

Pero esto se ve como una línea recta por lo que es incluso posible encontrar un punto dulce?

5voto

DJohnson Puntos 1347

Por "sweet spot", creo que podemos asumir que significar el punto de inflexión, que es el punto donde el crecimiento en los nuevos usuarios se da la vuelta y comienza a aplanar hacia un asymptomtic max. No hay ninguna escasez de maneras de analizar esta información. Uno de ellos es como un proceso de difusión. Algo que puede ayudarle a visualizar esto no sería tratarlo como un diagrama de dispersión, pero en lugar de trazar el número acumulado de usuarios nuevos por día. La forma de la curva se debe sugerir el punto de inflexión. La idea básica es que el crecimiento es en forma de S -- lento al principio y al final con un incremento rápido en el medio de la curva.

Modelación matemática de que el proceso se inició con Gompertz en los primeros 19 c, pero hay muchos otros, los nuevos modelos. Este wiki post (https://en.wikipedia.org/wiki/Gompertz_function ) que describe el modelo:

enter image description here

Fórmula

{\displaystyle y(t)=a\mathrm {e} ^{-b\mathrm {e} ^{ct}},} donde

a es una asíntota, ya que {\displaystyle \lim _{t\to \infty }\mathrm {e} ^{-b\mathrm {e} ^{ct}}=\mathrm {e} ^{0}=a} b, c son positivos los números b ajusta el desplazamiento a lo largo del eje x (se traduce el gráfico a la izquierda o a la derecha) c establece que la tasa de crecimiento (y ampliación) e es de Euler Número (e = 2.71828...).

(Disculpas por cualquier error de formato)

En la comercialización de nuevos productos, Rogers' modelo de difusión es uno de los más ampliamente citados documentos en cualquier campo.

enter image description here

Su modelo fue dado formulación matemática por Frank Bass y ha visto muchas modificaciones y variaciones a través de los años.

Bass, F. M. (1969), "Un Producto Nuevo Modelo de Crecimiento para el Consumo de bienes Duraderos, la" Gestión de la Ciencia, 215-227

Otros modelos fueron desarrollados en la biología de las matemáticas para describir el crecimiento de, por ejemplo, las vainas de arvejas. Conocido como el de Fisher-Palanca de transformación que se describe aquí (aquí). Fisher-Levante se ha aplicado a la difusión de la nueva tecnología por parte de grupos tales como el Programa para el medio Ambiente Humano, en la Universidad Rockefeller.

Todos los modelos mencionados hasta ahora, consistentes básicamente en el análisis univariante. Extensiones de los modelos de regresión multivariada se han hecho recientemente. Un buen recurso para los modelos más avanzados (que facilitaría la introducción de promoción pasar como covariable y incluir código R) están disponibles a partir de estas notas de la conferencia:

http://www.unc.edu/courses/2008fall/ecol/563/001/docs/lectures/lecture27.htm

Aquí están los contenidos de la página web:

  • Visión general de los lineales de efectos mixtos modelos
  • Decidir qué parámetros deben ser hechas al azar en modelos lineales de efectos mixtos
  • Centrar un predictor para reducir el parámetro de correlaciones en modelos lineales
  • El kestrel conjunto de datos
  • El modelo de Gompertz
  • selfStart funciones en R
  • Decidir qué parámetros deben ser hechas al azar en un Gompertz modelo de efectos mixtos La interpretación de los parámetros de la función SSgompertz

1voto

Nixit Patel Puntos 34

Usted no puede deducir a partir de los datos, que tal punto de que existe realmente. Usted tiene una teoría en la cabeza, que en algún Punto más prt no se va a ganar más usuarios, pero que no está en sus datos. Usted tendrá que formular esta opinión como un modelo matemático, a continuación, ajuste los datos a dicho modelo y, a continuación, usted puede hacer su pregunta a la modell. Por ejemplo, usted podría creer, que una función exponencial describe la relación, a continuación, ajuste una función exponencial a los datos y a investigar, cuando la pendiente de la función exponencial, se pone tan baja, que creo que es igual a Cero para los propósitos prácticos. O usted puede ser que desee para ajustar una curva polinomial y buscar un lugar con verdadero pendiente de cero. El p-valor de correlación depende mucho de si usted tiene suficientes Puntos de datos en un determinado Intervalo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X