2 votos

¿Qué estoy reinventando? RE: Modelado de regresión lineal para la frecuencia de eventos discretos

Busco modelar la frecuencia de los eventos para cuantificar cuánto aumenta o disminuye esa frecuencia. Para concretar, piense en los sucesos como visitas a páginas web de varios sitios web de bajo tráfico, y me gustaría comparar en qué medida están "tendiendo" hacia arriba o hacia abajo en relación con los demás. Mi pregunta principal es ¿qué estoy reinventando?

A grandes rasgos esto es lo que estoy pensando. Tengo un conjunto de eventos en un conjunto de tiempos $E = \{t_1,...t_N\}$ con $t_i < 0$ . A partir de ellas tengo una función de distribución de eventos que es la suma de funciones delta de Dirac. $$ \Phi(t) = K\sum_{i=1}^N\delta(t-t_i) $$ donde K es un factor de normalización. Me gustaría modelar esto como una regresión lineal con $L(t) = at + b$ minimizando $ \Vert{L-\Phi}\Vert$ . Los eventos más antiguos deberían tener una menor ponderación, por lo que mi medida del producto interno sería algo así como: $$ d\omega = e^{kt}dt $$ Antes de empezar a indagar en los detalles de esto (la normalización, la medida del producto interno, etc.) tengo la persistente sospecha de que esto ya se ha hecho antes :) Así que mi pregunta es: ¿dónde puedo leer sobre la teoría, la práctica y la terminología establecidas para este tipo de problema? Cualquier sugerencia sobre cómo reformular el título de esta pregunta o reformular el problema también se agradece.

1voto

Eran Medan Puntos 193

Creo que sólo estás buscando el mínimos cuadrados ponderados método.

En el artículo de la wiki se aborda una versión discreta, pero creo que es bastante fácil adaptarlo al caso continuo. Lo que se quiere es minimizar

$$\int_{-\infty}^{0}\left(L(t)-\Phi(t)\right)^2 e^{kt}dt = \int_{-\infty}^{0}\left(at+b-\Phi(t)\right)^2 e^{kt}dt$$

Como primer paso, se pueden buscar los puntos críticos diferenciando con respecto a $a$ y $b$ e igualando a cero. Esto da el siguiente conjunto de ecuaciones

$$\begin{eqnarray} a \int_{-\infty}^{0}t^2 e^{kt}dt + b \int_{-\infty}^{0}t e^{kt}dt & = & \int_{-\infty}^{0}\Phi(t) t e^{kt}dt \\ a \int_{-\infty}^{0}t e^{kt}dt + b \int_{-\infty}^{0}e^{kt}dt & = & \int_{-\infty}^{0}\Phi(t) e^{kt}dt \end{eqnarray}$$

Las integrales con $\Phi(t)=K\sum_{i=1}^N \delta(t-t_i)$ se reducirán a sumas mientras que las otras integrales se pueden calcular fácilmente (son sólo valores de la función gamma o factorial).

$$\begin{eqnarray} -\frac{2}{k^3}a + \frac{1}{k^2}b & = & K\sum_{i=1}^N t_i e^{kt_i} \\ \frac{1}{k^2}a - \frac{2}{k} b & = & K\sum_{i=1}^N e^{kt_i} \end{eqnarray}$$

Este sistema lineal puede resolverse fácilmente para obtener fórmulas explícitas para $a$ y $b$ .

EDITAR : Acabo de pensar en algo y creo que no es lógico ni natural hacer un ajuste lineal de $\Phi(t)$ . Hay que tratar de ajustar la función acumulativa, es decir $C(t)=\int_{-\infty}^t \Phi(u)du$ ya que esto da el recuento de eventos. Pero como no estoy 100% seguro de lo que quieres conseguir, dejo esto como un comentario adicional. Es fácil adaptar las fórmulas anteriores para $C(t)$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X