4 votos

Ventajas de los modelos lineales de troncos.

¿Cuáles son las ventajas de la utilización de un registro de representación lineal en lugar de una representación de tabla? Es simplemente computacional problema (evitar que se desborde)?

Por ejemplo, en una red de markov A-B, podemos representar el factor P(a,B) como una tabla:

A B P(A,B)
0 0 10
0 1 1
1 0 1
1 1 10

Alternativamente, si queremos representar el factor P(a,B) como registro de un modelo lineal:

$$P(A,B) = \exp\bigg(\sum\limits_{i=1}^4\theta_i f_i(D_i)\bigg)$$

Here $f$ is an indicator function. Then basically each $\theta$ es el registro de la entrada en la tabla de la representación. ¿Cuáles serían las ventajas del registro de representación lineal aquí?

1voto

DJohnson Puntos 1347

Hay una diferente de la literatura apoya el uso de log-lineal de los modelos que comienza con el Obispo, et al., Discretos Análisis Multivariante en 1975. Se extiende a través de Leo Goodman RC modelos de comienzo en la década de los 80, Agresti del Análisis de Datos Categóricos, los libros de Stephen Feinberg e incluye Wickens excelente libro Multiway Tablas de Contingencia de Análisis para las Ciencias Sociales, 1989. Huelga decir que estos enfoques son apropiados para la frecuencia, "count" o de clasificación de datos.

El ejemplo anterior es una simple tabla de 2x2. Puede darse el caso de que hay pocas ventajas en el uso de log-lineal de los modelos para este caso, ya que un análisis sofisticado no es necesario. Una de las grandes ventajas de la log-lineal de la estructura es el que ofrece flexibilidad en las pruebas de las diferentes estructuras de la tabla en las dimensiones superiores de 2X2 que distinguir, por ejemplo, la independencia en la diagonal (la clásica prueba de chi-cuadrado) de independencia condicional en una tabla como una función de la forma en que se rebanan que la tabla de arriba. Además, y más allá de la chi-cuadrados, odds-ratios son fácilmente estimables, como el más adecuado métricas de tamaño del efecto.

Claramente, no es más que una forma de analizar la frecuencia de los datos. Cómo se elige a hacer es una función de la formación y el nivel de comodidad.

0voto

Belgi Puntos 12598

La mayoría de los libros de texto y diapositivas que he encontrado del estado, que es "común" o "conveniente", pero no explican por qué.

He encontrado dos razones que se aplican a las Redes de Markov:

  1. Exponentiating el promedio ponderado de las características se asegura de que todos ellos son mayores de cero. La normalización con la función de partición Z se asegura de que todos ellos se resumen en uno. De esta manera conseguimos una validez de distribución de probabilidad. Esta ventaja se explica en este curso de Coursera (tiene que registrarse primero).

    2.Aprovechamos el hecho de que la función exponencial es su propia derivación. Esto hace que sea mucho más fácil para calcular la derivada cuando el aprendizaje de los pesos, por ejemplo, con gradiente de la pendiente.

Desde un punto de vista numérico, es preferible suma el registro de las probabilidades debido a la multiplicación de muchas pequeñas probabilidades puede correr el riesgo de un subdesbordamiento de el equipo de la precisión numérica.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X