Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

4 votos

Pregunta acerca de la no-positivo procesos Estocásticos

Esta pregunta va a ser un poco fuera de personaje para mí. Estoy leyendo una evolución de la teoría del juego libro (que no es para los matemáticos), y no estoy seguro de las matemáticas.

Mi definición de una matriz estocástica será una matriz cuadrada real 0 coordenadas, de tal manera que la suma de cada fila es 1.

Voy a llamar a una matriz estocástica positivo, si todos sus coordenadas son positivas.

El libro que estoy mirando es describir finito de nacimiento-muerte de los procesos. La idea es que hay una población finita A y una población finita B, y en cada paso de una de cualquiera de las A o B al azar muere, y uno al azar se multiplica. Podemos pensar en esto como un proceso estocástico con N+1 estados, uno para cada uno de los número posible de personas en A. (N el número de personas en A más el número de personas en B)

Deje P la correspondiente matriz estocástica.

El libro declara lo siguiente: vamos a xi la probabilidad de alcanzar el estado de N cuando a partir de i EVENTUALMENTE (en el límite del proceso de continuar ad infinitum). Deje x_ el valor del xi's como un vector. A continuación,x_=Px_, y (y cito) "la absorción de las probabilidades están dadas por la mano derecha de la autovector asociado con el mayor autovalor, que es uno, porque P es una matriz estocástica."

Mi pregunta real es: ¿qué es el derecho enunciado del teorema este utiliza?

Aviso de que esta x_ es sólo la última columna de P (el límite de Pn). Es la correcta declaración de que todas las columnas de a P vectores propios para el autovalor 1? Es la correcta declaración de que todas las columnas de a P son vectores propios de algunos autovalor (que puede cambiar de columna a columna) con valor absoluto 1 (posiblemente complejas)?

Yo también estoy teniendo un tiempo difícil comparar a la Perron-Frobenius teorema. Del nacimiento a la muerte no es un positivo proceso estocástico (uno positivo estocástico de la matriz), pero lo teorema estoy buscando también debería funcionar para aquellos. Deje Q ser positivo estocástico de la matriz. Entonces, de acuerdo a Perron-Frobenius (mi comprensión de lo que es en su mayoría de http://people.brandeis.edu/~igusa/Math56F06/Math56a_lectures.pdf página 4, pero también un poco de wiki): el espacio propio de 1 es exactamente 1-dimensional, y 1 es el único autovalor con valor absoluto 1. Además, hay una (única, obviamente) vector de π_ tal que es en este espacio propio, y que tiene positivo coordenadas, y su suma es 1. Más aún, P tiene todos sus filas π_!! Más aún, Ptπ=π.

Así que... estoy confundido. ¿Qué es el teorema de la que estoy buscando, y en qué sentido con Perron-Frobenius?

6voto

goric Puntos 5230

Tomar cualquier estado finito espacio de la cadena de Markov con matriz de transición P.

Cuando el límite de P existe, sus columnas v todas satisfacer Pv=v. De hecho, sus columnas se extienden por el espacio propio correspondiente al valor propio 1.

Hay un probabilística de la fórmula para el jésima columna de la función, es iPi(Tj<)Ej(Tj) donde Tj es el golpear el momento de que el estado j, es decir, Tj=inf. Esta fórmula se puede probar usando el fuerte de Markov de la propiedad.

Al j es transitorio, a continuación, \mathbb{E}_j(T_j)=\infty (desde que la cadena puede no devolver a j) y la proporción de arriba es igual a cero. A continuación, el jésima columna de a P^\infty es el vector cero. Obviamente, el vector cero satisface Pv=v!

En el caso extremo, cuando se j está absorbiendo, a continuación, \mathbb{E}_j(T_j)=1 P^\infty_{ij}=\mathbb{P}_i(T_j<\infty) es la oportunidad de ser absorbido en j, a partir del estado de i.

Parece que en su modelo de cada estado es la absorción o transitoria, de modo que cada columna se compone de absorción de probabilidades.


Por el contrario, cuando se P tiene todos estrictamente positivo entradas, a continuación, todos los estados que pertenecen a un común recurrente de la clase, y \mathbb{P}_i(T_j<\infty)=1 todos los i,j. En este caso, todas las columnas son constantes funciones, de hecho múltiplos de los vectores (1,1,\dots,1)^T. De forma equivalente, todas las filas son idénticos y dar el único invariante de la distribución de probabilidad de la cadena.


El resultado es que las cadenas de Markov con estrictamente positivo P vs general no negativo P puede tener muy diferentes límites y el comportamiento. Por favor, hágamelo saber si esto es claro.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X