Para fijar la notación, dejemos un conjunto de datos posibles $X$ y un conjunto de valores admisibles de los parámetros $\Theta$ se dará. Sea $\mathscr P(X)$ sea el conjunto de distribuciones de probabilidad sobre $X$ . Un modelo estadístico paramétrico sobre $X$ y $\Theta$ es una correspondencia $p:\Theta\to\mathscr P(X)$ . Si $p$ es un modelo estadístico sobre $X$ y $\Theta$ utilizaremos la notación $p(\cdot\,|\,\theta)$ para la distribución que $\theta$ se asigna mediante $p$ .
Sea $p_1$ sea un modelo estadístico sobre $X$ y $\Theta_1$ y que $p_2$ sea un modelo estadístico sobre $X$ y $\Theta_2$ . Estoy tentado de proponer algo como las siguientes nociones de equivalencia para tales modelos:
Candidato 1. $p_1$ y $p_2$ son forma equivalente siempre que sean iguales hasta la reparametrización; existe una biyección $f:\Theta_1\to\Theta_2$ para lo cual $p_1(x\,|\,\theta_1) = p_2(x\,|\,f(\theta_1))$ para todos $x\in X$ y $\theta_1\in\Theta_1$ .
Candidato 2. Sea $x^{(N)} = (x_1, x_2, \dots, x_N)$ sea una secuencia de datos (cada $x_n\in X$ ). Sea $\hat\theta_1(x^{(N)})$ y $\hat\theta_2(x^{(N)})$ son las estimaciones de los parámetros calculadas ajustando los modelos 1 y 2 a esta secuencia de datos según un procedimiento que supone que se generan de forma independiente, es decir, generados por las distribuciones \begin{align} p_1^{(N)}(x^{(N)}\,|\,\theta ) &= p_1(x_1\,|\,\theta)p_1(x_2\,|\,\theta)\cdots p_1(x_N\,|\theta) \\ p_2^{(N)}(x^{(N)}\,|\,\theta ) &= p_2(x_1\,|\,\theta)p_2(x_2\,|\,\theta)\cdots p_2(x_N\,|\theta). \end{align} Decimos que $p_1$ y $p_2$ son asintóticamente equivalente a la inferencia siempre que coincidan tanto como se desee dado que se ajustan con suficientes datos. Más concretamente, dado cualquier $\epsilon > 0$ existe un $N_*>0$ tal que si $N>N_*$ entonces \begin{align} |p_1(x\,|\,\hat\theta(x^{(N)})) - p_2(x\,|\,\hat\theta(x^{(N)}))| < \epsilon \end{align} para todos $x\in X$ .
Candidato 3. $p_1$ y $p_2$ son inferencia-equivalente siempre que concuerden cuando se ajusten a cualquier cantidad de datos, por grande o pequeña que sea.
Preguntas.
¿Se adoptan definiciones de este tipo en la literatura estadística? ¿Se han demostrado teoremas interesantes y útiles sobre modelos estadísticos equivalentes? Tal vez se discutan en la literatura múltiples tipos de equivalencia como los candidatos anteriores, en cuyo caso ¿se discute qué definiciones de equivalencia implican unas a otras?