Estoy aprendiendo algo de estadística por diversión y tengo una confusión con respecto a estadísticas suficientes . Escribiré mis confusiones en formato de lista:
-
Si una distribución tiene $n$ parámetros entonces tendrá $n$ ¿son suficientes las estadísticas?
-
¿Existe algún tipo de correspondencia directa entre los estadísticos suficientes y los parámetros? ¿O los estadísticos suficientes sólo sirven como una reserva de "información" para que podamos recrear el escenario y así poder calcular las mismas estimaciones para los parámetros de la distribución subyacente?
-
¿Tienen todas las distribuciones suficiente estadística? es decir, ¿puede fallar alguna vez el teorema de la factorización?
-
Utilizando nuestra muestra de datos, asumimos una distribución de la que es más probable que provengan los datos y entonces podemos calcular estimaciones (por ejemplo, la MLE) para los parámetros de la distribución. Los estadísticos suficientes son una forma de poder calcular las mismas estimaciones para los parámetros sin tener que depender de los propios datos, ¿verdad?
-
¿Todos los conjuntos de estadísticas suficientes tendrán una estadística suficiente mínima?
Este es el material que estoy utilizando para tratar de entender el tema: https://onlinecourses.science.psu.edu/stat414/node/283
Por lo que entiendo tenemos un teorema de factorización que separa la distribución conjunta en dos funciones, pero no entiendo cómo somos capaces de extraer el estadístico suficiente después de factorizar la distribución en nuestras funciones.
-
La pregunta de Poisson planteada en este ejemplo tenía una factorización clara, pero luego se decía que los estadísticos suficientes eran la media muestral y la suma muestral. ¿Cómo sabíamos que esos eran los estadísticos suficientes con sólo mirar la forma de la primera ecuación?
-
¿Cómo es posible realizar las mismas estimaciones MLE utilizando estadísticas suficientes si la segunda ecuación del resultado de la factorización dependerá a veces de los valores de los datos $X_i$ ¿a sí mismos? Por ejemplo, en el caso de Poisson la segunda función dependía de la inversa del producto de los factoriales de los datos, ¡y ya no tendríamos los datos!
-
¿Por qué el tamaño de la muestra $n$ no es una estadística suficiente, en relación con el ejemplo de Poisson en el página web ? Necesitaríamos $n$ para reconstruir ciertas partes de la primera función, ¿por qué no es también una estadística suficiente?