1 votos

Cómo formular y probar esta hipótesis estadística

En primer lugar me gustaría aclarar que mi mayor problema con este tema es probablemente mi incapacidad para formularlo correctamente, tal vez la respuesta se encuentre de forma trivial en internet pero no soy capaz de encontrarla. Dicho esto voy a formular la pregunta.

Digamos que me dan algún tipo de secuencia de probabilidad que correlaciona una serie de eventos independientes con sólo dos resultados posibles. Por ejemplo: Me dan la probabilidad de que llueva (o llueve o no llueve) para cada día de un año. Me gustaría cuantificar de alguna manera lo acertado de esta predicción cuando lo único que puedo hacer es comprobar dónde ha llovido o no esos días.

Mi primer enfoque es que, si tengo grandes cantidades de datos o las probabilidades no son muy diferentes entre sí, lo que podría hacer es dividir el conjunto de probabilidades en subconjuntos "bins" como las probabilidades de 20-25% donde tengo digamos 100 eventos, entonces podría hacer algún tipo de análisis estadístico habitual, asumiendo una distribución normal, etc. Si este es el enfoque correcto, me gustaría saber cómo se denomina esto para poder investigar más y también me gustaría saber cómo calcular el tamaño de esas franjas, etc. Tal vez lo que hay que hacer si tiene diferente / igual unceirtanty de cada una de las probabilidades dadas.

Si este no es el enfoque correcto, agradecería algunas directrices sobre cómo seguir adelante. En resumen, quiero saber que si el término n+1 de la sucesión dice que el evento tiene una probabilidad p con alguna unceirtanty dado (o no) ¿Cuál es una manera razonable de comprobar esto sobre la base de los datos anteriores y la forma de volver a calcular la probabilidad con su nueva unceirtanty (más grande que presumo).

Muchas gracias y perdón por la falta de rigor matemático en la pregunta (probablemente la hubiera oscurecido realmente) y también perdón por la mala redacción, ya que el inglés no es mi idioma principal, pero creo que tengo la suficiente formación matemática para entender la respuesta, lo que más quiero es un punto de partida (nombre del método, etc.) para poder investigar por mi cuenta.

0voto

Supongamos que se puede agrupar en 6 "bandejas". De momento, supongamos que las probabilidades son iguales. Entonces, cada casilla podría considerarse como una cara de un dado. Esto haría que el problema se asemejara a averiguar si un dado es justo o tendencioso. Esto puede hacerse mediante una prueba de Chi-cuadrado. Para ello, las frecuencias observadas son el resultado de un número de lanzamientos de dados y las frecuencias esperadas se obtienen a partir de la distribución de probabilidad. Supongo que en su caso las probabilidades serán diferentes de una casilla a otra, pero esto no debería representar ninguna dificultad. Cada casilla sería un grupo de días con información sobre las probabilidades y la frecuencia de las lluvias en ese grupo de días. El único problema podría ser la falta de datos en este tipo de estudio.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X