Cuán significativo es un valor que se compara con una lista de valores? En la mayoría de los casos estadístico de prueba se basa en la comparación de un conjunto de muestras de una población. En mi caso la muestra se hizo por un valor y la comparamos con la población.
Soy un diletante en las pruebas de hipótesis estadísticas confrontados con tal vez el más básico problema. No es solo una prueba, sino cientos de ellos. Tengo un espacio de parámetros, y se debe hacer una significación de la prueba para cada punto. Tanto en valor y el fondo de la lista (de la población) son generados para cada combinación de parámetros. Luego hago el pedido esta por valor de p y encontrar interesantes combinaciones de parámetros. De hecho, el hallazgo de combinaciones de parámetros donde este p-val es alta (nonsignificance) también es importante.
Así que vamos a tener una sola prueba: tengo un valor calculado generados a partir de un conjunto seleccionado y un fondo conjunto de valores calculados mediante la elección al azar del conjunto de entrenamiento. El valor calculado es de 0,35 y el fondo es (probablemente?) normalmente distribuida con una media de 0,25 y una muy estrecha sexual (e-7). Yo en realidad no tienen conocimiento sobre la distribución, debido a que las muestras se calculan a partir de algo más, que no son números al azar muestras de algunos distribución, de forma que de fondo es la palabra correcta para ella.
La hipótesis nula sería que "la media de la muestra de prueba es igual a mi valor calculado, de 0.35". Cuándo debo considerar que se trata de una prueba Z o un T-test? Quiero el valor para ser significativamente mayor que la media de la población es, por lo tanto se trata de una sola cola de la prueba.
Estoy un poco confundido en cuanto a qué considerar como un ejemplo: yo tengo una muestra de uno (la observación) y el fondo de la lista de la población O de mi ejemplo es el fondo de la lista y estoy comparando eso con el todo (no muestreados) de la población que de acuerdo a la hipótesis nula debe tener la misma media. Una vez que esto está decidido, la prueba va a direcciones diferentes, supongo.
Si es un T-test, ¿cómo puedo calcular el p-valor? Me gustaría calcular a mí mismo en lugar de usar un R/Python/función de Excel (ya sé cómo hacerlo) por lo tanto, debo establecer la fórmula correcta primero.
Para empezar, tengo la sospecha de un T-test es un poco demasiado general, ya que en mi caso la prueba de T estaría vinculado con el tamaño de la muestra y tendría el formulario: $$T=Z/s,$$ where $$Z=\frac{\bar{X}}{\frac{\sigma}{\sqrt{n}}}$$ and s is $$s=\hat{\sigma}/\sigma$$, la muestra std frente a la población de las ets. Así que tengo dos casos: a mi el tamaño de la muestra es el tamaño de la población, lo que yo "creo" significaría que estoy tratando con la prueba Z, o las estadísticas de la población (n y ets) son desconocidos, pero la distribución puede ser en alguna manera aproximada y estoy realmente tratando con un T-test. En cualquier caso mis siguientes preguntas:
- ¿Cómo puedo calcular un valor de p? (es decir, no utilizando un R/Python/función de Excel o p-valor tabla look-up, pero en realidad se calcula con base en una fórmula, porque quiero saber lo que estoy haciendo)
- ¿Cómo puedo decidir un umbral de significancia basado en mi tamaño de la muestra? (una fórmula sería bueno)