Estoy llevando a cabo un estudio descriptivo, y estoy usando toda la población en mi estudio y no una muestra. Entiendo que todo lo que estoy reportando en este momento es un parámetro de población. Sin embargo, Cómo informo de las relaciones que podría encontrar entre las variables. Por ejemplo, si tuviera que establecer una tabla de contingencia, cómo será lo que me parece demostrado como siendo significativa. ¿Debo utilizar chi cuadrado?
Respuestas
¿Demasiados anuncios?El concepto de significado, o la prueba de hipótesis no es relevante para toda la población. La prueba de hipótesis se basa en la suposición de que tratar con una muestra de un (por lo general) población infinita, con la pregunta: ¿cuál es la probabilidad de que hemos extraído la muestra al azar de una población que cumple con los supuestos de la hipótesis nula? Si esta probabilidad es baja, entonces rechazamos la nulos.
Imagine el siguiente escenario. Medir dos grupos de personas (por ejemplo, diez personas de Nueva York y 10 personas, por ejemplo, de Cracovia) y se encuentra que el promedio de altura en los dos grupos es de 1,80 y 1.79 metros, respectivamente, y las desviaciones estándar son 15cm. Si esto es una muestra de una población infinita, no rechazar la hipótesis nula-la diferencia es pequeña, y llegamos a la conclusión de que la probabilidad de obtener estos resultados si no hay ninguna diferencia en la realidad (que es, en nuestra infinita de la población) es relativamente alto.
Sin embargo, si estos dos grupos el total de la población, entonces no tiene ninguna importancia. Si usted ha medido cada persona que vive en Cracovia y a cada persona que vive en Nueva York y se encontró una diferencia en los promedios de 1 cm, las poblaciones son diferentes en su decir, que se detenga por completo. No tenemos probabilidades, sino sólo las medidas! (excepto posiblemente por un error de medición).
Lo que usted puede hacer en su lugar es para mostrar el tamaño del efecto. En el ejemplo hipotético, mostrar la diferencia entre los grupos, por ejemplo, el uso de Cohen d; es decir, expresar la diferencia en desviaciones estándar. En el ejemplo anterior, la diferencia sería de 1 cm/15cm = 0.0(6). Cómo calcular el tamaño del efecto dependerá de lo que en realidad es de sus datos.
El punto es, creo yo, no preguntes lo que es estadísticamente significativo, pero lo que el tamaño del efecto es significativo para usted, como un científico.
De enero de respuesta es correcta medida de lo que va. Sin embargo, si decir la población que está considerando es relativamente pequeños, por ejemplo de 100 a 1000 y recolectados los datos para un período determinado, entonces, si usted quiere inferir que sus conclusiones se aplican también a grupos similares en una fecha futura, entonces usted puede encontrar que es más apropiado para tratar como una muestra y aplicar los procesos estadísticos. Incluso para las ciudades de más de un año, puede haber una considerable afluencia o eflux de los inmigrantes o emigrantes, o puede haber una epidemia de la enfermedad o de otro evento que pueda afectar a sus conclusiones, si se utilizan con fines predictivos.
Usted siempre debe preguntarse, ¿qué cantidades me interesa? Las estadísticas no (directamente) respuesta no numérica preguntas. Debe tener en cuenta - que el aspecto de que el grupo de personas soy interesado en, y cómo se relacionan con los valores de la muestra en la mano?
Estadísticas descriptivas, tales como la media, el coeficiente de correlación, o de Cohen d, cuantificar diversos aspectos de una muestra. La estadística inferencial, como punto de pruebas de hipótesis, proporcionar estimaciones de estas mismas medidas para toda la población basado basado en un subconjunto (en la cara de un error de muestreo). Esto permite adivinar lo que una estadística descriptiva habría sido, tenía toda la población ha medido sin error. Que generalizar a partir de algunos datos de que disponemos, para algunos datos no tenemos - bajo el supuesto de que los datos que tenemos es representativa de los datos no lo hemos hecho.
Un inferencial estadística no será más que una aproximación de la estadística descriptiva. Como se nota por @de enero, la significación Estadística no significa que tiene una importancia práctica; más bien, la significación estadística (en el contexto de punto de las pruebas de hipótesis) le informa de que usted podrá ceder bajo nivel de confianza específico de un solo valor para el parámetro de población (frecuencia cero). Si precisamente saber el valor del parámetro de población, no puedo imaginar ninguna razón para estimar .
Lo que significa que tiene un nivel bajo de confianza en un determinado valor para el parámetro de población, tales como "rechazo de la nula" cuando p<0.05, normalmente, lo que significa que usted rechazar con un poco de confianza la hipótesis de que la media de población es de 0, depende del problema en cuestión. El valor puede ser distinto de cero, pero tan baja que no tienen relevancia práctica. Que una de las pruebas rechaza un punto nulo no llevar información más directa de conocer el parámetro de población específica (no-cero) valor; en su lugar, lleva menos información, ya que la prueba de hipótesis arroja dudas sobre un valor, el descriptiva estadística arroja dudas sobre todos, pero uno de los valores. (Indirectamente, un p valor también le informará acerca de otras estadísticas descriptivas, como la varianza y el tamaño del efecto). Usted puede imaginar la estadística inferencial como la "confianza etiquetas" asignado a la estadística descriptiva (aunque esta metáfora está acercando peligrosamente a p(H|D)).
Sin embargo, no es tan fácil como decir que si el conjunto de la población, el investigador está interesado en que ha sido medido, las estadísticas descriptivas son claramente superiores. Si la estadística inferencial sentido o no depende no sólo de la fracción de la población muestreada, pero también sobre la fiabilidad de las mediciones. Por ejemplo, la altura en @enero del ejemplo es bastante fácil de medir correctamente (ignorando por ahora que las personas crecen, mueren, accidentes, ...). Pero, ¿y si estaban interesados en su memoria lapso, los ingresos o la barba de longitud? En tales casos, un error de muestreo que caracteriza a los datos, incluso aunque la población ha sido la muestra, y no en el hecho de conocer de forma precisa el parámetro. Si se va a repetir la medición, usted obtendrá totalmente diferente (aunque estadísticamente muy similar) resultados! En tales casos, la inferencia aún puede ser útil.
Pero básicamente: considerar el parámetro que usted está interesado en. p los valores y la significación estadística no son tanto los parámetros, pero "la confianza en las etiquetas" para dichos parámetros.