Estoy trabajando con un producto que convierte los datos de las encuestas en estadísticas útiles. La revisión de su código, me ha puesto algo nervioso, y no soy un estadístico, así que espero poder pedir claridad del siguiente problema:
De una encuesta S, para un producto P. Se preguntó a los encuestados si
- me gustó el producto
- eran indiferentes
- odiaba el producto
El grupo de encuestados se dividió en hombres y mujeres. El gráfico suministrado por el programa informático, al procesar algunos datos de la encuesta, dice que "Los hombres son significativamente más propensos a ser likers". O "Los hombres y las mujeres..." O "Las mujeres..."
Para mí esto ya plantea problemas:
- Los hombres son significativamente más propensos a ser likers que qué?
- Los hombres y las mujeres tienen más probabilidades de ser likers que qué?
- ¿Cómo se miden estas cosas?
- ¿Qué prueba se utiliza?... etc.
Cuando eché un vistazo al código, me di cuenta de que estaban utilizando una prueba de chi (¡!). Tuve que preguntar cuál era exactamente la hipótesis nula, porque esto tenía cada vez menos sentido. Al parecer, la hipótesis nula es que " la probabilidad de que los hombres y las mujeres sean likers es la misma " ...vale, bien. Pero espera.
Así, tenemos la siguiente tabla:
Men Women Total
likers 54 46 100
indifferent 23 26 49
non-likers 22 31 53
Total 99 103 202
Podemos rellenar las distribuciones esperadas para las tres filas:
Men Women Total
likers 54-49 46-50 100
indifferent 23-24 26-24 49
non-likers 22-25 31-27 53
Total 99 103 202
A continuación, el código rellena una matriz con valores de chi basados en lo anterior. El programador decidió que los grados de libertad al hacer estos cálculos eran (m-1)(n-1) = 2, lo que en este punto me hizo pensar que la hipótesis nula era más bien que si te gusta, te es indiferente o no te gusta, hay la misma probabilidad de que seas hombre o mujer .
Estamos utilizando un nivel de confianza del 90%, así que todo lo que imaginé que teníamos que hacer era sumar todos los 6 valores de chi, y comparar eso con un valor crítico dado por los grados de libertad y el intervalo de confianza. A partir de ahí, podríamos decir con un 90% de certeza que los hombres y las mujeres tienen la misma probabilidad de gustar, etc... o rechazar la H.N.
Esto es lo que hace el código en su lugar:
- Utiliza 1 grado de libertad en lugar de 2 (todavía al 90%), por lo que tenemos un nuevo valor crítico 2,706
- Para cada fila (liker, etc...) de la matriz de valores chi, si un elemento es mayor que el valor crítico rechaza la hipótesis nula, y añade el elemento a una lista de "significación".
Para ilustrar, busca [likers;men] > cv, es decir, chi_value[0][0] > cv, si eso es cierto, rechaza N.H., y añade 'men' a la lista.
En el gráfico este resultado se refleja como: los hombres son más propensos a gustar . Para mí esta evaluación única de hombres y mujeres para cada fila me parece errónea. No tiene sentido pronunciarse sobre dos variables cuando sólo se observa una...
No soy ni mucho menos tan inteligente como mi jefe, pero me parece que algo ha fallado aquí y agradecería que alguien me ayudara a aclararlo.
Por último, el cliente ha pedido conocer el % más de probabilidades de que los hombres sean likers que las mujeres -- Creo que es una petición errónea, ya que una prueba de chi cuadrado no aborda cuestiones de cuál es mayor o menor, sino que sólo sirve para confirmar que un conjunto de variables son independientes. ¿Estoy en lo cierto?
Sólo quiero añadir que he utilizado la siguiente afirmación para guiar mi pensamiento:
Nota de advertencia Es importante tener en cuenta que la prueba de chi-cuadrado sólo comprueba si dos variables son independientes. No puede abordar cuestiones como cuál es mayor o menor. Utilizando la prueba de chi-cuadrado, no podemos evaluar directamente la hipótesis de que los hombres gustan más que las chicas; más bien, la prueba (estrictamente hablando) sólo puede probar si las dos variables Gusto y Género, son independientes o no.