Digamos que tengo una variable categórica. Trato de probar la hipótesis nula de que cada categoría tiene la misma cuenta (de algo), utilizando una de Pearson prueba de Chi-Cuadrado. Puede que no sea capaz de rechazar la hipótesis nula, utilizando sólo las variables categóricas, pero si yo grupo de las categorías juntos en el camino correcto, puedo rechazar la hipótesis nula. (Por ejemplo, {a,b,c} tienen un mayor conteo de {d,e,f}.) Parece sin embargo, que si puedo elegir mi agrupaciones basadas en mi la distribución de la muestra, entonces yo soy el sobreajuste. En las simulaciones, he sido capaz de agrupar las categorías de cargos a partir de una distribución uniforme en la forma correcta para rechazar la hipótesis nula demasiado a menudo para mi nivel de significación. Sin embargo, quiero ser cuantitativa acerca de este error/abuso estoy cometiendo. Por ejemplo, yo podría estar dispuesto a grupo{a,d,e},{b,c,f}, pero en ninguna otra partición tendría sentido en mi contexto. En este caso yo estaría más seguro en la toma de la decisión de grupo o no del grupo, a continuación, si me consideran todas las posibles particiones.
Hay alguna manera de cuantificar este tipo de sobreajuste? Pensé que podría estar escondido en los grados de libertad, o tal vez es un tipo de parámetro y algo como AIC o BIC puede ser útil.