No creo que el cuadrado necesariamente hacer lo que desee, incluso si hace las cosas parecen normales.
Si desea probar la igualdad de una media de población a una hipótesis significa entonces por la prueba de una variable transformada puede ser muy propensos a rechazar cuando el original de la media de población es el que se da en el valor null (es decir, usted va a ser propensos a rechazar los verdaderos valores nulos).
Considerar algunos variable aleatoria $X$ a que algunos de distribución con $\mu=\mu_0$ y la no-cero de la varianza.
Deje $Y=X^2$.
$E(Y)=E(X^2) = E(X)^2 +\text{Var}(X)=\mu_0^2+\sigma^2_X$
En consecuencia, una prueba de $H_0^*:\mu_Y=\mu_0^2$ debe rechazar (y en grandes muestras, será esencialmente cierto, a pesar de que la hipótesis original $H_0:\mu_X=\mu_0$ era cierto.
Cuidado con la mezcla de las pruebas de hipótesis y de las transformaciones a menos que usted realmente entender cómo se comportan!
Ilustración
Aquí una muestra de un poco a la izquierda-sesgar la distribución media de la población es 5:
Por casualidad, la media de la muestra salieron muy cerca de la media de población:
> mean(y)
[2] 5.000247
Ahora nos cuadrado. ¿Cómo funciona la media compara con el 25?
> mean(y^2)
[1] 27.97773
Casi 28 (la varianza de la población de Y fue alrededor de 3, así que esto es lo esperado)
Así que si queremos probar si la media de la población es de $Y^2$ es de 25 ... estamos propensos a rechazar. (En este ejemplo concreto, el p-valor sólo sería de alrededor de 0.08)
Código fue solicitado; por desgracia yo no mantener el código que he usado para generar
el ejemplo; este es vagamente similar a la del ejemplo en que se deja de sesgo con media 5 y desviación sustancial (aunque no tan grande como en el original):
n=100;x=ifelse(runif(n)<.5,pmax(runif(n),runif(n),runif(n))*5,runif(n,5,7.5))
He aquí los resultados de una muestra de 1000 en vez de 100 con el código:
> mean(x);var(x);mean(x^2)
[1] 4.985436
[1] 2.35402
[1] 27.20623
> mean(x)^2+var(x)*(1-1/length(x)) # adjust for Bessel's correction
[1] 27.20623
(El ajuste para deshacer la corrección de Bessel en las muestras hace que funcione como el álgebra de la población)
[De lo relevante que sería un caso de dos muestras? Si las dos poblaciones de las que se tomaron las muestras no tienen la misma varianza, los medios de sus plazas serán diferentes. Esto es muy diferente de la habitual problema con diferentes varianza y la igualdad de la varianza de la prueba t -- la prueba en este caso es mucho más afectados.]
Entonces, ¿qué hacer? Tenemos que empezar con la precisión de la hipótesis de interés y encontrar una forma razonable (al menos para una buena aproximación) prueba de eso.
Parece que el null es, definitivamente, la igualdad de medios.
Hay varias opciones que yo veo:
El uso de la prueba t-test como es; dependiendo de cómo sesgada y pesado de cola de la distribución, nivel de significación y potencia no puede ser tan gravemente afectados.
Vienen con un adecuado modelo paramétrico de las variables en cuestión.
Una prueba de permutación es posible, pero puede presentar dificultades; en virtud de la costumbre hipótesis sería necesario asumir la simetría bajo nulo (esto no implica que la muestra debe buscar simétrica, sólo que si la nula fuera cierto que se debe esperar a ser simétrica).
Una forma de bootstrap prueba podría ser empleado; puede ser razonable si los tamaños de muestra fueron bastante grande para las dos variables.