3 votos

Pruebas de hipótesis para datos no normales

Estoy midiendo el error producido por operarios que ejecutan cortes planares bajo diferentes sistemas de guiado. Defino un plano objetivo y luego mido la distancia euclidiana desde puntos muestreados uniformemente en el plano objetivo hasta el plano ejecutado. Como el plano objetivo es la referencia de mi sistema de coordenadas, lo defino como el plano $xz$ en $\mathbb{R}^3$ . El plano ejecutado $E$ se define como $ax + by + cz + d=0$ con $b \neq 0$ y, dado que estoy muestreando puntos de $xz$ y proyectarlos en $E$ entonces $b$ nunca podría ser $0$ . Entonces $E$ podría reescribirse como $y = -\frac{a}{b}x - -\frac{c}{b}z -\frac{d}{b}$ con $x \sim \mathcal{U}(x_{min}, x_{max})$ y $z \sim \mathcal{U}(z_{min}, z_{max})$ . Por supuesto, la herramienta de corte también produce algún ruido (tal vez normal) que afecta a $y$ . La variable aleatoria $y$ no se distribuye normalmente (lo he probado y he trazado algunos qq-plots de ello).

Tengo 2 sistemas de guiado diferentes y tengo que comprobar si son significativamente diferentes con respecto al método de medición descrito anteriormente. ¿Qué método me recomienda utilizar para comprobar mi hipótesis?

In yellow one of the methods, in green the other one. I'm trying to show that the green method is better

Gracias.

2voto

AdamSane Puntos 1825

Sugieres la posibilidad de una prueba de Kruskal-Wallis, y es muy posible que sea adecuada.

De hecho, el criterio que mencionas en los comentarios - "más cerca de cero con más frecuencia"- sugiere directamente hacer un Kruskal Wallis sobre la desviación absoluta de cero. La versión de dos muestras (una prueba de Wilcoxon-Mann-Whitney) tiene de hecho una interpretación directa en el sentido de "más pequeño más a menudo"; de hecho, en ese caso se puede escalar el estadístico U a una estimación de esa probabilidad (dividiendo el estadístico U por el número total de comparaciones por pares, es decir, su valor máximo posible).

Si, por el contrario, su interés se centra más en alguna medida del cambio de ubicación, entonces, con una suposición adicional (que las distribuciones tienen una forma idéntica, aparte del posible cambio de ubicación), Kruskal-Wallis puede seguir siendo una buena opción. Además, en el caso de dos muestras, hay una estimación de desplazamiento de ubicación que está fácilmente disponible (también se pueden obtener regiones de aceptación -parecidas a elipsoides de confianza en ANOVA- para todo el conjunto de desplazamientos de ubicación)

Estas dos posibles formas de ver el Wilcoxon-Mann-Whitney se analizan con más detalle aquí .

El Kruskal-Wallis es similar, pero no hay una correspondencia exacta porque el estadístico K-W puede dividirse en diferencias transitivas (tipo WMW) y no transitivas (véase la discusión en el punto (3) en esta respuesta ); normalmente el segundo componente es relativamente pequeño, pero a veces puede ser importante.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X