Hay una población $D$, en el que cada punto de datos tiene dos atributos $X$ $Y$ que están distribuidos al azar. Aunque probablemente no es exactamente una distribución normal, me imagino que no son demasiado patológico. No sé sus medios y $s.d.$'s, pero son propensos a ser algo similar. Yo también no se sabe a priori si $\mu_X$ o $\mu_Y$ es mayor; también no sé si $X$ $Y$ están correlacionados.
Hay otro conjunto de datos de $D'$, con los mismos dos atributos, pero ligeramente se distribuyen de manera diferente: $X'$ $Y'$ se distribuyen $X' \sim X + c1$ $Y' \sim Y + c2$ donde $c1$ $c2$ se asume como constante, pero desconocido.
Puedo probar directamente desde $X$ (sin saber $Y$) o de $Y$ (sin saber $X$); y, también puedo muestra de $max(X', Y')$ en la que puedo obtener los identificadores de ese estado si cada valor proviene de $X'$ o $Y'$, es decir, si $x' > y'$ o $y' > x'$ para este punto de datos. Aunque las variables son números reales, debido a que el procedimiento de muestreo se redondean. Como resultado, $x'$ $y'$ puede atar y en caso de que el identificador informe bien $X'$ o $Y'$ al azar.
Tengo dos preguntas. ¿Cuál es la mejor manera de probar:
- si $X' > X$$Y' > Y$?
- si $max(X', Y')$ > $max(X, Y)$?