"La mayoría de los hombres son más rápidos que la mayoría de las mujeres" es potencialmente un poco ambiguo, pero yo normalmente interpretar la intención de que sea que si miramos al azar parirings, la mayoría del tiempo el hombre sería más rápido, es decir, $P(M_i<F_j)>\frac12$ random $i,j$ (donde $M_i$ es 'tiempo para la $i$-th macho", etc).
Por supuesto, otras interpretaciones de la frase son posibles (que es lo que la ambigüedad es, después de todo) y algunas de esas otras posibilidades podrían ser coherente con su razonamiento.
[También tenemos la cuestión de si estamos hablando de las muestras o poblaciones... "la mayoría de los hombres [...] la mayoría de las mujeres", parece ser una población declaración (sobre una población de potenciales veces), pero sólo hemos observado veces que parece que lo estamos tratando como una muestra, por lo que debemos ser cuidadosos con la forma amplia en que hacer el reclamo.]
Tenga en cuenta que $P(M_i<F_j)>\frac12$ no está implícita $\widetilde{M}<\widetilde{F}$. Pueden ir en direcciones opuestas.
[No estoy diciendo que está mal en el pensamiento de que la proporción de azar M-F parejas donde el hombre fue más rápido que la mujer es más de 1/2-son casi ciertamente correcto. Solo estoy diciendo que no se puede saber mediante la comparación de las medianas. Ni se puede decir de ella mirando la proporción en cada una de las muestras por encima o por debajo de la mediana de la otra muestra. Tendrías que hacer una comparación diferente.]
Es decir, mientras que el hombre medio puede ser más rápido que la mediana de la mujer, es posible tener una muestra de veces (o una distribución continua de veces, de hecho) donde la probabilidad de que un azar que el hombre es más rápido que un azar de la mujer es menos de $\frac12$. En grandes muestras de los dos opuestos, las indicaciones de cada ser significativo.
Ejemplo:
Conjunto de datos:
1.58 2.10 16.64 17.34 18.74 19.90 1.53 2.78 16.48 17.53 18.57 19.05
1.64 2.01 16.79 17.10 18.14 19.70 1.25 2.73 16.19 17.76 18.82 19.08
1.42 2.56 16.73 17.01 18.86 19.98
Conjunto de datos B:
3.35 4.62 5.03 20.97 21.25 22.92 3.12 4.83 5.29 20.82 21.64 22.06
3.39 4.67 5.34 20.52 21.10 22.29 3.38 4.96 5.70 20.45 21.67 22.89
3.44 4.13 6.00 20.85 21.82 22.05
Conjunto de datos C:
6.63 7.92 8.15 9.97 23.34 24.70 6.40 7.54 8.24 9.37 23.33 24.26
6.18 7.74 8.63 9.62 23.07 24.80 6.54 7.37 8.37 9.09 23.22 24.16
6.57 7.58 8.81 9.08 23.43 24.45
(Los datos son de aquí, pero de ser utilizado para un propósito diferente allí-a mi recuerdo que me generó esta en uno mismo)
Tenga en cuenta que la proporción de Un < B es de 2/3, la proporción de < C es 5/9 y la proporción de B < C es de 2/3. Tanto a vs B y B vs C son significativas al 5% de nivel, pero podemos lograr cualquier nivel de significación, simplemente mediante la adición de un número suficiente de ejemplares de las muestras. Incluso podemos evitar lazos, mediante la duplicación de las muestras, pero añadiendo suficientemente pequeña fluctuación (lo suficientemente menor que la mínima diferencia entre los puntos)
La muestra de los separadores de ir en otra dirección: la mediana(A) > mediana (B) > mediana (C)
De nuevo podríamos alcanzar significación para la comparación de las medianas - para cualquier nivel de significación - por la repetición de las muestras.
Se relacionan con el problema presente, imaginar que es a las mujeres "a veces" y B es "hombres del tiempo". A continuación, la mediana de los hombres del tiempo es más rápido, pero un elegida al azar, el hombre va a 2/3 del tiempo de ser más lento que un elegido al azar de la mujer.
Tomando nuestro ejemplo de las muestras a y C, se puede generar un conjunto de datos mayor (R) de la siguiente manera:
n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))
La mediana de F será de alrededor de 16.25 mientras que la mediana de M será de alrededor de 11.25, pero la proporción de casos donde F < M será 5/9.
[Si se sustituye el n/3 con una variable aleatoria binomial con parámetros de $n$ $\frac13$
nos gustaría ser de muestreo de una población donde la mediana de la distribución de F es a las 16.25, mientras que la mediana de la distribución de M es a las 11: 25. Mientras tanto en la población la probabilidad de que F < M volverá a ser 5/9.]
Tenga en cuenta también que $P(F<\text{med}(M))=\frac23$ $P(M>\text{med}(F))=\frac23$ mientras $\text{med}(M)<\text{med}(F)$ (por una considerable distancia).