Estoy trabajando en un problema que tengo para calcular la mediana para un conjunto de datos muy grande (por ejemplo, a 100 metros de valores) que tiene un registro de la distribución normal. Debido a que el conjunto de datos de tamaño, estábamos pensando en tomar una muestra (es decir, un subconjunto aleatorio de 2000 valores), y el cálculo de la mediana. Aunque este es mucho más bonito de un cálculo perspectiva, estoy muy preocupado de que va a ser inexacta.
¿Qué método puedo utilizar para determinar que tan preciso es este muestreados mediana es?