A variable aleatoria , $X:\Omega \rightarrow \mathbb R$ es una función del espacio muestral a la recta real. Se trata de una fórmula determinista que puede ser tan sencillo como anotar el número en el que cae un dado en el experimento aleatorio de lanzar un dado. El experimento es aleatorio, en el sentido de que no controlamos muchos de los factores físicos que determinan su resultado; sin embargo, en cuanto el dado cae, la variable aleatoria asigna el resultado en el mundo físico a un número.
Otros ejemplos incluirían la medición de la altura de una muestra de alumnos de octavo curso, quizá para inferir los parámetros de la población (incluidas la media y la varianza). Cada niño o niña sería el resultado de un experimento aleatorio, más o menos como lanzar una moneda al aire. Una vez seleccionado un sujeto, la asignación real a un número en pulgadas o centímetros no está sujeta al azar, a pesar de su nombre de "variable aleatoria".
Un grupo de experimentos de este tipo constituiría un muestra : "En estadística, una muestra aleatoria simple es un subconjunto de individuos (una muestra) elegidos de un conjunto mayor (una población)". Esta definición es intuitiva, pero deja implícito el término población. En este documento , señalando que "el término "población" como sustantivo debería referirse al espacio muestral, no a la variable aleatoria, como ocurre en muchos libros de texto".
A muestra aleatoria es una colección de $n$ variables aleatorias independientes e idénticamente distribuidas (i.i.d.) $X_1, X_2, X_3,\dots, X_n.$ en el que ${\displaystyle X_{i}}$ es la función $X(\cdot)$ aplicado al resultado de la $i$ -experimento: ${\displaystyle x_{i}=X_{i}(\omega )}.$ Aunque el muestreo sin reemplazo no cumple el requisito de independencia, este punto se pasa por alto cuando se toman muestras de una población grande en favor de la conveniencia computacional.
En $n$ -tuplas $x_1,x_2,x_3,\dots,x_n$ son realizaciones particulares de las variables aleatorias, que en el caso propuesto en la pregunta, se extraerían de $N(\mu,\sigma^2)$ idénticamente distribuidos $X_i$ variables aleatorias. Así, en la OP, el proceso de "extraer algunas muestras" daría lugar a realizaciones individuales de esta colección de variables aleatorias.
Las variables aleatorias son objeto de leyes matemáticas, como la LLN o la CLT. La distribución de la variable aleatoria dictará la viabilidad de la inducción a partir de muestras aleatorias. Por ejemplo, cualquier realización dada tendrá siempre una media y una desviación típica como $n$ -tupla o números reales, pero sus variables aleatorias generadoras pueden no tener momentos finitos, por ejemplo, Pareto, lo que compromete la inferencia estadística sobre las características de la población.