A menudo sugerencias de ortografía en su significado. Con esto como punto de partida, junto con una comprensión de lo que una variable aleatoria es, podemos imaginar el resto. En lugar de simplemente dar una interpretación, en primer lugar se llevará a través del razonamiento utilizado para analizar estas expresiones: que podría ayudar a dar sentido a material relacionado en otras partes del libro.
Variables aleatorias
Podríamos tomar la capitalización de $X_1, \ldots, X_n$ $Y$ a las sugerencias que están destinadas para denotar variables aleatorias. Recordemos que de manera abstracta, esto significa que hay una probabilidad del espacio de algunos (abstracto, normalmente sin nombre) conjunto subyacente $\Omega$ y que cada una de estas cantidades se pueden medir con un valor real de la función con dominio de $\Omega$. Podemos escribir esto con flechas en el formulario
$$X_1, \ldots, X_n, Y: \Omega \to \mathbb{R}.$$
$\Omega$ es una representación matemática de los objetos del mundo real en el que estamos interesados. Estos objetos normalmente no son en sí mismos matemáticos y no tienen números intrínsecamente asociados con ellos. Que pueden ser las personas, los insectos, las estrellas, las economías, los procesos de producción, o lo que sea. El $X_i$ $Y$ representan numéricos de las propiedades de estos objetos.
Vectores
La variable aleatoria $X$ es el vector de valores. Formalmente,
$$X:\Omega\to \mathbb{R}^p$$
se define en términos de la $p$ canónica de proyección funciones
$$\eqalign{
\pi_i:\mathbb{R}^p \to \mathbb{R} \\
\pi_i(x_1, \ldots, x_{i-1}, x_i, x_{i+1}, \ldots, x_p) = x_i
}$$
como la única función para la que $\pi_i \circ X = X_i$. Con las flechas podemos representar de la siguiente manera:
$$X_i: \Omega \xrightarrow{X} \mathbb{R}^p \xrightarrow{\pi_i} \mathbb{R}.$$
$X$ muy bien recoge el $p$ predictores $X_i$ en un solo objeto matemático.
Las respuestas, las funciones del modelo y los errores
En la expresión
$$Y = f(X) + \epsilon,$$
sabemos que el valor de $Y$ es un número real, donde tanto $f(X)$ $\epsilon$ son números reales. La única razonable en el sentido de que $f:\mathbb{R}^p \to \mathbb{R}$, así:
$$f:\mathbb{R}^p \to \mathbb{R.}$$
El modelo de función $f$ es, simplemente, una función de $p$ números reales. Si me das los valores de $p$ predictores $X_i(\omega)$, $i=1, \ldots, p$, a continuación, $f$ me dará una conjetura sobre el correspondiente valor de $Y(\omega)$
La cantidad de $\epsilon$ es poco probable que solo se trate de un número fijo: representa la diferencia entre el $Y$ e lo $f$ predice de $X$. Por lo tanto, debemos entender que
$$\epsilon:\Omega \to \mathbb{R}$$
es una variable aleatoria ("error") y el "$+$" representa pointwise adición de funciones de la forma habitual:
$$Y(\omega) = (f(X) + \epsilon)(\omega) = f(X(\omega)) + \epsilon(\omega)$$
para todos los $\omega\in\Omega$. Esta es la manera habitual de añadir las variables aleatorias $f\circ X$$\epsilon$.
Si quieres ser formal acerca de usted tendrá que recoger $f$ $\epsilon$ a un par ordenado de las funciones e identificar que con una función en el producto Cartesiano de sus rangos, dando a esta foto de $Y$:
$$Y: \Omega \xrightarrow{(X, \epsilon)} \mathbb{R}^p \times \mathbb{R} \xrightarrow{(f, \operatorname{id})} \mathbb{R}\times\mathbb{R}\xrightarrow{+}\mathbb{R}.\tag{1}$$
"$\operatorname{id}$" denota la función identidad en $\mathbb{R}$, $x\to x$ para todos los números de $x$.
Predictores
Desde $\hat f$ es una "aproximación a la función, debemos tratar de entender como una versión de $f$: es una conjetura acerca de lo $f$ es. En consecuencia, $\hat f$ también deben estar en función de $p$ variables. Vamos a dibujar las flechas para $\hat{Y}=\hat f(X)$:
$$\hat{Y}: \Omega \xrightarrow{X} \mathbb{R}^p \xrightarrow{\hat f} \mathbb{R}.\tag{2}$$
Esto muestra claramente que $\hat Y = \hat{f}\circ X$ es el mismo tipo de objeto como $Y$: es decir, una variable aleatoria.
Respuestas
Respuesta 1
Las flechas en $(1)$ $(2)$ muestran que tanto $Y$ $\hat Y$ son variables aleatorias: sus dominios se $\Omega$.
Respuesta 2
Cuando una "observación" de $X$ se dibuja, nos da una "realización" $x_1$. Vamos a hacer esto $n \ge 0$ veces (a menudo de forma independiente, pero no necesariamente), la producción de una muestra de $x_1, x_2, \ldots, x_n$. Cada una de las $x_i$ $p$- vector. Las expresiones $f(x_i)$ $\hat f(x_i)$ no requieren de análisis: por definición, $f$ $\hat f$ son funciones cuyos dominios se $\mathbb{R}^p$. Aquí, se han aplicado a un elemento específico de $x_i \in \mathbb{R}^p$.
Respuesta 3
La expresión "$f(X_1, \ldots, X_p)$" tiene sentido: representa el $f\circ X: \Omega\to\mathbb{R}$. Como lo indica la flecha, se aplica a los elementos de $\omega\in\Omega$, no individual vectores $x_i$. Aunque podríamos entender "$(f(X_1, \ldots, X_p))(\omega)$" de esta manera, "$(f(X_1, \ldots, X_p))(x_i)$" sería absurdo a menos que se estipula que el $\Omega=\mathbb{R}^p$. Aunque a veces esto se hace, y muchos libros de texto (especialmente de los más elementales tipo) se puede leer en este camino, que conceptualmente es más claro para no confundir los objetos en $\Omega$ $p$- tuplas de números que se utilizan para caracterizar algunas de sus propiedades. Lejos de ser "suelta", esto es bastante rigurosa de la notación.