5 votos

¿Cuál es el dominio de esta variable aleatoria?

He estado de auto-estudio de Introducción a la Estadística de Aprendizaje. A partir de la página 16 del libro:

"...supongamos que se observa una respuesta cuantitativa $Y$ $p$ diferentes predictores, $X_1$, $X_2$, $\ldots$, $X_p$. Suponemos que existe una cierta relación entre el$Y$$X = (X_1, X_2, \ldots, X_p)$, que puede ser escrito en la misma forma general de la $Y = f(X) + \epsilon$

Posteriormente, se analiza la aproximación de la función

$$ \hat{Y} = \hat{f}(X). $$

Pregunta 1: ¿Cuál es el dominio de $Y$$\hat{Y}$? Es tuplas de observaciones o tuplas llena de valores a partir de los dominios de la $X_1$, $\ldots$, $X_p$?

Pregunta 2: a lo Largo de este texto, uno va a ver referencias a la notación como $\hat{f}(x_i)$. Por ejemplo:

$$ MSE = \frac{1}{n} \sum_{i=1}^n (y_i - \hat{f}(x_i))^2 $$

No es el dominio de $\hat{f}$ variables aleatorias (no tuplas de observaciones $x_i$)?. Si es así, ¿no es esto un abuso de notación? No hemos de lugar (técnicamente) escribir algo como

$$ (f(X_1, \ldots, X_p))(x_i)? $$

7voto

jldugger Puntos 7490

A menudo sugerencias de ortografía en su significado. Con esto como punto de partida, junto con una comprensión de lo que una variable aleatoria es, podemos imaginar el resto. En lugar de simplemente dar una interpretación, en primer lugar se llevará a través del razonamiento utilizado para analizar estas expresiones: que podría ayudar a dar sentido a material relacionado en otras partes del libro.


Variables aleatorias

Podríamos tomar la capitalización de $X_1, \ldots, X_n$ $Y$ a las sugerencias que están destinadas para denotar variables aleatorias. Recordemos que de manera abstracta, esto significa que hay una probabilidad del espacio de algunos (abstracto, normalmente sin nombre) conjunto subyacente $\Omega$ y que cada una de estas cantidades se pueden medir con un valor real de la función con dominio de $\Omega$. Podemos escribir esto con flechas en el formulario

$$X_1, \ldots, X_n, Y: \Omega \to \mathbb{R}.$$

$\Omega$ es una representación matemática de los objetos del mundo real en el que estamos interesados. Estos objetos normalmente no son en sí mismos matemáticos y no tienen números intrínsecamente asociados con ellos. Que pueden ser las personas, los insectos, las estrellas, las economías, los procesos de producción, o lo que sea. El $X_i$ $Y$ representan numéricos de las propiedades de estos objetos.


Vectores

La variable aleatoria $X$ es el vector de valores. Formalmente,

$$X:\Omega\to \mathbb{R}^p$$

se define en términos de la $p$ canónica de proyección funciones

$$\eqalign{ \pi_i:\mathbb{R}^p \to \mathbb{R} \\ \pi_i(x_1, \ldots, x_{i-1}, x_i, x_{i+1}, \ldots, x_p) = x_i }$$

como la única función para la que $\pi_i \circ X = X_i$. Con las flechas podemos representar de la siguiente manera:

$$X_i: \Omega \xrightarrow{X} \mathbb{R}^p \xrightarrow{\pi_i} \mathbb{R}.$$

$X$ muy bien recoge el $p$ predictores $X_i$ en un solo objeto matemático.


Las respuestas, las funciones del modelo y los errores

En la expresión

$$Y = f(X) + \epsilon,$$

sabemos que el valor de $Y$ es un número real, donde tanto $f(X)$ $\epsilon$ son números reales. La única razonable en el sentido de que $f:\mathbb{R}^p \to \mathbb{R}$, así:

$$f:\mathbb{R}^p \to \mathbb{R.}$$

El modelo de función $f$ es, simplemente, una función de $p$ números reales. Si me das los valores de $p$ predictores $X_i(\omega)$, $i=1, \ldots, p$, a continuación, $f$ me dará una conjetura sobre el correspondiente valor de $Y(\omega)$

La cantidad de $\epsilon$ es poco probable que solo se trate de un número fijo: representa la diferencia entre el $Y$ e lo $f$ predice de $X$. Por lo tanto, debemos entender que

$$\epsilon:\Omega \to \mathbb{R}$$

es una variable aleatoria ("error") y el "$+$" representa pointwise adición de funciones de la forma habitual:

$$Y(\omega) = (f(X) + \epsilon)(\omega) = f(X(\omega)) + \epsilon(\omega)$$

para todos los $\omega\in\Omega$. Esta es la manera habitual de añadir las variables aleatorias $f\circ X$$\epsilon$.

Si quieres ser formal acerca de usted tendrá que recoger $f$ $\epsilon$ a un par ordenado de las funciones e identificar que con una función en el producto Cartesiano de sus rangos, dando a esta foto de $Y$:

$$Y: \Omega \xrightarrow{(X, \epsilon)} \mathbb{R}^p \times \mathbb{R} \xrightarrow{(f, \operatorname{id})} \mathbb{R}\times\mathbb{R}\xrightarrow{+}\mathbb{R}.\tag{1}$$

"$\operatorname{id}$" denota la función identidad en $\mathbb{R}$, $x\to x$ para todos los números de $x$.


Predictores

Desde $\hat f$ es una "aproximación a la función, debemos tratar de entender como una versión de $f$: es una conjetura acerca de lo $f$ es. En consecuencia, $\hat f$ también deben estar en función de $p$ variables. Vamos a dibujar las flechas para $\hat{Y}=\hat f(X)$:

$$\hat{Y}: \Omega \xrightarrow{X} \mathbb{R}^p \xrightarrow{\hat f} \mathbb{R}.\tag{2}$$

Esto muestra claramente que $\hat Y = \hat{f}\circ X$ es el mismo tipo de objeto como $Y$: es decir, una variable aleatoria.


Respuestas

Respuesta 1

Las flechas en $(1)$ $(2)$ muestran que tanto $Y$ $\hat Y$ son variables aleatorias: sus dominios se $\Omega$.

Respuesta 2

Cuando una "observación" de $X$ se dibuja, nos da una "realización" $x_1$. Vamos a hacer esto $n \ge 0$ veces (a menudo de forma independiente, pero no necesariamente), la producción de una muestra de $x_1, x_2, \ldots, x_n$. Cada una de las $x_i$ $p$- vector. Las expresiones $f(x_i)$ $\hat f(x_i)$ no requieren de análisis: por definición, $f$ $\hat f$ son funciones cuyos dominios se $\mathbb{R}^p$. Aquí, se han aplicado a un elemento específico de $x_i \in \mathbb{R}^p$.

Respuesta 3

La expresión "$f(X_1, \ldots, X_p)$" tiene sentido: representa el $f\circ X: \Omega\to\mathbb{R}$. Como lo indica la flecha, se aplica a los elementos de $\omega\in\Omega$, no individual vectores $x_i$. Aunque podríamos entender "$(f(X_1, \ldots, X_p))(\omega)$" de esta manera, "$(f(X_1, \ldots, X_p))(x_i)$" sería absurdo a menos que se estipula que el $\Omega=\mathbb{R}^p$. Aunque a veces esto se hace, y muchos libros de texto (especialmente de los más elementales tipo) se puede leer en este camino, que conceptualmente es más claro para no confundir los objetos en $\Omega$ $p$- tuplas de números que se utilizan para caracterizar algunas de sus propiedades. Lejos de ser "suelta", esto es bastante rigurosa de la notación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X