Después de leer esta entrada Sigo sin entender muy bien qué es un estimador. Supongamos que las muestras $D_i={(x_1,y_1),...(x_n,y_n)}$ se extraen aleatoriamente de la función $$f(x)=sin(2\pi x),$$ así que mi objetivo final es llegar a una función estimada $h(x)$ que debería aproximarse a $f$ lo más cerca posible, ¿verdad? Como no sé cuál es el verdadero $f$ por lo que podría elegir diferentes modelos para hacer la aproximación, aquí considero el modelo de regresión lineal, que es $$h(x)=\beta^Tx,$$ luego intento estimar los parámetros del modelo $\beta$ mediante OLS, y finalmente dada la muestra de entrenamiento $D_i$ Tengo las estimaciones $\hat\beta_{|D_i}$ y absolutamente diferente $\hat\beta$ para diferentes conjuntos de entrenamiento $D_i$ .
Este es mi problema,
-
¿Cuál es el estimador aquí? Según el post que he leído, creo que el proceso de elección del modelo de regresión lineal y estimación $\hat\beta$ a través de OLS son componentes del estimador, ¿verdad?
-
¿Cómo comprobar si el estimador está sesgado o no? Dado que he elegido el modelo de regresión lineal $h(x)$ y ahora tenemos las estimaciones $\hat\beta$ Creo que para comprobar si el estimador está sesgado o no, hay que averiguar $$B(\hat\beta)=\beta_{true}-E[\hat\beta],$$ ¿verdad? Ahora esta es la cosa me confunde mal, ya que no tenemos este $\beta_{true}$ porque el verdadero $f$ es en realidad $sin(\theta x)$ con $\theta=2\pi$ sólo tenemos $\theta_{true}$ no hay tal $\beta_{true}$ ¿verdad?
Espero que puedan ayudarme a hacer las cosas bien.
ACTUALIZACIÓN
Para responder al comentario de @whuber, mi pregunta tiene su origen en esta nota de lectura (a partir de la página 11)
1. ¿cómo se "extraen al azar" valores de una función?
Digamos que la función objetivo $f(x)=sin(2\pi x)$ se define en $x\in [-1,1]$ podría aleatoriamente (mediante una distribución uniforme sobre $[-1,1]$ ) dibujar $N$ puntos $\{x_1,...,x_N\}$ donde $N$ es el tamaño de la muestra, después podría calcular el valor de salida $y_i=f(x_i)$ sin ruido añadido. Ahora la muestra es $\{(x_1,y_1),...,(x_N,y_N)\}$ .
2. son uno (o ambos) de los $xi$ o $yi$ ¿Cuál es el comportamiento estadístico esperado de los errores de medición?
Aquí sólo mido el error entrenamiento/prueba del valor de salida $y_i$ . Quiero decir, con diferentes muestras de formación, tengo diferentes $\hat\beta$ entonces para un punto fijo $x_0$ el resultado previsto $\hat y_0=h(x_0)=\beta^Tx_0$ será diferente, pero el valor verdadero es $y_0=f(x_0)$ .
3. ¿por qué eliges un estimador lineal x para aproximar una función sen(2x) que es a fortiori fuertemente no lineal?
Como lo que se hace en la nota de clase, lo que tengo es sólo la muestra, que parece no lineal, tal vez no es prudente elegir un estimador lineal, y tal vez debería elegir esta $$h(x)=\beta_0+\beta_1x+\beta_2x^2$$ un estimador polinómico, pero aún está lejos del objetivo $sin(2\pi x)$ .