El cartel original pedía una respuesta "explica como si tuviera 5 años". Supongamos que tu profesor del colegio te invita a ti y a tus compañeros a ayudar a adivinar el ancho de la mesa del profesor. Cada uno de los 20 alumnos de la clase puede elegir un dispositivo (regla, escala, cinta o vara de medir) y se le permite medir la mesa 10 veces. Se les pide a todos que utilicen diferentes puntos de partida en el dispositivo para evitar leer el mismo número una y otra vez; la lectura inicial tiene que restarse de la lectura final para obtener finalmente una medida de anchura (hace poco aprendiste a hacer ese tipo de matemáticas).
En total, la clase realizó 200 mediciones de anchura (20 alumnos, 10 mediciones cada uno). Las observaciones se entregan al profesor, que se encargará de hacer los números. Si se restan las observaciones de cada alumno a un valor de referencia, se obtendrán otros 200 números, denominados desviaciones . El profesor promedia la muestra de cada alumno por separado, obteniendo 20 significa . Si se restan las observaciones de cada alumno a su media individual, se obtendrán 200 desviaciones de la media, denominadas residuos . Si el residuo medio se calculara para cada muestra, te darías cuenta de que siempre es cero. Si en cambio elevamos al cuadrado cada residuo, lo promediamos y finalmente deshacemos el cuadrado, obtenemos el desviación estándar . (Por cierto, a este último bit de cálculo lo llamamos raíz cuadrada (piense en hallar la base o el lado de un cuadrado dado), por lo que la operación completa suele llamarse raíz cuadrada media para abreviar; la desviación estándar de las observaciones es igual a la raíz cuadrada media de los residuos).
Pero el profesor ya conocía la verdadera anchura de la mesa, basándose en cómo fue diseñada y construida y comprobada en la fábrica. Así que otros 200 números, llamados errores puede calcularse como la desviación de las observaciones con respecto a la anchura real. A error medio puede calcularse para cada muestra de estudiantes. Asimismo, el 20 desviación estándar del error o error estándar se puede calcular para las observaciones. Más 20 error cuadrático medio también se pueden calcular los valores. Los tres conjuntos de 20 valores están relacionados como sqrt(me^2 + se^2) = rmse, en orden de aparición. Basándose en el rmse, el profesor puede juzgar qué alumno ha proporcionado la mejor estimación de la anchura de la tabla. Además, observando por separado los 20 errores medios y los 20 valores de error estándar, el profesor puede indicar a cada alumno cómo mejorar sus lecturas.
Como comprobación, el profesor restó cada error de su respectivo error medio, dando como resultado otros 200 números, que llamaremos errores residuales (eso no se hace a menudo). Como en el caso anterior, error residual medio es cero, por lo que el desviación estándar de los errores residuales o error residual estándar es el mismo que el error estándar y, de hecho, también lo es el error residual de la raíz cuadrada También. (Véase más abajo para más detalles).
Ahora hay algo de interés para el profesor. Podemos comparar la media de cada alumno con la del resto de la clase (20 medias en total). Al igual que definimos antes estos valores de puntos:
- m: media (de las observaciones),
- s: desviación estándar (de las observaciones)
- me: error medio (de las observaciones)
- se: error estándar (de las observaciones)
- rmse: error cuadrático medio (de las observaciones)
también podemos definir ahora:
- mm: media de las medias
- sm: desviación estándar de la media
- mem: error medio de la media
- sem: error estándar de la media
- rmsem: error cuadrático medio de la media
Sólo si se dice que la clase de estudiantes es insesgada, es decir, si mem = 0, entonces sem = sm = rmsem; es decir, el error estándar de la media, la desviación estándar de la media y el error cuadrático medio de la media pueden ser iguales siempre que el error medio de las medias sea cero.
Si sólo hubiéramos tomado una muestra, es decir, si sólo hubiera un alumno en clase, la desviación típica de las observaciones (s) podría utilizarse para estimar la desviación típica de la media (sm), como sm^2~s^2/n, donde n=10 es el tamaño de la muestra (el número de lecturas por alumno). Las dos coincidirán mejor a medida que el tamaño de la muestra crezca (n=10,11,...; más lecturas por alumno) y el número de muestras crezca (n'=20,21,...; más alumnos en clase). (Una advertencia: un "error estándar" sin calificar suele referirse al error estándar de la media, no al error estándar de las observaciones).
A continuación se detallan los cálculos correspondientes. El valor real se indica como t.
Operaciones de ajuste:
- medio: MEDIA(X)
- raíz cuadrada media: RMS(X)
- desviación estándar: SD(X) = RMS(X-MEDIA(X))
CONJUNTOS INTRAMUESTRALES:
- observaciones (dadas), X = {x_i}, i = 1, 2, ..., n=10.
- desviaciones: diferencia de un conjunto con respecto a un punto fijo.
- residuos: desviación de las observaciones respecto a su media, R=X-m.
- errores: desviación de las observaciones respecto al valor real, E=X-t.
- errores residuales: desviación de los errores respecto a su media, RE=E-MEAN(E)
PUNTOS INTRAESPECÍFICOS (véase el cuadro 1):
- m: media (de las observaciones),
- s: desviación estándar (de las observaciones)
- me: error medio (de las observaciones)
- se: error estándar de las observaciones
- rmse: error cuadrático medio (de las observaciones)
CONJUNTOS ENTRE MUESTRAS (CONJUNTOS):
- es decir, M = {m_j}, j = 1, 2, ..., n'=20.
- residuos de la media: desviación de las medias con respecto a su media, RM=M-mm.
- errores de la media: desviación de las medias de la "verdad", EM=M-t.
- errores residuales de la media: desviación de los errores de la media con respecto a su media, REM=EM-MEAN(EM)
PUNTOS INTERMEDIOS (ENSEMBLE) (ver tabla 2):
- mm: media de las medias
- sm: desviación estándar de la media
- mem: error medio de la media
- sem: error estándar (de la media)
- rmsem: error cuadrático medio de la media
3 votos
¿Podría indicar el contexto en el que escuchó el término " error de prueba "? Porque hay es algo llamado "error de prueba" pero no estoy muy seguro de que sea lo que buscas... (surge en el contexto de tener un juego de pruebas y un conjunto de entrenamiento --(¿te suena algo de eso?)
0 votos
Sí, entiendo que es el modelo generado en el conjunto de entrenamiento aplicado al conjunto de prueba. El error de la prueba es y's modelado - y's de prueba o (y's modelado - y's de prueba)^2 o (y's modelado - y's de prueba)^2 ///DF(o N?) o ((y's modelado - y's de prueba)^2 / N )^.5?
0 votos
Esta respuesta es pertinente Relación entre RMSE y RSS