89 votos

¿Cuál es el significado de "Todos los modelos son incorrectos, pero algunos son útiles"?

"Básicamente, todos los modelos son incorrectos, pero algunos son útiles."

--- Box, George E. P.; Norman R. Draper (1987). Empirical Model-Building and Response Surfaces, p. 424, Wiley. ISBN 0471810339.

¿Cuál es exactamente el significado de la frase anterior?

14 votos

En el mismo libro se mencionó anteriormente: Recuerda que todos los modelos están equivocados; la pregunta práctica es qué tan equivocados tienen que estar para no ser útiles. Tal vez esto sea más útil.

4voto

Dipstick Puntos 4869

Si me permites, tal vez un comentario más podría ser útil. La versión de la frase que prefiero es

(...) todos los modelos son aproximaciones. Básicamente, todos los modelos están equivocados, pero algunos son útiles (...)

tomado de Response Surfaces, Mixtures, and Ridge Analyses de Box and Draper (2007, p. 414, Wiley). Al ver la cita extendida es más claro lo que Box quiso decir: el modelado estadístico se trata de aproximar la realidad y la aproximación nunca es exacta, por lo que se trata de encontrar la aproximación más apropiada. Lo que es apropiado para tu propósito es algo subjetivo, por eso no es necesario que uno de los modelos sea útil, sino posiblemente algunos de ellos, dependiendo del propósito del modelado.

3voto

Trevor Alexander Puntos 170

Puedes pensar en esto de la siguiente manera. la complejidad máxima (es decir, la entropía) de un objeto sigue alguna forma de la cota de Bekenstein:

$$ I \le \frac{2\pi RE}{\hbar c\ln 2} $$

donde $E$ es la energía total de reposo incluyendo la masa, y $R$ es el radio de una esfera que encierra al objeto.

Ese es un número grande, en la mayoría de los casos:

La cota de Bekenstein para un cerebro humano promedio sería $2.58991·10^{42}$ bits y representa un límite superior en la información necesaria para recrear perfectamente el cerebro humano promedio hasta el nivel cuántico. Esto implica que el número de estados diferentes ($Ω=2^I$) del cerebro humano (y de la mente si el fisicalismo es verdadero) es como máximo $107.79640·10^{41}$.

Entonces, ¿quieres usar "el mejor mapa", es decir, el territorio en sí mismo, con todas las ecuaciones de onda para todas las partículas en cada célula? Absolutamente no. No solo sería un desastre computacional, sino que estarías modelando cosas que pueden tener prácticamente nada que ver con lo que te importa. Si todo lo que quieres hacer es, por ejemplo, identificar si estoy despierto o no, no necesitas saber qué está haciendo el electrón #32458 en la neurona #844030 ribosoma #2305 molécula #2. Si no modelas eso, tu modelo es realmente "incorrecto", pero si puedes identificar si estoy despierto o no, tu modelo es definitivamente útil.

3voto

adi92 Puntos 4589

Un modelo no puede proporcionar predicciones 100% precisas si hay alguna aleatoriedad en los resultados. Si no hubiera incertidumbre, ni aleatoriedad, ni error, entonces se consideraría un hecho en lugar de un modelo. Lo primero es muy importante, porque los modelos se utilizan con frecuencia para modelar expectativas de eventos que no han ocurrido. Esto casi garantiza que haya alguna incertidumbre sobre los eventos reales.

Dados la información perfecta, en teoría podría ser posible crear un modelo que brinde predicciones perfectas para eventos precisamente conocidos. Sin embargo, incluso dadas estas circunstancias poco probables, dicho modelo puede ser tan complejo que resulte computacionalmente inviable de usar, y puede ser preciso solo en un momento particular en el tiempo a medida que otros factores cambian cómo los valores cambian con los eventos.

Dado que la incertidumbre y la aleatoriedad están presentes en la mayoría de los datos del mundo real, los esfuerzos por obtener un modelo perfecto son un ejercicio inútil. En cambio, es más valioso buscar obtener un modelo suficientemente preciso que sea lo suficientemente simple para ser utilizable en cuanto a los datos y la computación requerida para su uso. Si bien se sabe que estos modelos son imperfectos, algunas de estas fallas son bien conocidas y se pueden considerar para la toma de decisiones basada en los modelos.

Los modelos más simples pueden ser imperfectos, pero también son más fáciles de razonar, de comparar entre sí, y pueden ser más fáciles de trabajar porque es probable que sean menos exigentes computacionalmente.

2voto

cyborg Puntos 214

Creo que Peter y el usuario11852 dieron respuestas excelentes. También agregaría (por negación) que si un modelo fuera realmente bueno, probablemente sería inútil debido al sobreajuste (por lo tanto, no generalizable).

2 votos

+1 por el punto de sobreajuste. Algoritmos como Naive Bayes y análisis discriminante lineal a menudo funcionan muy bien, incluso si sabes que el modelo subyacente es incorrecto (por ejemplo, filtrado de spam), simplemente porque se necesita menos datos para estimar los parámetros.

1voto

Lennart Regebro Puntos 136

Mi interpretación ácida es: Creer que un modelo matemático describe exactamente todos los factores, y sus interacciones, que rigen un fenómeno de interés sería demasiado simplista y arrogante. Ni siquiera sabemos si la lógica que utilizamos es suficiente para comprender nuestro universo. Sin embargo, algunos modelos matemáticos representan una aproximación lo suficientemente buena (en términos del método científico) que son útiles para sacar conclusiones sobre dicho fenómeno.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X