28 votos

¿Un modelo se ajusta a los datos o los datos se ajustan a un modelo?

¿Existe alguna diferencia conceptual o de procedimiento entre ajustar un modelo a los datos y ajustar los datos al modelo? Un ejemplo de la primera formulación puede verse en https://courses.washington.edu/matlab1/ModelFitting.html y del segundo en https://reference.wolfram.com/applications/eda/FittingDataToLinearModelsByLeast-SquaresTechniques.html .

42voto

eldering Puntos 3814

Casi todas las fuentes o personas con las que he interactuado excepto la fuente Wolfram que enlazaste se refiere al proceso como ajuste de un modelo a los datos . Esto tiene sentido, ya que el modelo es el objeto dinámico y los datos son estáticos (es decir, fijos y constantes).

Me gusta el enfoque de Larry Wasserman. Según él, un modelo estadístico es una colección de distribuciones. Por ejemplo, la colección de todas las distribuciones normales:

$$ \{ \text{Normal}(\mu, \sigma) : \mu, \sigma \in R, \sigma > 0 \} $$

o el conjunto de todas las distribuciones de Poisson:

$$ \{ \text{Poisson}(\lambda) : \lambda \in R, \lambda > 0 \} $$

Ajuste de una distribución a los datos es cualquier algoritmo que combina un modelo estadístico con un conjunto de datos (los datos son fijos), y elige exactamente una de las distribuciones del modelo como la que "mejor" refleja los datos.

El modelo es lo que cambia (más o menos): lo estamos reduciendo de toda una colección de posibilidades a una única mejor opción. Los datos son sólo los datos, no les pasa nada.

18voto

mdewey Puntos 579

En el campo de la modelización Rasch, es habitual ajustar los datos al modelo. Se supone que el modelo es correcto y el trabajo del analista consiste en encontrar datos que se ajusten a él. El sitio Artículo de Wikipedia sobre Rasch contiene más detalles sobre el cómo y el porqué.

Pero estoy de acuerdo con otros en que, en general, en estadística ajustamos el modelo a los datos porque podemos cambiar el modelo, pero se considera de mala educación seleccionar o modificar los datos.

11voto

AdamSane Puntos 1825

Normalmente, los datos observados son fijos mientras que el modelo es mutable (por ejemplo, porque se estiman los parámetros), de modo que es el modelo el que se hace ajustar a los datos, y no al revés . (Normalmente la gente se refiere a este caso cuando dice cualquiera de las dos expresiones).

Cuando se dice que los datos se ajustan a un modelo, intento averiguar lo siguiente ¿Qué demonios han hecho con los datos? .

[Ahora bien, si eres transformación de datos podría decirse que eso es "ajustar los datos a un modelo", pero la gente casi nunca lo dice en este caso].

2voto

qwr Puntos 151

Normalmente, suponemos que nuestros datos corresponden al "mundo real" y hacer cualquier modificación significa que nos alejamos de la modelización del "mundo real". Por ejemplo, hay que tenga cuidado al eliminar los valores atípicos ya que, aunque facilita el cálculo, los valores atípicos siguen formando parte de nuestros datos.

Al probar un modelo o estimar las propiedades de un estimador mediante bootstrap u otras técnicas de remuestreo, podemos simular nuevos datos utilizando un modelo estimado y nuestros datos originales. Esto supone que el modelo es correcto y que no modificamos los datos originales.

-3voto

Alexandru Pupsa Puntos 108

Interesante tema este y no podía dejarlo pasar sin decir unas palabras. Ésta es mi opinión al respecto. Desde un punto de vista científico, un modelo es, por definición, una representación conceptual (aceptada universalmente como referencia) de un acontecimiento o proceso. Teniendo esto en cuenta, entiendo que cualquier dato que exista es una entidad dinámica, lo que significa que cambia con el tiempo. A diferencia de los modelos estadísticos, que son estáticos (de referencia) y se desarrollaron para describir determinados fenómenos. Dicho esto, los datos que tenemos entre manos son también una representación de un acontecimiento, pero que aún está por validar debido a su naturaleza dinámica. El proceso mediante el cual se validan los datos (en comparación con un modelo/referencia ya existente) es lo que llamamos modelización de los datos o ajuste del modelo a los datos. En conclusión, más bien deberíamos decir "AJUSTAR los DATOS A UN MODELO".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X