34 votos

Explicación intuitiva de "Inferencia Estadística"

¿Cuál es la forma más clara y sencilla de explicarle a alguien el concepto de inferencia? ¿Qué significa intuitivamente?

¿Cómo lo explicarías a una persona sin conocimientos especializados, o a alguien que ha estudiado un curso muy básico de probabilidad y estadística?

¡Cualquier cosa que contribuya a hacerlo más claro 'intuitivamente' sería muy apreciada!

8 votos

Deberías empezar por hacer más precisa tu definición, ya que desde tiempos inmemoriales los filósofos y científicos han reconocido formas de inferencia fundamentalmente diferentes, empezando por la división inductiva/deductiva. Dado el carácter de este sitio, debemos presuponer que te refieres a algún tipo de inferencia estadística, pero también existen muchas versiones de estas.

69voto

Isabella Ghement Puntos 9964

A veces es mejor explicar un concepto a través de un ejemplo concreto:

Imagínate que agarras una manzana, le das un mordisco y sabe dulce. ¿Concluirías basándote en ese mordisco que toda la manzana es dulce? Si es así, habrás inferido que toda la manzana es dulce basándote en un solo mordisco de ella.

La inferencia es el proceso de usar la parte para aprender sobre el todo.

Cómo se selecciona la parte es importante en este proceso: la parte necesita ser representativa del todo. En otras palabras, la parte debe ser como una versión en miniatura del todo. Si no lo es, nuestro aprendizaje será defectuoso y posiblemente incorrecto.

¿Por qué necesitamos inferencia? Porque necesitamos sacar conclusiones y luego tomar decisiones relacionadas con el todo basadas en información parcial sobre el mismo suministrada por la parte.

10 votos

Me uní a esta comunidad solo para +1 esto y decir que no solo es de lejos la mejor respuesta aquí, debería incluirse en todos los libros de texto y explicaciones web también. Maravillosamente bien redactado.

11 votos

¡Gracias por el comentario más amable que he recibido en esta plataforma, Daniel, y bienvenido a la plataforma! La belleza de CrossValidated es que puedes obtener una amplia gama de respuestas a tu pregunta, cubriendo diferentes perspectivas. Disfruté mucho leyendo las otras respuestas en este fascinante hilo y me sentí motivado a unirme. ¡Así que todos los que respondieron aquí merecen compartir el cálido resplandor que emana de tu encantador comentario!

1 votos

Mientras que esta es sin duda una respuesta hermosa (!), No estoy aún convencido de que realmente capture toda la inferencia. ¿No a veces (¿a menudo?) también infieres algo sobre A a partir de B, incluso cuando B no es parte de A? Por ejemplo, haces una prueba de COVID-19 e inferencias a partir del resultado sobre tu estado de salud. ¿Cómo es el resultado de la prueba parte de tu salud...? Esta formulación de parte/todo me parece bastante estrecha.

25voto

Dipstick Puntos 4869

Estoy asumiendo que estás preguntando aquí sobre inferencia estadística.

Usando la definición de All of Statistics de Larry A. Wasserman:

La inferencia estadística, o "aprendizaje" como se le llama en informática, es el proceso de usar datos para inferir la distribución que generó los datos. Una pregunta típica de inferencia estadística es:

$$ \textsf{Dada una muestra } X_1, \dots, X_n \sim F, \textsf{ ¿cómo inferimos } F ? $$

En algunos casos, podemos querer inferir solo alguna característica de $F$ como su media.

En estadística interpretamos los datos como realizaciones de variables aleatorias, por lo que lo que aprendemos en estadística son las características de las variables aleatorias, es decir, cosas como distribución, valor esperado, varianza, covarianza, parámetros de las distribuciones, etc. Por lo tanto, la inferencia estadística significa aprender esas cosas a partir de los datos.

19voto

jhin Puntos 106

Citando a E.T. Jaynes, "Probability theory: the logic of science" (una lectura muy recomendada):

Por 'inferencia' entendemos simplemente: razonamiento deductivo cuando hay suficiente información disponible para permitirlo; razonamiento inductivo o plausible cuando - como es casi siempre el caso en problemas reales - la información necesaria no está disponible. Pero si un problema puede ser resuelto mediante razonamiento deductivo, la teoría de probabilidad no es necesaria; por lo tanto, nuestro tema es el procesamiento óptimo de información incompleta.

En mis propias palabras, inferencia simplemente significa comenzar con cierta información dada y sacar conclusiones racionales de ella, donde lo racional generalmente se define por las reglas de la lógica predicativa o la teoría de la probabilidad.

La información que se utiliza para sacar conclusiones puede provenir de creencias que se tienen sobre el mundo (en jerga técnica: modelos y distribuciones previas), de datos que se han observado, o de ambos. ¡Por supuesto, una inferencia solo puede ser válida si la información en la que se basa es válida!

Si la información es cierta (sabes cosas que son verdaderas o falsas), entonces la inferencia se realiza mediante lógica predicativa: Aristóteles es un hombre, los hombres no son pájaros, por lo tanto inferimos que Aristóteles no es un pájaro.

Si la información es incierta (crees cosas pero no estás seguro), entonces la inferencia se realiza mediante teoría de la probabilidad: si el 50% de todas las personas les gusta la pizza, y el 50% de las personas que les gusta la pizza también les gusta la pasta, mientras que el 75% de las personas que no les gusta la pizza también no les gusta la pasta, puedes inferir que - en ausencia de más información - hay un 37.5% de probabilidades de que te guste la pasta. Cuando escuchas algún tipo de ruido, debido a tus experiencias puedes dudar si el televisor o tu hija son la fuente. Estás sacando inferencias - probablemente sea el televisor o tu hija - pero dudas porque la información proporcionada es incierta. Cuando las personas hablan de inferencia estadística, generalmente se refieren a aplicaciones técnicas donde se desea usar una gran cantidad de datos para inferir información sobre algo que no es directamente observable, tal como en el último ejemplo.*

Un ejemplo técnico típico podría ser el siguiente: tenemos un sensor de temperatura en una habitación que devuelve un voltaje $V(k)$. La hoja de datos del sensor proporciona un gráfico que relaciona el voltaje medido con la temperatura mediante un modelo lineal: $$ V(k) = a \cdot T(k) + b.$$ Luego podemos utilizar este modelo y las mediciones de voltaje para sacar inferencias sobre la temperatura en la habitación. ¡Todo es deductivo hasta ahora, porque hemos supuesto que toda la información es cierta! Dado $V(k)$, simplemente podemos calcular $T(k)$.

Luego observamos que la temperatura estimada fluctúa bastante rápidamente, mucho más rápido de lo que esperaríamos que fluctúe la temperatura de una habitación. Así que hipotetizamos que hay algún tipo de perturbación incorrelacionada de media cero que también influye en el sensor: $$ V(k) = a \cdot T(k) + b + \epsilon(k).$$ ¡Ahora estamos inciertos acerca del significado de cada medición de voltaje (haciendo que cada medición sea una VA i.i.d.)! Esto nos dice que deberíamos promediar algunas mediciones de voltaje para obtener una mejor estimación de la temperatura actual de la habitación.** Si alguna de la información que usamos (el modelo voltaje-temperatura del sensor, el modelo de perturbaciones, las mediciones de voltaje reales) está equivocada, entonces nuestra estimación de temperatura también estará equivocada.

*Nuestro cerebro es un dispositivo de inferencia extremadamente sofisticado que saca todo tipo de conclusiones sobre nosotros mismos, otras personas, nuestro entorno y nuestro futuro, todo el tiempo [1][2][3].

**Suponiendo que la frecuencia de muestreo sea mucho mayor que la tasa de cambio de la temperatura y que el ruido sea realmente incorrelacionado.

0 votos

Esto es cierto, pero desde un punto de vista conceptual -que es todo lo que me gustaría transmitir a una persona no experta- no hay diferencia entre los dos.

3 votos

Hay diferencias enormes entre ambos, empezando por la marcada diferencia entre la certeza de la inferencia lógica ("razonamiento deductivo") y la incertidumbre central a la inferencia estadística.

2 votos

@whuber Bueno, por favor, edúcame si me estoy perdiendo algo, ¿pero no es la inferencia lógica un corolario de la inferencia bayesiana? Asigna probabilidad 0 a las declaraciones falsas y probabilidad 1 a las verdaderas y realiza la inferencia bayesiana estándar, ¿y tienes inferencia lógica?

11voto

Aaron Puntos 36

La inferencia estadística es el arte de adivinar con acierto --- implica adivinar cosas que son desconocidas a partir de cosas relacionadas que son conocidas (observadas), y proporcionar medidas asociadas del nivel de confianza, variabilidad, etc., en tu suposición.

1 votos

Buena definición, aunque me preocupa que pueda carecer de contexto para alguien que no entienda lo que es.

0 votos

Quizás. El objetivo de mi pequeña encapsulación de inferencia es ayudar a un lego que carece de cualquier contexto. De hecho, creo que la belleza de esta explicación es que no requiere conocimiento contextual de distribuciones, muestras u otro concepto estadístico.

6voto

Permíteme intentarlo. La amplia definición de diccionario de inferencia es la siguiente:

algo que puedes descubrir indirectamente a partir de lo que ya sabes

Y, desde una perspectiva más técnica, del Diccionario Oxford de Términos Estadísticos de Upton, G., Cook I.,

inferencia estadística es el proceso de usar análisis de datos para deducir propiedades de una distribución de probabilidad subyacente

Aquí, lo que ya sabemos es los datos (experimentos que realizamos) y a veces una información previa. Y, queremos conocer las propiedades de una entidad de interés.

Por ejemplo, digamos que tenemos una moneda sesgada y queremos tener una idea sobre la probabilidad de caras. Lanzamos la moneda algunas veces, registramos los resultados (que serán nuestros datos), y al mirarlos, tendremos una comprensión (que formalmente podría ser la distribución, momentos, etc.) de cómo se ve la probabilidad de caras.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X