Citando a E.T. Jaynes, "Probability theory: the logic of science" (una lectura muy recomendada):
Por 'inferencia' entendemos simplemente: razonamiento deductivo cuando hay suficiente información disponible para permitirlo; razonamiento inductivo o plausible cuando - como es casi siempre el caso en problemas reales - la información necesaria no está disponible. Pero si un problema puede ser resuelto mediante razonamiento deductivo, la teoría de probabilidad no es necesaria; por lo tanto, nuestro tema es el procesamiento óptimo de información incompleta.
En mis propias palabras, inferencia simplemente significa comenzar con cierta información dada y sacar conclusiones racionales de ella, donde lo racional generalmente se define por las reglas de la lógica predicativa o la teoría de la probabilidad.
La información que se utiliza para sacar conclusiones puede provenir de creencias que se tienen sobre el mundo (en jerga técnica: modelos y distribuciones previas), de datos que se han observado, o de ambos. ¡Por supuesto, una inferencia solo puede ser válida si la información en la que se basa es válida!
Si la información es cierta (sabes cosas que son verdaderas o falsas), entonces la inferencia se realiza mediante lógica predicativa: Aristóteles es un hombre, los hombres no son pájaros, por lo tanto inferimos que Aristóteles no es un pájaro.
Si la información es incierta (crees cosas pero no estás seguro), entonces la inferencia se realiza mediante teoría de la probabilidad: si el 50% de todas las personas les gusta la pizza, y el 50% de las personas que les gusta la pizza también les gusta la pasta, mientras que el 75% de las personas que no les gusta la pizza también no les gusta la pasta, puedes inferir que - en ausencia de más información - hay un 37.5% de probabilidades de que te guste la pasta. Cuando escuchas algún tipo de ruido, debido a tus experiencias puedes dudar si el televisor o tu hija son la fuente. Estás sacando inferencias - probablemente sea el televisor o tu hija - pero dudas porque la información proporcionada es incierta. Cuando las personas hablan de inferencia estadística, generalmente se refieren a aplicaciones técnicas donde se desea usar una gran cantidad de datos para inferir información sobre algo que no es directamente observable, tal como en el último ejemplo.*
Un ejemplo técnico típico podría ser el siguiente: tenemos un sensor de temperatura en una habitación que devuelve un voltaje $V(k)$. La hoja de datos del sensor proporciona un gráfico que relaciona el voltaje medido con la temperatura mediante un modelo lineal: $$ V(k) = a \cdot T(k) + b.$$ Luego podemos utilizar este modelo y las mediciones de voltaje para sacar inferencias sobre la temperatura en la habitación. ¡Todo es deductivo hasta ahora, porque hemos supuesto que toda la información es cierta! Dado $V(k)$, simplemente podemos calcular $T(k)$.
Luego observamos que la temperatura estimada fluctúa bastante rápidamente, mucho más rápido de lo que esperaríamos que fluctúe la temperatura de una habitación. Así que hipotetizamos que hay algún tipo de perturbación incorrelacionada de media cero que también influye en el sensor: $$ V(k) = a \cdot T(k) + b + \epsilon(k).$$ ¡Ahora estamos inciertos acerca del significado de cada medición de voltaje (haciendo que cada medición sea una VA i.i.d.)! Esto nos dice que deberíamos promediar algunas mediciones de voltaje para obtener una mejor estimación de la temperatura actual de la habitación.** Si alguna de la información que usamos (el modelo voltaje-temperatura del sensor, el modelo de perturbaciones, las mediciones de voltaje reales) está equivocada, entonces nuestra estimación de temperatura también estará equivocada.
*Nuestro cerebro es un dispositivo de inferencia extremadamente sofisticado que saca todo tipo de conclusiones sobre nosotros mismos, otras personas, nuestro entorno y nuestro futuro, todo el tiempo [1][2][3].
**Suponiendo que la frecuencia de muestreo sea mucho mayor que la tasa de cambio de la temperatura y que el ruido sea realmente incorrelacionado.
8 votos
Deberías empezar por hacer más precisa tu definición, ya que desde tiempos inmemoriales los filósofos y científicos han reconocido formas de inferencia fundamentalmente diferentes, empezando por la división inductiva/deductiva. Dado el carácter de este sitio, debemos presuponer que te refieres a algún tipo de inferencia estadística, pero también existen muchas versiones de estas.