Creo que de $\mathcal{S}$ como un conjunto de entradas. Usted puede escribir cosas en un billete. Generalmente un billete comienza con el nombre de algunos de los del mundo real de la persona o el objeto que se "representa" o "modelos." Hay un montón de espacio en blanco en cada boleto para escribir otras cosas.
Puedes hacer tantas copias de cada una de las entradas que desee. Un modelo de probabilidad $\mathbb{P}$ de esta población en el mundo real o el proceso consiste en hacer una o más copias de cada boleto, la mezcla de ellos, y ponerlos en una caja. Si usted--la--analista puede establecer que el proceso de elaboración de un boleto al azar a partir de este cuadro emula todo el comportamiento importante de lo que se está estudiando, entonces usted puede aprender mucho sobre el mundo por el pensamiento acerca de este cuadro. Debido a que algunas entradas pueden ser más numerosos en el cuadro que otros, que pueden tener diferencia posibilidades de ser dibujado. La teoría de la probabilidad estudios de estas posibilidades.
Cuando los números están escritos en las entradas (en una forma consistente), dan lugar a (probabilidad) de las distribuciones. Una distribución de probabilidad , sólo describe la proporción de billetes en una caja cuyos números se encuentran dentro de cualquier intervalo de tiempo dado.
Debido a que habitualmente no sabemos exactamente cómo el mundo se comporta, tenemos que imaginar diferentes cajas en las que las entradas aparecen con diferentes frecuencias relativas. El conjunto de estas cajas es $\mathcal{P}$. Podemos ver el mundo como ser adecuadamente descrita por el comportamiento de uno de los cuadros de la $\mathcal{P}$. Que tu objetivo es hacer conjeturas razonables como para que cuadro es, basado en lo que usted vea en las entradas que se han retirado de ella.
Como un ejemplo (que es práctico y realista, no un libro de texto de juguete), suponga que usted es el estudio de la tasa de $y$ de una reacción química, ya que varía con la temperatura. Supongamos que la teoría de la química predice que dentro de la gama de temperaturas entre el $0$ $100$ grados, la velocidad es proporcional a la temperatura.
Planea para el estudio de esta reacción en ambos $0$ $100$ grados, haciendo varias observaciones a cada temperatura. Por lo tanto, son una parte muy, muy grande el número de cajas. Vas a llenar cada caja con billetes. Hay una constante de la tasa por escrito en cada uno de ellos. Todas las entradas en cualquier cuadro de tener la misma tasa constante escrito en ellos. Diferentes cuadros de utilizar diferentes constantes de velocidad.
El uso de la constante de velocidad escrito sobre cualquier billete, también anote la tasa en $0$ y la tasa en $100$ grados: llamar a estos $y_0$$y_{100}$. Pero esto aún no es suficiente para un buen modelo. Los químicos también sabemos que ninguna sustancia es pura, la cantidad no es exactamente medido, y otras formas de observación de la variabilidad de ocurrir. El modelo de estos "errores", que hacen muy, muy muchas copias de tus entradas. En cada copia de cambiar los valores de $y_0$$y_{100}$. En la mayoría de ellos puede cambiar sólo un poco. En muy pocos, puede cambiar mucho. Usted escriba los valores modificados a medida que el plan para observar a cada temperatura. Estas observaciones representan posibles observables de los resultados de su experimento. En el cuadro de ir cada conjunto de estas entradas: se trata de un modelo de probabilidad para lo que se puede observar para una determinada tasa constante.
Qué hacer observar es modelada por el dibujo de un billete de esa caja y con solo leer las observaciones escritas allí. No llegue a ver el subyacente (true) los valores de $y_0$ o $y_{100}$. No llegue a leer el (verdadero) la constante de velocidad. Esos no son otorgados por el experimento.
Cada modelo estadístico debe hacer algunas suposiciones acerca de las entradas en estos (hipotético) de las cajas. Por ejemplo, tenemos la esperanza de que cuando se modifican los valores de las $y_0$$y_{100}$, que lo hizo sin un aumento constante o constante disminución de uno (como un todo, dentro de la caja): que sería una forma de sesgo sistemático.
Dado que las observaciones por escrito de cada entrada son números, dan lugar a distribuciones de probabilidad. Las suposiciones sobre las cajas normalmente se expresan en términos de las propiedades de dichas distribuciones, tales como si se debe calcular el promedio de cero, ser simétricas, tienen una "curva de campana" forma, no están correlacionados, o lo que sea.
Eso es realmente todo lo que hay que hacer. Mucho en la forma en que una primitiva de doce tonos de la escala dio origen a todos los de la música clásica Occidental, una colección de entradas que contiene los cuadros es un concepto simple que puede ser utilizado en extremadamente ricas y complejas maneras. Puede modelar casi cualquier cosa, desde un tirón de la moneda a una biblioteca de vídeos, bases de datos de interacciones Web, mecánica cuántica conjuntos, y cualquier otra cosa que pueda ser observados y registrados.