Más a Kjetil excelente respuesta, quería añadir algunos ejemplos específicos para ayudar a aclarar el significado de una condicional de distribución, que puede ser un poco de un concepto esquivo.
Digamos que usted tomó una muestra al azar de 100 peces en un lago y estás interesado en ver cómo la edad de los peces afecta a varias variables de resultado:
- Los peces de peso (Peso);
- Sea o no que los peces son más de 30cm;
- El número de escamas de pescado.
El primer resultado de la variable es continua, la segunda es binaria (0 = el pez es de NO más de 30 cm; 1 = el pez ES de más de 30 cm) y la tercera es una variable de recuento.
Regresión Lineal Simple
¿Cómo influye la Edad de Peso? Usted va a formular un modelo de regresión lineal simple de la forma:
Weight = beta_{0} + beta_{1}*Age + epsilon
donde la $epsilon$'s son independientes, idénticamente distribuidas, siguiendo una distribución Normal con media 0 y desviación estándar $sigma$. En este modelo, la media del Peso de la variable para todos los peces en el lago de compartir la misma edad se supone que varía linealmente con la edad. La media condicional está representado por beta_{0} + beta_{1}*Edad. Se llama condicional porque es el peso medio de todos los peces en el lago con la misma Edad. (La incondicional la media de peso sería el peso promedio de todos los peces en el lago, independientemente de su peso.)
Simple De Regresión Logística Binaria
Cómo influye la Edad en si, o no, los peces son más de 30cm? Usted va a formular una simple regresión logística binaria modelo de la forma:
log(p/(1-p)) = beta_{0} + beta_{1}*Age
donde p denota la probabilidad condicional de que un pez de una determinada edad es de más de 30cm. En este modelo, la media condicional de la variable "sea o no que los peces son más de 30cm" correspondiente a todos los peces en el lago de compartir la misma edad se supone que varía linealmente con la edad después de ser alimentados a la transformación logit. El logit-transformado media condicional está representado por beta_{0} + beta_{1}la Edad. Este modelo funciona porque se supone que la distribución de los valores de la variable "sea o no que los peces son más de 30cm" para una determinada edad es una distribución de Bernoulli. Recordemos que para esta distribución, la varianza es una función del valor medio, por lo que si se puede estimar su valor medio, también podemos estimar su varianza. (La media de una variable de Bernoulli es p y la varianza es p(1-p).) Ver también https://www.theanalysisfactor.com/link-functions-and-errors-in-logistic-regression/.
Simple De Regresión De Poisson
Cómo influye la Edad en el número de escamas de pescado? Usted va a formular un simple modelo de regresión de Poisson de la forma:
log(mu) = beta_{0} + beta_{1}*Age
donde mu denota la media condicional valor de la variable de resultado "número de peces de escamas para peces de una determinada edad (es decir, se espera que el número de peces de escamas para todos los peces en el lago de una determinada edad). En este modelo, la media condicional de la variable de resultado se supone que varía linealmente con la edad después de ser alimentados a la transformación de registro. El registro de transformadas media condicional está representado por beta_{0} + beta_{1}*Edad. Este modelo funciona porque se supone que la distribución de los valores de la variable "número de peces de escamas para todos los peces en el lago de una determinada edad es una distribución de Poisson. Recordemos que para esta distribución, la media y la varianza son iguales, por lo que es suficiente para modelar su valor medio.
Para resumir, un condicional de distribución representa la distribución de los resultados para determinados valores de la variable predictora(s) incluidas en el modelo. Cada tipo de modelo de regresión se muestra arriba impone ciertas distribución de hipótesis sobre la distribución condicional de la variable de resultado de cierta Edad. Basándose en estos supuestos de distribución, el modelo se procede a establecer la forma en que (1) la media de la distribución condicional varía en función de la edad (regresión lineal simple), (2) el logit transformadas por medio de la condicional distribución varía en función de la edad (simple regresión logística binaria) o (3) el registro de transformadas por medio de la condicional distribución varía en función de la edad.
Para cada tipo de modelo, se puede definir correspondiente de los residuos para el propósito de la comprobación del modelo. En particular, de Pearson y la desviación de los residuos podría ser definido para la logística y modelos de regresión de Poisson.