En el de Máxima Verosimilitud, el término ortogonal de parámetros se utiliza cuando se puede lograr una limpieza de la factorización de un multi-parámetro de probabilidad de la función. Dicen que sus datos tienen dos parámetros de $\theta$$\lambda$. Si usted puede volver a escribir la probabilidad conjunta:
$L(\theta, \lambda) = L_{1}(\theta) L_{2}(\lambda)$
entonces llamamos a $\theta$ $\lambda$ ortogonal parámetros. El caso evidente es cuando se tiene la independencia, pero esto no es necesario para la definición de tan largo como el de la factorización se puede lograr. Ortogonal parámetros son deseables porque, si $\theta$ es de interés, a continuación, puede realizar la inferencia usando $L_{1}$.
Cuando no tenemos ortogonal parámetros, tratamos de encontrar factorizations como
$L(\theta, \lambda) = L_{1}(\theta) L_{2}(\theta, \lambda)$
y realizar inferencia utilizando $L_1$. En este caso, se debe argumentar que la pérdida de información debido a la exclusión de $L_{2}$ es bajo. Esto nos lleva al concepto de probabilidad marginal.