Dado que la pregunta puede interpretarse de múltiples maneras, dividiré esta respuesta en dos partes.
- R: familias de distribución.
- B: familias de distribución a escala de localización.
El problema del caso A puede ser fácilmente respondido/demostrado por muchas familias con un parámetro de forma.
El problema del caso B es más difícil, ya que un parámetro y medio parece ser suficiente para especificar la ubicación y la escala (ubicación en $\mathbb{R}$ y escala en $\mathbb{R_{>0}}$ ), y el problema se convierte en si dos parámetros pueden ser utilizados para codificar (múltiples) formas además. Esto no es tan trivial. Podemos fácilmente llegar a familias específicas de escalas de localización de dos parámetros y demostrar que no se tienen formas diferentes, pero no se demuestra que esta sea una regla fija para cualquier familia de escalas de localización de dos parámetros.
R: ¿Pueden dos distribuciones diferentes de la misma familia de distribuciones de 2 parámetros tener la misma media y varianza?
La respuesta es sí y ya se puede demostrar utilizando uno de los ejemplos mencionados explícitamente: la distribución Gamma normalizada
Familia de distribuciones gamma normalizadas
Dejemos que $Z = \frac{X-\mu}{\sigma}$ con $X$ una variable con distribución Gamma. La distribución (acumulativa) de $Z$ es el siguiente:
$$F_Z(z;k) = \begin{cases} 0 & \quad \text{if} & z < -\sqrt{k}\\ \frac{1}{\Gamma(k)} \gamma(k, {z\sqrt{k}+k}) & \quad \text{if} & z \geq -\sqrt{k} \end{cases} $$
donde $\gamma$ es la función gamma incompleta.
Por lo tanto, en este caso es evidente que diferentes $Z_1$ y $Z_2$ (distribuciones de la familia de las distribuciones gamma normalizadas) pueden tener la misma media y varianza (a saber $\mu=0$ y $\sigma=1$ ) pero difieren en función del parámetro $k$ (a menudo denominado parámetro de "forma"). Esto está estrechamente relacionado con el hecho de que la familia de distribuciones gamma no es una familia de escala de localización.
B: ¿Pueden dos distribuciones diferentes del mismo parámetro 2 escala de localización familia de distribución tienen la misma media y varianza?
Creo que la respuesta es no si consideramos sólo familias suaves (suaves: un pequeño cambio en los parámetros dará lugar a un pequeño cambio de la distribución/función/curva). Pero esa respuesta no es tan trivial y cuando utilizamos familias más generales (no suaves) entonces podemos decir sí Aunque estas familias sólo existen en teoría y no tienen relevancia práctica.
Generación de una familia a escala de localización a partir de una única distribución mediante traslación y escalado
Desde cualquier solo podemos generar una familia a escala de localización por traslación y escalado. Si $f(x)$ es la función de densidad de probabilidad de la distribución única, entonces la función de densidad de probabilidad de un miembro de la familia será
$$f(x;\mu,\sigma) = \frac{1}{\sigma}f(\frac{x-\mu}{\sigma})$$
Para una familia a escala de localización que puede ser generada de tal manera tenemos:
- para dos miembros cualesquiera $f(x;\mu_1,\sigma_1)$ y $f(x;\mu_2,\sigma_2)$ si sus medias y varianzas son iguales, entonces $f(x;\mu_1,\sigma_1) = f(x;\mu_2,\sigma_2)$
¿Pueden todas las familias de escala de localización de dos parámetros generar sus distribuciones de miembros a partir de una única distribución de miembros mediante traslación y escalado?
Así, la traslación y el escalado pueden convertir una distribución única en una familia a escala de localización. La cuestión es si lo contrario es cierto y si cada familia de escala de localización de dos parámetros (donde los parámetros $\theta_1$ y $\theta_2$ no tienen por qué coincidir con la ubicación $\mu$ y escala $\sigma$ ) puede describirse mediante una traslación y escalado de un solo miembro de esa familia.
Para familias particulares de dos parámetros de escala de localización, como la familia de distribuciones normales, no es demasiado difícil demostrar que se pueden generar según el proceso anterior (escalado y traslación de un solo miembro de ejemplo).
Cabe preguntarse si es posible que cada familia de escala de localización de dos parámetros que se genera a partir de un único miembro mediante la traslación y el escalado. O una afirmación contradictoria: "¿Puede una familia de escala de localización de dos parámetros contener dos distribuciones de miembros diferentes con la misma media y varianza?", para lo cual sería necesario que la familia es una unión de múltiples subfamilias que se generan cada una de ellas por traducción y escalamiento.
Caso 1: Familia de distribuciones t de Student generalizadas, parametrizadas por dos variables
Un ejemplo artificial ocurre cuando hacemos algún mapeo de $R^2$ en $R^3$ ( cardinalidad-de-mathbbr-y-mathbbr2 ) que permite la libertad de utilizar dos parámetros $\theta_1$ y $\theta_2$ para describir una unión de múltiples subfamilias que se generan mediante la traducción y el escalado.
Utilicemos la distribución t de Student generalizada (de tres parámetros):
$f(x;\nu,\mu,\sigma) = \frac{\Gamma \left( \frac{\nu + 1}{2} \right) }{\Gamma \left( \frac{\nu}{2} \right) \sqrt{\pi\nu}\sigma} \left(1 + \frac{1}{\nu} \left( \frac{x-\mu}{\sigma} \right)^2 \right)^{-\frac{\nu+1}{2}}$
con los tres parámetros modificados como sigue $$\begin{array}{rcl} \mu &=& \tan (\theta_1)\\ \sigma &=& \theta_2\\ \nu &=& \lfloor 0.5+\theta_1/\pi \rfloor \end{array}$$
entonces tenemos
$f(x;\theta_1,\theta_2) = \frac{\Gamma \left( \frac{\lfloor 0.5+\theta_1/\pi \rfloor + 1}{2} \right) }{\Gamma \left( \frac{\lfloor 0.5+\theta_1/\pi \rfloor}{2} \right) \sqrt{\pi\lfloor 0.5+\theta_1/\pi \rfloor}\theta_2} \left(1 + \frac{1}{\lfloor 0.5+\theta_1/\pi \rfloor} \left( \frac{x-\tan(\theta_1)}{\theta_2} \right)^2 \right)^{-\frac{\lfloor 0.5+\theta_1/\pi \rfloor+1}{2}}$
que puede considerarse una familia de escala de localización de dos parámetros (aunque no muy útil) que no puede generarse mediante la traslación y el escalado de un solo miembro.
Caso 2: Familias de escala de localización generadas por el escalado negativo de una única distribución con asimetría no nula
Un ejemplo menos rebuscado, que el uso de esta función tan, lo da Whuber en los comentarios de la respuesta de Carl. Podemos tener una familia $x \mapsto f(x/b + a)$ donde al voltear el signo de $b$ mantiene la media y la varianza sin cambios, pero posiblemente cambiando los momentos superiores desiguales. Así que esto da un poco más fácilmente una familia de escala de localización de dos parámetros donde los miembros con la misma media y varianza pueden tener diferentes momentos de orden superior. Este ejemplo de Whuber puede dividirse en dos subfamilias, cada una de las cuales puede generarse a partir de un único miembro mediante la traslación y el escalado.
Familias suaves
Si intentamos hacer una única familia de distribución suave de dos parámetros (suave: un pequeño cambio en los parámetros dará lugar a un pequeño cambio de la distribución/función/curva) haciendo de alguna manera una composición de dos o más familias que se generan por traslación y escalado, entonces nos metemos en problemas para que los dos parámetros cubran tanto la variación de la 'media' y la 'varianza', como el tercer parámetro 'forma'. Una prueba formal tendrá que ir en la misma línea que la respuesta a la pregunta: ¿Existe una función suryectiva suave $f:\mathbb{R}^2 \mapsto \mathbb{R}^3$ ? (donde la respuesta es no en el caso de suave es decir, funciones infinitamente diferenciables, aunque hay continuo funciones que harían el trabajo, como las curvas de Peano).
Intuición: Imagina que hay algunos parámetros $\theta_1$ , $\theta_2$ que describen las distribuciones en alguna familia de distribuciones a escala de localización y mediante las cuales podemos cambiar la media y la varianza también como algunos otros momentos, entonces deberíamos ser capaces de expresar $\theta_1$ , $\theta_2$ en términos de la media $\mu$ y la varianza $\sigma$
$$\begin{array}{rcl} \theta_1 &= &f_{\theta_1}(\mu,\sigma) \\ \theta_2 &=& f_{\theta_2}(\mu,\sigma)\end{array}$$
pero deben ser funciones de valor múltiple y éstas no pueden hacer transiciones continuas, los diferentes valores de $f_{\theta_1}(\mu,\sigma)$ para un determinado $\mu$ y $\sigma$ no son continuas, y no podrán modelar un parámetro de forma continua.
En realidad, no estoy tan seguro de esta parte final. Posiblemente podríamos utilizar una curva que llene el espacio (como la curva de Peano, si supiéramos cómo expresar las coordenadas de la curva a coordenadas del hipercubo) para tener un único parámetro $\theta_1$ modelar completamente características múltiples como la media y la varianza, sin renunciar a la propiedad de que un pequeño cambio del parámetro $\theta_1$ equivale a un pequeño cambio de la función $f(x;\theta_1)$ en cada $x$
4 votos
Sí, pueden. Pero, necesitarías al menos 3 parámetros en una distribución generalizada.
5 votos
@Carl Un parámetro será suficiente.
0 votos
@whuber El OP está preguntando por la misma distribución, no por otras diferentes.
0 votos
Si $Z$ es una variable aleatoria estándar de Cauchy con densidad $\frac{1}{\pi(1+x^2)}, -\infty < x < \infty$ entonces $bZ+a = X$ es una variable aleatoria de Cauchy escalada y desplazada. La familia $$\mathcal C(a,b) = \{X\colon X=a+bZ, Z~\text{standard Cauchy}, b\neq 0\}$$ es una familia a escala de localización en el sentido que usted ha definido (la distribución de $\frac{X-a}{b}$ no depende de $a$ o $b$ y es el mismo para todos $a$ y $b$ ), pero ninguna de las variables aleatorias goza de una media o una varianza.
1 votos
@DilipSarwate tienes razón, no lo he especificado pero me refiero a ambos $\mu$ y $\sigma$ finito
1 votos
Si necesita dos o menos parámetros, y está especificando una familia de ubicación-escala, los dos parámetros serán necesariamente la ubicación y la escala. Dado que se requiere la misma localización y escala entre las dos distribuciones, eso significa que los valores de los parámetros serán los mismos; si las distribuciones también tienen la misma forma funcional, debe ser que son idénticas, ya que tienen la misma forma funcional y los mismos valores de los parámetros. Como son idénticas, todos los momentos superiores serán también iguales.
5 votos
@Carl No está claro lo que quieres decir con "misma distribución". Literalmente, eso se referiría a una distribución única, con una sola ley y, por tanto, con una expectativa única, una varianza única y unos momentos únicos (en la medida en que estén definidos). Si te refieres a "la misma distribución familia Entonces su comentario no tiene sentido, porque la familia es lo que usted define como tal.
0 votos
@whuber Para aclarar, me refiero a distribuciones de la misma forma, antes de que sus parámetros tomen valores. Por ejemplo, una distribución normal tendría la forma $\mathcal{N}(\mu,\sigma^2)$ .
1 votos
La respuesta depende de la interpretación de "... la distribución de $Z=(Xa)/b$ no depende de ningún parámetro y es el mismo para cada $X$ perteneciente a esa familia". si el "es" significa "para tous $X$ en la familia, la distribución de $(X-a)/b$ no depende de $a$ y $b$ " o "para todos $X$ en la familia, $(X-a)/b$ tiene la misma distribución". yyzz eligió esta última interpretación pero todos los demás, incluido el moderador @whuber, prefieren la primera. Ambas interpretaciones tienen respuestas fáciles, pero diametralmente opuestas. Es injusto llamar a la respuesta de yyzz incorrecta; NO lo es.
3 votos
@HardCore Como parece que cree que su pregunta ha sido respondida, por favor vea ¿Qué debo hacer cuando alguien responde a mi pregunta?
0 votos
@DilipSarwate Estoy de acuerdo. Además, creo que aquí hay un uso más natural que "familia de distribuciones" y es "distribuciones de la misma forma". Por ejemplo, hay múltiples formas de distribución que están en la familia exponencial, por lo que puede ser demasiado confuso para ser natural. Mi respuesta se relaciona con eso, y tampoco es incorrecta a pesar de los downvotes. Tengo un problema con los downvotes; a veces tienden a la estrechez de miras sin inspiración.
2 votos
@Carl yo también upvoteé tu respuesta. El uso del OP parece apoyar la noción de $Z=(X-a)/b$ como si tuviera la misma distribución estándar para todas las opciones de $X$ en la familia. A ver qué respuesta acepta el OP (si es que el OP llega a leer el comentario de Glen_b y actúa en consecuencia).
0 votos
@DilipSarwate Agradezco mucho tu amplísima aportación, ojalá se comparta.
0 votos
@HardCore $Z_1$ y $Z_2$ no será el mismo cuando $X$ y $Y$ son ambos Gamma (pero con diferente parámetro de forma $k$ ).
0 votos
@MartijnWeterings Efectivamente, $\mu$ es generalmente un parámetro de localización, y las distribuciones gamma, sin generalizarlas, no tienen parámetros de localización así como, sin generalizar. estando definidas sólo en $[0,\infty)$ . Según mi respuesta más abajo, la pregunta, sin generalizar, sólo se refiere a las distribuciones simétricas.
1 votos
@Carl, no entiendo a qué viene lo de las distribuciones simétricas (¿eso lo hace diferente?). Estaba señalando a HC que ya uno de sus ejemplos (ambos normales, ambos gamma y así sucesivamente) es un caso de 2 parámetros que la pregunta buscaba. En tu respuesta tampoco veo tu punto de vista. Para mí es difícil de leer (por ejemplo, empieza con un comentario de una página sobre los votantes a la baja) y no veo cuál es tu conclusión sobre la distribución. Para los fijos $\mu$ tenemos otro ejemplo de familia de 2 parámetros: $$\dfrac{\beta}{2\alpha\Gamma\Big(1/\beta\Big)} \; e^{-\Big(|x|/\alpha\Big)^\beta}$$
0 votos
@MartijnWeterings Tu post muestra una distribución de parámetros de forma y escala sin un parámetro de localización. Si quieres convertir una generalización de la distribución gamma en una distribución normal generalizada y simétrica con parámetros de forma, escala y localización lo harías como sigue . ¿Cómo se relaciona esto con la pregunta, que es sobre distribuciones de parámetros de localización y de escala? La distribución gamma sin generalizar no encaja con el resto de la pregunta ya que es una distribución que contiene parámetros de escala y forma.
1 votos
@Carl, la distribución gamma se menciona explícitamente en la pregunta " (donde con la familia me refiero .. tanto Gamma y así sucesivamente ..)" . Por eso lo menciono. Pero ciertamente hay otros sabores de esta pregunta y la familia de distribuciones normales generalizadas con una media fija específica hace el trabajo si se piensa en distribuciones simétricas (la pregunta es ambigua sobre el hecho de si se trata de familias de escala de localización ). Personalmente, me parece que la pregunta sobre las familias de escala de localización de dos parámetros es la más interesante porque ese sabor de la pregunta no es en absoluto trivial.