Supongamos que $(X_1,\ldots,X_d)$ es una variable aleatoria continua positiva. Escribe su elemento de probabilidad conjunta como
$$f(x_1,\ldots,x_d)\,\mathrm{d}x_1 \cdots \mathrm{d}x_{d-1} \mathrm{d}x_d$$
para que la función de densidad sea $f(x_1,\ldots, x_d).$
Dejando el caso del $L^\infty$ norma para más adelante (es especial), considere $0\le p\lt \infty.$ Se pregunta por la densidad de la variable aleatoria
$$(Y_1,\ldots,Y_{d-1},R) = (X_1/R, \ldots, X_{d-1}/R, (X_1^p+\cdots+X_d^p)^{1/p}).$$
Se trata de una transformación invertible porque $X_i=R\,Y_i$ se define para $i=1,2,\ldots,d-1$ y $X_d = R\left(1 - Y_1^p-\cdots-Y_{d-1}^p\right)^{1/p}$ también es único.
Emulando la derivación de la distribución de Dirichlet mediante la álgebra de formas diferenciales , computa
$$\mathrm{d}x_i = r\,\mathrm{d}y_i + y_i\,\mathrm{d}r,\ i=1,2,\ldots, d-1$$
et
$$\begin{aligned} px_d^{p-1}\,\mathrm{d}x_d &= d\left(x_d^p\right) = \mathrm d\left(r^p-x_1^p-\cdots-x_{d-1}^p\right)\\ &= p\left(r^{p-1}\,\mathrm{d}r - x_1^{p-1}\,\mathrm{d}x_1 - \cdots - x_{d-1}^{p-1}\,\mathrm{d}x_{d-1}\right). \end{aligned}$$
Introdúzcalos para calcular el antiguo diferencial en términos de las nuevas variables y sus diferenciales:
$$\begin{aligned} \mathrm{d}x_1\wedge \cdots \wedge \mathrm{d}x_d &= \left(px_d^{p-1}\right)^{-1}\mathrm{d}x_1\wedge \cdots \wedge \mathrm{d}x_{d-1}\wedge \mathrm{d}(x_d^p)\\ &= \left(x_d^{p-1}\right)^{-1}\mathrm{d}x_1\wedge \cdots \wedge \mathrm{d}x_{d-1}\wedge \left(r^{p-1}\,\mathrm{d}r - x_1^{p-1}\,\mathrm{d}x_1 - \cdots - x_{d-1}^{p-1}\,\mathrm{d}x_{d-1}\right)\\ &= \left(x_d^{p-1}\right)^{-1}\mathrm{d}x_1\wedge \cdots \wedge \mathrm{d}x_{d-1}\wedge r^{p-1}\,\mathrm{d}r \\ &= \left(x_d^{p-1}\right)^{-1} \left(r\,\mathrm{d}y_1 + y_1\,\mathrm{d}r\right) \wedge \cdots \wedge \left(r\,\mathrm{d}y_{d-1} + y_{d-1}\,\mathrm{d}r\right) \wedge r^{p-1}\,\mathrm{d}r\\ &= r^{d-1}\left(\frac{r^{p-1}}{x_d^{p-1}}\right)\,\mathrm{d}y_1\wedge \cdots \wedge \mathrm{d}y_{d-1} \wedge \mathrm{d}r\\ &= r^{d-1}\left(1 - y_1^p - \cdots - y_{d-1}^p\right)^{1/p-1}\,\mathrm{d}y_1\wedge \cdots \wedge \mathrm{d}y_{d-1} \wedge \mathrm{d}r. \end{aligned} $$
El coeficiente de la forma diferencial es el jacobiano y (por tanto) la densidad de $(Y_1,\ldots, Y_{d-1})$ es
$$\begin{aligned} &g(y_1,\ldots, y_{d-1}) \\ &= \int_0^\infty f\left(ry_1, \ldots, ry_{d-1}, r\left(1-y_1^p-\cdots-y_{d-1}^p\right)^{1/p}\right)\, r^{d-1}\left(1 - y_1^p - \cdots - y_{d-1}^p\right)^{1/p-1}\,\mathrm{d}r. \end{aligned}$$
La dificultad cuando $p=\infty,$ donde $r=\max(x_i),$ es que $(y_1,\ldots, y_{d-1}) = (x_1/r,\ldots, x_{d-1}/r)$ ya no son coordenadas para la imagen de la proyección. Estas coordenadas sólo funcionan en el subconjunto en el que $x_d$ es el más grande.
Un enfoque sencillo consiste en descomponer la distribución en función de los eventos determinados por cuál de los $X_i$ es el más grande. Como la distribución conjunta es continua, la probabilidad de que haya un empate para el mayor es cero, por lo que se puede despreciar esa posibilidad. Dejemos que $K$ sea la variable aleatoria dada por el índice del mayor de los $X_i.$
Acondicionamiento primero en $K=d,$ tenemos $R=\max(X_i)=X_d$ y $Y_i = X_i/R = X_i/X_d$ para $i=1,2,\ldots, d-1.$ Calculando como antes obtenemos (fácilmente)
$$\mathrm{d}x_1\wedge \cdots \wedge \mathrm{d}x_{d} = r^{d-1}\, \mathrm{d}y_1\wedge \cdots \wedge \mathrm{d}y_{d-1}\wedge \mathrm{d}r.$$
Comparando esto con el $L^p$ obtenida anteriormente, podemos ofrecer un argumento intuitivo (a mano) para esta fórmula (como se sugiere en la pregunta): como $p$ crece, el factor $(1-y_1^p-\cdots -y_{d-1}^p)^{1/p-1}$ se acerca a $x_d^{-1} = r^{-1},$ dando $r^d(r^{-1})= r^{d-1}$ para el jacobiano.
Este análisis se aplica casi sin cambios cuando se condiciona a otros valores de $K:$ sólo hay que tomar la señal adecuada cuando se integra sobre $r$ en cada caso para asegurar que el resultado es una densidad positiva. En todos los casos el jacobiano sigue siendo igual a $r^{d-1}.$ La distribución completa de la proyección es un mezcla de la $d$ distribuciones condicionales. Cada uno de los $d$ componentes se apoya en una cara diferente del cubo de la unidad $I_d = (0,1]^d\subset \mathbb{R}^d;$ el componente correspondiente a $K=k$ es compatible con $\partial_k^{+} I_d = \{(y_1,\ldots,y_d)\mid 0\lt y_i\le 1;\ y_k=1\} \subset I_d.$