Te refieres a una transformación de un par de variantes independientes $(X,Y)$ a la representación polar $(R,\theta)$ (radio y ángulo), y luego observar la distribución marginal de $\theta$ .
Voy a ofrecer una explicación un tanto intuitiva (aunque una derivación matemática de la densidad hace esencialmente lo que describo informalmente).
Observa que si escalas las dos variables, X e Y por alguna escala común (por ejemplo, pasar de U(-1,1) a U(-10,10) o de N(0,1) a N(0,20) en ambas variables al mismo tiempo) eso no supone ninguna diferencia en la distribución del ángulo (sólo afecta a la escala de la distribución del radio). Así que consideremos sólo los casos unitarios.
Primero hay que considerar lo que ocurre con el caso de los uniformes. Obsérvese que la distribución es uniforme sobre el cuadrado unitario, de modo que la densidad de probabilidad en una región contenida dentro de $[-1,1]^2$ es proporcional al área de la región. En concreto, fíjate en la densidad asociada a un elemento de ángulo, $d\theta$ cerca de la horizontal (cerca del ángulo $\theta=0$ ) y en la diagonal (cerca del ángulo $\theta=\pi/4$ ):
Es evidente que el elemento de probabilidad $df_\theta$ (es decir, el área) correspondiente a un elemento de ángulo ( $d\theta$ ) es mayor cuando el ángulo está cerca de una de las diagonales. En efecto, si inscribimos un círculo en el interior del cuadrado, el área que abarca un ángulo minúsculo dado dentro del círculo es constante, y la parte que queda fuera del círculo crece a medida que nos acercamos a la diagonal, donde alcanza su máximo.
Esto explica completamente el patrón que se ve en las simulaciones.
En efecto, podemos ver que la densidad debe ser proporcional a la longitud del segmento desde el centro del cuadrado hasta su borde; basta con una simple trigonometría para deducir la densidad a partir de ahí y luego es fácil encontrar la constante necesaria para que la densidad se integre en 1.
[Edito: he añadido esta parte para hablar del radio, ya que la pregunta ha cambiado desde mi respuesta original].
Obsérvese que si tuviéramos una distribución uniforme sobre el círculo unitario (es decir, el que antes inscribimos en el cuadrado) entonces la densidad del radio para ello sería proporcional al radio (considérese el área de un pequeño elemento anular de anchura $dr$ en el radio $r$ - es decir, entre $r$ y $r+dr$ - tiene un área proporcional a $r$ ). Luego, a medida que pasamos fuera del círculo, las nuevas regiones anulares de mayor radio sólo reciben contribuciones de densidad de la parte situada en el cuadrado, por lo que la densidad disminuye (inicialmente con bastante rapidez, luego más lentamente) entre $1$ y $\sqrt 2$ . (De nuevo, unas nociones geométricas bastante sencillas bastan para obtener la forma funcional de la densidad si se necesita).
Por el contrario, si la distribución conjunta es rotacionalmente simétrica respecto al origen, entonces el elemento de probabilidad en algún ángulo no depende del ángulo (¡esto es esencialmente una tautología!). La distribución bivariada de dos gaussianas estándar independientes es rotacionalmente simétrica respecto al origen:
(código de esta imagen basado en el código de Elan Cohen aquí pero hay una buena alternativa aquí y algo entre los dos aquí )
En consecuencia, el volumen contenido en algún ángulo $d\theta$ es el mismo para cada $\theta$ por lo que la densidad asociada al ángulo es uniforme en $[0,2\pi)$ .
[El truco polar utilizado típicamente para integrar la densidad normal sobre la recta real puede utilizarse para averiguar que la densidad del radio al cuadrado es exponencial negativa, y a partir de ahí la densidad del radio es sencilla de identificar mediante un simple argumento de transformación de la función de distribución].