(He publicado esta pregunta antes en MSE pero no recibí respuestas, así que lo intentaré aquí. También he condensado la redacción, espero que no sea demasiado)
Dejemos que
$\displaystyle \small \qquad f_w = (2-1)(3-1)(5-1)\ldots(p_w-1) \qquad = \prod_{k=1}^w (prime(k)-1) $
o en general con un número natural para el exponente n
$\displaystyle \small (1) \qquad f_w(n) = (2^n-1)(3^n-1)(5^n-1)\ldots(p_w^n-1) \qquad = \prod_{k=1}^w (prime(k)^n-1) $
con w que va hasta el infinito.
Entonces denotemos la primefactorización canónica de ese producto
$\displaystyle \small (2) \qquad f_w(n) = 2^{a_{n,1}} \cdot 3^{a_{n,2}} \cdot 5^{a_{n,3}} \cdot \ldots \cdot q_k^{a_{n,k}} \cdot \ldots $
utilizando q para los factores primarios para evitar la confusión entre las dos representaciones.
Me interesa saber si existe una expresión analítica para las frecuencias relativas
$\small (3) \qquad r_w(n,k) = a_{n,k} / w $
en el límite en la última expresión.
Empíricamente (utilizando la primera 600000 primos en la fórmula (1)) encontré aproximaciones a valores racionales para las frecuencias relativas de los primeros factores primos q en la fórmula (2) dando una tabla de alguna manera significativa, donde, después de escalar cerca de los enteros, para los primos pequeños q el error estaba en el cerca de 1/1000 . Sin embargo, no puedo determinar si las desviaciones de mi fórmula analítica estimada son aleatorias y desaparecen en el límite o si mantienen un sesgo. Especialmente el factor primario q=2 en la fórmula (2) parece tener un sesgo no aleatorio que podría sobrevivir en el límite.
Aquí está la tabla. Las entradas $\small e_{n,q}$ dan las frecuencias empíricas redondeadas $\small e_{n,q} \approx a_{n,k}/w \cdot (q-1)^2 $
$\small \qquad \begin{array} {r|rrrrrrrrrrrr} n&2&3&5&7&11&13&17&19&23& (\ldots \text{ primefactor }q)\\ \hline \\ 1&2&3&5&7&11&13&17&19&23 \\ 2&4&6&10&14&22&26&34&38&46 \\ 3&2&5&5&21&11&39&17&57&23 \\ 4&5&6&20&14&22&52&68&38&46 \\ 5&2&3&9&7&55&13&17&19&23 \\ 6&4&10&10&42&22&78&34&114&46 \\ 7&2&3&5&13&11&13&17&19&23 \\ 8&6&6&20&14&22&52&136&38&46 \\ 9&2&7&5&21&11&39&17&171&23 \\ 10&4&6&18&14&110&26&34&38&46 \\ 11&2&3&5&7&21&13&17&19&253 \\ 12&5&10&20&42&22&156&68&114&46 \\ 13&2&3&5&7&11&25&17&19&23 \\ 14&4&6&10&26&22&26&34&38&46 \\ 15&2&5&9&21&55&39&17&57&23 \\ 16&7&6&20&14&22&52&272&38&46 \\ 17&2&3&5&7&11&13&33&19&23 \\ 18&4&14&10&42&22&78&34&342&46 \end{array} $
La fórmula heurística que he extrapolado (dejando w aumento hacia el infinito) tiene dos formas:
si q=2 y n es par ( gcd(n,q)=2 ):
$\small \qquad e_{n,2} = (3 + \operatorname{val}( n,2 ) ) $
donde la función val(n,q) significa: el exponente, al que el factor primario q se produce en n
Para todos los demás casos
$\small \qquad e_{n,q} = \gcd(n,q-1) \cdot (q + (q-1)\cdot \operatorname{val}(n,q) ) $
Entonces
$\small \qquad \displaystyle a_{n,q} = { e_{n,q} \cdot w \over (q-1)^2 } $
¿Puede confirmarse la fórmula adivinada mediante un argumento analítico?