La primera parte de la pregunta es fácil: la caída de potencia es típica. Veamos, por ejemplo $\theta\in[1/3,1/2)$ . Tome cualquier $\xi>0$ y considerar la secuencia $\nu_k=\pi^{-1}\xi\theta^k$ hasta el momento en que baje $1$ . Sea $m$ sea el número de términos de esta secuencia. Sea $n_k$ sea el número entero más próximo a $\nu_k$ . La disminución de potencia estará garantizada si demostramos que una parte notable de las diferencias $|\nu_k-n_k|$ no son demasiado pequeños para todos los $m$ .
Fijar $\alpha,\delta>0$ y supongamos que tenemos como máximo $\alpha m$ diferencias $|\nu_k-n_k|$ superando $\delta$ . Tracemos la secuencia $n_k$ al revés. Supongamos que $n_k$ , $n_{k+1}$ et $n_{k+2}$ aproximar la correspondiente $\nu's$ con un error inferior a $\delta$ . Entonces tenemos $n_k\approx n_{k+1}^2n_{k+2}^{-1}$ con el error relativo sobre $\delta(2n_{k+1}^{-1}+n_{k+2}^{-1})<\frac 13 n_k^{-1}$ si $\delta$ se elige lo suficientemente pequeño. Pero entonces $n_k$ está completamente determinada por $n_{k+1}$ y $n_{k+2}$ . El mismo argumento demuestra que aunque sólo sepamos que el error de aproximación es como máximo $\frac 12$ podemos tener un número fijo $A$ de opciones para $n_k$ .
Ahora, contemos las secuencias "malas" de $m$ condiciones. Tenemos ${m\choose \alpha m}$ formas de seleccionar las "malas posiciones de aproximación". Entonces tenemos un número constante de pares de partida $n_{m-1}, n_m$ . Al retroceder, sólo tenemos $3\alpha m$ lugares donde tenemos alguna libertad. Por lo tanto, sólo tenemos $C{m\choose \alpha m}A^{3\alpha m}\le Ce^{q(\alpha)m}$ malas secuencias en las que $q(\alpha)\to 0$ como $\alpha\to 0$ . Por otra parte, $n_0$ y $n_1$ determine $\theta$ con un error de orden $n_1^{-1}\le 2^{-m}$ . Así, la medida de $\theta$ que son malos para algunos $m$ es exponencialmente pequeño en $m$ si $\alpha$ es lo suficientemente pequeño. El resto debería estar claro.
La segunda parte de la pregunta es más difícil de responder. No me cabe duda de que la gente ha descubierto la mayor parte de lo que valdría la pena descubrir aquí, pero dudo mucho que se hayan molestado en publicar algo o, si lo han hecho, que los artículos hayan pasado la revisión de los árbitros. Si necesita algo concreto, formule una pregunta precisa y veremos si podemos averiguarlo.
Editar en respuesta a la edición de la pregunta.
Así que la tasa de decaimiento que esperaba es (o arbitrariamente cerca de) la mitad de la dimensión de Hausdorff $\frac12 dim_H(C_\theta)=\frac 12\frac{\log(1/2)}{\log(\theta)}$ .
Eso es demasiado optimista. Tome grandes $\lambda=\theta^{-1}$ . Toma cualquier número entero. Multiplícalo por $\lambda$ . Corrige el producto al entero más próximo. Multiplica por $\lambda$ . Corrige el producto al número entero más próximo, y así sucesivamente. Después de $m$ pasos, obtendrá $\xi\approx\lambda^m$ mientras que el efecto acumulado de todas las correcciones en cada posición es como máximo de $\theta+\theta^2+\theta^3+\dots\approx\theta$ por lo que todos los cosenos son aproximadamente $1-\theta^2$ y obtienes $\alpha$ no mucho mejor que $\frac{\theta^2}{\log(1/\theta)}$