Algunas ideas:
Divisibilidad por $3$:
E. g. $n$ es divisible por $3$ si y sólo si su suma de dígitos es divisible por 3, por ejemplo, ver aquí.
$$
3 \mediados n \iff 3 \mediados de ds(n)
$$
Ahora $S$ contiene los números de $2^k (k \in \mathbb{N}_0)$ que no son divisibles por $3$ (véase el único descomposición en factores primos). Por lo tanto su suma de dígitos no es divisible por $3$.
Un número generado a partir de la inversión de su cadena de dígitos (y la eliminación de cola cero dígitos) todavía tiene la misma suma de dígitos y por lo tanto no es divisible por $3$.
$$
3 \no\mid 2^k =: x \iff 3 \no\mediados de ds(x) = ds(y) \iff 3 \no\mid y \\
y = \text{rev}(x) = \text{integer}(\text{normalizar}((x)_{10}^R)) \quad (*)
$$
La multiplicación por algunos no trivial poder de $2$ sólo aumentará el exponente de $2$ en la única factorización prima
$n = 2^{e_2} 3^{e_3} 5^{e_5} \cdots$ y no aumentar el exponente de $3$, por lo que no afectará a la divisibilidad por $3$.
Así que los números divisibles por $3$ no son miembros de $S$.
Divisibilidad por $11$:
Divisibilidad por $11$ de un número entero $n$ parece referirse a la divisibilidad por $11$ de la alternancia de suma de dígitos, que también es invariante a la generación a través de la inversión, etc, hasta un signo, que no importa la divisibilidad. Un argumento similar como para $3$ debe aplicar.
Por lo que la demanda de los números no divisibles por $3$ $11$ $S$ parece válida y, como Robert Israel notas en los comentarios, la parte dura de la izquierda es argumentar por qué cada otro entero positivo puede ser que aparezca en $S$, o no.
Acerca de la conjetura:
Personal de mi conjetura es que esta conjetura no es cierto. Los números en los espacios entre las $2^k$, por ejemplo, $5$ sólo puede ir introducido por de que la reversión del proceso de $(*)$. Por lo que deben provenir de alguna cadena de dígitos $s_5 = 5\,0^m$, posiblemente por un gran $m$. Dudo que dicha cadena se muestra en el dígito de las cadenas de $2^k$ y amigos. (ver coffeemath del ejemplo)
La generación de $S$:
Podemos utilizar una palabra binaria de
$$
w \in \{ 0, 1 \}^n \quad (n \in \mathbb{N}) \\
w = d_1 \cdots d_n
$$
para codificar una generación de un elemento $s \in S$ mediante la aplicación de las reglas de $n$ veces, cada dígito binario $d_i$ $w$ codificación de una función
$f_i^{(w)}:\mathbb{N}\to\mathbb{N}$:
$$
f_i^{(w)}(k) =
\begin{cases}
2 k & \text{for } d_i = 0 \\
\text{rev}(k) & \text{for } d_i = 1
\end{casos} \\
$$
a estas funciones se aplican uno tras otro, componiendo una resultante de la función de $f^{(w)}$:
$$
f^{(w)} = f_n^{(w)} \circ f_{n-1}^{(w)} \circ \cdots \circ f_2^{(w)} \circ f_1^{(w)} \\
1 = \sigma(\epsilon) \\
s = \sigma(w) = f^{(w)}(1)uu
$$
Ejemplos:
$$
58 = \sigma(0000001010) \\
1
\desbordado{0} {\,} 2
\desbordado{0} {\,} 4
\desbordado{0} {\,} 8
\desbordado{0} {\,} 16
\desbordado{0} {\,} 32
\desbordado{0} {\,} 64
\desbordado{1} {\,} 46
\desbordado{0} {\,} 92
\desbordado{1} {\,} 29
\desbordado{0} {\,} 58
\\
2 = \sigma(0) \\
4 = \sigma(00)
$$
El binario de palabras de longitud $n$ puede ser generado por el conteo de $0$ $2^n-1$y el cálculo de la base de $2$ representación de cadenas de dígitos de longitud $n$ (con cero a la izquierda de los dígitos). Entonces
$$
S = \bigcup_{n=0}^\infty S_n \\
S_0 = \{ \sigma(\epsilon) \} = \{ 1 \} \\
S_n = \{ \sigma(w) \mid w = (i)_2, i \in \{ 0, \ldots, 2^n-1\} \}
\quad (n \ge 1)
$$
Consideraciones Prácticas:
El número binario de palabras de longitud $n$$2^n$, crece exponencialmente con $n$, por lo que tarde o temprano un cálculo se necesita demasiado tiempo. En la máquina que me trató de un script en Ruby, la cosa se pone fea en torno a $n=24$.
Optimización de 1:
Uno de optimización es de notar que de las diversas palabras $w$ que evaluar a un cierto valor de $s$,
$$
s = \sigma(w)
$$
el uno con un mínimo de longitud y en el orden de la palabra valor se interpreta como valor entero, que la palabra que acaba de características $1$ o $11$ como sub secuencia de $1$ dígitos, pero ya no de la secuencia. Esto es debido a que
$$
\text{rev}^2 \ne \text{id}
$$
por ejemplo, $\text{rev}^2(1200) = \text{rev}(21) = 12$ y
$$
\text{rev}^{1+2k} = \text{rev} \quad (k\in \mathbb{N})
$$
por lo que podemos sustituir
$$
1(11)^+ \a 1
$$
para acortar el binario palabras a otras con el mismo $s$ valor, o ignorarlos, porque hemos visto antes, si vamos de menor a las palabras largas.
Optimización 2:
El $\text{rev}^2$ operación actúa como un truncamiento de cola cero dígitos (véase el ejemplo de arriba para $1200$):
$$
\text{rev}^2(u0^k) = \text{rev}(u^R) = u
$$
Una Segunda Codificación:
Los medios mencionados anteriormente podemos componer la generación de un miembro de la $s\in S$ a través de tres operaciones básicas:
$$
0: 0 \leftrightarrow f(k) = 2 k \\
1: 1 \leftrightarrow f(k) = \text{rev}(k) \\
2: 11 \leftrightarrow f(x) = \text{rev}^2(k)
$$
y el uso ternario números para la codificación. De esta manera nos saltamos algunas generaciones que no añadir miembro nuevo.