Por un árbol binario En esta pregunta me refiero a un árbol binario con raíz completa en el que se etiquetan el hijo izquierdo y el derecho. Una hoja de dicho árbol es un vértice de grado como máximo 1 (la mayoría de las referencias probablemente considerarían que una hoja es un vértice de grado exactamente 1) y un vértice interno es un vértice de grado como mínimo 2. Con estas convenciones, hay $C_n=\frac{1}{n+1}$$ {2n} \choose {n} $ binary trees with $ n \in\mathbb N $ internal vertices (and $ n+1 $ leaves). We say that a leaf $ x $ of a binary tree $ T$ es distinguido si $\sigma(x)$ es igual a $x$ para todos los automorfismos del gráfico $\sigma\in\operatorname{Aut}(T)$ .
Por ejemplo, el único árbol binario con 0 vértices internos tiene 1 hoja distinguida, el único árbol binario con 1 vértice interno no tiene ninguna hoja distinguida, los 2 árboles binarios con 2 vértices internos tienen cada uno 1 hoja distinguida, los 5 árboles binarios con 3 vértices internos tienen de media $2/5$ hojas distinguidas y los 14 árboles binarios con 4 vértices internos tienen en promedio $15/7$ hojas distinguidas. Entre estos 14 árboles binarios, 8 tienen 3 hojas distinguidas y 6 tienen una única hoja distinguida.
¿Existe una fórmula conocida o una expansión asintótica del número de hojas distinguidas como $n$ va a $+\infty$ ? ¿Existe una forma de estimar la proporción de árboles binarios con $n+1$ hojas que tienen como máximo (o equivalentemente, como mínimo) $d$ ¿Hojas distinguidas?
La motivación de esta pregunta, y sus tal vez sorprendentes etiquetas, proviene de la sintaxis. Una posible formalización de la sintaxis de las lenguas naturales (comúnmente asociada a los nombres de N.Chomsky y R.Kayne) consiste en suponer que las oraciones se construyen mediante aplicaciones recursivas de una operación binaria que opera sobre un conjunto que contiene (pero no se limita a) elementos léxicos. El proceso da como resultado un árbol binario con algunas hojas unidas a elementos léxicos que se cree que se transforman en una cadena lineal de morfemas. Se cree que para que dicho árbol sea linealizado, tiene que satisfacer una condición que se acerca (aunque en realidad no es equivalente) a la condición de tener elementos léxicos sólo en hojas distinguidas. Uno de los objetivos de la pregunta es hacerse una idea del tamaño relativo del hipotético árbol binario subyacente en comparación con el tamaño de la frase medido de la forma habitual.