No estoy seguro de la métrica del CCI en sí (nunca he visto a nadie informar de esta métrica con fines inferenciales, sólo para la descripción), pero no creo que muchas estrategias de modelización se vean muy afectadas por la instancia de muchos grupos pequeños. Esto se debe a que la modelización de efectos aleatorios tiene en cuenta el tamaño de la muestra de los grupos, "reduciendo" las varianzas estimadas de los grupos por sus tamaños de muestra. Como nota, cuando me refiero a efectos fijos o aleatorios, es en línea con las definiciones establecidas aquí .
Una forma de evaluar esto es examinar el resultado de interés como desviaciones de las medias del grupo en oposición a la métrica original. Así, si $y_{ij}$ es la variable $y$ para la observación $i$ dentro del grupo $j$ de esta variable se resta la media del grupo $j$ y graficar un diagrama de dispersión de esas desviaciones frente al tamaño del grupo. Es de esperar que este gráfico de dispersión muestre heteroscedasticidad (ya que la media de los grupos más pequeños debería ser menos representativa de las observaciones dentro del grupo), y que tenga una varianza más amplia para los grupos más pequeños. Si ocurre lo contrario, esto sugiere que los grupos más pequeños son más homogéneos, y podría ser una prueba de que se viola la independencia de las observaciones y está directamente relacionada con el tamaño del grupo (por ejemplo, los que están en grupos más pequeños tienden a ser más similares entre sí que los que están en grupos más grandes).
En todo caso, los grupos pequeños deberían inflar la CPI. Cuando sólo hay una observación, toda la varianza de esa observación se atribuye a la media a nivel de grupo, y si todos los grupos sólo tuvieran una observación, el CCI sería 1 (es decir, no hay variación dentro del grupo, sólo entre grupos).
También como nota, frecuentemente para estimar alguna relación no es que las observaciones tengan que ser independientes, es simplemente que los residuos del modelo tienen que ser independientes. De ahí la razón de ajustar modelos multinivel.
Stephen Raudenbush tiene un capítulo del libro, Muchos grupos pequeños que puede ser de interés (veo que se puede encontrar un PDF de todo el libro aquí ). El capítulo trata principalmente de cómo estimar modelos con muchos grupos pequeños y los posibles problemas que pueden surgir. Sin embargo, esto sólo es pertinente si quiere estimar modelos de efectos aleatorios. Si simplemente le interesan los modelos de efectos fijos, no hay muchos problemas.
También he encontrado los tutoriales desarrollados por el Centro de Modelización Multinivel para ser introducciones muy útiles al material del tema (¡muy suaves, especialmente comparadas con el capítulo de Raudenbush que acabo de citar!)