Sí, para un agregado simple como el coeficiente Silhouette es razonable calcularlo sólo en una muestra. En muchos casos, también puede estar bien hacer la agrupación completa sólo en dicha muestra (en particular si no se sabe lo que funciona) en lugar de perder el tiempo en calcularla en los datos completos.
En general, no sirve de mucho agrupar conjuntos de datos enormes: es caro, y si no se obtienen conocimientos adicionales en comparación con una muestra, ha sido una pérdida de tiempo. La gente tiende a tratar el clustering como un ejercicio de juguete y a escalarlo a conjuntos de datos enormes en los que los resultados no aportan ningún beneficio... La forma inteligente de utilizarlo es como generador de hipótesis; y para ello basta con una muestra de tamaño razonable. A continuación, puede plantear la hipótesis de qué clases de clientes tiene, etc., y -tras un análisis y una verificación humanos- etiquetar sus datos en consecuencia. La agrupación nunca ha sido algo que se pueda automatizar completamente, y nunca lo será.