Hay una muy amplia variedad de métodos de agrupamiento, que son exploratorio por naturaleza, y no creo que ninguno de ellos, ya sea jerárquica o partición de base, se basa en el tipo de suposiciones que uno tiene que satisfacer para el análisis de la varianza.
Tener un vistazo a la [MV] documentación en Stata para responder a su pregunta, he encontrado este divertido cita en la página 85:
Aunque algunos han dicho que hay muchos clúster-métodos de análisis como hay gente a la realización de un análisis de cluster. Esto es un eufemismo! Existen infinidad de formas de llevar a cabo un análisis de cluster de las personas que las realizan.
En ese contexto, dudo que haya ninguna hipótesis a través de la aplicación de método de agrupación. El resto del texto se establece como regla general que usted necesita alguna forma de "medida de disimilitud", que no tiene por qué ser incluso una métrica de distancia, para crear clústeres.
Hay una excepción, sin embargo, que es cuando la agrupación de las observaciones como parte de un post-estimación de análisis. En Stata, el vce
comando viene con la siguiente advertencia, en la página 86 de la misma fuente:
Si usted está familiarizado con el programa Stata gran variedad de estimación de comandos, tener cuidado de distinguir entre el análisis de cluster (el comando cluster) y la vce(clúster clustvar) opción permite con muchos estimación de comandos. El análisis de Cluster encuentra grupos de datos. La vce(clúster clustvar) opción permite con diversas estimación de comandos indica que las observaciones son independientes a través de los grupos definidos por la opción, pero no son necesariamente independientes dentro de esos grupos. Una agrupación de variables producidas por el comando cluster rara vez satisfacen el supuesto detrás del uso de la vce(clúster clustvar) opción.
Basado en eso, supongo que observaciones independientes no están obligados fuera de ese caso en particular. Intuitivamente, me gustaría añadir que el análisis de cluster (incluso podría ser utilizado para el propósito preciso de explorar el grado en que las observaciones son independientes o no.
Voy a terminar de mencionar que, en la página 356 de Estadísticas con el programa Stata, Lawrence Hamilton menciona estandarizada de las variables como "esencial" de los aspectos de análisis de cluster, a pesar de no ir más a fondo en la cuestión.