4 votos

¿Pueden los humanos agrupar conjuntos de datos manualmente?

¿Puede el ser humano agrupar conjuntos de datos manualmente? Por ejemplo, consideremos el conjunto de datos Iris, representado a continuación:

enter image description here

En lugar de utilizar algoritmos de clustering como el clustering basado en la conectividad (clustering jerárquico), el clustering basado en el centroide, el clustering basado en la distribución, el clustering basado en la densidad, etc.

¿Puede un humano agrupar manualmente el conjunto de datos Iris? Para nuestra comodidad, considerémoslo como un conjunto de datos bidimensional. ¿Cómo y con qué medios agruparía un ser humano el conjunto de datos?

1 votos

Tal vez quiera leer sobre parecido familiar concepto.

0 votos

En Weka existe la función iterativa UserClassifier que es un algoritmo de clustering basado en un árbol que pide al usuario que defina los límites del cluster.

0 votos

Veo 3 grupos aquí, probablemente debido a las etiquetas de los 3 colores y símbolos diferentes. Si no estuvieran etiquetados (y con diferentes colores y símbolos), sospecho que vería 2 grupos en ese gráfico.

6voto

AusTravel Puntos 6

Ciertamente, los humanos pueden agrupar conjuntos de datos, pero los de tamaño y complejidad limitados . De hecho, lo hacemos todo el tiempo en nuestro la vida cotidiana . Para (una muy simple) ejemplo cuando nos encontramos en una calle concurrida y queremos contratar un taxi, miramos a nuestro alrededor y realizamos agrupación visual de todos los vehículos cercanos que pensamos que son taxi o podrían serlo. Se nos puede ocurrir un gran número de ejemplos similares, pero seguro que te haces una idea.

¿Cómo actúan los humanos agrupación manual ¿ por ejemplo, de los taxis? Creo que una respuesta, bastante simplificada, es la siguiente: al comparando cierta atributos de [ objetos La presencia de los vehículos en los alrededores (como una marca o color especial, una señal en el techo, la presencia en un lugar especialmente designado) con nuestra mentalidad asociaciones para un taxi (según los atributos mencionados). Estos atributos suelen denominarse dimensiones en estadística, ciencia de los datos, aprendizaje automático y otros campos. Los mismos principios se aplican a los datos de Iris o a cualquier otro conjunto de datos que se factible para ser agrupado manualmente. Espero que mi explicación sea lo suficientemente clara y se acerque a lo que esperabas.

ACTUALIZACIÓN por comentarios [Mis reflexiones sobre la relación entre la agrupación humana y los modelos estadísticos y algoritmos de agrupación:]

Entonces, ¿cuáles son los algoritmos de clustering que más se acercan al clustering humano o a la forma en que los humanos agruparían el conjunto de datos? - Parashara

Creo que todo depende en gran medida de lo que nivel y de lo que perspectiva quiere analizar el fenómeno (de la agrupación humana). Por ejemplo, desde el aplicación (funcional) y/o perspectivas estadísticas Yo diría que la agrupación humana se asemeja a los árboles de decisión o, más exactamente, bosque aleatorio algoritmos y, tal vez, algunos Enfoques bayesianos como por ejemplo modelo oculto de Markov y su primo modelo jerárquico de Markov oculto . De un perspectiva fisiológica estructural , yo colocaría la agrupación humana en un redes neuronales categoría, por razones obvias. De una perspectiva de enfoque integral lo más probable es que la mejor categoría (o una de las mejores) para la agrupación humana sea modelo de memoria temporal jerárquica que se basa en una combinación de modelos bayesianos, agrupación espacial y temporal y redes neuronales. Espero que tenga sentido.

0 votos

Entonces, ¿cuáles son los algoritmos de agrupación que más se acercan a la agrupación humana o a cómo los humanos agruparían el conjunto de datos?

0 votos

@Parashara: Por favor, vea mi actualización, que espero que responda a su pregunta en el comentario anterior.

2voto

Zolomon Puntos 250

Herman Chernoff inventó hace tiempo Las caras de Chernoff que abordan precisamente su problema. Observó que los humanos son especialmente capaces de distinguir a otras personas mirando sus caras, y propuso codificar hasta 18 variables (si no recuerdo mal) en una sola cara.

En su original JASA 1973 muestra un ejemplo en el que un humano puede hacer un muy buen trabajo de clasificación de fósiles con sólo mirar esas caras.

4 votos

He leído numerosas discusiones sobre este método a lo largo de 40 años. La mayoría de los que he visto atribuyen a Chernoff una idea inteligente, pero niegan que, o discuten hasta qué punto, funcione realmente en la práctica. Pero en cualquier caso, esto tiene la pregunta al revés. Si el método de Chernoff funciona es porque aprovecha la forma en que la gente identifica las similitudes. Eso no explica cómo lo hacen. Además, aunque sus usuarios piensen que el método de Chernoff funciona, sigue abierta la cuestión de hasta qué punto están identificando clusters genuinos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X