5 votos

¿Método de reducción de dimensionalidad para datos no correlacionados?

En la neurociencia es muy común para medir el tiempo de reacción (RT) de los sujetos. Basado en la RT se pueden extraer conclusiones personales sobre la memoria de trabajo, capacidad de IQ, etc.

Así que tenga esos datos, que proviene de algunos de neurociencia experimento. En los datos que tengo de 180 sujetos de los dos grupos (90 sujetos en cada grupo) por simplicidad, vamos a decir que los niños y las niñas, y tengo un conjunto de 500 RTs para cada sujeto. La diferencia entre la media de RT de cada grupo es estadísticamente significativa (t-test). Ahora, me gustaría construir un clasificador que aprenderán las diferencias entre los dos grupos. Quiero que el clasificador para clasificar nuevos temas basados solamente en su RT - y estoy hablando específicamente de la clasificación de la RT.

(A) estoy buscando dimensionalidad método de reducción que se ajuste a este caso. ( He tratado de PCA y no funciona bien ). No estoy seguro si la PCA es lo correcto aquí como no hay ninguna diferencia entre el 100 y el 200 RT. Cada RT es independiente y no es que el pedido - así que no hay ningún tipo de co-varianza de aquí que la PCA puede capturar. (¿correcto ?)

(B) Que el clasificador se recomienda en estos casos ?

¿Alguien consciente de este tipo de trabajo en general y específicas para la RT ? Cualquier información sobre este sería apreciada.

4voto

Dan Appleyard Puntos 223

Esta descripción está más cerca de ACEPTAR, pero todavía se necesita para describir un montón de cosas con más detalle.

Desde que se desea clasificar, parece que lo que quieres es LDA (Análisis Discriminante Lineal) más de PCA. "La reducción de dimensionalidad", posiblemente debido a que usted necesita para ser capaz de describir la regla de obtener, pero lo más importante es no olvidar que usted quiere algo que le ayuda a clasificar a los niños de las niñas.

La clave más importante paso es que usted tendrá que pensar en una representación sensible de los datos que ayuda a lograr este objetivo. Dependiendo de esto:

  • ¿qué hacen los 500 RTs decir? Son repeticiones de un mismo experimento? o
  • son ejecuciones de los diferentes experimentos? ¿Por qué es "estar en su propio" y "el fin no tiene sentido"?

la representación podría ser significativamente diferentes.

También cuando dices PCA no funciona bien, ¿qué es exactamente lo que usted quiere decir? Podría ser muchas cosas: ¿da inaceptable exactitud en los datos nuevos? o funciona razonablemente bien, pero no tan bien como usted había esperado?

Lo que dices en tu pregunta (A), no es cierto, usted puede ver los efectos de una pobre representación de los datos.

3voto

jatanp Puntos 1687

Un sencillo clasificador discriminativo debe entrenar en segundos y generalizar bien después del ajuste de parámetros de regularización de l1 y l2 en un conjunto de datos de este tamaño. No hay que hacer reducción de dimensionalidad.

Si usted todavía necesita hacer reducción de dimensionalidad por cualquier razón, usted podría utilizar proyecciones al azar, análisis de componentes independientes, autoencoders o cualquier número de técnicas no lineales que funcionan bien en la ausencia de relaciones lineales obvias en el datos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X