2 votos

Encontrar un umbral entre dos acumulaciones

Mi pregunta:

Tengo una lista de números. Estos números forman parte de dos acumulaciones, para cada acumulación hay algún número desconocido de valores alrededor de una media específica que desconozco.

¿Cómo puedo encontrar un umbral entre esas dos acumulaciones, de modo que pueda decir para cada número si está en la acumulación $1$ o $2$ ?

Calcular la media de los dos valores que forman el mayor salto no funcionaría, sería demasiado impreciso.

Casi ningún número es igual, por lo que originalmente no es una distribución bimodal.

Un ordenador debería calcularlo finalmente, por lo que la forma de hacerlo puede ser larga.

Los datos los realiza un humano, pulsando un botón prolongada o brevemente. El ordenador debe detectar si quiere decir larga o corta, independientemente de la longitud absoluta de la presión.

Gracias por sus consejos.

0voto

MrComment4 Puntos 6

Ya tengo una idea: Quizá podría "agrupar" los números reduciendo su "resolución" y luego calcular el umbral de la distribución ahora bimodal. Pero esta "resolución" tiene que ser correcta, si es demasiado pequeña, el resultado sería demasiado impreciso, si es demasiado alta, el resultado podría ser totalmente erróneo. Me interesan tus ideas :)

0voto

BruceET Puntos 7117

El concepto general que necesitas se llama análisis discriminante, iniciada por R. A. Fisher hace unos 80 años. Puede leer más sobre el análisis discriminante original de Fisheer en el Wikipedia artículo . Pero su problema particular es el caso más simple posible de discriminar entre sólo dos grupos, por lo que algo como mi procedimiento simplificado sugerido a continuación podría funcionar.

Para que sea posible una discriminación perfecta, los valores máximos de los impulsos "cortos" deben ser inferiores a los valores mínimos de los "largos". Humanos Los sujetos humanos pueden tener inicialmente una variedad de definiciones de "corto" y "largo", por lo que sin sin alguna instrucción, la discriminación puede no ser posible.

Podrías empezar la sesión de cada sujeto con una secuencia de cinco o así respuestas "largas" mezcladas con otras cinco "cortas". A continuación, podría ver si es necesario familiarizarse más con el procedimiento. con el procedimiento.

Una versión muy simplificada del análisis discriminante de Fisher sería tomar un punto intermedio entre las medias de pulsaciones cortas y pulsaciones largas $\bar X_s$ y $\bar X_\ell,$ respectivamente, y ver si separa completamente lo corto de lo largo. Dado que los pulsos cortos pueden tener un desviación estándar (DE) más pequeña $S_s$ que las largas $S_\ell,$ puede funcionar mejor ver si el valor $\bar X_s + cd$ es un valor adecuado para separación, donde $d = \bar X_\ell - \bar X_s$ y $c = \frac{S_x}{S_x + X_\ell}.$

Sin embargo, dispone de valores de datos históricos, $Y_s$ y $Y_\ell$ 's, de corta y largas, respectivamente. Así, el periodo de "familiarización" podría acortarse demostrando un pulso corto ideal con un tono de longitud $\bar Y_s$ y una larga ideal con un tono de longitud $\bar Y_\ell.$ A continuación, dé al sujeto la oportunidad de mostrar un par de pulsaciones de ambos longitudes. Si lo consigue, el ordenador puede decir "Lo has conseguido". Y Y si no, "No noto la diferencia, probemos un poco más". antes de iniciar la sesión mencionada con cinco de cada tipo.

Porque no has dicho mucho sobre el escenario en el que el largo y el corto cortos, mis sugerencias exactas pueden no ser factibles. Pero las ideas Pero las ideas están probadas y sonido, así que estoy seguro de que puede pensar en una manera de modificarlos para adaptarse a sus necesidades particulares.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X