Tengo un conjunto de datos de población bimodal. Contiene un pico más pequeño, que se considera "malo", y un pico más grande. Intento separar la parte mala de los datos del resto de los datos. Lo que hice fue: primero hice una estimación de la densidad del núcleo, luego encontré el máximo local de este pequeño pico, y el mínimo local de la fosa entre dos picos, luego tomé el punto medio (media aritmética de las coordenadas x) de ellos, y lo definí como un corte. Todo lo que está por debajo de este límite se considera "malo". La razón por la que tomé el punto medio en lugar de la fosa es porque intenté ser más conservador.
Ahora me gustaría preguntar: ¿Es razonable lo que hice? Si la respuesta es afirmativa, ¿cómo puedo explicar mi acción de una manera que favorezca a los estadísticos? Si no, ¿cómo puedo cambiar? (Cualquier otro método es bienvenido, especialmente los implementados en R.) ¡Gracias!
Esta es la cifra.
0 votos
¿cómo hizo para encontrar el máximo local de este pequeño pico, y el mínimo local de la fosa entre dos picos?