La identificación de una moda para una distribución continua requiere suavizar o dividir los datos.
Binning suele ser demasiado procrastinador: los resultados suelen depender de dónde se coloquen los puntos de corte de los contenedores.
Alisamiento del núcleo (concretamente, en forma de estimación de la densidad del núcleo ) es una buena opción. Aunque son posibles muchas formas de núcleo, normalmente el resultado no depende mucho de la forma. Depende del ancho de banda del núcleo. Por lo tanto, la gente utiliza un núcleo adaptativo suave o llevar a cabo una secuencia de alisados del núcleo para variar los anchos de banda fijos con el fin de comprobar la estabilidad de los modos que se identifican. Aunque el uso de un suavizador adaptativo u "óptimo" es atractivo, tenga en cuenta que la mayoría de ellos (¿todos?) están diseñados para lograr un equilibrio entre la precisión y la exactitud media: no están diseñados para optimizar la estimación de la ubicación de los modos.
En cuanto a la implementación, los suavizadores de núcleo desplazan y escalan localmente una función predeterminada para ajustarse a los datos. Siempre que esta función básica sea diferenciable -los gaussianos son una buena opción porque se pueden diferenciar tantas veces como se quiera-, lo único que hay que hacer es sustituirla por su derivada para obtener la derivada del suavizado. Entonces es simplemente cuestión de aplicar un procedimiento estándar de búsqueda del cero para detectar y comprobar los puntos críticos. ( El método de Brent funciona bien). Por supuesto, se puede hacer el mismo truco con la segunda derivada para obtener una prueba rápida de si cualquier punto crítico es un máximo local, es decir, un modo.
5 votos
Pregunta intrigante. No sé nada de esto, así que no intentaré responder, pero buscar en Google bimodalidad+prueba da bastantes pistas prometedoras. google.es/search?q=bimodalidad+prueba
0 votos
un código programático para probar la multimodalidad está disponible en www.estima.com y se llama MODES.SRC. Se puede convertir fácilmente a Matlab, R u otros softwares. Saludos, guido.
1 votos
No se puede identificar el número de modos (no hay límite para el número de pequeños meneos que puede tener una distribución), pero se puede obtener un límite inferior. por ejemplo, ver aquí projecteuclid.org/euclid.aos/1176351045