Supongamos que recibimos una lectura de muestras tomadas de un sistema de sensores con múltiples variables, que pueden asumirse como valores reales continuos.
Al cabo de unos días, recibimos otra lectura de muestras del mismo sistema.
¿Cómo podemos saber si ambos conjuntos de muestras proceden de la misma distribución o ha habido alguna diferencia?
- Tengo entendido que la prueba KS podría detectar la diferencia entre las dos muestras.
- También tengo entendido que la prueba ANDERSON-DARLING es una alternativa para esto. Según algunas fuentes, que he leído, también es aplicable a las muestras k y no es necesario conocer las distribuciones.
Pregunta: Quiero utilizar el test de ANDERSON-DARLING, por algunas razones que se enumeran aquí: http://www.jaqm.ro/issues/volume-6,issue-3/pdfs/1_engmann_cousineau.pdf
Lo que no entiendo es que tengo múltiples variables. Según tengo entendido, estas pruebas se ejecutarán contra una variable tomada de los datos anteriores, y una variable de los datos actuales y se hará la comparación. ¿Existe un enfoque multivariable para esto? O tendré que comparar ambos conjuntos de datos tomando una variable a la vez. ¿Cómo llegaré a una conclusión en ese caso?
Tx
0 votos
Ninguna de las pruebas que mencionas son adecuadas para datos binarios
0 votos
Lo siento, si ha suscitado una confusión. Los datos se clasifican con una columna separada. Podríamos llamarla columna objetivo, que tiene 0,1. Podríamos eliminar eso, y puede no participar en el proceso.